所属成套资源:【精品试题】高考数学一轮 必刷题 专题(含解析)共70套
【精品试题】高考数学一轮必刷题 专题66 变量间的相关关系、统计案例(含解析)
展开
考点66 变量间的相关关系、统计案例
1.(湖南省师范大学附属中学2019届高三下学期模拟三理)某社区消费者协会为了解本社区居民网购消费情况,随机抽取了100位居民作为样本,就最近一年来网购消费金额(单位:千元),网购次数和支付方式等进行了问卷调査.经统计这100位居民的网购消费金额均在区间内,按,,,,,分成6组,其频率分布直方图如图所示.
(1)估计该社区居民最近一年来网购消费金额的中位数;
(2)将网购消费金额在20千元以上者称为“网购迷”,补全下面的列联表,并判断有多大把握认为“网购迷与性别有关系”;
男
女
合计
网购迷
20
非网购迷
45
合计
100
(3)调査显示,甲、乙两人每次网购采用的支付方式相互独立,两人网购时间与次数也互不. 影响.统计最近一年来两人网购的总次数与支付方式,所得数据如下表所示:
网购总次数
支付宝支付次数
银行卡支付次数
微信支付次数
甲
80
40
16
24
乙
90
60
18
12
将频率视为概率,若甲、乙两人在下周内各自网购2次,记两人采用支付宝支付的次数之和为,求的数学期望.
附:观测值公式:
临界值表:
0.01
0.05
0.025
0.010
0.005
0.001
2.706
3.841
5.024
6.635
7.879
10.828
2.(山东省实验中学等四校2019届高三联合考试理)随着科技的发展,网络已逐渐融入了人们的生活.网购是非常方便的购物方式,为了了解网购在我市的普及情况,某调查机构进行了有关网购的调查问卷,并从参与调查的市民中随机抽取了男女各100人进行分析,从而得到表(单位:人)
经常网购
偶尔或不用网购
合计
男性
50
100
女性
70
100
合计
(1)完成上表,并根据以上数据判断能否在犯错误的概率不超过0.01的前提下认为我市市民网购与性别有关?
(2)①现从所抽取的女市民中利用分层抽样的方法抽取10人,再从这10人中随机选取3人赠送优惠券,求选取的3人中至少有2人经常网购的概率;
②将频率视为概率,从我市所有参与调查的市民中随机抽取10人赠送礼品,记其中经常网购的人数为,求随机变量的数学期望和方差.
参考公式:
0.15
0.10
0.05
0.025
0.010
0.005
0.001
2.072
2.706
3.841
5.024
6.635
7.879
10.828
3.(华大新高考联盟2018届高三上学期11月教学质量测评理)某种子公司对一种新品种的种子的发芽多少与昼夜温差之间的关系进行分析研究,以便选择最合适的种植条件.他们分别记录了10块试验地每天的昼夜温差和每块实验地里50颗种子的发芽数,得到如下资料:
(1)从上述十组试验数据来看,是否可以判断昼夜温差与发芽数之间具有相关关系?是否具有线性相关关系?
(2)若在一定温度范围内,昼夜温差与发芽数近似满足相关关系:(其中).取后五组数据,利用最小二乘法求出线性回归方程(精确到0.01);
(3)利用(2)的结论,若发芽数试验值与预测值差的绝对值不超过3个就认为正常,否则认为不正常.从上述十组试验中任取三组,至少有两组正常的概率是多少?
附:回归直线方程的斜率和截距的最小二乘估计公式分别为,
4.(湖南省2017届高三高考冲刺预测卷六理)已知某蔬菜商店买进的土豆(吨)与出售天数(天)之间的关系如下表所示:
2
3
4
5
6
7
9
12
1
2
3
3
4
5
6
8
(1)请根据上表数据在下列网格纸中绘制散点图;
(2)请根据上表提供的数据,用最小二乘法求出关于的线性回归方程(其中保留三位小数);(注:)
(3)在表格中(的8个对应点中,任取3个点,记这3个点在直线的下方的个数为,求的分布列和数学期望.
5.(山东省栖霞市2019届高三高考模拟卷数学理)李克强总理在2018年政府工作报告指出,要加快建设创新型国家,把握世界新一轮科技革命和产业变革大势,深入实施创新驱动发展战略,不断增强经济创新力和竞争力.某手机生产企业积极响应政府号召,大力研发新产品,争创世界名牌.为了对研发的一批最新款手机进行合理定价,将该款手机按事先拟定的价格进行试销,得到一组销售数据,如表所示:
单价(千元)
销量(百件)
已知.
(1)若变量具有线性相关关系,求产品销量(百件)关于试销单价(千元)的线性回归方程;
(2)用(1)中所求的线性回归方程得到与对应的产品销量的估计值.当销售数据对应的残差的绝对值时,则将销售数据称为一个“好数据”.现从个销售数据中任取个子,求“好数据”个数的分布列和数学期望.
(参考公式:线性回归方程中的估计值分别为.
6.(江西省鹰潭市2019届高三第一次模拟考试理)近年来,随着我国汽车消费水平的提高,二手车流通行业得到迅猛发展.某汽车交易市场对2017年成交的二手车交易前的使用时间(以下简称“使用时间”)进行统计,得到频率分布直方图如图1.
附注:①对于一组数据,,…,,其回归直线的斜率和截距的最小二乘估计分别为,;
②参考数据:,,,,.
(Ⅰ)记“在2017年成交的二手车中随机选取一辆,该车的使用年限在”为事件,试估计的概率;
(Ⅱ)根据该汽车交易市场的历史资料,得到散点图如图2,其中(单位:年)表示二手车的使用时间,(单位:万元)表示相应的二手车的平均交易价格.由散点图看出,可采用作为二手车平均交易价格关于其使用年限的回归方程,相关数据如下表(表中,):
5.5
8.7
1.9
301.4
79.75
385
①根据回归方程类型及表中数据,建立关于的回归方程;
②该汽车交易市场对使用8年以内(含8年)的二手车收取成交价格的佣金,对使用时间8年以上(不含8年)的二手车收取成交价格的佣金.在图1对使用时间的分组中,以各组的区间中点值代表该组的各个值.若以2017年的数据作为决策依据,计算该汽车交易市场对成交的每辆车收取的平均佣金.
7.(广东省深圳市高级中学2019届高三适应性考试6月数学(理)某景区的各景点从2009年取消门票实行免费开放后,旅游的人数不断地增加,不仅带动了该市淡季的旅游,而且优化了旅游产业的结构,促进了该市旅游向“观光、休闲、会展”三轮驱动的理想结构快速转变.下表是从2009年至2018年,该景点的旅游人数(万人)与年份的数据:
第年
1
2
3
4
5
6
7
8
9
10
旅游人数(万人)
300
283
321
345
372
435
486
527
622
800
该景点为了预测2021年的旅游人数,建立了与的两个回归模型:
模型①:由最小二乘法公式求得与的线性回归方程;
模型②:由散点图的样本点分布,可以认为样本点集中在曲线的附近.
(1)根据表中数据,求模型②的回归方程.(精确到个位,精确到0.01).
(2)根据下列表中的数据,比较两种模型的相关指数,并选择拟合精度更高、更可靠的模型,预测2021年该景区的旅游人数(单位:万人,精确到个位).
回归方程
①
②
30407
14607
参考公式、参考数据及说明:
①对于一组数据,其回归直线的斜率和截距的最小二乘法估计分别为.
②刻画回归效果的相关指数 .
③参考数据:,.
5.5
449
6.05
83
4195
9.00
表中.
8.(甘肃省兰州市第一中学2019届高三6月最后高考冲刺模拟数学理)某商场营销人员进行某商品的市场营销调查时发现,每回馈消费者一定的点数,该商品每天的销量就会发生一定的变化,经过试点统计得到以下表:
反馈点数t
1
2
3
4
5
销量(百件)/天
0.5
0.6
1
1.4
1.7
(Ⅰ)经分析发现,可用线性回归模型拟合当地该商品销量(千件)与返还点数之间的相关关系.试预测若返回6个点时该商品每天的销量;
(Ⅱ)若节日期间营销部对商品进行新一轮调整.已知某地拟购买该商品的消费群体十分庞大,经营销调研机构对其中的200名消费者的返点数额的心理预期值进行了一个抽样调查,得到如下一份频数表:
返还点数预期值区间
(百分比)
[1,3)
[3,5)
[5,7)
[7,9)
[9,11)
[11,13)
频数
20
60
60
30
20
10
(1)求这200位拟购买该商品的消费者对返点点数的心理预期值的样本平均数及中位数的估计值(同一区间的预期值可用该区间的中点值代替;估计值精确到0.1);
(2)将对返点点数的心理预期值在和的消费者分别定义为“欲望紧缩型”消费者和“欲望膨胀型”消费者,现采用分层抽样的方法从位于这两个区间的30名消费者中随机抽取6名,再从这6人中随机抽取3名进行跟踪调查,设抽出的3人中 “欲望紧缩型”消费者的人数为随机变量,求的分布列及数学期望.
9.下表为年至年某百货零售企业的线下销售额(单位:万元),其中年份代码年份.
年份代码
线下销售额
(1)已知与具有线性相关关系,求关于的线性回归方程,并预测年该百货零售企业的线下销售额;
(2)随着网络购物的飞速发展,有不少顾客对该百货零售企业的线下销售额持续增长表示怀疑,某调查平台为了解顾客对该百货零售企业的线下销售额持续增长的看法,随机调查了位男顾客、位女顾客(每位顾客从“持乐观态度”和“持不乐观态度”中任选一种),其中对该百货零售企业的线下销售额持续增长持乐观态度的男顾客有人、女顾客有人,能否在犯错误的概率不超过的前提下认为对该百货零售企业的线下销售额持续增长所持的态度与性别有关?
参考公式及数据:.
10.(山东省烟台市2019届高三5月适应性练习二)混凝土具有原材料丰富、抗压强度高、耐久性好等特点,是目前使用量最大的土木建筑材料.抗压强度是混凝土质量控制的重要技术参数,也是实际工程对混凝土要求的基本指标.为了解某型号某批次混凝土的抗压强度(单位: )随龄期(单位:天)的发展规律,质检部门在标准试验条件下记录了10组混凝土试件在龄期分别为2,3,4,5,7,9,12,14,17,21时的抗压强度的值,并对数据作了初步处理,得到下面的散点图及一些统计量的值.
表中,.
(1)根据散点图判断与哪一个适宜作为抗压强度关于龄期的回归方程类型?选择其中的一个模型,并根据表中数据,建立关于的回归方程;
(2)工程中常把龄期为28天的混凝土试件的抗压强度视作混凝土抗压强度标准值.已知该型号混凝土设置的最低抗压强度标准值为.
(ⅰ)试预测该批次混凝土是否达标?
(ⅱ)由于抗压强度标准值需要较长时间才能评定,早期预测在工程质量控制中具有重要的意义.经验表明,该型号混凝土第7天的抗压强度与第28天的抗压强度具有线性相关关系,试估计在早期质量控制中,龄期为7天的试件需达到的抗压强度.
附: ,,
参考数据: ,.
11.(陕西省2019年高三第三次教学质量检测理)已知某种细菌的适宜生长温度为10℃~25℃,为了研究该种细菌的繁殖数量(单位:个)随温度(单位:℃)变化的规律,收集数据如下:
温度/℃
12
14
16
18
20
22
24
繁殖数量/个
20
25
33
27
51
112
194
对数据进行初步处理后,得到了一些统计量的值,如下表所示:
18
66
3.8
112
4.3
1428
20.5
其中,.
(1)请绘出关于的散点图,并根据散点图判断与哪一个更适合作为该种细菌的繁殖数量关于温度的回归方程类型(给出判断即可,不必说明理由);
(2)根据(1)的判断结果及表格数据,建立关于的回归方程(结果精确到0.1);
(3)当温度为25℃时,该种细菌的繁殖数量的预报值为多少?
参考公式:对于一组数据,其回归直线的斜率和截距的最小二成估计分别为,.
参考数据:.
12.(安徽省黄山市2019届高三毕业班第三次质量检测数学理)全民健身倡导全民做到每天参加一次以上的体育健身活动,旨在全面提高国民体质和健康水平.某部门在该市2013-2018年发布的全民健身指数中,对其中的“运动参与评分值”进行了统计,制成如图所示的散点图.
(1)根据散点图,建立关于的回归方程;
(2)从该市的市民中随机抽取了容量为150的样本,其中经常参加体育锻炼的人数为50,以频率为概率,若从这150名市民中随机抽取4人,记其中“经常参加体育锻炼”的人数为,求的分布列和数学期望.
附:对于一组数据,其回归直线的斜率和截距的最小二乘估计公式分别为,.
13.(河南省洛阳市2019届高三第三次统一考试数学理)某商场营销人员对某商品进行市场营销调查,发现每回馈消费者一定的点数,该商品每天的销量就会发生一定的变化,经过统计得到下表:
回馈点数
1
2
3
4
5
销量(百件)/天
0.5
0.6
1
1.4
1.7
(1)经分析发现,可用线性回归模型拟合该商品每天的销量(百件)与返还点数之间的相关关系.请用最小二乘法求关于的线性回归方程,并预测若回馈6个点时该商品每天销量;
(2)已知节日期间某地拟购买该商品的消费群体十分庞大,营销调研机构对其中的200名消费者的返点数额的心理预期值进行了抽样调查,得到如下频数表:
返还点数预期值区间
频数
20
60
60
30
20
10
(i)求这200位拟购买该商品的消费者对返点点数的心理预期值的样本平均数及中位数的估计值(同一区间的预期值可用该区间的中点值代替;估计值精确到0.1);
(ii)将对返点点数的心理预期值在和的消费者分别定义为“欲望紧缩型”消费者和“欲望膨胀型”消费者,现采用分层抽样的方法从位于这两个区间的30名消费者中随机抽取6名,再从这6人中随机抽取3名进行跟踪调查,设抽出的3人中“欲望紧缩型”消费者的人数为随机变量,求的分布列及数学期望.
参考公式及数据:①,;②.
14.(东北三省三校(辽宁省实验中学、东北师大附中、哈师大附中)2019届高三第三次模拟考试数学理)现代社会,“鼠标手”已成为常见病,一次实验中,10名实验对象进行160分钟的连续鼠标点击游戏,每位实验对象完成的游戏关卡一样,鼠标点击频率平均为180次/分钟,实验研究人员测试了实验对象使用鼠标前后的握力变化,前臂表面肌电频率()等指标.
(I)10 名实验对象实验前、后握力(单位:)测试结果如下:
实验前:346,357,358,360,362,362,364,372,373,376
实验后:313,321,322,324,330,332,334,343,350,361
完成茎叶图,并计算实验后握力平均值比实验前握力的平均值下降了多少?
(Ⅱ)实验过程中测得时间(分)与10名实验对象前臂表面肌电频率()的中的位数()的九组对应数据为,.建立关于时间的线性回归方程;
(Ⅲ)若肌肉肌电水平显著下降,提示肌肉明显进入疲劳状态,根据(Ⅱ)中9组数据分析,使用鼠标多少分钟就该进行休息了?
参考数据:;
参考公式:回归方程中斜率和截距的最小二乘估计公式分别为:
,
15.(安徽省蚌埠市2019届高三年级第三次教学质量检查考试数学理)某地种植常规稻和杂交稻,常规稻的亩产稳定为485公斤,今年单价为3.70元/公斤,估计明年单价不变的可能性为,变为3.90元/公斤的可能性为,变为4.00的可能性为.统计杂交稻的亩产数据,得到亩产的频率分布直方图如图①.统计近10年杂交稻的单价(单位:元/公斤)与种植亩数(单位:万亩)的关系,得到的10组数据记为,并得到散点图如图②.
(1)根据以上数据估计明年常规稻的单价平均值;
(2)在频率分布直方图中,各组的取值按中间值来计算,求杂交稻的亩产平均值;以频率作为概率,预计将来三年中至少有二年,杂交稻的亩产超过795公斤的概率;
(3)①判断杂交稻的单价(单位:元/公斤)与种植亩数(单位:万亩)是否线性相关?若相关,试根据以下的参考数据求出关于的线性回归方程;
②调查得知明年此地杂交稻的种植亩数预计为2万亩.若在常规稻和杂交稻中选择,明年种植哪种水稻收入更高?
统计参考数据:,,,,
附:线性回归方程,.
16.(湖南湖北八市十二校(湖南师范大学附属中学、衡阳八中等)2019届高三第二次调研联考数学理)近期,某公交公司分别推出支付宝和微信扫码支付乘车活动,活动设置了一段时间的推广期,由于推广期内优惠力度较大,吸引越来越多的人开始使用扫码支付.某线路公交车队统计了活动刚推出一周内每一天使用扫码支付的人次,用表示活动推出的天数,表示每天使用扫码支付的人次(单位:十人次),统计数据如表所示:
1
2
3
4
5
6
7
6
11
21
34
66
101
196
根据以上数据,绘制了如图所示的散点图.
(1)根据散点图判断,在推广期内,与均为大于零的常数)哪一个适宜作为扫码支付的人次关于活动推出天数的回归方程类型?(给出判断即可,不必说明理由);
(2)根据(1)的判断结果及表l中的数据,求关于的回归方程,并预测活动推出第8天使用扫码支付的人次;
(3)推广期结束后,车队对乘客的支付方式进行统计,结果如表所示:
支付方式
现金
乘车卡
扫码
比例
已知该线路公交车票价为2元,使用现金支付的乘客无优惠,使用乘车卡支付的乘客享受8折优惠,扫码支付的乘客随机优惠,根据统计结果得知,使用扫码支付的乘客,享受7折优惠的概率为,享受8折优惠的概率为,享受9折优惠的概率为.根据所给数据以事件发生的频率作为相应事件发生的概率,估计一名乘客一次乘车的平均费用.
参考数据:
66
1.54
2.711
50.12
3.47
其中,.
17.(广西桂林市、崇左市2019届高三下学期二模联考数学理)某汽车公司为调查店个数对该公司汽车销量的影响,对同等规模的四座城市的店一季度汽车销量进行了统计,结果如下:
(1)根据统计的数据进行分析,求关于的线性回归方程;
(2)现要从三座城市的10个店中选取3个做深入调查,求城市中被选中的店个数的分布列和期望.
附:回归方程中的斜率和截距的最小二乘法估计公式分别为:
;.
18.(贵州省贵阳第一中学、云南师大附中、广西南宁三中2019届高三“333”高考备考诊断联考数学理)为了适应高考改革,某中学推行“创新课堂”教学.高一平行甲班采用“传统教学”的教学方式授课,高一平行乙班采用“创新课堂”的教学方式授课,为了比较教学效果,期中考试后,分别从两个班中各随机抽取20名学生的成绩进行统计分析,结果如表:(记成绩不低于120分者为“成绩优秀”)
分数
[80,90)
[90,100)
[100,110)
[110,120)
[120,130)
[130,140)
[140,150]
甲班频数
1
1
4
5
4
3
2
乙班频数
0
1
1
2
6
6
4
(1)由以上统计数据填写下面的2×2列联表,并判断是否有95%以上的把握认为“成绩优秀与教学方式有关”?
甲班
乙班
总计
成绩优秀
成绩不优秀
总计
(2)现从上述样本“成绩不优秀”的学生中,抽取3人进行考核,记“成绩不优秀”的乙班人数为X,求X的分布列和期望.
参考公式:,其中.
临界值表
P()
0.100
0.050
0.010
0.001
2.706
3.841
6.635
10.828
19.(山东省淄博市部分学校2019届高三5月阶段性检测三模数学(理)某医院治疗白血病有甲、乙两套方案,现就70名患者治疗后复发的情况进行了统计,得到其等高条形图如图所示(其中采用甲、乙两种治疗方案的患者人数之比为).
(1)补充完整列联表中的数据,并判断是否有的把握认为甲、乙两套治疗方案对患者白血病复发有影响;
(2)从复发的患者中抽取3人进行分析,求其中接受“乙方案”治疗的人数的数学期望.
附:
,其中.
20.(2017届四川省成都市石室中学高三二诊模拟考试数学理)中央政府为了对应因人口老龄化而造成的劳动力短缺等问题,拟定出台“延迟退休年龄政策”,为了了解人们对“延迟退休年龄政策”的态度,责成人社部进行调研,人社部从网上年龄在15~65的人群中随机调查50人,调查数据的频率分布直方图和支持“延迟退休”的人数与年龄的统计结果如下:
(1)由以上统计数据填下面2×2列联表,并问是否有90%的把握认为以45岁为分界点对“延迟退休年龄政策”的支持度有差异:
(2)若从年龄在,的被调查人中各随机选取两人进行调查,记选中的4人中支持“延迟退休”人数为,求随机变量的分布列及数学期望.
参考数据:
.
21.(山西省晋城市2019届高三第三次模拟考试数学理)某机构为了了解不同年龄的人对一款智能家电的评价,随机选取了50名购买该家电的消费者,让他们根据实际使用体验进行评分.
(Ⅰ)设消费者的年龄为,对该款智能家电的评分为.若根据统计数据,用最小二乘法得到关于的线性回归方程为,且年龄的方差为,评分的方差为.求与的相关系数,并据此判断对该款智能家电的评分与年龄的相关性强弱.
(Ⅱ)按照一定的标准,将50名消费者的年龄划分为“青年”和“中老年”,评分划分为“好评”和“差评”,整理得到如下数据,请判断是否有的把握认为对该智能家电的评价与年龄有关.
好评
差评
青年
8
16
中老年
20
6
附:线性回归直线的斜率;相关系数,独立性检验中的,其中.
临界值表:
0.050
0.010
0.001
3.841
6.635
10.828
22.(山东省安丘市、诸城市、五莲县、兰山区2019届高三5月校级联合考试数学理)某手机公司生产某款手机,如果年返修率不超过千分之一,则生产部门当年考核优秀,现获得该公司2010-2018年的相关数据如下表所示:
年份
2010
2011
2012
2013
2014
2015
2016
2017
2018
年生产量(万台)
3
4
5
6
7
7
9
10
12
产品年利润(千万元)
3.6
4.1
4.4
5.2
6.2
7.8
7.5
7.9
9.1
年返修量(台)
47
42
48
50
92
83
72
87
90
(1)从该公司2010-2018年的相关数据中任意选取3年的数据,以表示3年中生产部门获得考核优秀的次数,求的分布列和数学期望;
(2)根据散点图发现2015年数据偏差较大,如果去掉该年的数据,试用剩下的数据求出年利润(千万元)关于年生产量(万台)的线性回归方程(精确到0.01).部分计算结果:,,.
附:;线性回归方程中,,.
23.(河南省百校联盟2019届高三考前仿真试卷数学理)为了调查煤矿公司员工的饮食习惯与月收入之间的关系,随机抽取了30名员工,并制作了这30人的月平均收入的频率分布直方图和饮食指数表(说明:图中饮食指数低于70的人,饮食以蔬菜为主;饮食指数高于70的人,饮食以肉类为主).其中月收入4000元以上员工中有11人饮食指数高于70.
20
21
21
25
32
33
36
37
42
43
44
45
45
58
58
59
61
66
74
75
76
77
77
78
78
82
83
85
86
90
(Ⅰ)是否有95%的把握认为饮食习惯与月收入有关系?若有请说明理由,若没有,说明理由并分析原因;
(Ⅱ)以样本中的频率作为概率,从该公司所有主食蔬菜的员工中随机抽取3人,这3人中月收入4000元以上的人数为,求的分布列与期望;
(Ⅲ)经调查该煤矿公司若干户家庭的年收入(万元)和年饮食支出(万元)具有线性相关关系,并得到关于的回归直线方程:.若该公司一个员工与其妻子的月收入恰好都为这30人的月平均收入(该家庭只有两人收入),估计该家庭的年饮食支出费用.
附:
.
0.15
0.10
0.05
0.025
0.010
2.072
2.706
3.841
5.024
6.635
24.(安徽省合肥市2019届高三第三次教学质量检测数学理)在第十五次全国国民阅读调查中,某地区调查组获得一个容量为的样本,其中城镇居民人,农村居民人.在这些居民中,经常阅读的城镇居民人,农村居民人.
(Ⅰ)填写下面列联表,并判断是否有的把握认为,经常阅读与居民居住地有关?
城镇居民
农村居民
合计
经常阅读
不经常阅读
合计
(Ⅱ)从该地区居民城镇的居民中,随机抽取位居民参加一次阅读交流活动,记这位居民中经常阅读的人数为,若用样本的频率作为概率,求随机变量的分布列和期望.
附:,其中
考点66 变量间的相关关系、统计案例
1.(湖南省师范大学附属中学2019届高三下学期模拟三理)某社区消费者协会为了解本社区居民网购消费情况,随机抽取了100位居民作为样本,就最近一年来网购消费金额(单位:千元),网购次数和支付方式等进行了问卷调査.经统计这100位居民的网购消费金额均在区间内,按,,,,,分成6组,其频率分布直方图如图所示.
(1)估计该社区居民最近一年来网购消费金额的中位数;
(2)将网购消费金额在20千元以上者称为“网购迷”,补全下面的列联表,并判断有多大把握认为“网购迷与性别有关系”;
男
女
合计
网购迷
20
非网购迷
45
合计
100
(3)调査显示,甲、乙两人每次网购采用的支付方式相互独立,两人网购时间与次数也互不. 影响.统计最近一年来两人网购的总次数与支付方式,所得数据如下表所示:
网购总次数
支付宝支付次数
银行卡支付次数
微信支付次数
甲
80
40
16
24
乙
90
60
18
12
将频率视为概率,若甲、乙两人在下周内各自网购2次,记两人采用支付宝支付的次数之和为,求的数学期望.
附:观测值公式:
临界值表:
0.01
0.05
0.025
0.010
0.005
0.001
2.706
3.841
5.024
6.635
7.879
10.828
【答案】(1) 中位数估计为17.5千元. (2)见解析;(3)
【解析】(1)在直方图中,从左至右前3个小矩形的面积之和为,
后2个小矩形的面积之和为,所以中位数位于区间内.
设直方图的面积平分线为,则,得,所以该社区居民网购消费金额的中位数估计为17.5千元.
(2)由直方图知,网购消费金额在20千元以上的频数为,
所以“网购迷”共有35人,由列联表知,其中女性有20人,则男性有15人.
所以补全的列联表如下:
男
女
合计
网购迷
15
20
35
非网购迷
45
20
65
合计
60
40
100
因为,查表得,
所以有97.5%的把握认为“网购迷与性别有关系”.
(3)由表知,甲,乙两人每次网购采用支付宝支付的概率分别为,.
设甲,乙两人采用支付宝支付的次数分别为,,据题意,,.
所以,.
因为,则,所以的数学期望为.
2.(山东省实验中学等四校2019届高三联合考试理)随着科技的发展,网络已逐渐融入了人们的生活.网购是非常方便的购物方式,为了了解网购在我市的普及情况,某调查机构进行了有关网购的调查问卷,并从参与调查的市民中随机抽取了男女各100人进行分析,从而得到表(单位:人)
经常网购
偶尔或不用网购
合计
男性
50
100
女性
70
100
合计
(1)完成上表,并根据以上数据判断能否在犯错误的概率不超过0.01的前提下认为我市市民网购与性别有关?
(2)①现从所抽取的女市民中利用分层抽样的方法抽取10人,再从这10人中随机选取3人赠送优惠券,求选取的3人中至少有2人经常网购的概率;
②将频率视为概率,从我市所有参与调查的市民中随机抽取10人赠送礼品,记其中经常网购的人数为,求随机变量的数学期望和方差.
参考公式:
0.15
0.10
0.05
0.025
0.010
0.005
0.001
2.072
2.706
3.841
5.024
6.635
7.879
10.828
【答案】(Ⅰ)详见解析;(Ⅱ)①;②数学期望为6,方差为2.4.
【解析】(1)完成列联表(单位:人):
经常网购
偶尔或不用网购
合计
男性
50
50
100
女性
70
30
100
合计
120
80
200
由列联表,得:
,
∴能在犯错误的概率不超过0.01的前提下认为我市市民网购与性别有关.
(2)①由题意所抽取的10名女市民中,经常网购的有人,
偶尔或不用网购的有人,
∴选取的3人中至少有2人经常网购的概率为:
.
② 由列联表可知,抽到经常网购的市民的频率为:,
将频率视为概率,
∴从我市市民中任意抽取一人,恰好抽到经常网购市民的概率为0.6,
由题意,
∴随机变量的数学期望,
方差D(X)=.
3.(华大新高考联盟2018届高三上学期11月教学质量测评理)某种子公司对一种新品种的种子的发芽多少与昼夜温差之间的关系进行分析研究,以便选择最合适的种植条件.他们分别记录了10块试验地每天的昼夜温差和每块实验地里50颗种子的发芽数,得到如下资料:
(1)从上述十组试验数据来看,是否可以判断昼夜温差与发芽数之间具有相关关系?是否具有线性相关关系?
(2)若在一定温度范围内,昼夜温差与发芽数近似满足相关关系:(其中).取后五组数据,利用最小二乘法求出线性回归方程(精确到0.01);
(3)利用(2)的结论,若发芽数试验值与预测值差的绝对值不超过3个就认为正常,否则认为不正常.从上述十组试验中任取三组,至少有两组正常的概率是多少?
附:回归直线方程的斜率和截距的最小二乘估计公式分别为,
【答案】(1)可以判断昼夜温差与发芽数之间具有相关关系,不具有线性相关关系;
(2) (3)
【解析】(1)可以判断昼夜温差与发芽数之间具有相关关系,
不具有线性相关关系;
(2)
,,
,.
(3)
十组数据中有两组不正常,
(或).
4.(湖南省2017届高三高考冲刺预测卷六理)已知某蔬菜商店买进的土豆(吨)与出售天数(天)之间的关系如下表所示:
2
3
4
5
6
7
9
12
1
2
3
3
4
5
6
8
(1)请根据上表数据在下列网格纸中绘制散点图;
(2)请根据上表提供的数据,用最小二乘法求出关于的线性回归方程(其中保留三位小数);(注:)
(3)在表格中(的8个对应点中,任取3个点,记这3个点在直线的下方的个数为,求的分布列和数学期望.
【答案】(1)见解析(2)(3)见解析
【解析】(1)散点图如下所示:
(2)依题意,,,
,,
,
∴;
∴回归直线方程为(注: 也可)
(3)在对应的8个点中,有4个点在直线 的下方,所以的可能取值为0,1,2,3,
,
∴的分布列为
0
1
2
3
的数学期望.
5.(山东省栖霞市2019届高三高考模拟卷数学理)李克强总理在2018年政府工作报告指出,要加快建设创新型国家,把握世界新一轮科技革命和产业变革大势,深入实施创新驱动发展战略,不断增强经济创新力和竞争力.某手机生产企业积极响应政府号召,大力研发新产品,争创世界名牌.为了对研发的一批最新款手机进行合理定价,将该款手机按事先拟定的价格进行试销,得到一组销售数据,如表所示:
单价(千元)
销量(百件)
已知.
(1)若变量具有线性相关关系,求产品销量(百件)关于试销单价(千元)的线性回归方程;
(2)用(1)中所求的线性回归方程得到与对应的产品销量的估计值.当销售数据对应的残差的绝对值时,则将销售数据称为一个“好数据”.现从个销售数据中任取个子,求“好数据”个数的分布列和数学期望.
(参考公式:线性回归方程中的估计值分别为.
【答案】(1) (2)见解析
【解析】(1)由,可求得,
故,,,,
代入可得,
,
所以所求的线性回归方程为.
(2)利用(1)中所求的线性回归方程可得,当时,;当 时,;当时,;当时,;当时,;当时,.
与销售数据对比可知满足的共有4个“好数据”:、、、
于是的所有可能取值为
,,,
∴ 的分布列为:
1
2
3
P
所以.
6.(江西省鹰潭市2019届高三第一次模拟考试理)近年来,随着我国汽车消费水平的提高,二手车流通行业得到迅猛发展.某汽车交易市场对2017年成交的二手车交易前的使用时间(以下简称“使用时间”)进行统计,得到频率分布直方图如图1.
附注:①对于一组数据,,…,,其回归直线的斜率和截距的最小二乘估计分别为,;
②参考数据:,,,,.
(Ⅰ)记“在2017年成交的二手车中随机选取一辆,该车的使用年限在”为事件,试估计的概率;
(Ⅱ)根据该汽车交易市场的历史资料,得到散点图如图2,其中(单位:年)表示二手车的使用时间,(单位:万元)表示相应的二手车的平均交易价格.由散点图看出,可采用作为二手车平均交易价格关于其使用年限的回归方程,相关数据如下表(表中,):
5.5
8.7
1.9
301.4
79.75
385
①根据回归方程类型及表中数据,建立关于的回归方程;
②该汽车交易市场对使用8年以内(含8年)的二手车收取成交价格的佣金,对使用时间8年以上(不含8年)的二手车收取成交价格的佣金.在图1对使用时间的分组中,以各组的区间中点值代表该组的各个值.若以2017年的数据作为决策依据,计算该汽车交易市场对成交的每辆车收取的平均佣金.
【答案】(1)(2)①,②万元
【解析】解:(1)由题得,二手车使用时间在的频率为,
在的频率为,
∴;
(2)①由题得,,即关于的线性回归方程为.
∵,
,
∴关于的线性回归方程为,即关于的回归方程为;
②根据①中的回归方程和图1,对成交的二手车可预测:
使用时间在的平均成交价格为,对应的频率为0.2;
使用时间在的平均成交价格为,对应的频率为0.36;
使用时间在的平均成交价格为,对应的频率为0.28;
使用时间在平均成交价格为,对应的频率为0.12;
使用时间在的平均成交价格为,对应的频率为0.04.
∴该汽车交易市场对于成交的每辆车可获得的平均佣金为万元.
7.(广东省深圳市高级中学2019届高三适应性考试6月数学(理)某景区的各景点从2009年取消门票实行免费开放后,旅游的人数不断地增加,不仅带动了该市淡季的旅游,而且优化了旅游产业的结构,促进了该市旅游向“观光、休闲、会展”三轮驱动的理想结构快速转变.下表是从2009年至2018年,该景点的旅游人数(万人)与年份的数据:
第年
1
2
3
4
5
6
7
8
9
10
旅游人数(万人)
300
283
321
345
372
435
486
527
622
800
该景点为了预测2021年的旅游人数,建立了与的两个回归模型:
模型①:由最小二乘法公式求得与的线性回归方程;
模型②:由散点图的样本点分布,可以认为样本点集中在曲线的附近.
(1)根据表中数据,求模型②的回归方程.(精确到个位,精确到0.01).
(2)根据下列表中的数据,比较两种模型的相关指数,并选择拟合精度更高、更可靠的模型,预测2021年该景区的旅游人数(单位:万人,精确到个位).
回归方程
①
②
30407
14607
参考公式、参考数据及说明:
①对于一组数据,其回归直线的斜率和截距的最小二乘法估计分别为.
②刻画回归效果的相关指数 .
③参考数据:,.
5.5
449
6.05
83
4195
9.00
表中.
【答案】(1) (2)见解析
【解析】(1)对取对数,得,
设,,先建立关于的线性回归方程,
,
模型②的回归方程为
(2)由表格中的数据,有30407>14607,即,
即,
模型①的相关指数小于模型②的,说明回归模型②的拟合效果更好.
2021年时,,预测旅游人数为(万人).
8.(甘肃省兰州市第一中学2019届高三6月最后高考冲刺模拟数学理)某商场营销人员进行某商品的市场营销调查时发现,每回馈消费者一定的点数,该商品每天的销量就会发生一定的变化,经过试点统计得到以下表:
反馈点数t
1
2
3
4
5
销量(百件)/天
0.5
0.6
1
1.4
1.7
(Ⅰ)经分析发现,可用线性回归模型拟合当地该商品销量(千件)与返还点数之间的相关关系.试预测若返回6个点时该商品每天的销量;
(Ⅱ)若节日期间营销部对商品进行新一轮调整.已知某地拟购买该商品的消费群体十分庞大,经营销调研机构对其中的200名消费者的返点数额的心理预期值进行了一个抽样调查,得到如下一份频数表:
返还点数预期值区间
(百分比)
[1,3)
[3,5)
[5,7)
[7,9)
[9,11)
[11,13)
频数
20
60
60
30
20
10
(1)求这200位拟购买该商品的消费者对返点点数的心理预期值的样本平均数及中位数的估计值(同一区间的预期值可用该区间的中点值代替;估计值精确到0.1);
(2)将对返点点数的心理预期值在和的消费者分别定义为“欲望紧缩型”消费者和“欲望膨胀型”消费者,现采用分层抽样的方法从位于这两个区间的30名消费者中随机抽取6名,再从这6人中随机抽取3名进行跟踪调查,设抽出的3人中 “欲望紧缩型”消费者的人数为随机变量,求的分布列及数学期望.
【答案】(Ⅰ)返回6个点时该商品每天销量约为2百件;(Ⅱ)(1)均值的估计值为6, 中位数的估计值为5.7;(2)详见解析.
【解析】
(Ⅰ)由题意可得:,
因为线性回归模型为,所以,解得;
故关于的线性回归方程为,
当时,,即返回6个点时该商品每天销量约为2百件.
(Ⅱ)(1)根据题意,这200位拟购买该商品的消费者对返回点数的心里预期值的平均值的估计值为:
,
中位数的估计值为.
(2)抽取6名消费者中“欲望紧缩型”消费者人数为,
“欲望膨胀型”消费者人数为.
由题意的可能取值为,
所以, ,
故随机变量的分布列为
X
1
2
3
P
.
9.下表为年至年某百货零售企业的线下销售额(单位:万元),其中年份代码年份.
年份代码
线下销售额
(1)已知与具有线性相关关系,求关于的线性回归方程,并预测年该百货零售企业的线下销售额;
(2)随着网络购物的飞速发展,有不少顾客对该百货零售企业的线下销售额持续增长表示怀疑,某调查平台为了解顾客对该百货零售企业的线下销售额持续增长的看法,随机调查了位男顾客、位女顾客(每位顾客从“持乐观态度”和“持不乐观态度”中任选一种),其中对该百货零售企业的线下销售额持续增长持乐观态度的男顾客有人、女顾客有人,能否在犯错误的概率不超过的前提下认为对该百货零售企业的线下销售额持续增长所持的态度与性别有关?
参考公式及数据:.
【答案】(1),万元;(2)能.
【解析】(1)由题易得,,,,
所以,
所以,
所以y关于x的线性回归方程为.
由于,所以当时,,
所以预测年该百货零售企业的线下销售额为万元.
(2)由题可得列联表如下:
持乐观态度
持不乐观态度
总计
男顾客
女顾客
总计
故的观测值,
由于,所以可以在犯错误的概率不超过的前提下认为对该百货零售企业的线下销售额持续增长所持的态度与性别有关.
10.(山东省烟台市2019届高三5月适应性练习二)混凝土具有原材料丰富、抗压强度高、耐久性好等特点,是目前使用量最大的土木建筑材料.抗压强度是混凝土质量控制的重要技术参数,也是实际工程对混凝土要求的基本指标.为了解某型号某批次混凝土的抗压强度(单位: )随龄期(单位:天)的发展规律,质检部门在标准试验条件下记录了10组混凝土试件在龄期分别为2,3,4,5,7,9,12,14,17,21时的抗压强度的值,并对数据作了初步处理,得到下面的散点图及一些统计量的值.
表中,.
(1)根据散点图判断与哪一个适宜作为抗压强度关于龄期的回归方程类型?选择其中的一个模型,并根据表中数据,建立关于的回归方程;
(2)工程中常把龄期为28天的混凝土试件的抗压强度视作混凝土抗压强度标准值.已知该型号混凝土设置的最低抗压强度标准值为.
(ⅰ)试预测该批次混凝土是否达标?
(ⅱ)由于抗压强度标准值需要较长时间才能评定,早期预测在工程质量控制中具有重要的意义.经验表明,该型号混凝土第7天的抗压强度与第28天的抗压强度具有线性相关关系,试估计在早期质量控制中,龄期为7天的试件需达到的抗压强度.
附: ,,
参考数据: ,.
【答案】(1)(2)(i) 达标. (ii)估计龄期为天的混凝土试件需达到的抗压强度为.
【解析】解:(1)由散点图可以判断,适宜作为抗压强度关于龄期的回归方程类型.
令,先建立关于的线性回归方程.
由于,
,
所以关于的线性回归方程为,
因此关于的线性回归方程为.
(2)(i)由(1)知,当龄期为天,即时,
抗压强度的预报值.
因为,所以预测该批次混凝土达标.
(ii)令,得.
所以估计龄期为天的混凝土试件需达到的抗压强度为.
11.(陕西省2019年高三第三次教学质量检测理)已知某种细菌的适宜生长温度为10℃~25℃,为了研究该种细菌的繁殖数量(单位:个)随温度(单位:℃)变化的规律,收集数据如下:
温度/℃
12
14
16
18
20
22
24
繁殖数量/个
20
25
33
27
51
112
194
对数据进行初步处理后,得到了一些统计量的值,如下表所示:
18
66
3.8
112
4.3
1428
20.5
其中,.
(1)请绘出关于的散点图,并根据散点图判断与哪一个更适合作为该种细菌的繁殖数量关于温度的回归方程类型(给出判断即可,不必说明理由);
(2)根据(1)的判断结果及表格数据,建立关于的回归方程(结果精确到0.1);
(3)当温度为25℃时,该种细菌的繁殖数量的预报值为多少?
参考公式:对于一组数据,其回归直线的斜率和截距的最小二成估计分别为,.
参考数据:.
【答案】(1) 更适合作为关于的回归方程.(2) .(3)245.
【解析】(1)由题意,关于的散点图如下图所示.
更适合作为关于的回归方程.
(2)由(1)因为,则,
∴,
∴,
∴关于的回归方程为.
(3)由(2)中的回归方程,令,求得,
所以当温度为时,预报值为.
12.(安徽省黄山市2019届高三毕业班第三次质量检测数学理)全民健身倡导全民做到每天参加一次以上的体育健身活动,旨在全面提高国民体质和健康水平.某部门在该市2013-2018年发布的全民健身指数中,对其中的“运动参与评分值”进行了统计,制成如图所示的散点图.
(1)根据散点图,建立关于的回归方程;
(2)从该市的市民中随机抽取了容量为150的样本,其中经常参加体育锻炼的人数为50,以频率为概率,若从这150名市民中随机抽取4人,记其中“经常参加体育锻炼”的人数为,求的分布列和数学期望.
附:对于一组数据,其回归直线的斜率和截距的最小二乘估计公式分别为,.
【答案】(1);
(2)的分布列如下:
.
【解析】
(1)由题意得:
,
.
则.
∴所求回归方程为.
(2)以频率为概率,从这150名市民中随机抽取人,经常参加体育锻炼的概率为,由题知,的可能取值为0,1,2,3,4.则
.
的分布列如下:
∴或.
13.(河南省洛阳市2019届高三第三次统一考试数学理)某商场营销人员对某商品进行市场营销调查,发现每回馈消费者一定的点数,该商品每天的销量就会发生一定的变化,经过统计得到下表:
回馈点数
1
2
3
4
5
销量(百件)/天
0.5
0.6
1
1.4
1.7
(1)经分析发现,可用线性回归模型拟合该商品每天的销量(百件)与返还点数之间的相关关系.请用最小二乘法求关于的线性回归方程,并预测若回馈6个点时该商品每天销量;
(2)已知节日期间某地拟购买该商品的消费群体十分庞大,营销调研机构对其中的200名消费者的返点数额的心理预期值进行了抽样调查,得到如下频数表:
返还点数预期值区间
频数
20
60
60
30
20
10
(i)求这200位拟购买该商品的消费者对返点点数的心理预期值的样本平均数及中位数的估计值(同一区间的预期值可用该区间的中点值代替;估计值精确到0.1);
(ii)将对返点点数的心理预期值在和的消费者分别定义为“欲望紧缩型”消费者和“欲望膨胀型”消费者,现采用分层抽样的方法从位于这两个区间的30名消费者中随机抽取6名,再从这6人中随机抽取3名进行跟踪调查,设抽出的3人中“欲望紧缩型”消费者的人数为随机变量,求的分布列及数学期望.
参考公式及数据:①,;②.
【答案】(1),2百件;(2)(i)6,;(ii)2.
【解析】
(1)易知,,
,
从而
.
所以.
则关于的线性回归方程为,
当时,,即返回6个点时该商品每天销量约为2百件.
(2)(i)根据题意,这200位拟购买该商品的消费者对返回点数的心里预期值的平均值,则 ,
所以中位数的估计值为.
(ii)抽取6名消费者中“欲望紧缩型”消费者人数为,
“欲望膨胀型”消费者人数为.
,,.
故随机变量的分布列为
1
2
3
所以.
14.(东北三省三校(辽宁省实验中学、东北师大附中、哈师大附中)2019届高三第三次模拟考试数学理)现代社会,“鼠标手”已成为常见病,一次实验中,10名实验对象进行160分钟的连续鼠标点击游戏,每位实验对象完成的游戏关卡一样,鼠标点击频率平均为180次/分钟,实验研究人员测试了实验对象使用鼠标前后的握力变化,前臂表面肌电频率()等指标.
(I)10 名实验对象实验前、后握力(单位:)测试结果如下:
实验前:346,357,358,360,362,362,364,372,373,376
实验后:313,321,322,324,330,332,334,343,350,361
完成茎叶图,并计算实验后握力平均值比实验前握力的平均值下降了多少?
(Ⅱ)实验过程中测得时间(分)与10名实验对象前臂表面肌电频率()的中的位数()的九组对应数据为,.建立关于时间的线性回归方程;
(Ⅲ)若肌肉肌电水平显著下降,提示肌肉明显进入疲劳状态,根据(Ⅱ)中9组数据分析,使用鼠标多少分钟就该进行休息了?
参考数据:;
参考公式:回归方程中斜率和截距的最小二乘估计公式分别为:
,
【答案】(I)茎叶图见解析,;(Ⅱ);(Ⅲ)60分钟.
【解析】(Ⅰ)根据题意得到茎叶图如下图所示:
由图中数据可得 ,
,
∴ ,
∴故实验前后握力的平均值下降.
(Ⅱ)由题意得,
,
,
又 ,
∴,
∴,
∴关于时间的线性回归方程为.
(Ⅲ)九组数据中40分钟到60分钟的下降幅度最大,提示60分钟时肌肉已经进入疲劳状态,
故使用鼠标60分钟就该休息了.
15.(安徽省蚌埠市2019届高三年级第三次教学质量检查考试数学理)某地种植常规稻和杂交稻,常规稻的亩产稳定为485公斤,今年单价为3.70元/公斤,估计明年单价不变的可能性为,变为3.90元/公斤的可能性为,变为4.00的可能性为.统计杂交稻的亩产数据,得到亩产的频率分布直方图如图①.统计近10年杂交稻的单价(单位:元/公斤)与种植亩数(单位:万亩)的关系,得到的10组数据记为,并得到散点图如图②.
(1)根据以上数据估计明年常规稻的单价平均值;
(2)在频率分布直方图中,各组的取值按中间值来计算,求杂交稻的亩产平均值;以频率作为概率,预计将来三年中至少有二年,杂交稻的亩产超过795公斤的概率;
(3)①判断杂交稻的单价(单位:元/公斤)与种植亩数(单位:万亩)是否线性相关?若相关,试根据以下的参考数据求出关于的线性回归方程;
②调查得知明年此地杂交稻的种植亩数预计为2万亩.若在常规稻和杂交稻中选择,明年种植哪种水稻收入更高?
统计参考数据:,,,,
附:线性回归方程,.
【答案】(1)3.9;(2)0.104;(3)①;②选择种杂交稻收入更高.
【解析】解:(1)设明年常规稻的单价为,则的分布列为
3.70
3.90
4.00
0.1
0.7
0.2
,
估计明年常规稻的单价平均值为3.9(元/公斤);
(2)杂交稻的亩产平均值为:
.
依题意知杂交稻的亩产超过795公斤的概率,
则将来三年中至少二年,杂交稻的亩产超过795公斤的概率为:
.
(3)①∵散点图中各点大致分布在一条直线附近,
∴可以判断杂交稻的单价与种植亩数线性相关,
由题中提供的数据得:,
由得,
∴线性回归方程为,
② 估计明年杂交稻的单价元/公斤;
估计明年杂交稻的每亩平均收入为元/亩,
估计明年常规稻的每亩平均收入为元/亩,
∵,∴明年选择种杂交稻收入更高.
16.(湖南湖北八市十二校(湖南师范大学附属中学、衡阳八中等)2019届高三第二次调研联考数学理)近期,某公交公司分别推出支付宝和微信扫码支付乘车活动,活动设置了一段时间的推广期,由于推广期内优惠力度较大,吸引越来越多的人开始使用扫码支付.某线路公交车队统计了活动刚推出一周内每一天使用扫码支付的人次,用表示活动推出的天数,表示每天使用扫码支付的人次(单位:十人次),统计数据如表所示:
1
2
3
4
5
6
7
6
11
21
34
66
101
196
根据以上数据,绘制了如图所示的散点图.
(1)根据散点图判断,在推广期内,与均为大于零的常数)哪一个适宜作为扫码支付的人次关于活动推出天数的回归方程类型?(给出判断即可,不必说明理由);
(2)根据(1)的判断结果及表l中的数据,求关于的回归方程,并预测活动推出第8天使用扫码支付的人次;
(3)推广期结束后,车队对乘客的支付方式进行统计,结果如表所示:
支付方式
现金
乘车卡
扫码
比例
已知该线路公交车票价为2元,使用现金支付的乘客无优惠,使用乘车卡支付的乘客享受8折优惠,扫码支付的乘客随机优惠,根据统计结果得知,使用扫码支付的乘客,享受7折优惠的概率为,享受8折优惠的概率为,享受9折优惠的概率为.根据所给数据以事件发生的频率作为相应事件发生的概率,估计一名乘客一次乘车的平均费用.
参考数据:
66
1.54
2.711
50.12
3.47
其中,.
【答案】(1)适宜作为扫码支付的人数关于活动推出天数的回归方程类型;(2)关于x的回归方程式为:,第8天使用扫码支付的人次为347人次;
(3)元.
【解析】解:(1)根据散点图判断,适宜作为扫码支付的人数y关于活动推出天数x的回归方程类型;
(2)由(1)知回归方程为,
两边同时取常用对数得:,
设,
,
又,,,
,
把样本中心点代入,
即,
解得:,
,
,
关于x的回归方程式为:,
把代入上式得,,
活动推出第8天使用扫码支付的人次为347人次;
(3)记一名乘客乘车支付的费用为Z,则Z的取值可能为:2,1.8,1.6,1.4,
则,
,
,
;
分布列为:
Z
2
1.8
1.6
1.4
P
0.1
0.15
0.7
0.05
所以,一名乘客一次乘车的平均费用为:(元).
17.(广西桂林市、崇左市2019届高三下学期二模联考数学理)某汽车公司为调查店个数对该公司汽车销量的影响,对同等规模的四座城市的店一季度汽车销量进行了统计,结果如下:
(1)根据统计的数据进行分析,求关于的线性回归方程;
(2)现要从三座城市的10个店中选取3个做深入调查,求城市中被选中的店个数的分布列和期望.
附:回归方程中的斜率和截距的最小二乘法估计公式分别为:
;.
【答案】(1);(2)见解析.
【解析】
(1);,
.
.
所以回归直线方程为.
(2)的可能取值为:0,1,2,3.
;;
;.
的分布列为
0
1
2
3
所以的期望为.
18.(贵州省贵阳第一中学、云南师大附中、广西南宁三中2019届高三“333”高考备考诊断联考数学理)为了适应高考改革,某中学推行“创新课堂”教学.高一平行甲班采用“传统教学”的教学方式授课,高一平行乙班采用“创新课堂”的教学方式授课,为了比较教学效果,期中考试后,分别从两个班中各随机抽取20名学生的成绩进行统计分析,结果如表:(记成绩不低于120分者为“成绩优秀”)
分数
[80,90)
[90,100)
[100,110)
[110,120)
[120,130)
[130,140)
[140,150]
甲班频数
1
1
4
5
4
3
2
乙班频数
0
1
1
2
6
6
4
(1)由以上统计数据填写下面的2×2列联表,并判断是否有95%以上的把握认为“成绩优秀与教学方式有关”?
甲班
乙班
总计
成绩优秀
成绩不优秀
总计
(2)现从上述样本“成绩不优秀”的学生中,抽取3人进行考核,记“成绩不优秀”的乙班人数为X,求X的分布列和期望.
参考公式:,其中.
临界值表
P()
0.100
0.050
0.010
0.001
2.706
3.841
6.635
10.828
【答案】(1)有以上的把握认为“成绩优秀与教学方式有关”.(2)见解析.
【解析】
(1)补充的列联表如下表:
甲班
乙班
总计
成绩优秀
成绩不优秀
总计
根据列联表中的数据,得的观测值为 ,
所以有以上的把握认为“成绩优秀与教学方式有关”.
(2)的可能取值为,,,,
,
,
,
,
所以的分布列为
19.(山东省淄博市部分学校2019届高三5月阶段性检测三模数学(理)某医院治疗白血病有甲、乙两套方案,现就70名患者治疗后复发的情况进行了统计,得到其等高条形图如图所示(其中采用甲、乙两种治疗方案的患者人数之比为).
(1)补充完整列联表中的数据,并判断是否有的把握认为甲、乙两套治疗方案对患者白血病复发有影响;
(2)从复发的患者中抽取3人进行分析,求其中接受“乙方案”治疗的人数的数学期望.
附:
,其中.
【答案】(1)没有;(2).
【解析】
(1)
复发
未复发
总计
甲方案
20
30
50
乙方案
2
18
20
总计
22
48
70
由于,
所以没有的把握认为甲、乙两套治疗方案对患者白血病复发有影响;
(2)接受“乙方案”治疗的人数.
;;;
.
20.(2017届四川省成都市石室中学高三二诊模拟考试数学理)中央政府为了对应因人口老龄化而造成的劳动力短缺等问题,拟定出台“延迟退休年龄政策”,为了了解人们对“延迟退休年龄政策”的态度,责成人社部进行调研,人社部从网上年龄在15~65的人群中随机调查50人,调查数据的频率分布直方图和支持“延迟退休”的人数与年龄的统计结果如下:
(1)由以上统计数据填下面2×2列联表,并问是否有90%的把握认为以45岁为分界点对“延迟退休年龄政策”的支持度有差异:
(2)若从年龄在,的被调查人中各随机选取两人进行调查,记选中的4人中支持“延迟退休”人数为,求随机变量的分布列及数学期望.
参考数据:
.
【答案】(1)见解析;(2)见解析.
【解析】(1)由频率分布直方图知,被调查的50人中年龄在45岁以上的人数为,年龄在45岁以下的人数为50-10=40,其中45岁以上支持“延迟退休”的人数为3,45岁以下支持“延迟退休”人数为25,则2×2列联表如下:
.
所以有90%的把握认为以45岁为分界点对“延迟退休年龄政策”的支持度有差异.
(2)由频率分布直方图知,被调查的50人中年龄在和年龄在的人数都为,其中年龄在和年龄在支持: “延迟退休”的人数分布为2,1,故的所有可能取值为0,1,2,3.
,,
,.
所以的分布列是
所以的期望值是 .
21.(山西省晋城市2019届高三第三次模拟考试数学理)某机构为了了解不同年龄的人对一款智能家电的评价,随机选取了50名购买该家电的消费者,让他们根据实际使用体验进行评分.
(Ⅰ)设消费者的年龄为,对该款智能家电的评分为.若根据统计数据,用最小二乘法得到关于的线性回归方程为,且年龄的方差为,评分的方差为.求与的相关系数,并据此判断对该款智能家电的评分与年龄的相关性强弱.
(Ⅱ)按照一定的标准,将50名消费者的年龄划分为“青年”和“中老年”,评分划分为“好评”和“差评”,整理得到如下数据,请判断是否有的把握认为对该智能家电的评价与年龄有关.
好评
差评
青年
8
16
中老年
20
6
附:线性回归直线的斜率;相关系数,独立性检验中的,其中.
临界值表:
0.050
0.010
0.001
3.841
6.635
10.828
【答案】(Ⅰ),相关性较强;(Ⅱ)有的把握认为对该智能家电的评价与年龄有关.
【解析】
(Ⅰ)相关系数
.
故对该款智能家电的评分与年龄的相关性较强.
(Ⅱ)由列联表可得
.
故有的把握认为对该智能家电的评价与年龄有关.
22.(山东省安丘市、诸城市、五莲县、兰山区2019届高三5月校级联合考试数学理)某手机公司生产某款手机,如果年返修率不超过千分之一,则生产部门当年考核优秀,现获得该公司2010-2018年的相关数据如下表所示:
年份
2010
2011
2012
2013
2014
2015
2016
2017
2018
年生产量(万台)
3
4
5
6
7
7
9
10
12
产品年利润(千万元)
3.6
4.1
4.4
5.2
6.2
7.8
7.5
7.9
9.1
年返修量(台)
47
42
48
50
92
83
72
87
90
(1)从该公司2010-2018年的相关数据中任意选取3年的数据,以表示3年中生产部门获得考核优秀的次数,求的分布列和数学期望;
(2)根据散点图发现2015年数据偏差较大,如果去掉该年的数据,试用剩下的数据求出年利润(千万元)关于年生产量(万台)的线性回归方程(精确到0.01).部分计算结果:,,.
附:;线性回归方程中,,.
【答案】(1)见解析(2)
【解析】解:(1)由数据可知,2012,2013,2016,2017,2018五个年份考核优秀,
所以的所有可能取值为0,1,2,3,
,,
,,
故的分布列为:
0
1
2
3
∴
(2)因为,,
所以去掉2015年的数据后不影响的值,
所以,
去掉2015年数据后,,,
所以,
故回归方程为:.
23.(河南省百校联盟2019届高三考前仿真试卷数学理)为了调查煤矿公司员工的饮食习惯与月收入之间的关系,随机抽取了30名员工,并制作了这30人的月平均收入的频率分布直方图和饮食指数表(说明:图中饮食指数低于70的人,饮食以蔬菜为主;饮食指数高于70的人,饮食以肉类为主).其中月收入4000元以上员工中有11人饮食指数高于70.
格谦教育收集整理,更多优惠资料请搜索淘宝店铺:格谦教育 https://shop174652146.taobao.com
20
21
21
25
32
33
36
37
42
43
44
45
45
58
58
59
61
66
74
75
76
77
77
78
78
82
83
85
86
90
(Ⅰ)是否有95%的把握认为饮食习惯与月收入有关系?若有请说明理由,若没有,说明理由并分析原因;
(Ⅱ)以样本中的频率作为概率,从该公司所有主食蔬菜的员工中随机抽取3人,这3人中月收入4000元以上的人数为,求的分布列与期望;
(Ⅲ)经调查该煤矿公司若干户家庭的年收入(万元)和年饮食支出(万元)具有线性相关关系,并得到关于的回归直线方程:.若该公司一个员工与其妻子的月收入恰好都为这30人的月平均收入(该家庭只有两人收入),估计该家庭的年饮食支出费用.
附:
.
0.15
0.10
0.05
0.025
0.010
2.072
2.706
3.841
5.024
6.635
【答案】(Ⅰ)有;(Ⅱ);(Ⅲ)3.0552万元.
【解析】(Ⅰ)根据频率分布直方图,月收入4000元以上的人数,
所以完成下列列联表如下:
月收入4000元以下
月收入4000元以上
合计
主食蔬菜
8
10
18
主食肉类
1
11
12
合计
9
21
30
所以,故有95%的把握认为饮食习惯与月收入有关系.
(Ⅱ)从公司所有主食蔬菜中的员工中任选1人, 该人月收入4000元以上的概率.
可取0,1,2,3.
所以.
的分布列为
0
1
2
3
∵,
∴.
(Ⅲ)根据频率分布直方图,(百元).
所以(万元),故该家庭的年饮食支出费用约为3.0552万元.
24.(安徽省合肥市2019届高三第三次教学质量检测数学理)在第十五次全国国民阅读调查中,某地区调查组获得一个容量为的样本,其中城镇居民人,农村居民人.在这些居民中,经常阅读的城镇居民人,农村居民人.
(Ⅰ)填写下面列联表,并判断是否有的把握认为,经常阅读与居民居住地有关?
城镇居民
农村居民
合计
经常阅读
不经常阅读
合计
(Ⅱ)从该地区居民城镇的居民中,随机抽取位居民参加一次阅读交流活动,记这位居民中经常阅读的人数为,若用样本的频率作为概率,求随机变量的分布列和期望.
附:,其中
【答案】(Ⅰ)见解析;(Ⅱ)见解析
【解析】(Ⅰ)由题意得:
城镇居民
农村居民
合计
经常阅读
不经常阅读
合计
则 ,
所以,有的把握认为经常阅读与居民居住地有关.
(Ⅱ)根据样本估计,从该地区城镇居民中随机抽取人,抽到经常阅读的人的概率是,且,所以的分布列为:
.