全国统考2022版高考数学大一轮复习第12章统计与统计案例第2讲变量间的相关关系与统计案例2备考试题(含解析)
展开第十二章 统计与统计案例
第二讲 变量间的相关关系与统计案例
1.[2021贵阳市四校第二次联考]某产品的宣传费用x(单位:万元)与销售额y(单位:万元)的统计数据如表所示:
宣传费用x/万元 | 2 | 3 | 4 | 5 |
销售额y/万元 | 24 | 30 | 42 | 50 |
根据上表可得回归方程=9x+,则宣传费用为6万元时,销售额最接近 ( )
A.55万元 B.60万元 C.62万元 D.65万元2.[2021江西红色七校第一次联考]某大型电子商务平台每年都会举行“双11”商业促销狂欢活动,现统计了该平台从2011年到2019年共9年“双11”当天的销售额(单位:亿元)并作出散点图,将销售额y看成年份序号x(2011年作为第1年)的函数.运用Excel软件,分别选择回归直线和三次多项式回归曲线进行拟合,拟合效果如图12-2-1所示,则下列说法错误的是 ( )
图12-2-1
A.销售额y与年份序号x呈正相关关系
B.根据三次多项式函数可以预测2020年“双11”当天的销售额约为2 684.54亿元
C.销售额y与年份序号x线性相关关系不显著
D.三次多项式回归曲线的拟合效果好于回归直线的拟合效果
3.[2020南昌市测试]已知一组样本数据(x1,y1),(x2,y2),(x3,y3),…,(x6,y6),用最小二乘法得到其线性回归方程为=-2x+4,若x1,x2,x3,…,x6的平均数为1,则y1+y2+y3+…+y6=( )
A.10 B.12 C.13 D.14
4.[2020太原模拟]为检验某种药物预防某一疾病的效果,进行了动物试验,得到如下列联表:
| 患病 | 未患病 | 总计 |
服用药 | 10 | 45 | 55 |
没服用药 | 20 | 30 | 50 |
总计 | 30 | 75 | 105 |
由上述数据给出下列结论,其中正确结论的个数是 ( )
①不能在犯错误的概率不超过0.05的前提下认为药物有效;
②能在犯错误的概率不超过0.025的前提下认为药物有效;
③不能在犯错误的概率不超过0.010的前提下认为药物有效;
④能在犯错误的概率不超过0.005的前提下认为药物有效.
附:K2=,n=a+b+c+d;
P(K2≥k0) | 0.05 | 0.025 | 0.010 | 0.005 |
k0 | 3.841 | 5.024 | 6.635 | 7.879 |
A.1 B.2 C.3 D.4
5.[2021蓉城名校联考]随着新冠肺炎疫情防控进入常态化,人们的生产生活逐步步入正轨,为拉动消费,成都市先后发行了四批(每批2亿元)消费券.某调查机构随机抽取了50人,对是否赞同这种拉动消费的方式进行调查,结果如下表,其中年龄低于45岁的总人数与不低于45岁的总人数之比为3∶2.
年龄/岁 | [15,25) | [25,35) | [35,45) | [45,55) | [55,65) | [65,75] |
抽取人数 | 5 | m | 15 | 10 | n | 5 |
赞同人数 | 5 | 10 | 12 | 7 | 2 | 1 |
(1)求m,n的值;
(2)若以年龄45岁为分界点,由以上统计数据完成下面2×2列联表,并判断是否有99%的把握认为赞同的态度与人的年龄有关;
| 年龄低于45岁的人数 | 年龄不低于45岁的人数 | 合计 |
赞同 |
|
|
|
不赞同 |
|
|
|
合计 |
|
|
|
(3)若从年龄在[55,65)的被调查人中随机选取2人进行追踪调查,求这2人中至少有1人不赞同的概率.
附:K2=,其中n=a+b+c+d.
P(K2≥k0) | 0.15 | 0.10 | 0.05 | 0.025 | 0.010 | 0.005 | 0.001 |
k0 | 2.072 | 2.706 | 3.841 | 5.024 | 6.635 | 7.879 | 10.828 |
6.[2021陕西百校联考]某出租汽车公司决定购买一批新的出租车以代替原来报废的出租车,现有A,B两款车型,根据以往这两种出租车车型的数据得到两款车型出租车使用寿命的频数表如下:
使用寿命 | 4年 | 5年 | 6年 | 7年 |
A型/辆 | 10 | 20 | 45 | 25 |
B型/辆 | 15 | 35 | 40 | 10 |
(1)完成下列2×2列联表,并判断是否有99%的把握认为出租车的使用寿命与汽车车型有关?
| 使用寿命 不高于5年 | 使用寿命 不低于6年 | 总计 |
A型 |
|
|
|
B型 |
|
|
|
总计 |
|
|
|
(2)司机师傅小李准备在一辆开了3年的A型车和一辆开了3年的B型车中选择一辆车,为了尽最大可能实现3年内(含3年)不换车,试通过计算说明小李应如何选择.
参考公式:K2=,其中n=a+b+c+d.
参考数据:
P(K2≥k0) | 0.050 | 0.010 | 0.001 |
k0 | 3.841 | 6.635 | 10.828 |
7.[2021陕西省部分学校摸底检测]2019年12月27日,国家统计局公布全国规模以上工业企业月累计营业收入利润率数据如下表:
月份累计 | 1~2月 | 1~3月 | 1~4月 | 1~5月 | 1~6月 | 1~7月 | 1~8月 | 1~9月 | 1~10月 | 1~11月 |
月份累计 代码x | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | 10 |
营业收入 利润率 y(%) | 4.79 | 5.31 | 5.52 | 5.72 | 5.86 | 5.87 | 5.87 | 5.91 | 5.85 | 5.91 |
(1)根据表中有关数据请在图12-2-2中补充完整y与x的折线图,判断x与哪一个更适宜作为y关于x的回归方程类型,并说明理由;
图12-2-2
(2)根据(1)的判断结果及表中数据,建立y关于x的回归方程(系数精确到0.01);
(3)根据(2)得出的回归方程,预测1~12月月累计营业收入利润率(%)的值为多少?
参考公式:对于一组数据(u1,v1),(u2,v2),…,(un,vn),其回归直线u的斜率和截距的最小二乘估计分别为,.
参考数据:
(xI-)2 | (wI-)2 | (xI-)(yI-) | (wI-)(yI-) | |||
5.50 | 5.66 | 2.25 | 82.50 | 4.52 | 8.14 | 2.07 |
表中wI=,wI,≈3.32.
8.[角度创新]某农业种子公司研发了一豌豆的新品种,新品种的豌豆豆荚长度比原来有所增加,研发人员进行了试种试验.将同一块田地(超过1亩)平均分为两部分,分别种植新品种和原来的品种,其他的生长条件完全相同.收获后,分别挑选6 cm以上的合格品,按每20个一袋装袋密封,从中各随机抽取5袋,测量豆荚长度(单位:dm),将所测得的数据按[0.6,0.8),[0.8,1.0),[1.0,1.2),[1.2,1.4),[1.4,1.6]分为5组.新品种豌豆豆荚长度的统计结果的频率分布直方图如图12-2-3所示,原来品种的豌豆豆荚长度的统计结果如频数分布表所示.
图12-2-3
原来品种的豌豆 豆荚长度/dm | [0.6,0.8) | [0.8,1.0) | [1.0,1.2) | [1.2,1.4) | [1.4,1.6] |
频数 | 16 | 39 | 31 | 10 | 4 |
(1)求a的值并估计新品种豌豆豆荚长度的平均数(结果保留两位小数).
(2)如果豌豆豆荚长度不低于1.0 dm,则认为豌豆豆荚长度优良,否则,认为豌豆豆荚长度不优良,完成下面的2×2列联表:
| 豌豆豆荚长度不优良 | 豌豆豆荚长度优良 | 总计 |
新品种 |
|
|
|
原来的品种 |
|
|
|
总计 |
|
|
|
并判断能否有97.5%的把握认为豌豆豆荚长度优良与否与豌豆品种有关.
(3)试验结束以后,将抽取的两种豌豆装箱,每2袋装1箱,同品种优先装,箱子外表相同,现从这5箱中任选2箱,求选中的2箱中的豌豆全是新品种豌豆的概率.
附:K2=,n=a+b+c+d,
P(K2≥k) | 0.15 | 0.10 | 0.05 | 0.025 | 0.010 | 0.005 | 0.001 |
k | 2.072 | 2.706 | 3.841 | 5.024 | 6.635 | 7.879 | 10.828 |
9.[2021河南新乡月考][与数列综合]为深入贯彻党中央决策部署,努力实现全面建设小康社会目标任务,某贫困地区的广大党员干部积极开展精准扶贫工作.经过多年的精心帮扶,截至2018年年底,该地区仅剩部分家庭的人均年纯收入尚未达到8 000元.2019年7月,为估计该地区能否在2020年实现全部家庭人均年纯收入达到8 000元的目标,统计了该地区当时最贫困的一个家庭2019年1月至6月的人均月纯收入(记2019年1月,2019年2月,…分别为x=1,x=2,…,依此类推),作出散点图如图12-2-4所示.
图12-2-4
根据相关性分析,发现这个家庭人均月纯收入y(单位:元)与时间代码x之间具有较强的线性相关关系,由此估计该家庭2020年能实现人均年纯收入达到8 000元的目标.但2020年年初突如其来的新冠肺炎疫情影响了家庭经济收入,该家庭2020年第一季度每月的人均月纯收入只有2019年12月的预估值的.
(1)求y关于x的线性回归方程;
(2)求该家庭2020年3月的人均月纯收入;
(3)如果以该家庭2020年3月的人均月纯收入为基数,以后每月增长率为8%,问该家庭2020年年底能否实现人均年纯收入达到8 000元的目标?
参考数据:xIyI=9 310,6=8 610,1.0810≈2.16.
参考公式:回归直线y=bx+a中斜率和截距的最小二乘估计分别为,.
答 案
第十二章 统计与统计案例
第二讲 变量间的相关关系与统计案例
1.B (2+3+4+5)=3.5,(24+30+42+50)=36.5,由回归直线过样本点的中心(,),得36.5=9×3.5+,得=5,所以=9x+5.当x=6时,=9×6+5=59,所以销售额最接近60万元,故选B.
2.C 由题图可以看出,两条拟合曲线都是呈单调上升的变化趋势,所以销售额y与年份序号x呈正相关关系,所以A选项正确;由题意可知,2020年的年份序号为10,将x=10代入三次多项式函数得,y=0.074×103+29.31×102-33.09×10+10.44=2 684.54,所以B选项正确;回归直线的相关系数R2=0.936非常接近于1,所以回归直线的拟合效果非常好,即销售额y与年份序号x线性相关关系显著,所以C选项不正确;因为0.999>0.936,所以三次多项式回归曲线的拟合效果要好于回归直线的拟合效果,所以D选项正确.故选C.
【名师点拨】 R2叫作相关指数,R2≤1.R2越大,即残差的平方和越小,回归平方和越大,拟合效果越好;R2越小,即残差的平方和越大,回归平方和越小,拟合效果越差.
3.B 回归直线过样本点的中心(,),因为=1,所以=-2×1+4=2,所以y1+y2+y3+…+y6=6×2=12.故选B.
4.B 由表格数据可得K2的观测值k=≈6.1>5.024,所以由参考数据知能在犯错误的概率不超过0.025的前提下认为药物有效,故②正确;又6.1<6.635,所以由参考数据知不能在犯错误的概率不超过0.010的前提下认为药物有效,故③正确;由参考数据易知①④错误.综上所述,正确结论的个数为2,故选B.
5.(1)由题意,得5+m+15+10+n+5=50,
且(5+m+15)∶(10+n+5)=3∶2,解得m=10,n=5.
(2)由统计数据填写2×2列联表,如下:
| 年龄低于45岁的人数 | 年龄不低于45岁的人数 | 合计 |
赞同 | 27 | 10 | 37 |
不赞同 | 3 | 10 | 13 |
合计 | 30 | 20 | 50 |
可得K2的观测值k=≈9.98>6.635,
所以若以年龄45岁为分界点,有99%的把握认为赞同的态度与人的年龄有关.
(3)设年龄在[55,65)的被调查人中不赞同“发行消费券”的人为A,B,C,赞同“发行消费券”的人为a,b,则从5人中随机选取2人,有AB,AC,Aa,Ab,BC,Ba,Bb,Ca,Cb,ab,共10个基本事件;其中选取的2人中至少有1人不赞同“发行消费券”,有AB,AC,Aa,Ab,BC,Ba,Bb,Ca,Cb,共9个基本事件,所以这2人中至少有1人不赞同“发行消费券”的概率P=.
【素养提升】 概率与统计题目通常涉及数据的搜集、整理、分析的过程,考查频率分布直方图、分层抽样、独立性检验、古典概型等知识,体现理性思维、数学应用学科素养,培养考生的数据收集、数据处理、数学建模能力,以及数学应用意识.
6.(1)根据题目所给的数据得到如下2×2列联表,
| 使用寿命 不高于5年 | 使用寿命 不低于6年 | 总计 |
A型 | 30 | 70 | 100 |
B型 | 50 | 50 | 100 |
总计 | 80 | 120 | 200 |
则K2=≈8.333>6.635,
所以有99%的把握认为出租车的使用寿命与汽车车型有关.
(2)记事件“小李选择开了3年的A型出租车3年内(含3年)换车”为A1,事件“小李选择开了3年的B型出租车3年内(含3年)换车”为A2,则P(A1)==0.75,P(A2)==0.9,
因为P(A1)<P(A2),
所以为了尽最大可能实现3年内(含3年)不换车,小李应选择A型出租车.
7.(1)补充完整的折线图如图D 12-2-1所示,可知选用更适宜.理由:根据折线图知折线的形状更接近y=c+d的图象.
图D 12-2-1
(2)令w=,先建立y关于w的线性回归方程.
∵≈0.46,
∴=5.66-0.46×2.25≈4.63,
∴y关于w的线性回归方程为=4.63+0.46w,
∴y关于x的回归方程为=4.63+0.46.
(3)由(2)可知,当x=11时,=4.63+0.46×3.32≈6.16,
∴预测1~12月月累计营业收入利润率(%)的值为6.16.
8.(1)由频率分布直方图的性质可得0.5×0.2+1×0.2+2×0.2+2a×0.2=1,解得a=0.75.
根据频率分布直方图中的数据,可得从左到右每个小矩形的面积分别为0.5×0.2=0.1,1×0.2=0.2,2×0.2=0.4,0.75×0.2=0.15,0.75×0.2=0.15,
所以估计新品种豌豆豆荚长度的平均数=0.7×0.1+0.9×0.2+1.1×0.4+1.3×0.15+1.5×0.15=1.11(dm).
所以a的值为0.75,这批新品种豌豆豆荚长度的平均数的估计值为1.11 dm.
(2)由频率分布直方图可得,新品种豌豆豆荚长度不低于1.0 dm的有100×(0.4+0.15+0.15)=70(个),新品种豌豆豆荚长度低于1.0 dm的有100-70=30(个).
由频数分布表可得,原来品种的豌豆豆荚长度不低于1.0 dm的有31+10+4=45(个),
原来品种的豌豆豆荚长度低于1.0 dm的有100-45=55(个).
所以补全的2×2列联表如下表所示.
| 豌豆豆荚长度不优良 | 豌豆豆荚长度优良 | 总计 |
新品种 | 30 | 70 | 100 |
原来的品种 | 55 | 45 | 100 |
总计 | 85 | 115 | 200 |
因为K2=≈12.79>5.024,
所以有97.5%的把握认为豌豆豆荚长度优良与否与豌豆品种有关.(3)易知全是新品种豌豆的箱子有2个,分别记为A1,A2,全是原来品种的豌豆的箱子有2个,分别记为B1,B2,两种品种各装1袋的箱子有1个,记为C,
则从这5箱豌豆中任选2箱的情况有{A1,A2},{A1,B1},{A1,B2},{A1,C},{A2,B1},{A2,B2},{A2,C},{B1,B2},{B1,C},{B2,C},共10种,
选中的2箱中的豌豆全是新品种豌豆的情况有{A1,A2},共1种,所以选中的2箱中的豌豆全是新品种豌豆的概率为.
9.(1)依题意得,=3.5,=410,
=91,xiyi=9 310,所以=40,
=410-40×3.5=270,
所以y关于x的线性回归方程为=40x+270.
(2)令x=12,得2019年12月该家庭人均月纯收入的预估值为40×12+270=750(元).
故2020年3月该家庭的人均月纯收入为750×=500(元).
(3)根据题意,从2020年3月起,该家庭的人均月纯收入构成等比数列,设该等比数列的前10项之和为S10.则S10=500+500×(1+0.08)+…+500×(1+0.08)9==7 250,
所以该家庭2020年全年12个月人均年纯收入为500+500+S10=8 250(元),8 250>8 000.
故该家庭2020年年底能实现人均年纯收入达到8 000元的目标.
高中数学高考2 第2讲 变量间的相关关系与统计案例: 这是一份高中数学高考2 第2讲 变量间的相关关系与统计案例,共19页。试卷主要包含了变量间的相关关系,两个变量的线性相关,独立性检验,下面是2×2列联表等内容,欢迎下载使用。
(新高考)高考数学一轮复习第63讲《变量间的相关关系、统计案例》达标检测(解析版): 这是一份(新高考)高考数学一轮复习第63讲《变量间的相关关系、统计案例》达标检测(解析版),共18页。
(新高考)高考数学一轮复习考点复习讲义第63讲《变量间的相关关系、统计案例》(讲)(解析版): 这是一份(新高考)高考数学一轮复习考点复习讲义第63讲《变量间的相关关系、统计案例》(讲)(解析版),共11页。试卷主要包含了变量间的相关关系,两个变量的线性相关,独立性检验等内容,欢迎下载使用。