所属成套资源:2024高考数学一轮总复习(导与练)
2024高考数学一轮总复习(导与练)第九章第3节 成对数据的统计分析
展开这是一份2024高考数学一轮总复习(导与练)第九章第3节 成对数据的统计分析,共16页。
第3节 成对数据的统计分析
[选题明细表]
知识点、方法 | 题号 |
散点图、回归分析 | 1,2,3,4,6 |
独立性检验 | 5,7,9,10,11 |
综合应用 | 8,12,13,14 |
1.已知变量x与y正相关,且由观测数据算得样本平均数=3,=3.5,则由该观测数据算得经验回归方程可能为( A )
A.=0.4x+2.3 B.=2x-2.4
C.=-2x+9.5 D.=-0.3x+4.4
解析:由变量x与y正相关,排除C,D选项.将点(3,3.5)代入A,B选项的方程中可知,选项A成立.
2.(多选题)(2022·广东惠州月考)某种产品的价格x(单位:元/kg)与需求量y(单位:kg)之间的对应数据如表所示,
x | 10 | 15 | 20 | 25 | 30 |
y | 11 | 10 | 8 | 6 | 5 |
根据表中的数据可得经验回归方程为=x+14.4,则以下结论正确的是( BC )
A.y与x正相关
B.y与x负相关
C.经验回归直线过点(20,8)
D.该产品价格为35元/kg时,日需求量大约为3.4 kg
解析:由表格数据可知,随着价格x的增加,需求量y随之减小,所以y与x负相关.
因为==20,
==8,
经验回归方程=x+14.4必过点(20,8),
所以8=·20+14.4,解得=-0.32,
所以当x=35时,=-0.32×35+14.4=3.2,日需求量大约为3.2 kg.
3.一只红铃虫的产卵数y和温度x有关,现收集了6组观测数据,y(单位:个)与温度x(单位:℃)得到样本数据(xi,yi)(i=1,2,3,4,5,6),令zi=ln yi,并将(xi,zi)绘制成如图所示的散点图.若用非线性经验回归方程=对y与x的关系进行拟合,则( A )
A.>1,>0 B.>1,<0
C.0<<1,>0 D.0<<1,<0
解析:因为=,令z=ln y,则z与x的经验回归方程为=x+ln .根据散点图可知z与x正相关,所以>0.由经验回归方程图象可知,经验回归方程的纵截距大于0,即ln >0,所以>1.
4.(2022·辽宁大连二模)色差和色度是衡量毛绒玩具质量优劣的重要指标,现抽检一批产品测得如下数据:
色差x | 21 | 23 | 25 | 27 | 29 | 31 |
色度y | 15 | 16 | 19 | 20 | 21 | 23 |
已知该产品的色度y和色差x之间满足线性相关关系,且=0.8x+,现有一对测量数据为(33,25.2),则该数据的残差为( A )
A.0.6 B.0.4
C.-0.4 D.-0.6
解析:由表中数据可得=×(21+23+25+27+29+31)=26,=×(15+16+
19+20+21+23)=19,
将(26,19)代入经验回归方程得=-1.8.
所以=0.8x-1.8.
将x=33代入,可得=0.8×33-1.8=24.6,
因此其残差为25.2-24.6=0.6.
5.某机构为研究中老年人坚持锻炼与患糖尿病、高血压、冠心病、关节炎四种慢性疾病之间的关系,随机调查部分中老年人,统计数据如下表1至表4,则这四种慢性疾病可以通过坚持锻炼来预防的可能性最大的是( B )
表1
| 患糖尿病 | 未患糖尿病 |
坚持锻炼 | 6 | 14 |
不坚持锻炼 | 7 | 25 |
表2
| 患高血压 | 未患高血压 |
坚持锻炼 | 2 | 18 |
不坚持锻炼 | 11 | 21 |
表3
| 患冠心病 | 未患冠心病 |
坚持锻炼 | 4 | 16 |
不坚持锻炼 | 9 | 23 |
表4
| 患关节炎 | 未患关节炎 |
坚持锻炼 | 7 | 13 |
不坚持锻炼 | 6 | 26 |
A.糖尿病 B.高血压
C.冠心病 D.关节炎
解析:由表1得=≈0.43,
由表2得==3.9,
由表3得=≈0.43,
由表4得=≈1.73,
所以这四种慢性疾病可以通过坚持锻炼来预防的可能性最大的是高血压.
6.(2022·陕西西安模拟)小华为了研究数学名次和物理名次的相关关系,记录了本班五名同学的数学和物理的名次,如图.后来发现第四名同学数据记录有误,那么去掉数据D(3,10)后,下列说法错误的是( B )
A.样本相关系数r变大
B.残差平方和变大
C.变量x,y的相关程度变强
D.样本相关系数r越趋近于1
解析:由散点图知,去掉D(3,10)后,y与x的线性相关程度变强,且为正相关,
所以r变大,且样本相关系数r越趋近于1,去掉D(3,10)后,散点分布更均匀,残差平方和变小.故A,C,D正确,B错误.
7.有两个分类变量X和Y,其中一组观测值为如表的2×2列联表:
X | Y | 合计 | |
Y1 | Y2 | ||
X1 | a | 15-a | 15 |
X2 | 20-a | 30+a | 50 |
合计 | 20 | 45 | 65 |
其中a,15-a均为大于5的整数,则a= 时,依据小概率值α=
0.01的独立性检验,认为“X和Y之间有关系”.
附:χ2=(其中,n=a+b+c+d).
α | 0.1 | 0.05 | 0.025 | 0.01 | 0.005 |
xα | 2.706 | 3.841 | 5.024 | 6.635 | 7.879 |
解析:由题意知χ2≥6.635,则=≥6.635,解得a≥8.65或a≤0.58,因为a>5且15-a>5,a∈N,所以
8.65≤a<10,a∈N,
所以a=9.
答案:9
8.某食品厂为了检查甲、乙两条自动包装流水线的生产情况,随机在这两条流水线上各抽取100件产品作为样本称出它们的质量(单位:
mg),质量值落在(175,225]的产品为合格品,否则为不合格品.统计数据如下列2×2列联表,
质量 | 流水线 | 合计 | |
甲 | 乙 | ||
合格品 | 92 | 96 | 188 |
不合格品 | 8 | 4 | 12 |
合计 | 100 | 100 | 200 |
(1)依据小概率值α=0.15的独立性检验,能否认为产品的包装的合格性与流水线的选择有关联?
附:χ2=,其中n=a+b+c+d.
临界值表:
α | 0.15 | 0.1 | 0.05 | 0.025 |
xα | 2.072 | 2.706 | 3.841 | 5.024 |
| ||||
α | 0.01 | 0.005 | 0.001 | — |
xα | 6.635 | 7.879 | 10.828 | — |
(2)公司工程师抽取几组一小时生产的产品数据进行不合格品情况检查分析,在数量为x(单位:百件)的产品中,得到不合格品数量y(单位:件)的情况汇总如表所示,
x/百件 | 1 | 4 | 7 | 8 | 10 |
y/件 | 2 | 14 | 24 | 35 | 40 |
求y关于x的经验回归方程=x+,并预测一小时生产2 000件时的不合格品数.(精确到1)
附:==;
=-.
解:(1)根据2×2列联表可得χ2=≈1.418<2.072,
所以依据小概率值α=0.15的独立性检验,不能认为产品包装的合格性与流水线的选择有关联.
(2)由已知可得==6,
==23,
又xiyi=1×2+4×14+7×24+8×35+10×40=906,
=12+42+72+82+102=230,
所以====4.32,所以=-=23-4.32×
6=-2.92,
所以y关于x的经验回归方程为=4.32x-2.92,
当x=20时,=4.32×20-2.92=83.48≈83,
所以估计一小时生产2 000件时的不合格品数约为83件.
9.(多选题)有甲、乙两个班级进行数学考试,按照大于等于120分为优秀,120分以下为非优秀统计成绩,得到如下2×2列联表,
班级 | 成绩 | 合计 | |
优秀 | 非优秀 | ||
甲班 | 10 | b |
|
乙班 | c | 30 |
|
合计 |
|
| 105 |
已知在这105人中随机抽取1人,成绩优秀的概率为(视频率为概率),则下列说法正确的是( BC )
附表及公式:
α | 0.05 | 0.01 | 0.001 |
xα | 3.841 | 6.635 | 10.828 |
χ2=,n=a+b+c+d.
A.2×2列联表中c的值为30,b的值为35
B.2×2列联表中c的值为20,b的值为45
C.根据2×2列联表中的数据,若依据小概率值α=0.05的独立性检验,则能认为成绩与班级有关系
D.根据2×2列联表中的数据,若依据小概率值α=0.05的独立性检验,则不能认为成绩与班级有关系
解析:因为在这105人中随机抽取1人,成绩优秀的概率为,
所以成绩优秀的人数为105×=30,非优秀的人数为105-30=75,
所以c=30-10=20,b=75-30=45,
所以χ2=≈6.109>3.841=x0.05,
所以依据小概率值α=0.05的独立性检验,能认为成绩与班级有关系.
10.(2022·安徽芜湖模拟)为了检验某种血清预防感冒的作用,把500名使用血清的人与另外500名未使用血清的人一年中的感冒记录作比较,提出假设H0;“这种血清不能起到预防感冒的作用”,利用2×2列联表计算的结果,根据小概率值α=0.01的独立性检验,可以认为H0成立,那么χ2的一个可能取值为( A )
α | 0.05 | 0.025 | 0.01 | 0.005 | 0.001 |
xα | 3.841 | 5.024 | 6.635 | 7.879 | 10.828 |
A.7.879 B.6.635 C.5.024 D.3.841
解析:由题意,χ2>6.635,由选项知χ2的一个可能取值为7.879.
11.疫苗是为预防、控制传染病的发生、流行,用于人体预防接种的预防性生物制品,为了考察某种疫苗预防效果,在试验时,得到如下统计数据,
疫苗 | 传染病 | 合计 | |
未发病 | 发病 | ||
未注射 | 30 |
|
|
注射 | 40 |
|
|
合计 | 70 | 30 | 100 |
附表及公式:
α | 0.05 | 0.01 | 0.005 | 0.001 |
xα | 3.841 | 6.635 | 7.879 | 10.828 |
χ2=,n=a+b+c+d.
现从试验动物中任取一只,取到“注射疫苗”动物的概率为0.5,则下列判断错误的是( D )
A.注射疫苗发病的动物数为10
B.从该试验未注射疫苗的动物中任取一只,发病的概率为
C.能在犯错概率不超过0.05的前提下,认为疫苗有效
D.该疫苗的有效率为80%
解析:现从试验动物中任取一只,取到“注射疫苗”动物的概率为0.5,则注射疫苗发病的动物数为100×0.5-40=10,故A正确;
2×2列联表如下:
疫苗 | 传染病 | 合计 | |
未发病 | 发病 | ||
未注射 | 30 | 20 | 50 |
注射 | 40 | 10 | 50 |
合计 | 70 | 30 | 100 |
从该试验未注射疫苗的动物中任取一只,发病的概率为=,故B正确;
因为χ2=≈4.762>3.841=x0.05,
根据小概率值α=0.05的独立性检验,认为疫苗有效,故C正确;
对于D选项,未考虑未注射疫苗的动物中也有不发病的情况,故D
错误.
12.某二手车经销商对其所经营的A型号二手汽车的使用年数x与销售价格y(单位:万元/辆)进行整理,得到数据如表所示,
使用年数x | 2 | 3 | 4 | 5 | 6 | 7 |
售价y | 20 | 12 | 8 | 6.4 | 4.4 | 3 |
z=ln y | 3.00 | 2.48 | 2.08 | 1.86 | 1.48 | 1.10 |
如图所示,z关于x的折线图:
(1)由折线图可以看出,可以用线性回归模型拟合z与x的关系,请用样本相关系数加以说明;
(2)求y关于x的经验回归方程,并预测某辆A型号二手车使用年数为9年时售价约为多少;(,小数点后保留两位有效数字)
(3)基于成本的考虑,该型号二手车的售价不得低于7 118元,请根据(2)求出的经验回归方程预测在收购该型号二手车时车辆的使用年数不得超过多少年.
参考公式:==,
=-,r=.
参考数据:xiyi=187.4,xizi=47.64,=139,≈4.18,≈13.96,≈1.53,ln 1.46≈0.38,
ln 0.711 8≈-0.34.
解:(1)由题意知
=×(2+3+4+5+6+7)=4.5,
=×(3+2.48+2.08+1.86+1.48+1.10)=2,
又xizi=47.64,≈4.18,
≈1.53,
所以r≈=-≈-0.99,
所以z与x的样本相关系数大约为-0.99,说明z与x的线性相关程度很高.
(2)==-≈-0.36,
所以=-=2+0.36×4.5=3.62,
所以z与x的经验回归方程是=-0.36x+3.62,又z=ln y,
所以y关于x的经验回归方程是=e-0.36x+3.62.
令x=9,得=e-0.36×9+3.62=e0.38.
因为ln 1.46≈0.38,所以≈1.46,
即预测某辆A型号二手车使用年数为9年时售价约为1.46万元.
(3)当≥0.711 8,
即e-0.36x+3.62≥0.711 8=eln 0.711 8≈e-0.34时,
则有-0.36x+3.62≥-0.34,解得x≤11,
因此,预测在收购该型号二手车时车辆的使用年数不得超过11年.
13.(多选题)某中学课外活动小组为了研究经济走势,根据该市
1999—2021年的GDP(国内生产总值)数据绘制出下面的散点图.
该小组选择了如下2个模型来拟合GDP值y随年份x的变化情况,模型一:y=kx+b(k>0,x>0);模型二:y=kex+b(k>0,x>0),下列说法正确的是( AD )
A.变量y与x正相关
B.根据散点图的特征,模型一能更好地拟合GDP值随年份的变化情况
C.若选择模型二,y=kex+b的图象一定经过点(,)
D.当x=13时,通过模型计算得GDP值为70,实际GDP值为71,则残差为1
解析:根据散点图易得变量y与x正相关,故A正确;由散点图可得y与x的变化趋向于一条曲线,所以模型二能更好地拟合GDP值随年份的变化情况,故B错误;若选择模型二y=kex+b,令t=ex,则图象经过点(,),故C错误;当x=13时,通过模型计算得GDP值为70,实际GDP值为71,则残差为1,故D正确.
14.某基地蔬菜大棚采用无土栽培方式种植各类蔬菜.过去50周的资料显示,该地周光照量X(单位:h)都在30 h以上,其中不足50 h的有5周,不低于50 h且不超过70 h的有35周,超过70 h的有10周.根据统计,该基地的西红柿增加量y(单位:kg)与使用某种液体肥料的质量x(单位:kg)之间的对应数据如折线图所示.
(1)依据折线图计算样本相关系数r(精确到0.01),并据此判断是否可用线性回归模型拟合y与x的关系;(若|r|>0.75,则线性相关程度很高,可用线性回归模型拟合)
(2)蔬菜大棚对光照要求较高,某光照控制仪商家为该基地提供了部分光照控制仪,但每周光照控制仪运行台数受周光照量X限制,并有如表所示的关系:
周光照 量X/ h | 30<X<50 | 50≤X≤70 | X>70 |
光照控制仪 运行台数 | 3 | 2 | 1 |
对商家来说,若某台光照控制仪运行,则该台光照控制仪产生的周利润为3 000元;若某台光照控制仪未运行,则该台光照控制仪周亏损
1 000元.若商家提供了3台光照控制仪,求商家在过去50周的周总利润的平均值.
参考公式:r=,
参考数据:≈0.55,≈0.95.
解:(1)由已知数据可得==5,==4.
因为(xi-)(yi-)=(-3)×(-1)+0+0+0+3×1=6,
==2,
==,
所以样本相关系数
r===≈0.95.
因为|r|>0.75,所以可用线性回归模型拟合y与x的关系.
(2)由条件可得在过去的50周里,当X>70时,共有10周,此时只有
1台光照控制仪运行,每周的总利润为1×3 000-2×1 000=1 000(元).
当50≤X≤70时,共有35周,此时有2台光照控制仪运行,
每周的总利润为2×3 000-1×1 000=5 000(元).
当30<X<50时,共有5周,此时3台光照控制仪都运行,每周的总利润为3×3 000=9 000元.
所以过去50周的周总利润的平均值为
=4 600(元),
所以商家在过去50周的周总利润的平均值为 4 600元.
相关试卷
这是一份最新高考数学一轮复习【讲通练透】 第02讲 成对数据的统计分析(练透),文件包含第02讲成对数据的统计分析练习原卷版docx、第02讲成对数据的统计分析练习解析版docx等2份试卷配套教学资源,其中试卷共50页, 欢迎下载使用。
这是一份备考2024届高考数学一轮复习分层练习第九章统计与成对数据的统计分析第3讲成对数据的统计分析,共10页。
这是一份备考2024届高考数学一轮复习强化训练第九章统计与成对数据的统计分析第3讲成对数据的统计分析,共3页。试卷主要包含了824 5,6万元等内容,欢迎下载使用。