


人教版高中数学高考一轮复习训练-- 成对数据的统计分析
展开1.(2020全国Ⅰ,理5)某校一个课外学习小组为研究某作物种子的发芽率y和温度x(单位:℃)的关系,在20个不同的温度条件下进行种子发芽实验,由实验数据(xi,yi)(i=1,2,…,20)得到下面的散点图:
由此散点图,在10 ℃至40 ℃之间,下面四个回归方程类型中最适宜作为发芽率y和温度x的回归方程类型的是( )
A.y=a+bx
B.y=a+bx2
C.y=a+bex
D.y=a+bln x
2.某公司生产的某型号无人机以小巧轻便、高效机动、影像清晰、智能化、用途广等突出特点,得到广大用户的青睐.该型号无人机近5年的年销售量数据统计如表所示.
根据表中的数据,用最小二乘法求得y关于x的经验回归方程为y^=6.5x+t,则预测2021年该型号无人机的年销售量为( )
A.40万件
B.41.5万件
C.45万件
D.48万件
3.为了调查学生对网络课程的喜爱程度,研究人员随机调查了相同人数的男、女学生,发现有80%的男生喜欢网络课程,有40%的女生不喜欢网络课程.若依据小概率值α=0.01的独立性检验,可以推断喜欢网络课程与性别有关;依据小概率值α=0.001的独立性检验,可以推断喜欢网络课程与性别无关,则被调查的男、女学生的总人数可能为( )
附:χ2=n(ad-bc)2(a+b)(c+d)(a+c)(b+d),其中n=a+b+c+d.
A.130B.190C.240D.250
4.(多选)已知成年儿子的身高y(单位:cm)与父亲的身高x(单位:cm)具有线性相关关系,根据样本数据(xi,yi)(i=1,2,…,n),用最小二乘法求得的经验回归方程为y^=0.84x+28.96,则下列说法正确的是( )
A.y与x正相关
B.经验回归直线过点(x,y),其中x=x1+x2+…+xnn,y=y1+y2+…+ynn
C.若父亲身高为179 cm,则儿子身高约为179.32 cm
D.若父亲身高为179 cm,则儿子身高必为179.32 cm
5.已知变量x与y的部分数据如下:
用最小二乘法得到y关于x的经验回归方程为y^=-2x+4.若数据x1,x2,…,x8的平均数为1,则∑i=18yi= .
6.对196名接受心脏搭桥手术的病人和196名接受血管清障手术的病人进行了3年的跟踪研究,调查他们是否又发作过心脏病,得到2×2列联表如表所示.
依据小概率值α=0.1的独立性检验,推断这两种手术对病人又发作心脏病的影响 .(填“有差别”或“没有差别”)
7.某研究性学习小组对春季昼夜温差大小与某花卉种子发芽多少之间的关系进行研究,他们分别记录了3月1日至3月5月每天的昼夜温差与实验室每天每100颗种子浸泡后的发芽数,所得数据如表所示.
(1)从3月1日至3月5日中任选2天,记发芽的种子数分别为m,n,求事件“m,n均不小于25”的概率;
(2)请根据3月2日至3月4日的三组数据,求出y关于x的经验回归方程y^=b^x+a^;
(3)若由经验回归方程得到的估计数据与实际数据的差的绝对值均不超过2,则认为得到的经验回归方程是可靠的,试用3月1日与3月5日的两组数据检验,判断(2)中所得的经验回归方程是否可靠.
参考公式:b^=∑i=1n(xi-x)(yi-y)∑i=1n(xi-x)2=∑i=1nxiyi-nxy∑i=1nxi2-nx2,a^=y−b^x.
二、综合应用
8.(多选)下列说法正确的是( )
A.成对样本数据的线性相关程度越强,样本相关系数r越接近1
B.在回归分析模型中,残差平方和越小,说明模型的拟合效果越好
C.若y关于x的经验回归方程为y^=0.1x+10,则当x每增加1个单位时,y一定增加0.1个单位
D.若根据两个分类变量的2×2列联表中的数据计算得χ2=13.079,则依据小概率值α=0.001的独立性检验,推断这两个变量有关联正确的概率不低于99.9%
9.某校团委对“学生性别和喜欢微电影是否有关”作了一次调查,其中女生人数是男生人数的13,男生喜欢微电影的人数占男生人数的16,女生喜欢微电影的人数占女生人数的23.若依据小概率值α=0.05的独立性检验,推断学生性别和喜欢微电影有关,则男生至少有 人.
附:
10.某校为调查高中生在校参加体育活动的时间,随机抽取了100名高中学生进行调查,其中男生、女生各占一半,下面是根据调查结果绘制的学生日均体育锻炼时间的频率分布直方图:
将日均体育锻炼时间不低于40分钟的学生评价为“良好”,已知“良好”评价中有18名女生.
(1)请将列联表补充完整;
(2)试依据小概率值α=0.01的独立性检验,分析高中生的性别是否与喜欢体育锻炼有关.
参考公式:χ2=n(ad-bc)2(a+b)(c+d)(a+c)(b+d),n=a+b+c+d.
χ2独立性检验中常用的小概率值和相应的临界值:
11.(2020全国Ⅱ,理18)某沙漠地区经过治理,生态系统得到很大改善,野生动物数量有所增加,为调查该地区某种野生动物的数量,将其分成面积相近的200个地块,从这些地块中用简单随机抽样的方法抽取20个作为样区,调查得到样本数据(xi,yi)(i=1,2,…,20),其中xi和yi分别表示第i个样区的植物覆盖面积(单位:公顷)和这种野生动物的数量,并计算得∑i=120xi=60,∑i=120yi=1 200,∑i=120(xi-x)2=80,∑i=120(yi-y)2=9 000,∑i=120(xi-x)(yi-y)=800.
(1)求该地区这种野生动物数量的估计值(这种野生动物数量的估计值等于样区这种野生动物数量的平均数乘以地块数);
(2)求样本(xi,yi)(i=1,2,…,20)的相关系数(精确到0.01);
(3)根据现有统计资料,各地块间植物覆盖面积差异很大.为提高样本的代表性以获得该地区这种野生动物数量更准确的估计,请给出一种你认为更合理的抽样方法.并说明理由.
附:样本相关系数r=∑i=1n(xi-x)(yi-y)∑i=1n(xi-x)2∑i=1n(yi-y)2,2≈1.414.
三、探究创新
12.某工厂有25周岁以上(含25周岁)工人300名,25周岁以下工人200名.为研究工人的日平均生产量是否与年龄有关,现采用分层随机抽样的方法从中抽取了100名工人,先统计了他们某月的日平均生产件数,然后按工人年龄在“25周岁以上(含25周岁)”和“25周岁以下”分为两组,再将两组工人的日平均生产件数分成5组:[50,60),[60,70),[70,80),[80,90),[90,100]分别加以统计,得到的频率分布直方图如图所示.
25周岁以上(含25周岁)组
25周岁以下组
(1)从样本中日平均生产件数不足60的工人中随机抽取2人,求至少抽到一名“25周岁以下组”工人的概率;
(2)规定日平均生产件数不少于80者为“生产能手”,请你根据已知条件作出2×2列联表,依据小概率值α=0.1的独立性检验,能否推断生产能手与工人所在的年龄组有关?
考点规范练53 成对数据的统计分析
1.D 结合题中散点图,由图象的大致走向判断,此函数应该是对数函数模型,故应该选用的函数模型为y=a+bln x.
2.D 由已知得x=0+1+2+3+45=2,y=10+15+20+30+355=22,则t=y-6.5x=22-6.5×2=9.故y^=6.5x+9.
故预测2021年该型号无人机的年销售量为6.5×6+9=48(万件).
3.B 设调查的男、女学生的人数均为5x,根据题意,得到2×2列联表为
则χ2=10x·(8x2-3x2)25x·5x·3x·7x=10x21.
由题意可知6.635≤10x21<10.828,
即139.335≤10x<227.388.只有选项B符合题意.
4.ABC 因为经验回归直线的斜率b^=0.84>0,所以y与x正相关,故A正确.
经验回归直线必过样本点的中心(x,y),故B正确.
当x=179时,y的预测值为y^=0.84×179+28.96=179.32,故C正确,D错误.
5.16 由已知得x=1,则y=-2x+4=-2×1+4=2.
故∑i=18yi=8y=8×2=16.
6.没有差别 零假设为H0:这两种手术对病人又发作心脏病的影响没有差别.根据2×2列联表中的数据,计算得到χ2=392×(39×167-29×157)268×324×196×196≈1.779<2.706=x0.1.
根据小概率值α=0.1的独立性检验,没有充分证据推断H0不成立,因此认为H0成立,即这两种手术对病人又发作心脏病的影响没有差别.
7.解 (1)由已知得这5天中有3天发芽的种子数不小于25,故事件“m,n均不小于25”的概率为C32C52=310.
(2)依题意,x=11+13+123=12,y=25+30+263=27,
∑i=13(xi-x)(yi-y)=(-1)×(-2)+1×3+0×(-1)=5,
∑i=13(xi-x)2=(-1)2+12+0=2.
则b^=52,a^=27-52×12=-3.
故y关于x的经验回归方程为y^=52x-3.
(3)当x=10时,y^=52×10-3=22,|22-23|<2.
当x=8时,y^=52×8-3=17,|17-16|<2.
故经验回归方程y^=52x-3可靠.
8.BD 对于A,成对样本数据的线性相关程度越强,|r|越接近1,
故A错误.
对于B,在回归分析中,残差的平方和越小,模型的拟合效果越好,故B正确.
对于C,当x增加1个单位时,y不一定增加0.1个单位,故C错误.
对于D,根据小概率值α=0.001的独立性检验的规则,可知D正确.
9.18 设男生人数为x,则由题意可得2×2列联表为
零假设为H0:学生性别和喜欢微电影无关.根据2×2列联表中的数据,计算得到χ2=4x3(x6·x9-5x6·2x9) 2x·x3·7x18·17x18=36x119.
依据小概率值α=0.05的独立性检验,推断H0不成立,则χ2=36x119≥3.841=x0.05,解得x≥12.697.
又人数均为整数,所以xmin=18.故男生至少有18人.
10.解 (1)设学生日均体育锻炼时间为x分钟,根据频率分布直方图可知x≥40的频率为(0.025+0.020+0.005)×10=0.5.
抽取总人数为100,故评价为“良好”的学生人数为50.列联表如下:
(2)零假设为H0:高中生的性别与喜欢体育锻炼无关.
根据2×2列联表中的数据,计算得到χ2=100×(18×18-32×32)250×50×50×50=7.84>6.635=x0.01.
根据小概率值α=0.01的独立性检验,有充分证据推断H0不成立,即高中生的性别与喜欢体育锻炼有关,此推断犯错误的概率不超过0.01.
11.解 (1)由已知得样本平均数y=120∑i=120yi=60,
从而该地区这种野生动物数量的估计值为60×200=12 000.
(2)样本(xi,yi)(i=1,2,…,20)的相关系数r=∑i=120(xi-x)(yi-y)∑i=120(xi-x)2∑i=120(yi-y)2=80080×9 000=223≈0.94.
(3)分层随机抽样:先根据植物覆盖面积的大小对地块分层,再对200个地块进行分层随机抽样.
理由如下:由(2)知各样区的这种野生动物数量与植物覆盖面积有很强的正相关.由于各地块间植物覆盖面积差异很大,从而各地块间这种野生动物数量差异也很大,采用分层随机抽样的方法较好地保持了样本结构与总体结构的一致性,提高了样本的代表性,从而可以获得该地区这种野生动物数量更准确的估计.
12.解 (1)由已知得,样本中有25周岁以上(含25周岁)组工人60名,25周岁以下组工人40名.
故样本中日平均生产件数不足60件的工人中,25周岁以上(含25周岁)组工人有60×0.05=3(人),记为A1,A2,A3;25周岁以下组工人有40×0.05=2(人),记为B1,B2.
从中随机抽取2名工人,所有可能的结果共有10种,该试验的样本空间Ω={(A1,A2),(A1,A3),(A2,A3),(A1,B1),(A1,B2),(A2,B1),(A2,B2),(A3,B1),(A3,B2),(B1,B2)}.
设事件A=“至少有1名‘25周岁以下组’工人”,则A={(A1,B1),(A1,B2),(A2,B1),(A2,B2),(A3,B1),(A3,B2),(B1,B2)}.故所求的概率P(A)=710.
(2)由频率分布直方图可知,在抽取的100名工人中,“25周岁以上(含25周岁)组”中的生产能手有60×0.25=15(人),“25周岁以下组”中的生产能手有40×0.375=15(人),据此可得2×2列联表如下:
零假设为H0:生产能手与工人所在的年龄组无关.
χ2=100×(15×25-15×45)260×40×30×70≈1.786<2.706=x0.1.
根据小概率值α=0.1的独立性检验,没有证据推断H0不成立,因此可以认为H0成立,即认为生产能手与工人所在的年龄组无关.年份
2015
2016
2017
2018
2019
年份代码x
0
1
2
3
4
年销售量y/万件
10
15
20
30
35
α
0.1
0.05
0.01
0.001
xα
2.706
3.841
6.635
10.828
x
x1
x2
…
x8
y
y1
y2
…
y8
手术
心脏病
合计
又发作过心脏病
未发作过心脏病
心脏搭桥手术
39
157
196
血管清障手术
29
167
196
合计
68
324
392
日期
3月1日
3月2日
3月3日
3月4日
3月5日
昼夜温差/℃
10
11
13
12
8
发芽数/颗
23
25
30
26
16
α
0.05
0.01
0.001
xα
3.841
6.635
10.828
学生性别
是否良好
合计
非良好
良好
男
女
合计
α
0.1
0.05
0.01
0.005
0.001
xα
2.706
3.841
6.635
7.879
10.828
性别
网络课程
合计
喜欢
不喜欢
男
4x
x
5x
女
3x
2x
5x
合计
7x
3x
10x
性别
微电影
合计
喜欢
不喜欢
男
x6
5x6
x
女
2x9
x9
x3
合计
7x18
17x18
4x3
学生性别
是否良好
合计
非良好
良好
男
18
32
50
女
32
18
50
合计
50
50
100
组别
是不是生产能手
合计
生产能手
非生产能手
25周岁以上(含25周岁)组
15
45
60
25周岁以下组
15
25
40
合计
30
70
100
备考2024届高考数学一轮复习分层练习第九章统计与成对数据的统计分析第3讲成对数据的统计分析: 这是一份备考2024届高考数学一轮复习分层练习第九章统计与成对数据的统计分析第3讲成对数据的统计分析,共10页。
备考2024届高考数学一轮复习强化训练第九章统计与成对数据的统计分析第3讲成对数据的统计分析: 这是一份备考2024届高考数学一轮复习强化训练第九章统计与成对数据的统计分析第3讲成对数据的统计分析,共3页。试卷主要包含了824 5,6万元等内容,欢迎下载使用。
新高考数学一轮复习课时过关练习第09章 统计与成对数据的统计分析第3节 成对数据的统计分析 (含解析): 这是一份新高考数学一轮复习课时过关练习第09章 统计与成对数据的统计分析第3节 成对数据的统计分析 (含解析),共23页。试卷主要包含了了解样本相关系数的统计含义,样本相关系数,一元线性回归模型,列联表与独立性检验,1% B,069>6,616,8,1等内容,欢迎下载使用。