9.2.1统计模型(题型战法)-备战高三数学一轮复习题型与战法精准训练(新高考专用)
展开
这是一份9.2.1统计模型(题型战法)-备战高三数学一轮复习题型与战法精准训练(新高考专用),文件包含921统计模型题型战法-备战高三数学一轮复习题型与战法精准训练新高考专用解析版docx、921统计模型题型战法-备战高三数学一轮复习题型与战法精准训练新高考专用原卷版docx等2份试卷配套教学资源,其中试卷共33页, 欢迎下载使用。
第九章 统计与统计模型
9.2.1统计模型(题型战法)
知识梳理
一 线性回归方程及其应用
1.相关系数:
用它来衡量两个变量之间的线性相关程度。
(1)当,当时,变量与正相关,当时,变量与负相关。
(2),且越接近1,相关程度越强;且越接近0,相关程度越弱,几乎不存在。
2.求线性回归方程的步骤:
(1)利用散点图或进行相关性检验判断两个变量具有线性相关关系;
(2)列表求出等。
(3)线性回归方程,其中b=i=1n(xi-x)(yi-y)i=1n(xi-x)2=i=1nxiyi-nxyi=1nxi2-nx2,a=y-bx。
二 独立性检验在实际中的应用
解题步骤:(1)独立性检验原理只能解决两个对象,且每个对象有两类属性的问题,所以对于一个实际问题,我们要明确能否用独立性检验的思想加以解决;
(2)如果确实属于这类问题,要科学的抽取样本,样本容量要适当,不可太小;
(3)根据数据列出列联表;
(4)提出假设:所研究的两类对象无关;
(5)根据公式计算的值;
(6)比较观测值与临界值表中相应的检验水平,根据小概率原理肯定或否定假设,判断是否相关。
题型战法
题型战法一 相关系数与误差分析
典例1.对两个变量与进行回归分析,分别选择不同的模型,它们的相关系数如下,其中拟合效果最好的模型是( )
①模型Ⅰ的相关系数为; ②模型Ⅱ的相关系数为;
③模型Ⅲ的相关系数为; ④模型Ⅳ的相关系数为;
A.Ⅰ B.Ⅱ C.Ⅲ D.Ⅳ
【答案】D
【分析】根据相关系数的大小对相关关系强弱的判定,即可解出.
【详解】因为越趋近于,相关性越强,模型拟合效果越好,
所以拟合效果最好的模型是Ⅳ.
故选:D.
变式1-1.下列有关样本线性相关系数r的说法,错误的是( )
A.相关系数r可用来衡量x与y之间的线性相关程度
B.,且越接近0,相关程度越小
C.,且越接近1,相关程度越大
D.,且越接近1,相关程度越小
【答案】D
【分析】根据相关系数的定义,即可判断选项.
【详解】相关系数是来衡量两个变量之间的线性相关程度的,线性相关系数是一个绝对值小于等于1的量,并且它的绝对值越大就说明相关程度越大,所以不正确的只有D.
故选:D.
变式1-2.某统计部门对四组数据进行统计分析后,获得如图所示的散点图.
下面关于相关系数的比较,正确的是( )
A. B. C. D.
【答案】C
【分析】根据散点图的分布可得相关性的强弱,即可比较大小.
【详解】由图可知:所对应的图中的散点呈现正相关 ,而且对应的相关性比对应的相关性要强,故,所对应的图中的散点呈现负相关,且根据散点的分布情况可知,因此,
故选:C
变式1-3.下列命题是真命题的有( )
A.经验回归方程至少经过其样本数据点中的一个
B.可以用相关系数r来刻画两个变量x和y线性相关程度的强弱,r的值越小,说明两个变量线性相关程度越弱
C.在回归分析中,决定系数的模型比决定系数的模型拟合的效果要好
D.残差平方和越小的模型,拟合的效果越好
【答案】D
【分析】根据经验回归方程、相关系数、决定系数、残差等知识确定正确答案.
【详解】对于A,经验回归方程是由最小二乘法计算出来的,它不一定经过其样本数据点,一定经过,所以A是假命题;
对于B,由相关系数的意义,当越接近1时,表示变量y与x之间的线性相关程度越强,所以B是假命题;
对于C,用决定系数的值判断模型的拟合效果,越大,模型的拟合效果越好,所以C是假命题;
由残差的统计学意义知,D为真命题.
故选: D
变式1-4.关于线性回归的描述,下列命题错误的是( )
A.回归直线一定经过样本点的中心 B.残差平方和越小,拟合效果越好
C.决定系数越接近1,拟合效果越好 D.残差平方和越小,决定系数越小
【答案】D
【分析】根据线性回归的性质判断即可
【详解】对A,回归直线一定经过样本点的中心正确;
对B,残差平方和越小,拟合效果越好正确;
对C,决定系数越接近1,拟合效果越好正确;
对D,残差平方和越小,拟合效果越好,决定系数越接近1,故D错误;
故选:D
题型战法二 回归分析
典例2.哈三中高二数学备课组对学生的记忆力和判断力进行统计分析,所得数据如下表所示:
4
6
8
10
2
3
5
6
(1)请根据上表提供的数据,用最小二乘法求出关于的线性回归方程;
(2)根据(1)中求出的线性回归方程,预测记忆力为9的学生的判断力.
(参考公式:,)
【答案】(1);(2)判断力为5.4.
【分析】(1)直接利用公式求解即可
(2)把代入回归方程中求解
【详解】解:(1)由表中数据可得,
,
,
所以,
所以,
所以关于的线性回归方程为,
(2)当时,,
所以记忆力为9的学生的判断力约为5.4
变式2-1.防疫抗疫,人人有责,随着奥密克戎的全球肆虐,防疫形势越来越严峻,防疫物资需求量急增.下表是某口罩厂今年的月份与订单(单位:万元)的几组对应数据:
月份
1
2
3
4
5
订单
20
24
43
52
(1)求关于的线性回归方程,并估计6月份该厂的订单数;
(2)求相关系数(精确到0.01),说明与之间具有怎样的相关关系.
参考数据:,,.,.参考公式:相关系数;回归直线的方程是,其中.
【答案】(1),6月份该厂的订单数为59.9万元;
(2),与之间具有很强的正相关关系.
【分析】(1)求出与的值,可得关于的线性回归方程,取求得值得答案;
(2)由已知数据求得值,可得与的相关系数近似为0.99,故与之间的线性相关程度相当高.
(1)
解:由题可得:,
,
,
关于的线性回归方程为,
2022年6月对应的变量为6,将代入,
得,
估计6月份该厂的订单数为59.9万元.
(2)
相关系数.
与之间具有很强的正相关关系.
变式2-2.某服装企业采用服装个性化设计为客户提供服务,即由客户提供身材的基本数据用于个人服装设计.该企业为了设计所用的数据更精准,随机地抽取了10位男子的身高和臂长的数据,数据如下表所示:
身高
164
165
168
172
173
176
178
181
182
191
臂长
160
164
161
170
175
181
170
182
180
187
(1)根据表中的数据,求男子的身高预报臂长的线性回归方程,并预报身高为170cm的男子的臂长(男子臂长计算结果精确到0.01);
(2)统计学认为,两个变量、的相关系数r的大小可表明两变量间的相关性强弱.一般地,如果|r|[0.75,1],那么相关性很强;如果|r|[0.30,0.75),那么相关性一般;如果|r|[0,0.30),那么没有相关性.求出r的值,并判断变量x、y的相关性强弱(结果精确到0.01).
附:线性回归方程其中,,,,,,,
【答案】(1);;(2);变量间的相关性很强.
【分析】(1)根据表中的数据求出,从而利用可求出,进而可得回归方程,然后当时,代入回归方程可求出身高为170cm的男子的臂长;
(2)直接利用公式和已知的数据求解相关系数,再根据所给数据判断强弱
【详解】(1)解:,
由,得
所以所求线性回归方程为
当时,
所以身高为170cm的男性臂长约为
(2),
因为r[0.75,1],所以变量间的相关性很强.
变式2-3.某市为吸引大学生人才来本市就业,大力实行人才引进计划,提供现金补贴,为了解政策的效果,收集了2011-2020年人才引进就业人数数据(单位:万),统计如下(年份代码1-10分别代表2011-2020年)其中,,,.
年份代码
1
2
3
4
5
6
7
8
9
10
引进人数
3.4
5.7
7.3
8.5
9.6
10.2
10.8
11.3
11.6
11.8
(1)根据数据画出散点图,并判断,,,哪一个适合作为该市人才引进就业人数y关于年份 代码x的回归方程类型?(给出判断即可,不必说明理由)
5.5
9.02
2.14
1.51
82.5
4.84
72.2
9.67
18.41
(2)根据(1)的判断结果及表中数据,建立y关于x的回归方程;(所有过程保留两位小数)
(3)试预测该市2022年的人才引进就业人数.
参考公式:,a=y-bx.
【答案】(1)答案见解析
(2)
(3)
【分析】(1)根据数据直接做图,并根据图判断函数类型;
(2)根据回归方程计算公式和已知数据求解即可得出方程;
(3)将代入回归方程即可求解.
(1)
图像
适合作为该市人才引进就业人数y关于年份 代码x的回归方程类型
(2)
(2)
(3)
(3)将x=12代入得.
变式2-4.如图是某市2011年至2020年当年在售二手房均价(单位:千元/平方米)的散点图(图中年份代码1~10分别对应2011年~2020年).现根据散点图选择用和两个模型对年份代码和房价的关系进行拟合,经过数据处理得到两个模型对应回归方程的相关指数和一些统计量的值,如下表:
模型
相关指数
0.8821
0.9046
6.81
1.89
82.5
44.55
6.6
表中,.
(1)请利用相关指数判断:哪个模型的拟合效果更好;并求出该模型对应的回归方程(参数估计值精确到0.01);
(2)根据(1)得到的方程预计;到哪一年,该市的当年在售二手房均价能超过10.5千元/平方米.
参考公式:对于一组数据,,…,,其回归线的斜率和截距的最小二乘估计分别为:,.参考数据:,.
【答案】(1)模型的拟合效果更好,
(2)到2022年,该市的当年在售二手房均价能超过10.5千元/平方米
【分析】(1)根据相关指数的数值可知模型的拟合效果更好,从而可得,利用最小二乘法即可求解.
(2)由(1)将代入即可求解.
(1)
由相关指数:,知模型的拟合效果更好.
∵,∴,令,
可知与满足线性模型回归方程,
,
则,
,
所以回归方程为,即.
(2)
将代入,可得,
将代入,可得,
所以,根据方程预计:到2022年,该市的当年在售二手房均价能超过10.5千元/平方米.
题型战法三 独立性检验
典例3.随着经济社会的发展,消费者对食品安全的关注度越来越高,通过随机询问某地区110名居民在购买食品时是否看生产日期与保质期等内容,得到如下的列联表:
60岁以下
60岁以上
总计
看生产日期与保质期
50
30
80
不看生产日期与保质期
10
20
30
总计
60
50
110
(1)从这50名60岁以上居民中按是否看生产日期与保质期采取分层抽样,抽取一个容量为5的样本,问样本中看与不看生产日期与保质期的60岁以上居民各有多少名?
(2)根据以上列联表,在犯错误的概率不超过1%的情况下,是否有把握认为“该地区居民的年龄与在购买食品时是否看生产日期与保质期”有关?
附:,其中.
0.100
0.050
0.025
0.010
0.001
2.706
3.841
5.024
6.635
10.828
【答案】(1)样本中看生产日期与保质期的60岁以上居民有3名,样本中不看生产日期与保质期的60岁以上居民有2(名);
(2)在犯错误的概率不超过1%的情况下,有把握认为“该地区居民的年龄与在购买食品时是否看生产日期与保质期”有关.
【分析】(1)根据分层抽样的定义,代入计算即可得到结果.
(2)根据列联表列出式子计算,然后结合所给表格即可判断.
(1)
根据分层抽样可得:样本中看生产日期与保质期的60岁以上居民有名,样本中不看生产日期与保质期的60岁以上居民有(名).
(2)
根据题中的列联表得,
所以在犯错误的概率不超过1%的情况下,有把握认为“该地区居民的年龄与在购买食品时是否看生产日期与保质期”有关.
变式3-1.信息时代人们对通信功能的要求越来越高,5G的拓展运营在西部得到某科技公司的大力推进.已知该公司现有1000名员工,其中女员工400名.为了解员工在某个月内推进5G运行指标的情况,采用分层抽样的方法随机抽取100名员工进行调查,得到如下统计表:
运行指标
频率
0.15
m
0.25
0.15
0.10
(1)求m的值,并估计该科技公司该月推进5G运行指标的平均数(同一组中的数据用该组区间的中点值为代表);
(2)若将推进5G运行指标不低于75的员工评为“璀璨之星”,已知该月被评为“璀璨之星”的男员工有10人,完成如下2×2列联表,并且判断是否有97.5%的把握认为被评为“璀璨之星”与性别有关.
“璀璨之星”
非“璀璨之星”
合计
男员工
女员工
合计
附:.
0.150
0.100
0.050
0.025
0.010
k
2.072
2.706
3.841
5.024
6.635
【答案】(1),67
(2)列联表见解析,有
【分析】(1)根据频率和为1可求,根据平均数公式即可求解;
(2)根据分层抽样可得所抽取的100人中男员工60人,女员工40人,求出被评为“璀璨之星”的人数及被评为“璀璨之星”的女员工的人数,补充列联表,根据卡方公式及临界值表即可判断.
(1)
根据题意,,解得,
平均数.
所以该科技公司该月推进5G运行指标的平均数约为67.
(2)
根据题意,利用分层抽样法可知所抽取的100人中男员工60人,女员工40人,被评为“璀璨之星”的有(人),则被评为“璀璨之星”的女员工有(人),
则2×2列联表如下:
“璀璨之星”
非“璀璨之星”
合计
男员工
10
50
60
女员工
15
25
40
合计
25
75
100
则.
所以有97.5%的把握认为被评为“璀璨之星”与性别有关.
变式3-2.2022年6月17日,我国第三艘航空母舰“中国人民解放军海军福建舰”下水试航,这是我国完全自主设计建造的首艘弹射型航空母舰,采用平直通长飞行甲板,配置电磁弹射和阻拦装置,满载排水量8万余吨.“福建舰”的建成,下水及试航,是新时代中国强军建设的重要成果.某校为纪念“福建舰”下水试航,增强学生的国防意识,组织了一次国防知识竞赛,共有100名学生参赛,成绩均在区间上,现将成绩制成如图所示频率分布直方图(每组均包括左端点,最后一组包括右端点).
(1)学校计划对成绩不低于平均分的参赛学生进行奖励,若同一组中的数据用该组区间的中点值为代表,试求受奖励的分数线的估计值;
(2)对这100名参赛学生的成绩按参赛者的性别统计,成绩不低于80分的为“良好”,低于80分的为“不良好”得到如下未填写完整的列联表.
良好
不良好
合计
男
48
女
16
合计
(ⅰ)将列联表填写完整;
(ⅱ)是否有95%以上的把握认为参赛学生的成绩是否良好与性别有关?
附:.
0.050
0.010
0.001
k
3.841
6.635
10.828
【答案】(1)73.8
(2)(ⅰ)表格见解析;(ⅱ)没有,理由见解析.
【分析】(1)利用频率之和为1列出方程,求出,进而利用中间值求出平均值,得到受奖励的分数线的估计值为73.8;
(2)完善列联表,计算出卡方,与3.841比较得到结论.
(1)
由频率分布直方图可知:,
解得.
所以平均分的估计值为,
故受奖励的分数线的估计值为73.8.
(2)
(ⅰ)列联表如下表所示.
良好
不良好
合计
男
8
40
48
女
16
36
52
合计
24
76
100
(ⅱ)由列联表得,
所以没有95%以上的把握认为参赛学生的成绩是否良好与性别有关.
变式3-3.根据某赛季甲、乙两名篮球运动员每场比赛得分的原始记录数据绘制了如下茎叶图:
(1)根据茎叶图判断哪位运动员的成绩更好?并说明理由;
(2)求24个得分的中位数m,并将所得分超过m和不超过m的得分数填入下面的列联表:
超过m
不超过m
甲
乙
(3)根据(2)中的列联表,能否有90%的把握认为甲、乙两名运动员的每场比赛得分有差异?
附:
0.15
0.10
0.05
2.072
2.706
3.841
【答案】(1)乙运动员的成绩更好,理由见解析
(2);填表见解析
(3)没有90%的把握认为甲、乙两名运动员的每场比赛得分有差异
【分析】(1)根据茎叶图分析数据的分布情况判断即可;
(2)根据中位数的定义求解,再完善表格即可;
(3)计算卡方并对比表格中的数据判断即可.
(1)
乙运动员的成绩更好,理由如下:
(ⅰ)由茎叶图可知:乙运动员的得分基本上是对称的,叶的分布是“单峰”的,有的叶集中在茎3,4上;甲运动员的得分基本上也是对称的,只有的叶集中在茎3,4上.所以乙运动员的成绩更好.
(ⅱ)由茎叶图可知:乙运动员得分的中位数是36;甲运动员得分的中位数是27.所以乙运动员的成绩更好.
(ⅲ)从叶在茎上的分布看,乙运动员的得分更集中于单峰值附近,这说明乙运动员的发挥更稳定.
以上给出3种理由,学生答出其中一种或其他合理理由均可得分.
(2)
由茎叶图可知,列联表如下:
超过m
不超过m
甲
5
7
乙
7
5
(3)
由于,
所以没有90%的把握认为甲、乙两名运动员的每场比赛得分有差异.
变式3-4.随着人们生活水平的提高,国家倡导绿色安全消费,菜篮子工程从数量保障型转向质量效益型,为了测试A、B两种不同有机肥料的使用效果,某科研单位用黄瓜做对比实验,分别在两片实验区各摘取100个,对其质量的某项指标值进行检测,质量指数达到45及以上的为“质量优等”,由测量结果绘成频率分布直方图,其中质量指标值分组区间是,,,,.
(1)分别求A实验区黄瓜质量指数的平均数和中位数;(每组数据以区间的中点值为代表,结果保留小数点后一位有效数字)
(2)请根据题中信息完成下面的2×2列联表,并判断是否有99.9%的把握认为“质量优等”与使用肥料有关.
A有机肥料
B有机肥料
合计
质量优等
质量非优等
合计
,其中n=a+b+c+d,
0.100
0.050
0.010
0.005
0.001
2.706
3.841
6.635
7.879
10.828
【答案】(1)平均数为44.5,中位数为45.9
(2)列联表见解析,有
【分析】(1)根据频率分布直方图以每组数据以区间的中点值为代表,求平均数和中位数;(2)根据频率分布直方图补全2×2列联表,代入公式计算,并与临界值比较大小,分析理解.
(1)
A片实验区黄瓜的质量指数平均数为:
,
设A片实验区黄瓜质量指数中位数为x,则:,
得.
(2)
由题意可得2×2列联表为:
A有机肥料
B有机肥料
合计
质量优等
60
30
90
质量非优等
40
70
110
合计
100
100
200
.
∵,所以有99.9%的把握认为“质量优等”与使用不同的肥料有关.
相关试卷
这是一份9.2.1统计模型(题型战法)-备战高三数学一轮复习题型与战法精准训练(新高考专用),文件包含921统计模型题型战法-备战高三数学一轮复习题型与战法精准训练新高考专用解析版docx、921统计模型题型战法-备战高三数学一轮复习题型与战法精准训练新高考专用原卷版docx等2份试卷配套教学资源,其中试卷共33页, 欢迎下载使用。
这是一份1.1.1 集合(题型战法)-备战高三数学一轮复习题型与战法精准训练(新高考专用),文件包含111集合题型战法-备战高三数学一轮复习题型与战法精准训练新高考专用解析版docx、111集合题型战法-备战高三数学一轮复习题型与战法精准训练新高考专用原卷版docx等2份试卷配套教学资源,其中试卷共29页, 欢迎下载使用。
这是一份9.2.2统计模型(针对练习)-备战高三数学一轮复习题型与战法精准训练(新高考专用),文件包含922统计模型针对练习-备战高三数学一轮复习题型与战法精准训练新高考专用解析版docx、922统计模型针对练习-备战高三数学一轮复习题型与战法精准训练新高考专用原卷版docx等2份试卷配套教学资源,其中试卷共29页, 欢迎下载使用。