2021年高考艺术生数学基础复习 考点22 回归方程和2×2联表(学生版)
展开考点22 回归方程和2×2联表
知识理解
一.线性关系
1.变量间的相关关系
(1)常见的两变量之间的关系有两类:
一类是函数关系,另一类是相关关系;与函数关系不同,相关关系是一种非确定性关系.
(2)从散点图上看,点散布在从左下角到右上角的区域内,两个变量的这种相关关系称为正相关;点散布在左上角到右下角的区域内,两个变量的这种相关关系为负相关.
2.两个变量的线性相关
(1)从散点图上看,如果这些点从整体上看大致分布在通过散点图中心的一条直线附近,称两个变量之间具有线性相关关系,这条直线叫做回归直线.
(2)回归方程: 是两个具有线性相关关系的变量的一组数据的回归方程,其中是待定参数. 的计算公式.
注意:回归方程必过样本中心,这也是做小题的依据和检验所求回归方程是否正确。
(3)相关系数:
当r>0时,表明两个变量正相关;
当r<0时,表明两个变量负相关.
r的绝对值越接近于1,表明两个变量的线性相关性越强.r的绝对值越接近于0,表明两个变量之间几乎不存在线性相关关系.通常|r|大于0.75时,认为两个变量有很强的线性相关性.
二.独立性检验
(1)2×2列联表
设X,Y为两个变量,它们的取值分别为{x1,x2}和{y1,y2},其样本频数列联表(2×2列联表)如下:
y1
y2
总计
x1
a
b
a+b
x2
c
d
c+d
总计
a+c
b+d
a+b+c+d
(2)独立性检验
利用随机变量K2(也可表示为χ2)的观测值(其中n=a+b+c+d为样本容量)来判断“两个变量有关系”的方法称为独立性检验.
考向分析
考向一 一次线性关系
【例1-1】(2020·山东高三专题练习)某工厂的每月各项开支与毛利润(单位:万元)之间有如下关系,与的线性回归方程,则( )
2
4
5
6
8
30
40
60
50
70
A.17.5 B.17 C.15 D.15.5
【例1-2】(2021·全国高三专题练习)西尼罗河病毒(WNV)是一种脑炎病毒,WNV通常是由鸟类携带,经蚊子传播给人类.1999年8-10月,美国纽约首次爆发了WNV脑炎流行.在治疗上目前尚未有什么特效药可用,感染者需要采取输液及呼吸系统支持性疗法,有研究表明,大剂量的利巴韦林含片可抑制WNV的复制,抑制其对细胞的致病作用.现某药企加大了利巴韦林含片的生产,为了提高生产效率,该药企负责人收集了5组实验数据,得到利巴韦林的投入量x(千克)和利巴韦林含片产量y(百盒)的统计数据如下:
投入量x(千克)
1
2
3
4
5
产量y(百盒)
16
20
23
25
26
由相关系数可以反映两个变量相关性的强弱,,认为变量相关性很强;,认为变量相关性一般;,认为变量相关性较弱.
(1)计算相关系数r,并判断变量x、y相关性强弱;
(2)根据上表中的数据,建立y关于x的线性回归方程;为了使某组利巴韦林含片产量达到150百盒,估计该组应投入多少利巴韦林?
参考数据:.
参考公式:相关系数,线性回归方程中,,.
【举一反三】
1.(2020·全国高三专题练习)某工厂某产品产量(千件)与单位成本(元)满足回归直线方程,则以下说法中正确的是( )
A.产量每增加件,单位成本约下降元 B.产量每减少件,单位成本约下降元
C.当产量为千件时,单位成本为元 D.当产量为千件时,单位成本为元
2.(2020·安徽省六安中学高三开学考试)“关注夕阳、爱老敬老”—某马拉松协会从年开始每年向敬老院捐赠物资和现金.下表记录了第年(年是第一年)与捐赠的现金(万元)的对应数据,由此表中的数据得到了关于的线性回归方程,则预测年捐赠的现金大约是( )
A.万元 B.万元 C.万元 D.万元
3.(2020·全国高三专题练习)基于移动互联技术的共享单车被称为“新四大发明”之一,短时间内就风靡全国,带给人们新的出行体验、某共享单车运营公司的市场研究人员为了解公司的经营状况,对该公司最近六个月内的市场占有率进行了统计,结果如下表:
月份
月份代码
市场占有率()
(1)请在给出的坐标纸中作出散点图,并用相关系数说明可用线性回归模型拟合月度市场占有率与月份代码之间的关系;
(2)求关于的线性回归方程,并预测该公司年月份的市场占有率;
(3)根据调研数据,公司决定再采购一批单车扩大市场,现有采购成本分别为元/辆和元/辆的、两款车型报废年限各不相同,考虑到公司的经济效益,该公司决定先对两款单车各辆进行科学模拟测试,得到两款单车使用寿命频数表如下:
报废年限
车型
年
年
年
年
总计
经测算,平均每辆单车每年可以为公司带来收入元.不考虑除采购成本之外的其他成本,假设每辆单车的使用寿命都是整数年,且用频率估计每辆单车使用寿命的概率,以每辆单车产生利润的期望值为决策依据、如果你是该公司的负责人,你会选择采购哪款车型?
参考数据:,,
参考公式:相关系数;
回归直线方程为,其中,
4.(2020·全国高三专题练习)近年来,“双11”网购的观念逐渐深入人心.某人统计了近年某网站“双11”当天的交易额,,统计结果如下表:
年份
2015
2016
2017
2018
2019
年份代码x
1
2
3
4
5
交易额y/百亿元
9
12
17
21
26
(1)请根据上表提供的数据,用相关系数说明与的线性相关程度,线性相关系数保留三位小数.(统计中用相关系数来衡量两个变量之间线性关系的强弱.若相应于变量的取值,变量的观测值为(),则两个变量的相关系数的计算公式为:.统计学认为,对于变量,如果,那么负相关很强;如果,那么正相关很强;如果或,那么相关性一般;如果,那么相关性较弱);
(2)求出关于x的线性回归方程,并预测年该网站“双11”当天的交易额.
参考公式:,;参考数据:.
考向二 独立性检验
【例2】(2021·江苏泰州市·高三期末)2020年是脱贫攻坚的收官之年,国务院扶贫办确定的贫困县全部脱贫摘帽,脱贫攻坚取得重大胜利,为确保我国如期全面建成小康社会,实现第一个百年奋斗目标打下了坚实的基础在产业扶贫政策的大力支持下,西部某县新建了甲、乙两家玩具加工厂,加工同一型号的玩具质监部门随机抽检了两个厂的各100件玩具,在抽取中的200件玩具中,根据检测结果将它们分成“A”、“B”、“C”三个等级,A、B等级都是合格品,C等级是次品,统计结果如下表所示:
等级
A
B
C
频数
20
120
60
(表一)
厂家
合格品
次品
合计
甲
75
乙
35
合计
(表二)
在相关政策扶持下,确保每件合格品都有对口销售渠道,但从安全起见,所有的次品必须由原厂家自行销.
(1)请根据所提供的数据,完成上面的2×2列联表(表二),并判断是否有95%的把握认为产品的合格率与厂家有关?
(2)每件玩具的生产成本为30元,A、B等级产品的出厂单价分别为60元、40元.另外已知每件次品的销毁费用为4元.若甲厂抽检的玩具中有10件为A等级,用样本的频率估计概率,试判断甲、乙两厂能否都能盈利,并说明理由.
附:,其中.
0.50
0.40
0.25
0.15
0.10
0.05
0.025
0.010
0.005
0.001
0.455
0.708
1.323
2.072
2.706
3.841
5.024
6.635
7.879
10.828
【举一反三】
1.(2021·山东高三专题练习)共享单车进驻城市,绿色出行引领时尚.某市有统计数据显示,2020年该市共享单车用户年龄等级分布如图1所示,一周内市民使用单车的频率分布扇形图如图2所示.若将共享单车用户按照年龄分为“年轻人”(20岁-39岁)和“非年轻人”(19岁及以下或者40岁及以上)两类,将一周内使用的次数为6次或6次以上的称为“经常使用单车用户”,使用次数为5次或不足5次的称为“不常使用单车用户”.已知在“经常使用单车用户”中有是“年轻人”.
(1)现对该市市民进行“经常使用共享单车与年龄关系”的调查,采用随机抽样的方法,抽取一个容量为200的样本,请你根据图表中的数据,补全下列列联表,并根据列联表的独立性检验,判断是否有85%的把握认为经常使用共享单车与年龄有关?
年轻人
非年轻人
合计
经常使用单车用户
120
不常使用单车用户
80
合计
160
40
200
(2)将(1)中频率视为概率,若从该市市民中随机任取3人,设其中经常使用共享单车的“非年轻人”人数为随机变量,求的分布列与期望.
参考数据:独立性检验界值表
0.15
0.10
0.050
0.025
0.010
2.072
2.706
3.841
5.024
6.635
其中,,
【举一反三】
1.(2021·全国高三专题练习)某工厂为了提高生产效率,对生产设备进行了技术改造,为了对比技术改造后的效果,采集了技术改造前后各20次连续正常运行的时间长度(单位:天)数据,整理如下:
改造前:19,31,22,26,34,15,22,25,40,35,18,16,28,23,34,15,26,20,24,21
改造后:32,29,41,18,26,33,42,34,37,39,33,22,42,35,43,27,41,37,38,36
(1)完成下面的列联表,并判断能否有99%的把握认为技术改造前后的连续正常运行时间有差异?
超过30
不超过30
改造前
改造后
(2)工厂的生产设备的运行需要进行维护,工厂对生产设备的生产维护费用包括正常维护费,保障维护费两种.对生产设备设定维护周期为T天(即从开工运行到第kT天,k∈N*)进行维护.生产设备在一个生产周期内设置几个维护周期,每个维护周期相互独立.在一个维护周期内,若生产设备能连续运行,则只产生一次正常维护费,而不会产生保障维护费;若生产设备不能连续运行,则除产生一次正常维护费外,还产生保障维护费.经测算,正常维护费为0.5万元/次;保障维护费第一次为0.2万元/周期,此后每增加一次则保障维护费增加0.2万元.现制定生产设备一个生产周期(以120天计)内的维护方案:T=30,k=1,2,3,4.以生产设备在技术改造后一个维护周期内能连续正常运行的频率作为概率,求一个生产周期内生产维护费的分布列及均值.
附:
P(K2≥k)
0.050
0.010
0.001
k
3.841
6.635
10.828
2.(2020·四川成都市·高三一模)一网络公司为某贫困山区培养了名“乡土直播员”,以帮助宣传该山区文化和销售该山区的农副产品,从而带领山区人民早日脱贫致富.该公司将这名“乡土直播员”中每天直播时间不少于小时的评为“网红乡土直播员”,其余的评为“乡土直播达人”.根据实际评选结果得到了下面列联表:
网红乡土直播员
乡土直播达人
合计
男
10
40
50
女
20
30
50
合计
30
70
100
(1)根据列联表判断是否有的把握认为“网红乡土直播员”与性别有关系?
(2)在“网红乡土直播员”中按分层抽样的方法抽取人,在这人中选人作为“乡土直播推广大使”.设被选中的名“乡土直播推广大使”中男性人数为,求的分布列和期望.
附:,其中.
考向三 非一次性回归方程
【例3-1】(2021·全国高三专题练习)在一项调查中有两个变量和,下图是由这两个变量近8年来的取值数据得到的散点图,那么适宜作为关于的回归方程的函数类型是( )
A. B.
C. D.()
【例3-2】.(2020·全国高三专题练习)根据公安部交管局下发的通知,自2020年6月1日起,将在全国开展“一盔一带”安全守护行动,其中就要求骑行摩托车、电动车需要佩戴头盔,为的就是让大家重视交通安全.某地交警部门根据某十字路口的监测数据,从穿越该路口的骑行者中随机抽查了200人,得到如图所示的列联表:
戴头盔
不带头盔
合计
男性
30
90
120
女性
10
70
80
合计
40
160
200
(1)是否有97.5%的把握认为自觉带头盔行为与性别有关?
(2)通过一定的宣传和相关处罚措施出台后,交警在一段时间内通过对某路口不带头盔的骑行者统计,得到上面的散点图和如下数据:
天数
1
2
3
4
5
6
人数
110
60
44
34
30
28
观察散点图,发现两个变量不具有线性相关关系,现考虑用函数对两个变量的关系进行拟合,通过分析得y与有一定的线性相关关系,并得到以下参考数据(其中):
3.5
0.41
12.25
0.1681
91
1.492
816
173.8
306
请选择合适的参考数据,求出y关于x的回归方程.
参考公式:.
0.050
0.025
0.010
0.005
0.001
k
3.841
5.024
6.635
7.879
10.828
对于一组数据,,…,,其回归直线的斜率和截距的最小二乘估计分别为:,.
【举一反三】
1.(2020·河南周口市·高三月考)已知变量关于变量的回归方程为,其一组数据如下表所示:
1
2
3
4
若,则( )
A.5 B.6 C.7 D.8
2.(2021·全国高三专题练习)近期,济南公交公司分别推出支付宝和微信扫码支付乘车活动,活动设置了一段时间的推广期,由于推广期内优惠力度较大,吸引越来越多的人开始使用扫码支付.某线路公交车队统计了活动刚推出一周内每一天使用扫码支付的人次,用表示活动推出的天数,表示每天使用扫码支付的人次(单位:十人次),统计数据如表所示:表:根据以上数据,绘制了散点图.
1
2
3
4
5
6
7
6
11
21
34
66
101
196
(1)根据散点图判断,在推广期内与(,均为大于零的常数)哪一个适宜作为扫码支付的人次关于活动推出天数的回归方程类型?(给出判断,不必说明理由);
(2)根据(1)的判断结果及表中的数据,建立关于的回归方程,并预测活动推出第8天使用扫码支付的人次;
(3)推广期结束后,车队对乘客的支付方式进行统计,结果如下表:
支付方式
现金
乘车卡
扫码
比例
10%
60%
30%
车队为缓解周边居民出行压力,以80万元的单价购进了一批新车,根据以往的经验可知,每辆车每个月的运营成本约为0.66万元.已知该线路公交车票价为2元,使用现金支付的乘客无优惠,使用乘车卡支付的乘客享受8折优惠,扫码支付的乘客随机优惠,根据统计结果得知,使用扫码支付的乘客中有的概率享受7折优惠,有的概率享受8折优惠,有的概率享受9折优惠,预计该车队每辆车每个月有1万人次乘车,根据所给数据以事件发生的频率作为相应事件发生的概率,在不考虑其它因素的条件下,按照上述收费标准,假设这批车需要年才能开始盈利,求的值.
参考数据:其中,
参考公式:对于一组数据,,…,,其回归直线的斜率和截距的最小二乘估计公式分别为:,.
66
1.54
2.711
50.12
3.47
3.(2021·全国高三专题练习)某公司研发了一种帮助家长解决孩子早教问题的萌宠机器人.萌宠机器人语音功能让它就像孩子的小伙伴一样和孩子交流,记忆功能还可以记住宝宝的使用习惯,很快找到宝宝想听的内容.同时提供快乐儿歌、国学经典、启蒙英语等早期教育内容,且云端内容可以持续更新.萌宠机器人一投放市场就受到了很多家长欢迎.为了更好地服务广大家长,该公司研究部门从流水线上随机抽取100件萌宠机器人(以下简称产品),统计其性能指数并绘制频率分布直方图(如图1):
产品的性能指数在的适合托班幼儿使用(简称A类产品),在的适合小班和中班幼儿使用(简称B类产品),在的适合大班幼儿使用(简称C类产品),A,B,C,三类产品的销售利润分别为每件1.5,3.5,5.5(单位:元).以这100件产品的性能指数位于各区间的频率代替产品的性能指数位于该区间的概率.
(1)求每件产品的平均销售利润;
(2)该公司为了解年营销费用(单位:万元)对年销售量(单位:万件)的影响,对近5年的年营销费用,和年销售量数据做了初步处理,得到的散点图(如图2)及一些统计量的值.
16.30
24.87
0.41
1.64
表中,,,.
根据散点图判断,可以作为年销售量(万件)关于年营销费用(万元)的回归方程.
(i)建立关于的回归方程;
(ii)用所求的回归方程估计该公司应投入多少营销费,才能使得该产品一年的收益达到最大?
(收益=销售利润-营销费用,取).
参考公式:对于一组数据,其回归直线的斜率和截距的最小二乘估计分别为,.
强化练习
1.(2021·全国高三专题练习)给出下列说法:
①回归直线恒过样本点的中心,且至少过一个样本点;
②两个变量相关性越强,则相关系数就越接近1;
③将一组数据的每个数据都加一个相同的常数后,方差不变;
④在回归直线方程中,当解释变量增加一个单位时,预报变量平均减少0.5个单位.
其中说法正确的是( )
A.①②④ B.②③④ C.①③④ D.②④
2.(2020·全国高三专题练习)对两个变量、进行线性相关检验,得线性相关系数,对两个变量、进行线性相关检验,得线性相关系数,则下列判断正确的是( )
A.变量与正相关,变量与负相关,变量与的线性相关性较强
B.变量与负相关,变量与正相关,变量与的线性相关性较强
C.变量与正相关,变量与负相关,变量与的线性相关性较强
D.变量与负相关,变量与正相关,变量与的线性相关性较强
3.(2020·河南新乡市·高三一模)年的“金九银十”变成“铜九铁十”,全国各地房价“跳水”严重,但某地二手房交易却“逆市”而行.下图是该地某小区年月至年月间,当月在售二手房均价(单位:万元/平方米)的散点图.(图中月份代码分别对应年月年月)
根据散点图选择和两个模型进行拟合,经过数据处理得到的两个回归方程分别为和,并得到以下一些统计量的值:
注:是样本数据中的平均数,是样本数据中的平均数,则下列说法不一定成立的是( )
A.当月在售二手房均价与月份代码呈正相关关系
B.根据可以预测年月在售二手房均价约为万元/平方米
C.曲线与的图形经过点
D.回归曲线的拟合效果好于的拟合效果
4.(2020·全国高三专题练习)对四组数据进行统计,获得以下散点图,关于其相关系数的比较,正确的是( )
A. B.
C. D.
5.(2020·邵阳市第二中学高三其他模拟(文))某种产品的广告费支出与销售额(单位:万元)之间有如表关系,与的线性回归方程为,当广告支出5万元时,随机误差的效应(残差)为( )
2
4
5
6
8
30
40
60
50
70
A.10 B.20 C.30 D.40
6.(2020·全国高三专题练习)为研究某种细菌在特定环境下,随时间变化的繁殖情况,得到如下实验数据:
天数(天)
3
4
5
6
繁殖个数(千个)
2.5
3
4.5
由最小二乘法得与的线性回归方程为,则当时,繁殖个数的预测值为( )
A.4.9 B.5.25
C.5.95 D.6.15
7.(2020·全国高三专题练习)已知某种商品的广告费支出x(单位:万元)与销售额y(单位:万元)之间有如下对应数据:
x
2
4
5
6
8
y
30
40
50
60
70
根据上表可得回归方程,计算得,则当投入10万元广告费时,销售额的预报值为
A.75万元 B.85万元
C.99万元 D.105万元
8.(2020·全国高三专题练习)随着国家二孩政策的全面放开,为了调查一线城市和非一线城市的二孩生育意愿,某机构用简单随机抽样方法从不同地区调查了100位育龄妇女,结果如下表.
非一线
一线
总计
愿生
45
20
65
不愿生
13
22
35
总计
58
42
100
由,得.
参照下表,
P(K2≥k0)
0.050
0.010
0.001
k0
3.841
6.635
10.828
下列结论正确的是( )
A.在犯错误的概率不超过0.1%的前提下,认为“生育意愿与城市级别有关”
B.在犯错误的概率不超过0.1%的前提下,认为“生育意愿与城市级别无关”
C.有99%以上的把握认为“生育意愿与城市级别有关”
D.有99%以上的把握认为“生育意愿与城市级别无关”
9.(2020·全国高三专题练习)为考察高中生的性别与是否喜欢数学课程之间的关系,利用2×2列联表进行检验,经计算K2的观测值k=7.069,参考下表,则认为“性别与是否喜欢数学课程有关”犯错误的概率不超过( )
P(K2≥k0)
0.100
0.050
0.025
0.010
0.001
k0
2.706
3.841
5.024
6.635
10.828
A.0.001 B.0.01 C.0.99 D.0.999
10.(多选)(2021·全国高三专题练习)因防疫的需要,多数大学开学后启用封闭式管理.某大学开学后也启用封闭式管理,该校有在校学生9000人,其中男生4000人,女生5000人,为了解学生在封闭式管理期间对学校的管理和服务的满意度,随机调查了40名男生和50名女生,每位被调查的学生都对学校的管理和服务给出了满意或不满意的评价,经统计得到如下列联表:
满意
不满意
男
20
20
女
40
10
附表:
P(K2≥k)
0.100
0.05
0.025
0.010
0.001
k
2.706
3 .841
5.024
6.635
10.828
附:
以下说法正确的有( )
A.满意度的调查过程采用了分层抽样的抽样方法
B.该学校学生对学校的管理和服务满意的概率的估计值为0.6
C.有99%的把握认为学生对学校的管理和服务满意与否与性别有关系
D.没有99%的把握认为学生对学校的管理和服务满意与否与性别有关系
11.(2021·山东高三专题练习)某沙漠地区经过治理,生态系统得到很大改善,野生动物数量有所增加.为调查该地区某种野生动物的数量,将其分成面积相近的200个地块,从这些地块中用简单随机抽样的方法抽取20个作为样区,调查得到样本数据(xi,yi)(i=1,2,…,20),其中xi和yi分别表示第i个样区的植物覆盖面积(单位:公顷)和这种野生动物的数量,并计算得,,,,.
(1)求该地区这种野生动物数量的估计值(这种野生动物数量的估计值等于样区这种野生动物数量的平均数乘以地块数);
(2)求样本(xi,yi)(i=1,2,…,20)的相关系数(精确到0.01);
(3)根据现有统计资料,各地块间植物覆盖面积差异很大.为提高样本的代表性以获得该地区这种野生动物数量更准确的估计,请给出一种你认为更合理的抽样方法,并说明理由.
附:相关系数r=,≈1.414.
12.(2020·江苏南通市·高三期中)利用简单随机抽样的方法,从某校高一年级男生体验表格中抽取名同学的胸围与肺活量的样本,计算平均值,,并求出线性回归方程为.
高一男生胸围与肺活量样本统计表
胸围
肺活量
胸围
肺活量
(1)求的值;
(2)求样本与的相关系数,并根据相关性检验的临界值表,判断有无把握认为肺活量与胸围线性关系是有意义的(精确到);
(3)将肺活量不低于视为大肺活量,用样本大肺活量的频率作为全校高一男生大肺活量的概率,求从本校高一年级任意抽取名男同学,恰有两名是大肺活量的概率.
(参考公式及数据:,,,.)
附:相关性检验的临界值表
检验水平
13.(2020·江苏扬州市·高三期中)某校从高二年级随机抽取了20名学生的数学总评成绩和物理总评成绩,记第i位学生的成绩为() (i=1,2,3...20),其中分别为第i位学生的数学总评成绩和物理总评成绩.抽取的数据列表如下( 按数学成绩降序整理):
序号
1
2
3
4
5
6
7
8
9
10
数学总评成绩x
95
92
91
90
89
88
88
87
86
85
物理总评成绩y
96
90
89
87
92
81
86
88
83
84
序号
11
12
13
14
15
16
17
18
19
20
数学总评成绩x
83
82
81
80
80
79
78
77
75
74
物理总评成绩
81
80
82
85
80
78
79
81
80
78
(1)根据统计学知识,当相关系数|r|≥0.8时,可视为两个变量之间高度相关.根据抽取的数据,能否说明数学总评成绩与物理总评成绩高度相关?请通过计算加以说明.
参考数据:
参考公式:相关系数
(2)规定:总评成绩大于等于85分者为优秀,小于85分者为不优秀,对优秀赋分1,对不优秀赋分0,从这20名学生中随机抽取2名学生,若用X表示这2名学生两科赋分的和,求X的分布列和数学期望.
14.(2020·全国高三专题练习)近年来,“双11”网购的观念逐渐深入人心.某人统计了近年某网站“双11”当天的交易额,统计结果如下表:
年份
2015
2016
2017
2018
2019
年份代码x
1
2
3
4
5
交易额y/百亿元
9
12
17
21
26
(1)请根据上表提供的数据,用相关系数说明与的线性相关程度,线性相关系数保留三位小数.(统计中用相关系数来衡量两个变量之间线性关系的强弱.若相应于变量的取值,变量的观测值为(),则两个变量的相关系数的计算公式为:.统计学认为,对于变量,如果,那么负相关很强;如果,那么正相关很强;如果或,那么相关性一般;如果,那么相关性较弱);
(2)求出关于的线性回归方程,并预测年该网站“双11”当天的交易额.
参考公式:,;参考数据:.
15.(2020·陕西高三零模)年月日,国家统计局公布全国规模以上工业企业月累计营业收入利润率数据如表:
月份累计
月
月
月
月
月
月
月
月
月
月
月份累计代码
营业收入利润率
(1)根据表中有关数据请在下图中补充完整与的折线图,判断与哪一个更适宜作为关于的回归方程类型,并说明理由;
(2)根据(1)的判断结果及表中数据,建立关于的回归方程(系数精确到);
(3)根据(2)得出的回归方程,预测月月累计营业收入利润率的值为多少?
参考公式:对于一组数据、、、,其回归直线的斜率和截距的最小二乘估计分别为,.
参考数据:
表中,,.
16.(2020·河北邢台市·邢台一中高三月考)近年来,国资委、党委高度重视扶贫开发工作,坚决贯彻落实中央扶贫工作重大决策部署,在各个贫困县全力推进定点扶贫各项工作,取得了积极成效.某贫困县为了响应国家精准扶贫的号召,建了一些蔬菜大棚供村民承包管理,已知土地的使用面积以及相应的管理时间的关系如下表所示:
土地使用面积(单位:亩)
1
2
3
4
5
管理时间(单位:月)
8
10
13
20
24
并调查了某村300名村民参与管理的意愿,得到的部分数据如下表所示:
愿参与管理
不愿参与管理
男性村民
150
50
女性村民
50
(1)求出相关系数r(保留三位小数)的大小,并判断管理时间y与土地使用面积x是否有较强的相关关系?若有,求出线性回归方程.
(2)是否有99.9%的把握认为村民的性别与参与管理的意愿有关?
参考公式:,;,
0.010
0.005
0.001
6.635
7.879
10.828
参考数据:
17.(2020·山东济南市·高三开学考试)2019年6月25日,《固体废物污染环境防治法(修订草案)》初次提请全国人大常委会审议,草案对“生活垃圾污染环境的防治”进行了专章规定.草案提出,国家推行生活垃圾分类制度.为了了解人民群众对垃圾分类的认识,某市环保部门对该市市民进行了一次垃圾分类网络知识问卷调查,每一位市民仅有一次参加机会,通过随机抽样,得到参加问卷调查的1000人(其中450人为女性)的得分(满分:100分)数据,统计结果如表所示:
得分
男性人数
15
90
130
100
125
60
30
女性人数
10
60
70
150
100
40
20
(1)由频数分布表可以认为,此次问卷调查的得分服从正态分布,近似为这1000人得分的平均值(同一组数据用该组区间的中点值作为代表),请利用正态分布的知识求;
(2)把市民分为对垃圾分类“比较了解”(不低于60分的)和“不太了解”(低于60分的)两类,请完成如下列联表,并判断是否有的把握认为市民对垃圾分类的了解程度与性别有关?
不太了解
比较了解
合计
男性
女性
合计
(3)从得分不低于分的被调查者中采用分层抽样的方法抽取名.再从这人中随机抽取人,求抽取的人中男性人数的分布列及数学期望.
参考数据:①;②若,则,,;
,
18.(2020·河南高三月考)某省为了迎接国家数学竞赛,特地在,两所学校分别用甲、乙两种方法培训教学.为观测其成绩情况,分别在两个班级各随机抽取60名学生,对每名学生进行综合评分,将每名学生所得的综合评分制成如图所示的频率分布直方图,其中,.记综合评分为80及以上的学生为优质学生.
(1)求图中,的值,并求综合评分的平均数(同一组中的数据用该组区间的中点值作代表);
(2)用样本估计总体,以频率作为概率,若在,两个班级随机抽取3名学生,求所抽取的学生中的优质学生数的分布列和数学期望﹔
(3)填写下面的列联表,能否在犯错误的概率不超过0.1的情况下认为优质学生与培训方法有关.
优质学生
非优质学生
合计
甲培训法
40
乙培训法
合计
附:
0.15
0.10
0.05
0.025
0.010
0.005
0.001
2.072
2.706
3.841
5.024
6.635
7.879
10.828
(参考公式:,其中.)
20.(2020·全国高三专题练习)某企业销售部门为了解员工的销售能力,按性别利用分层抽样的方法从该部门现有员工中(其中男生占比为45%)随机抽取名进行问卷调查,并将得分分为1,2,3,4,5五个档次,各档次中参与问卷调查的员工人数如条形图所示.已知第5档的员工人数占总人数的.
(1)若将某员工得分所在的档次作为该员工销售的能力基数(记能力基数为能力基数高,其他均为能力基数不高),在能力基数为5的员工中,女生与男生的比例为,以抽取的名员工为研究对象,完成下面的列联表,并判断是否有90%的把握认为能力基数高低与性别有关;
男生
女生
合计
能力基数高
能力基数不高
合计
(2)为提高员工认知并调动员工自主学习的积极性,部门组织员工参加各种形式的培训讲座.已知每位员工的销售能力指数、能力基数以及参加培训的次数满足函数关系式,如果员工甲的能力基数为4,员工乙的能力基数为2,则在甲不参加培训的情况下,乙至少参加多少次培训,其销售能力指数超过甲?
参考数据及参考公式:,,
0.15
0.10
0.05
0.01
2.072
2.706
3.841
6.635
21.(2020·全国高三专题练习)近年来我国电子商务行业迎来蓬勃发展的新机遇,2016年双11期间,某购物平台的销售业绩高达918亿人民币.与此同时,相关管理部门推出了针对电商的商品和服务的评价体系.现从评价系统中选出200次成功交易,并对其评价进行统计,对商品的好评率为0.6,对服务的好评率为0.75,其中对商品和服务都做出好评的交易为80次.
(1)完成下面列联表,并通过计算说明是否可以在犯错误概率不超0.1%的前提下,认为商品好评与服务好评有关?
对商品好评
对商品非好评
合计
对服务好评
对服务非好评
合计
参考数据及公式如下:
0.15
0.10
0.05
0.025
0.010
0.005
0.001
2.072
2.706
3.841
5.024
6.635
7.879
10.828
(,其中)
(2)若将频率视为概率,某人在该购物平台上进行的次购物中,设对商品和服务全好评的次数为随机变量:
①求对商品和服务全好评的次数的分布列(概率用组合数算式表示);
②求的数学期望和方差.
22.(2020·广东高三月考)受新冠肺炎疫情影响,上学期网课时间长达三个多月,电脑与手机屏幕代替了黑板,对同学们的视力造成了非常大的损害.我市某中学为了了解同学们现阶段的视力情况,现对高三年级2000名学生的视力情况进行了调查,从中随机抽取了100名学生的体检表,绘制了频率分布直方图如图所示:
前50名
后50名
近视
40
32
不近视
10
18
(1)求的值,并估计这2000名学生视力的平均值(精确到0.1);
(2)为了进一步了解视力与学生成绩是否有关,对本年级名次在前50名与后50名的学生进行了调查,得到的数据如列联表,根据表中数据,能否有95%把握认为视力与学习成绩有关?
(3)自从“十八大”以来,国家郑重提出了人才强军战略,充分体现了国家对军事人才培养的高度重视.近年来我市空军飞行员录取情况喜人,继2019年我市有6人被空军航空大学录取之后,今年又有3位同学顺利拿到了空军航空大学通知书,彰显了我市爱国主义教育,落实立德树人根本任务已初见成效.2020年某空军航空大学对考生视力的要求是不低于5.0,若以该样本数据来估计全市高三学生的视力,现从全市视力在4.8以上的同学中随机抽取3名同学,这3名同学中有资格报考该空军航空大学的人数为,求的分布列及数学期望.
0.10
0.05
0.025
0.010
0.005
2.706
3.841
5.024
6.635
7.879
附:,其中.
23.(2020·海口市第四中学高三月考)为研究家用轿车在高速公路上的车速情况,交通部门随机选取100名家用轿车驾驶员进行调查,得到其在高速公路上行驶时的平均车速情况为:在55名男性驾驶员中,平均车速超过的有40人,不超过的有15人;在45名女性驾驶员中,平均车速超过的有20人,不超过的有25人.
(1)完成下面列联表,并判断能否在犯错误概率不超过的前提下认为“平均车速超过与性别有关”?
平均车速超过
平均车速不超过
总计
男性驾驶员
女性驾驶员
总计
附:,其中.
(2)在被调查的驾驶员中,从平均车速不超过的人中随机抽取2人,求这2人恰好是1名男性驾驶员和1名女性驾驶员的概率;
(3)以上述样本数据估计总体,从高速公路上行驶的家用轿车中随机抽取3辆,记这3辆车平均车速超过且为男性驾驶员的车辆数为,求的分布列和数学期望.
2021年高考艺术生数学基础复习 考点22 回归方程和2×2联表(教师版含解析): 这是一份2021年高考艺术生数学基础复习 考点22 回归方程和2×2联表(教师版含解析),共50页。教案主要包含了独立性检验,非一次性回归方程等内容,欢迎下载使用。
2021年高考艺术生数学基础复习 考点33 幂函数(学生版): 这是一份2021年高考艺术生数学基础复习 考点33 幂函数(学生版),共10页。教案主要包含了幂函数的定义域值域,幂函数的性质等内容,欢迎下载使用。
2021年高考艺术生数学基础复习 考点03 集合(学生版): 这是一份2021年高考艺术生数学基础复习 考点03 集合(学生版),共8页。教案主要包含了子集的个数,集合间的关系,集合间运算等内容,欢迎下载使用。