还剩37页未读,
继续阅读
所属成套资源:全套通用版2023届高考数学二轮复习作业含答案
成套系列资料,整套一键下载
通用版2023届高考数学二轮复习成对数据的统计问题作业含答案
展开这是一份通用版2023届高考数学二轮复习成对数据的统计问题作业含答案,共40页。试卷主要包含了单选题,多选题,填空题,解答题等内容,欢迎下载使用。
成对数据的统计问题
一、单选题
1. 对四组数据进行统计,获得以下散点图,关于其相关系数的比较,正确的是( )
A. r4
A. 平均数 B. 中位数 C. 众数 D. 方差
二、多选题
3. 某中学为了解学生数学史知识的积累情况,随机抽取150名同学参加数学史知识测试,测试题共5道,每答对一题得20分,答错得0分,得分不少于60分记为及格,不少于80分记为优秀,测试成绩百分比分布图如图所示,则( )
A. 该次数学史知识测试及格率超过90%
B. 该次数学史知识测试得满分的同学有15名
C. 该次测试成绩的中位数大于测试成绩的平均数
D. 若该校共有1500名学生,则数学史知识测试成绩能得优秀的同学大约有720名
4. 为了满足不同人群的差异化健身需求,营造全民健身的浓厚氛围,某地不断加大经费投入,推进各类公共体育设施的建设.下表是该地近5年来投建体育设施的资金:
年数x
1
2
3
4
5
年投资y(百万元)
0.62
2.08
3.45
4.80
6.15
根据上表可得年投入资金y(百万元)关于年数x的线性回归方程y=bx-0.714,则
A. 前5年投建体育设施的年平均资金为3.42百万元
B. 该地第6年投建体育设施的资金为7.554百万元
C. 预测该地第7年投建体育设施的资金超过8.9百万元
D. 第7年后该地每年投资体育设施的资金都超过8.9百万元
5. 下列说法正确的是( )
A. 设有一个回归方程y=2x+3,变量x增加1个单位时,y平均增加2个单位
B. 若x-1xn的二项展开式共有9项,则该展开式中各项二项式系数之和为256
C. 10件产品中有8件正品2件次品,若从这10件产品中任取2件,则恰好取到1件次品的概率为845
D. 已知一组数据x1,x2,x3,x4,x5的方差为4,则数据4x1-1,4x2-1,4x3-1,4x4-1,4x5-1的标准差为8
6. 下列说法正确的是( )
A. 为了更好地开展创文创卫工作,需要对在校中小学生参加社会实践活动的意向进行调查,拟采用分层抽样的方法从该地区ABCD四个学校中抽取一个容量为400的样本进行调查,已知ABCD四校人数之比为7:4:3:6,则应从B校中抽取的样本数量为80
B. 6件产品中有4件正品,2件次品,从中任取2件,则至少取到1件次品的概率为0.6
C. 已知变量x、y线性相关,由样本数据算得线性回归方程是y=0.4x+a,且由样本数据算得x=4,y=3.7,则a=2.1
D. 箱子中有4个红球、2个白球共6个小球,依次不放回地抽取2个小球,记事件M={第一次取得红球},N={第二次取得红球},则M、N为相互独立事件
7. 下列说法正确的是( )
A. 设有一个回归方程y=2x+3,变量x增加1个单位时,y平均增加2个单位
B. 若(x-1x)n的二项展开式共有9项,则该展开式中各项二项式系数之和为256
C. 10件产品中有8件正品,2件次品,若从这10件产品中任取2件,则恰好取到1件次品的概率为845
D. 已知一组数据x1,x2,x3,x4,x5的方差为4,则数据4x1-1,4x2-1,4x3-1,4x4-1,4x5-1的标准差为8
8. 下列命题中,正确的命题有( )
A. 已知随机变量X服从正态分布N(2,σ2)且P(X<4)=0.9,则P(0
C. 在抛骰子试验中,事件A={1,2,3,5,6},事件B={2,4,5,6},则P(A|B)=35
D. 在线性回归模型中,R2表示解释变量对于预报变量变化的贡献率,R2越接近于1,表示回归的效果越好
三、填空题
9. 一只红铃虫产卵数y和温度x有关,现测得一组数据xi,yii=1,2,……,10,可用模型y=c1ec2x拟合,设z=lny,其变换后的线性回归方程为z=bx-4,若x1+x2+……+x10=300,y1y2⋅⋅⋅y10=e50,e为自然常数,则c1c2= .
10. 心理学家分析发现视觉和空间想象能力与性别有关,某数学兴趣小组为了验证这个结论,从所在学校中按分层随机抽样的方法抽取50名同学(男30,女20),给所有同学几何题和代数题各一题,让各位同学自由选择一道题进行解答.选题情况如下表:(单位:人)
性别
题型
合计
几何题
代数题
男同学
22
8
30
女同学
8
12
20
合计
30
20
50
根据上述数据,推断视觉和空间想象能力与性别有关系,则这种推断犯错误的概率不超过 .
附:χ2=n(ad-bc)2(a+b)(c+d)(a+c)(b+d),其中n=a+b+c+d.
α
0.15
0.10
0.05
0.025
0.010
0.005
0.001
xα
2.072
2.706
3.841
5.024
6.635
7.879
10.828
四、解答题
11. (本小题12.0分)
甲、乙两种产品的误差指标划分为小于或等于1.5的为一等品,现从这批产品中随机抽取这两种产品各6件进行检验,其误差指标记录如下:
甲
0.8
1.4
a
0.6
2.4
1.4
乙
1.6
1.3
0.7
2.1
1.5
1.2
已知两种产品检验数据的平均数相等
(Ⅰ)求出表中a的值,并求出甲种产品检验数据的标准差;
(Ⅱ)若从被检验的6件甲种产品中任取2件,求这2件都是一等品的概率.
12. (本小题12.0分)
随着全民运动健康意识的提高,马拉松运动在全国各大城市逐渐兴起,参与马拉松训练与比赛的人数逐年增加,为此某市对人们参加马拉松运动的情况进行了统计调查,其中一项调查是调查人员从参与马拉松运动的人中随机抽取200人,对其每周参与马拉松长跑训练的天数进行统计,得到以下统计表:
平均每周进行长跑训练天数
不大于2天
3天或4天
不少于5天
人数
30
130
40
若某人平均每周进行长跑训练天数不少于5天,则称其为“热烈参与者”,否则称为“非热烈参与者”
(1)经调查,该市约有3万人参与马拉松运动,估计其中“热烈参与者”的人数;
(2)根据上表的数据,填写下列2×2列联表,并通过计算判断是否能在犯错误的概率不超过0.01的前提下,认为“热烈参与马拉松”与性别有关?
热烈参与者
非热烈参与者
合计
男
140
女
55
合计
附:χ2=n(ad-bc)2(a+b)(c+d)(a+c)(b+d)(n为样本容量).
P(χ2≥k0)
0.150
0.100
0.050
0.025
0.010
0.005
0.001
k0
2.072
2.706
3.841
5.024
6.635
7.879
10.828
13. (本小题12.0分)
新冠肺炎疫情发生以来,我国某科研机构开展应急科研攻关,研制了一种新型冠状病毒疫苗,并已进入二期临床试验.根据普遍规律.志愿者接种疫苗后体内会产生抗体,人体中检测到抗体,说明有抵御病毒的能力.通过检测,用x表示注射疫苗后的天数.y表示人体中抗体含量水平(单位:miu/mL,即:百万国际单位/毫升),现测得某志愿者的相关数据如下表所示:
天数x
1
2
3
4
5
6
抗体含量水平y
5
10
26
50
96
195
根据以上数据,绘制了散点图.
(1)根据散点图判断,y=c·edx与y=a+bx(a,b,c,d均为大于零的常数)哪一个更适宜作为描述y与x关系的回归方程类型?(给出判断即可,不必说明理由)
(2)根据(1)的判断结果求出y关于x的回归方程,并预测该志愿者在注射疫苗后的第10天的抗体含量水平值;
(3)从这位志愿者的前6天的检测数据中随机抽取4天的数据作进一步的分析,记其中的y值大于50的天数为X,求X的分布列与数学期望.
参考数据:
x
y
ω
i=16(x1-x)2
i=16(ω1-ω)2
i=16(ωi-ω)(xi-x)
i=16(xi-x)(yi-y)
e8.3
3.50
63.67
3.49
17.50
9.49
12.95
519.01
4023.87
其中ω=lny.
参考公式:用最小二乘法求经过点(u1,v1),(u2,v2),(u3,v3),….(ui,vi)的线性回归方程v=bu+a的系数公式,b=i=1n(ui-u)(vi-v)i=1n(ui-u)2=i=1nuivi-nu·vi=1nui2-nu2,a=v-bu.
14. (本小题12.0分)
千百年来,我国劳动人民在生产实践中根据云的形状、走向、速度、厚度、颜色等的变化,总结了丰富的“看云识天气”的经验,并将这些经验编成谚语,如“天上钩钩云,地上雨淋淋”,“日落云里走,雨在半夜后”…….某同学为了验证“天上钩钩云,地上雨淋淋”的现象,在气象局获取了200天的天气情况数据,得到如下2×2列联表:
天上钩钩云
地上雨淋淋
合计
下雨
未下雨
出现
60
100
未出现
70
合计
附:
α
0.1
0.05
0.01
0.005
0.001
xα
2.706
3.841
6.635
7.879
10.828
(1)根据所给数据,将上述列联表补充完整,并根据小概率值α=0.01的独立性检验,分析出现“天上钩钩云”与次日的“地上雨淋淋”是否有关.
(2)按分层随机抽样的方式在该地区统计的“地上雨淋淋”中下雨的天数中随机抽取9天,再从这9天中任意选取3天,记其中未出现“天上钩钩云”的天数为X,求X的分布列与期望.
15. (本小题12.0分)
某公司研发了一种帮助家长解决孩子早教问题的萌宠机器人.萌宠机器人的语音功能让它像孩子的小伙伴一样和孩子交流,记忆功能还可以记住宝宝的使用习惯,很快找到宝宝想听的内容.它同时提供快乐儿歌、国学经典、启蒙英语等早期教育内容,且云端内容可以持续更新,萌宠机器人一投放市场就受到了很多家长欢迎.为了更好的服务广大家长,该公司对萌宠机器人的某个性能指数x(0
3
4
5
6
7
y
0.45
0.50
0.60
0.65
0.70
(1)请根据上表提供的数据,用最小二乘法求出y关于x的线性回归方程;
(2)计算变量x,y的相关系数r(计算结果精确到0.01),并回答是否可以认为该性能指数与孩子的喜爱程度相关性很强.(|r|∈[0.75,1],x,y相关性很强,|r|∈[0.3,0.75),x,y相关性一般,|r|∈[0,0.25],x,y相关性很弱)
参考数据:0.43≈0.656,0.043≈0.207,i=15yi-y2=0.043.
参考公式:b=i=1nxiyi-nxyi=1nxi2-nx2=i=1nxi-xyi-yi=1nxi-x2,a=y-b⋅x,
相关系数r=i=1nxi-xyi-yi=1nxi-x2i=1nyi-y2.
16. (本小题12.0分)
直播电商带货的模式近年来发展势头迅猛,我国直播电商模式不仅规模上实现增长,在影响力上也发展成为重要的电商消费模式,包括直播活跃程度、覆盖商品类型、主播类型等都实现延展.每年的“双十一”购物节成为各直播电商重点关注的节点.某直播公司为增加销售额,准备采取新举措,将原本单一的直播团队拆分为甲、乙两个直播团队,相互竞争.该公司记录了新举措实施前40天的全公司的日均总销售额和新举措实施后40天的日均总销售额的天数频数分布表,如表所示:
日均总销售
额(万元)
[15,16)
[16,17)
[17,18)
[18,19)
[19,20)
[20,21)
[21,22)
[22,23)
天数
12
15
6
2
2
1
1
1
新举措实施后40天全公司的日均总销售额
日均总销售
额(万元)
[15,16)
[16,17)
[17,18)
[18,19)
[19,20)
[20,21)
[21,22)
[22,23)
天数
1
2
3
4
13
14
2
1
(1)将下面的2x2列联表补充完整.并回答:在犯错误的概率不超过0.001的前提下,能否判断公司销售额提高与采取新措施有关
日均总销售额小于20万元的天数
日均销售额不小于20万元的天数
总计
新举措实施前40天
新举措实施后40天
总计
(2)后期该公司还打算对甲、乙两个直播团队的表现进行如下考核:选定某周周一至周五的5天时间,两队进行当天销售额的比较,若甲团队的销售额超过10万元且乙团队的销售额未超过10万元,则甲团队得1分,乙团队得-1;若乙团队的销售额超过10万元且甲团队的销售额未超过10万元,则乙团队得1分,甲团队得-1;若两团队的销售额都超过10万元或都未超过10万元,则两团队均得0分.根据以往数据,甲、乙两团队某天销售额超过10万元的概率分别为p1和p2,某一天的考核中甲团队的得分记为X.
(i)若p1=0.5,p2=0.8,求X的分布列;
(i)若甲乙两团队在考核开始时都赋予3分,两队销售额比较1次算一轮,若经过10轮比较,甲
团队得分的数学期望超过5分,求p1的取值范围(用p2表示).
参考公式及数据:K2=n(ad-bc)2(a+b)(c+d)(a+c)(b+d),其中n=a+b+c+d.
P(K2⩾k0)
0.15
0.10
0.05
0.025
0.010
0.005
0.001
k0
2.072
2.706
3.841
5.024
6.635
7.879
10.828
17. (本小题12.0分)
2022年是奥运年,我国北京和张家口联合承办第二十四届冬季奥运会,本届冬奥会共设7个大项(滑雪、滑冰、冰球、冰壶、雪车、雪橇、冬季两项)、15个分项(高山滑雪、自由式滑雪、单板滑雪、跳台滑雪、越野滑雪、北欧两项、短道速滑、速度滑冰、花样滑冰、冰球、冰壶、雪车、钢架雪车、雪橇、冬季两项)共计109个小项.某校为了调查学生是否喜欢冬季冰雪运动与性别有关,在高三年级特选取了200名学生进行了问卷调查,得到如下的2×2列联表:
喜欢
不喜欢
合计
男生
a
c
女生
b
d
合计
已知从这200名学生中随机抽取1人,这个人喜欢冰雪运动的概率为0.8,表格中a=100,d=20.
(1)完成2×2列联表,并判断是否有90%的把握认为喜欢冰雪运动与性别有关;
(2)从上述喜欢冰雪运动的学生中用分层抽样的方法抽取8名学生,再从这8人中抽取3人调查其喜欢的运动,用X表示3人中女生的人数,求X的分布列及数学期望.
参考公式及数据:χ2=n(ad-bc)2(a+b)(c+d)(a+c)(b+d),其中n=a+b+c+d.
P(χ2≥k0)
0.50
0.40
0.25
0.15
0.10
0.05
0.025
0.01
0.005
0.001
k0
0.46
0.71
1.32
2.07
2.71
3.84
5.024
6.635
7.879
10.828
18. (本小题12.0分)
2020年7月,我国湖北、江西等地连降暴雨,造成严重的地质灾害.某地两防指挥部在汛期对当地一条河流进行连续监测,下表是连续7日该河流某段的水位情况.
河流水位表(1)
xi
第1日
第2日
第3日
第4日
第5日
第6日
第7日
水位yi(米)
3.5
3.6
3.8
3.9
4.2
4.4
4.6
根据河流的堤防情况规定:水位超过一定高度将分别启动相应预警措施(见下表),当水位达到保证水位时,防汛进入紧急状态,防汛部门要按照紧急防汛期的权限,采取各种必要措施,确保堤防等工程的安全.
水位预警分级表(2)
水位
≥4.7
≥5.1
≥5.6
水位分类
设防水位
警戒水位
保证水位
预警颜色
黄色
橙色
红色
(Ⅰ)求样本(xi,yi)(i=1,2,…,7)的相关系数.
(Ⅱ)根据相关系数的大小,判断水位y与x是否存在较强的线性相关关系.若存在,求出线性回归方程;若不存在,请说明理由(以上数据均精确到0.001).
(Ⅲ)根据表(1)推测,第几日可能达到橙色预警?
附:相关系数r=i=1n(xi-x)(yi-y)i=1n(xi-x)2i=1n(yi-y)2,28.56≈5.344.
回归方程y=a+bx中斜率和截距的最小二乘估计公式分别为:b=i=1n(xi-x)(yi-y)i=1n(xi-x)2,a=y-bx.
19. (本小题12.0分)
高铁、移动支付、网购与共享单车被称为中国的新四大发明,为了解永安共享单车在淮南市的使用情况,永安公司调查了100辆共享单车每天使用时间的情况,得到了如图所示的频率分布直方图.
(Ⅰ)求图中a的值;
(Ⅱ)现在用分层抽样的方法从前3组中随机抽取8辆永安共享单车,将该样本看成一个总体,从中随机抽取2辆,求其中恰有1辆的使用时间不低于50分钟的概率;
(Ⅲ)为进一步了解淮南市对永安共享单车的使用情况,永安公司随机抽取了200人进行调查问卷分析,得到如下2×2列联表:
经常使用
偶尔使用或不用
合计
男性
50
100
女性
40
合计
200
完成上述2×2列联表,并根据表中的数据判断是否有85%的把握认为淮南市使用永安共享单车的情况与性别有关?
附:χ2=n(ad-bc)2(a+b)(c+d)(a+c)(b+d)
P(χ2⩾k0)
0.15
0.10
0.05
0.025
0.010
k0
2.072
2.706
3.841
5.024
6.635
20. (本小题12.0分)
科学技术是第一生产力,创新是引领发展的第一动力.某企业积极响应国家“科技创新”的号召,大力研发新产品.为对新研发的一批产品进行合理定价,将该产品按事先拟定的价格进行试销,得到一组销售数据(xi,yi)(i=1,2,3,4,5,6)如表格所示:
试销单价x(百元)
1
2
3
4
5
6
产品销量y(件)
91
86
82
78
73
70
(Ⅰ)统计学认为,两个变量x、y的相关系数r的大小可表明两变量间的相关性强弱.一般地,如果|r|∈[0.75,1],那么相关性很强;如果|r|∈[0.30,0.75),那么相关性一般;如果|r|∈[0,0.25],那么相关性较弱.试判断变量x、y的相关性强弱.
(Ⅱ)若变量x、y线性相关时,由线性回归方程求得的与x对应的产品销售量估计值yi与实际值yi差的绝对值小于1时,则将销售数据称为“有效数据”.现从这6组销售数据中任取2组,求抽取的2组销售数据都是“有效数据”的概率.(求线性回归方程时,a,b精确到个位)
参考公式及数据:y=16i=16yi=80,i=16xiyi=1606,i=16xi2=91,5495≈74,b=i=1n(xi-x)(yi-y)i=1n(xi-x)2=i=1nxiyi-nx·yi=1nxi2-nx2,a=y-bx,
r=i=1nxi-xyi-yi=1nxi-x2·i=1nyi-y2=i=1nxiyi-nx yi=1nxi-x2·i=1nyi-y2.
21. (本小题12.0分)
在“十三五”期间,我国的扶贫工作进入了“精准扶贫”阶段.到2020年底,全国830个贫困县全部脱贫摘帽,最后4335万贫困人口全部脱贫,这是我国脱贫攻坚史上的一大壮举.重庆市奉节县作为国家贫困县之一,于2019年4月顺利脱贫摘帽.因地制宜发展特色产业,是奉节脱贫攻坚的重要抓手.奉节县规划发展了以高山烟叶、药材、反季节蔬菜;中山油橄榄、养殖;低山脐橙等为主的产业格局,各类特色农产品已经成为了当地村民的摇钱树.尤其是奉节脐橙,因“果皮中厚、脆而易剥,肉质细嫩化渣、无核少络,酸甜适度,汁多爽口,余味清香”而闻名.为了防止返贫,巩固脱贫攻坚成果,各职能部门对脐橙种植、销售、运输、改良等各方面给予大力支持.已知脐橙分类标准:果径80~85mm为一级果,果径75~80mm为二级果,果径70~75mm或85mm以上为三级果.某农产品研究所从种植园采摘的大量奉节脐橙中随机抽取1000个,测量这些脐橙的果径(单位:mm),得到如图所示的频率分布直方图.
(1)试估计这1000个奉节脐橙的果径的中位数;
(2)在这1000个脐橙中,按分层抽样的方法在果径70~85mm中抽出9个脐橙,为进一步测量其他指标,在抽取的9个脐橙中再抽出3个,求抽到的一级果个数X的分布列与数学期望;
(3)以样本估计总体,用频率代替概率,某顾客从种植园的这批脐橙中随机购买100个,其中一级果的个数为Y,记一级果的个数为k的概率为P(Y=k),写出P(Y=k)的表达式,并求出当k为何值时,P(Y=k)最大?
22. (本小题12.0分)
在我国,大学生就业压力日益严峻,随着政府政策引导与社会观念的转变,大学生创业意识、就业方向也悄然发生转变.某大学生在国家提供的税收、担保贷款等很多方面的政策扶持下选择加盟某专营店自主创业,该专营店统计了近五年来创收利润数yi(单位:万元)与时间ti(单位:年)的数据,列表如下:
ti
1
2
3
4
5
yi
2.4
2.7
4.1
6.4
7.9
(1)依据表中给出的数据,是否可用线性回归模型拟合y与t的关系,请计算相关系数r,并加以说明(计算结果精确到0.01).(若r>0.75,则线性相关程度很高,可用线性回归模型拟合)
附:相关系数公式r=i=1nti-tyi-yi=1nti-t2i=1nyi-y2=i=1ntiyi-ntyi=1nti-t2i=1nyi-y2.
参考数据:56.95≈7.547.
(2)该专营店为吸引顾客,特推出两种促销方案.
方案一:每满500元可减50元;
方案二:每满500元可抽奖一次,每次中奖的概率都为25,中奖就可以获得100元现金奖励,假设顾客每次抽奖的结果相互独立.
①某位顾客购买了1050元的产品,该顾客选择参加两次抽奖,求该顾客获得100元现金奖励的概率.
②某位顾客购买了1500元的产品,作为专营店老板,是希望该顾客直接选择返回150元现金,还是选择参加三次抽奖?请说明理由.
23. (本小题12.0分)
区块链技术被认为是继蒸汽机、电力、互联网之后,下一代颠覆性的核心技术.区块链作为构造信任的机器,将可能彻底改变整个人类社会价值传递的方式,2015年至2019年五年期间,中国的区块链企业数量逐年增长,居世界前列.现收集我国近5年区块链企业总数量相关数据,如下表
年份
2015
2016
2017
2018
2019
编号x
1
2
3
4
5
企业总数量y(单位:千个)
2.156
3.727
8.305
24.279
36.224
注:参考数据i=15yi=74.691,i=15xiyi=312.761,i=15zi=10.980,i=15xizi=40.457(其中z=lny)
附:样本(xi,yi)(i=1,2,⋯,n)的最小二乘法估计公式为b=i=1n(xi-x)(yi-y)i=1n(xi-x)2=i=1n(xiyi)-nx⋅yi=1nxi2-n⋅x-2,a=y-bx
(1)根据表中数据判断,y=a+bx与y=cedx(其中e=2.71828⋯,为自然对数的底数),哪一个回归方程类型适宜预测未来几年我国区块链企业总数量?(给出结果即可,不必说明理由)
(2)根据(1)的结果,求y关于x的回归方程(结果精确到小数点后第三位);
(3)为了促进公司间的合作与发展,区块链联合总部决定进行一次信息化技术比赛,邀请甲、乙、丙三家区块链公司参赛,比赛规则如下:①每场比赛有两个公司参加,并决出胜负;②每场比赛获胜的公司与未参加此场比赛的公司进行下一场的比赛;③在比赛中,若有一个公司首先获胜两场,则本次比赛结束,该公司就获得此次信息化比赛的“优胜公司”,已知在每场比赛中,甲胜乙的概率为13,甲胜丙的概率为35,乙胜丙的概率为12,请通过计算说明,哪两个公司进行首场比赛时,甲公司获得“优胜公司”的概率最大⋅
24. (本小题12.0分)
沙漠蝗虫灾害年年有,今年灾害特别大.为防范罕见暴发的蝗群迁飞入境,我国决定建立起多道防线,从源头上控制沙漠蝗群.经研究,每只蝗虫的平均产卵数y和平均温度x有关,现收集了以往某地的7组数据,得到下面的散点图及一些统计量的值.
平均温度xi℃
21
23
25
27
29
32
35
平均产卵数yi个
7
11
21
24
66
115
325
∑xi7i=1=192,i=17yi=569,∑xi7i=1yi=18542,∑xi27i=1=5414,∑zi7i=1=25.2848,i=17xizi=733.707(其中zi=lny,z=17i=17zi).
(1)根据散点图判断,y=a+bx与y=cedx(其中e=2.718…,自然对数的底数)哪一个更适宜作为平均产卵数y关于平均温度x的回归方程类型?(给出判断即可,不必说明理由)并由判断结果及表中数据,求出y关于x的回归方程.(计算结果精确到小数点后第三位)
(2)根据以往统计,该地每年平均温度达到28℃以上时蝗虫会造成严重伤害,需要人工防治,其他情况均不需要人工防治,记该地每年平均温度达到28℃以上的概率为p(0 ①记该地今后5年中,恰好需要3次人工防治的概率为f(p),求f(p)的最大值,并求出相应的概率p.
②当f(p)取最大值时,记该地今后5年中,需要人工防治的次数为X,求X的数学期望和方差.
附:线性回归方程系数公式b=i=1n(xi-x)(yi-y)i=1n(xi-x)2,a=y-bx.
25. (本小题12.0分)
某企业研发了一种新药,为评估药物对目标适应症患者的治疗作用和安全性,需要开展临床用药试验,检测显示临床疗效评价指标A的数量y与连续用药天数x具有相关关系.随机征集了一部分志愿者作为样本参加临床用药试验,并得到了一组数据xi,yi,i=1,2,3,4,5,其中xi表示连续用药i天,yi表示相应的临床疗效评价指标A的数值.根据临床经验,刚开始用药时,指标A的数量y变化明显,随着天数增加,y的变化趋缓.经计算得到如下一些统计量的值:∑i=15yi=62,i=15(xi-x)(yi-y)=47,∑i=15ui≈4.79,∑i=15ui-u2≈1.615,∑i=15ui-uyi-y≈19.38,其中ui=lnxi.
(1)试判断y=a+bx与y=a+blnx哪一个适宜作为y关于x的回归方程类型?并建立y关于x的回归方程;
(2)新药经过临床试验后,企业决定通过两条不同的生产线每天8小时批量生产该商品,其中第1条生产线的生产效率是第2条生产线的两倍.若第1条生产线出现不合格药品的概率为0.012,第2条生产线出现不合格药品约概率为0.009,两条生产线是否出现不合格药品相互独立.
(i)随机抽取一件该企业生产的药品,求该药品不合格的概率;
(ii)若在抽查中发现不合格药品,求该药品来自第1条生产线的概率.
参考公式:对于一组数据x1,y1,x2,y2,⋅⋅⋅xn,yn,其回归直线y=a+bx的斜率和截距的最小二乘估计分别为b=∑i=1nxi-xyi-y∑i=1nxi-x2,a=y-bx.
26. (本小题12.0分)
某工厂为了提高生产效率,对生产设备进行了技术改造,为了对比技术改造后的效果,采集了技术改造前后各20次连续正常运行的时间长度(单位:天)数据,整理如下:
改造前:19,31,22,26,34,15,22,25,40,35,18,16,28,23,34,15,26,20,24,21.
改造后:32,29,41,18,26,33,42,34,37,39,33,22,42,35,43,27,41,37,38,36.
(1)完成下面的列联表,并依据小概率值α=0.010的独立性检验分析判断技术改造前后的连续正常运行时间是否有差异?
技术改造
设备连续正常运行天数
合计
超过30
不超过30
改造前
改造后
合计
(2)工厂的生产设备的运行需要进行维护,工厂对生产设备的生产维护费用包括正常维护费和保障维护费两种.对生产设备设定维护周期为T天(即从开工运行到第kT天,k∈N*)进行维护.生产设备在一个生产周期内设置几个维护周期,每个维护周期相互独立.在一个维护周期内,若生产设备能连续运行,则只产生一次正常维护费,而不会产生保障维护费;若生产设备不能连续运行,则除产生一次正常维护费外,还产生保障维护费.经测算,正常维护费为0.5万元/次,保障维护费第一次为0.2万元/周期,此后每增加一次则保障维护费增加0.2万元.现制定生产设备一个生产周期(以120天计)内的维护方案:T=30,k=1,2,3,4.以生产设备在技术改造后一个维护周期内能连续正常运行的频率作为概率,求一个生产周期内生产维护费的分布列及均值.
附:
α
0.15
0.10
0.05
0.025
0.010
0.005
0.001
xα
2.702
2.706
3.841
5.024
6.635
7.879
10.828
χ2=n(ad-bc)2(a+b)(c+d)(a+c)(b+d),(其中n=a+b+c+d)
答案和解析
1.C
【解析】
【分析】
本题主要考查回归分析及独立性检验中的相关系数,属于中档题.
根据相关系数的定义以及散点图所表达的含义求解.
【解答】
解:比较相关程度与正负相关,相关系数r的范围是[-1,1],当r<0时,数据为负相关,当r>0时,数据为正相关,|r|越大,相关性越强,由图中点的紧密程度和增减性可知:r2
2.D
【解析】
【分析】
根据平均值、中位数、众数、方差的定义即可得解.
本题考查了平均数、众数、中位数与方差的概念,是基础题.
【解答】
解:去掉最大值与最小值这组数的平均值大小不确定,中位数不变,众数大小不确定,根据方差的定义,去掉最高分,最低分后,剩余四个数据的波动性小于原来六个数据的波动性,故方差一定会变小.
故选:D.
3.AC
【解析】
【分析】
本题主要考查饼状图的应用,考查频率与频数的关系和平均数公式,属于基础题.
对于A,结合扇形图的数据,以及及格率,即可求解,对于B,结合频率与频数的关系,即可求解,对于C,先找出成绩的中位数,再结合平均数公式,即可求解,对于D,求出抽取选手的成绩优秀率,再估算出数学史知识测试成绩能得优秀的同学人数即可.
【解答】
解:对于A,由图可知,及格率为1-8%=92%>90%,故A正确,
对于B,该测试满分同学的百分比为1-8%-32%-48%=12%,
则有12%×150=18名,故B错误,
对于C,由图可知,中位数为80分,平均数为40×8%+60×32%+80×48%+100×12%=72.8分,故C正确,
对于D,由题意可得,1500名学生成绩能得到优秀的同学有1500×(48%+12%)=900,故D错误.
故选:AC.
4.AC
【解析】
【分析】
本题考查了用回归直线方程对总体进行估计,属于基础题.
【解答】
解:依题意,x=3,y=3.42,故A正确,带入y=bx-0.714得,b=1.378,故y=1.378x-0.714,可预测该地第7年投建体育设施的资金y=8.932,C正确;回归方程表示的是预测值而非准确值,BD错误.
5.ABD
【解析】
【分析】
本题考查回归直线方程,二项式定理,主要考查学生的运算能力和数学思维能力,属于中档题.
直接利用回归直线方程,二项式定理,方差关系式的变化和原数据的关系,判断A、B、C、D的结论.
【解答】
解:对于A,若回归方程y=2x+3,变量x增加1个单位时y=2(x+1)+3=2x+5,2x+5-(2x+3)=2,故y平均增加2个单位,A对;
对于B,(x-1x)n的展开式总共有9项,所以n的值为8,二项式系数之和为28=256,所以B对;
对于C,所求概率p=C81C21C102=1645,所以C错;
对于D,数据x1,x2,x3,x4,x5的方差是4,则数据4x1-1,4x2-1,4x3-1,4x4-1,4x5-1的方差是4×16=64,标准差为8,所以D对.
故选ABD.
6.ABC
【解析】
【分析】
本题考查命题真假的判定,涉及分层随机抽样、古典概型、线性回归方程、相互独立事件等知识,属于基础题.
根据相关知识逐一分析求解即可.
【解答】
解:A.由分层随机抽样可知,应抽取人数为400×47+4+3+6=80,A正确;
B.至少取到1件次品的概率为1-C42C62=35,B正确;
C.∵回归直线必过样本中心点4,3.7,∴0.4×4+a=3.7,即a=2.1,C正确;
D.由于第一次取到球不放回,因此会对第2次取球的概率产生影响,因此M、N不是相互独立事件.
故选:ABC.
7.ABD
【解析】
【分析】
本题主要考查命题真假的判断,考查二项式定理,回归方程,概率的计算,方差与标准差,考查运算求解能力,属于中档题.
选项A明显正确;选项B由二项展开式共有9项确定n的值,即可求出各项二项式系数之和;选项C根据题意利用公式算概率即可;选项D先求出新数据的方差,再求标准差即可.
【解答】
解:对于A,变量x增加1个单位时,y=2(x+1)+3=2x+5,
故y平均增加2个单位,故A正确;
对于B,由于(x-1x)n的二项展开式共有9项,故n=8,
故各项二项式系数之和为2n=256,故B正确;
对于C,恰好取到1件次品的概率为C81C21C102=1645,故C错误;
对于D,一组数据x1,x2,x3,x4,x5的方差为4,
则数据4x1-1,4x2-1,4x3-1,4x4-1,4x5-1的方差为4×42=64,
故标准差为8,故D正确.
故选:ABD.
8.BD
【解析】
【分析】
本题考查了正态分布的性质,二项分布的数字特征,条件概率的计算公式,以及相关指数的含义,属于基础题.
选项A,由正态分布的对称性,可得解;
选项B,根据二项分布的方差的性质,得解;
选项C,分别计算P(AB)和P(B)的值,再由条件概率的计算公式,得解;
选项D,根据相关指数的概念与性质,可判断.
【解答】
解:选项A,P(0
选项C,由题意知,AB={2,5,6},所以P(AB)=12,
而P(B)=23,所以P(A|B)=P(AB)P(B)=1223=34,即C错误;
选项D,由相关指数的概念与性质,可知D正确.
故选BD.
9.310e-4
【解析】
【分析】
本题考查回归直线分析,用到了对数运算,属于基础题.
根据题意,取对数,可以求出c1,求出x和z,从而可以求出c2,进而可以求出结果.
【解答】
解:因为y=c1ec2x,所以lny=c2x+lnc1,
所以根据题意:lnc1=-4,c1=e-4,
x=110(x1+x2+……+x10)=30,
z=110ln(y1y2⋅⋅⋅y10)=5,
所以c2=b=5+430=310,
从而c1c2=310e-4.
10.0.025
【解析】
【分析】
本题考查了独立性检验的应用,考查2×2列联表,独立性检验的方法等知识,考查了学生处理数据和运算求解的能力,属于基础题.
结合列联表计算χ2的值,然后与表格中的数据进行比较即可得到结论.
【解答】
解:由列联表计算得χ2=50×(22×12-8×8)230×20×20×30≈5.556>5.024,
∴推断犯错误的概率不超过0.025.
11.解:(Ⅰ,
因为两种产品检验数据的平均数相等,
所以,6.6+a6=1.4,解得a=1.8,
所以,S甲2=16[(0.8-1.4)2+(1.4-1.4)2+(1.8-1.4)2+(0.6-1.4)2+(2.4-1.4)2-(1.4-1.4)2]=0.36,
所以S甲=0.6.
(Ⅱ)从被检验的6件甲种产品中任取2件基本事件有C62=15个,其中这6件产品中有4件事一等品,任取2件都是一等品的有C42=6,
所以这2件都是一等品的概率是615=25.
【解析】本题考查了平均数,标准差,古典概型的概率的求法,属于基础题.
(Ⅰ)分别求出甲乙的平均数,列出方程解得,利用标准差公式求得,
(Ⅱ)列举出满足条件的基本事件,利用古典概型的概率计算公式代入计算即可.
12.解:(1)以200人中“热烈参与者”的频率作为概率,则该市“热烈参与者”的人数约为30000×40200=6000.
(2)2×2列联表如下:
热烈参与者
非热烈参与者
总计
男
35
105
140
女
5
55
60
总计
40
160
200
∵χ2=200×(35×55-105×5)240×160×140×60≈7.292>6.635,∴能在犯错误的概率不超过0.01的前提下,认为“热烈参与马拉松”与性别有关.
【解析】本题主要考查独立性检验的应用问题,属于基础题.(1)根据已知条件,结合频率与频数的关系,即可求解.(2)根据已知条件,结合独立性检验公式,即可求解.
13.解:(1)根据散点图判断,y=cedx更适合作为描述y与x关系的回归方程类型.
(2)设ω=lny,变换后可得ω=p+dx,
设p=lnc,建立ω关于x的回归方程ω=p+dx,
d=i=16(ωi-ω)(xi-x)i=16(xi-x)2=12.9517.50=0.74,
p=ω-dx=3.49-0.74×3.50=0.90,
所以ω关于x的回归方程为ω=0.74x+0.90,
所以y=e0.74x+0.90,
当x=10时,y=e0.74×10+0.90=e8.3≈4023.87,
即该志愿者在注射疫苗后的第10天的抗体含量水平值约为4023.87miu/mL.
(3)由表格数据可知,第5,6天的y值大于50,
故x的可能取值为0,1,2,
P(X=0)=C44C64=115,
P(X=1)=C43C21C64=815,
p(X=2)=C42C22C64=25,
X的分布列为
X
0
1
2
P
115
815
25
E(X)=0×115+1×815+2×25=43.
【解析】本题考查可线性化的回归分析,考查离散型随机变量的分布列和期望的求法,属于中档题.
(1)由散点图知点在一条弯曲的曲线上,故选y=c·edx作为回归方程类型;
(2)先求出回归方程,再将x=10代入回归方程,可得结论;
(3)由于y值大于50的天数为2,6天中随机抽取4天y值大于50的天数为X,则X是随机变量,由古典概型概率公式可得分布列,由此可得结论.
14.解:(1)零假设为H0:出现“天上钩钩云”与次日的“地上雨淋淋”无关.
根据所给数据,完成下面的2×2列联表(表中数据单位:天),具体如下:
天上钩钩云
地上雨淋淋
合计
下雨
未下雨
出现
60
40
100
未出现
30
70
100
合计
90
110
200
所以:χ2=200×(60×70-40×30)2100×100×90×110=20011≈18.182,
容易判断出:18.182>6.635=x0.01,
所以根据小概率α=0.01的独立性检验,我们推断H0不成立,即认为该地区出现“天上钩钩云”与次日的“地上雨淋淋”有关;
(2)依题意,在该地区统计的“地上雨淋淋”中下雨的天数中随机抽取9天,出现“天上钩钩云”的天数6090×9=6天,未出现的天数有3090×9=3天,
从中任意选取3天,X的取值可能为0,1,2,3,则有:
P(X=0)=C63C93=521,P(X=1)=C62C31C93=1528,P(X=2)=C61C32C93=314,P(X=3)=C33C93=184.
则X的分布列为:
X
0
1
2
3
P
521
1528
314
184
故 E(X)=0×521+1×1528+2×314+3×184=1.
【解析】本题考查独立性检验,考查离散型随机变量的分布列以及期望,属于中档题.
(1)首先完成2×2列联表,代入公式求出χ2,可得结论;
(2)9天中未出现的天数有3天,从中任意选取3天,X的取值可能为0,1,2,3,分别计算出概率,列出分布列,求出期望.
15.解:(1)由表知,
x=3+4+5+6+75=5,y=0.45+0.50+0.60+0.65+0.705=0.58,
i=15(xi-x)(yi-y)=0.65,i=15(xi-x)2=10,
因为b=i=1n(xi-x)(yi-y)i=1n(xi-x)2=0.6510=0.065,
a=0.58-0.065×5=0.255,
所以y关于x的线性回归方程为y=0.065x+0.255.
(2)由(1)知,i=15(xi-x)(yi-y)=0.65,i=15(xi-x)2=10,
因为i=15(yi-y)2=0.043, 所以i=1n(xi-x)2i=1n(yi-y)2=0.43,
所以r=i=1n(xi-x)(yi-y)i=1n(xi-x)2i=1n(yi-y)2≈0.650.656≈0.99,
由此可以认为该性能指数与孩子的喜爱程度相关性很强.
【解析】本题考查了回归直线方程和样本相关系数,属于一般题.
(1)利用题中的数据求出x和y,由公式求出b和a,即可得到y关于x的线性回归方程;
(2)由公式求出相关系数r,即可判断是否可以认为该性能指数与孩子的喜爱程度相关性很强.
16.解:(1)2x2列联表如下:
日均总销售额小于20万元的天数
日均销售额不小于20万元的天数
总计
新举措实施前40天
37
3
40
新举措实施后40天
23
17
40
总计
60
20
80
因为K2=80(37×17-3×23)260×20×40×40=19615≈13.067>10.828,
所以在犯错误的概率不超过0.001的前提下,能判断公司销售额提高与采取新措施有关.
(2)X的所有可能取值为-1,0,1,
P(X=-1)=(1-p1)p2,P(X=0)=p1p2+(1-p1)(1-p2),P(X=1)=p1(1-p2)
(i)将已知值p1=0.5,p2=0.8代入,得
X
-1
0
1
P
0.4
0.5
0.1
(ii)E(10X)=10(p1-p2)>5-3=2⇒p1>p2+15
又概率p1≤1,故p2+15
【解析】本题考查独立性检验,离散型随机变量的分布列及期望,属于中档题.
17.解析:(1)由题可知,从200名学生中抽取1人,
这个人喜欢冰雪运动的概率为0.8,
故喜欢冰雪运动的有200×0.8=160人,
不喜欢冰雪运动的有200-160=40人,
即a=100,b=60,c=20,d=20.
2×2列联表如下:
喜欢
不喜欢
合计
男生
100
20
120
女生
60
20
80
合计
160
40
200
χ2=200(100×20-60×20)2160×40×120×80≈2.083<2.71,
故没有90%的把握认为是否喜欢冰雪运动与性别有关.
(2)按分层抽样,设抽取女生x名,男生y名,
8160=x60=y100,解得x=3,y=5,
即抽取的8人中喜欢冰雪运动的女生有3人,男生有5人,
故X=0,1,2,3.
P(X=0)=C30C53C83=528,
P(X=1)=C31C52C83=1528,
P(X=2)=C32C51C83=1556,
P(X=3)=C33C50C83=156,
故X的分布列如下:
X
0
1
2
3
P
528
1528
1556
156
E(X)=0×528+1×1528+2×1556+3×156=98.
【解析】本题考查了独立性检验的基本思想、二项分布以及数学期望,考查了基本运算求解能力,属于中等题.
(1)由200×0.8=160以及表中数据即可完善列联表,计算观测值,再利用独立性检验的基本思想即可求解;
(2)根据分层抽样的抽样比可得随机变量X的取值可能为0,1,2,3,再根据二项分布求出概率,得到X的分布列,再利用数学期望的计算公式即可求解.
18.解:(Ⅰ)由题意可得x=4,y=4,i=17(xi-x)2=28,i=17(yi-y)2=1.02,
i=17(xi-x)(yi-y)=5.3,
所以相关系数r=i=17(xi-x)(yi-y)i=17(xi-x)2i=17(yi-y)2=5.328×1.02=5.328.56≈0.992.
(Ⅱ)根据相关系数的判断,水位y与x存在较强的线性相关关系,
且b=i=17(xi-x)(yi-y)i=17(xi-x)2=5.328≈0.189,a=y-bx=4-5.328×4≈3.243,
所以水位y关于x的回归直线方程为y=0.189x+3.243.
(Ⅲ)令y=0.189x+3.243≥5.1,解得x≥9.825,
所以第10日可能进入橙色预警.
【解析】本题考查用回归直线方程对总体进行估计、变量的相关关系、样本相关系数、回归直线方程,属于较难题.
(Ⅰ)由已知数据求得x=4,y=4,i=17(xi-x)2=28,i=17(yi-y)2=1.02,代入相关系数的公式即可求出r;
(Ⅱ)根据相关系数判断水位y与x存在较强的线性相关关系,由已知数据分别求得b,a,即可求得回归直线方程;
(Ⅲ)令y=0.189x+3.243≥5.1,由此求得x的取值范围,即可判断第几日可能达到橙色预警.
19.解:(Ⅰ)由题意知,10×(0.01+0.015×2+a+0.025+0.005)=1,解得a=0.030;
(Ⅱ)由频率分布直方图可知,前三组的频率比为2:3:3,所以由分层抽样可知前三组抽取的单车辆数分别为2,3,3,分别记为A1,A2,B1,B2,B3,C1,C2,C3,
从中抽取2辆的结果有:(A1,A2),(A1,B1),(A1,B2),(A1,B3),(A1,C1),(A1,C2),(A1,C3),(A2,B1),(A2,B2),(A2,B3),(A2,C1),(A2,C2),(A2,C3),(B1,B2),(B1,B3),(B1,C1),(B1,C2),(B1,C3),(B2,B3),(B2,C1),(B2,C2),(B2,C3),(B3,C1),(B3,C2),(B3,C3);(C1,C2),(C1,C3),(C2,C3)共28个,
恰有1辆的使用时间不低于50分钟的结果有12个,故所求事件的概率为p=1228=37;
(Ⅲ)由题意填写2×2列联表如下,
经常使用
偶尔使用或不用
合计
男性
50
50
100
女性
60
40
100
合计
110
90
200
由上表及公式可知χ2=200×(50×40-60×50)2100×100×110×90≈2.02;
因为2.02<2.072,所以没有85%的把握认为淮南市使用永安共享单车的情况与性别有关.
【解析】本题考查频率分布直方图与独立性检验的问题,属于中档题.
(Ⅰ)由频率和为1,列方程求出a的值;
(Ⅱ)由频率分布直方图和分层抽样原理,利用列举法求出基本事件数,再求概率值;
(Ⅲ)由题意填写列联表,计算χ2,对照临界值得出结论.
20.解:(Ⅰ)因为x=161+2+3+4+5+6=72,y=1691+86+82+78+73+70=80,
i=16(xi-x)2·i=16(yi-y)2=-522+-322+-122+122+322+522×112+62+22+-22+-72+-102=5495,
又i=16xiyi=1606,
所以r=1606-6×72×805495≈-1,
因为|r|=1∈[0.75,1],
故变量x、y间的相关性很强;
(Ⅱ)由题意知,b=i=16xiyi-6x⋅yi=16xi2-6x2=1606-6×3.5×8091-6×3.52≈-4,a=y-bx=80+4×3.5=94,
所以y=-4x+94,
当x1=1时,y1=90;
当x2=2时,y2=86;
当x3=3时,y3=82;
当x4=4时,y4=78;
当x5=5时,y5=74;
当x6=6时,y6=70,
这6组数据按照销售单价一次递增的顺序依次编号为第1、2、3、4、5、6组数据,
与销售数据对比可知满足|yi-y|<1(i=1,2,…,6)的共有4个“有效数据”
是第2组(2,86)、第3组(3,82)、第4组(4,78)、第6组(6,70),
则从6组销售数据中任取2组有:
(1,2)、(1,3)、(1,4)、(1,5)、(1,6)、(2,3)、(2,4)、(2,5)、
(2,6)、(3,4)、(3,5)、(3,6)、(4,5)、(4,6)、(5,6)共15种情况,
其中两组都是有效数据的情况为:(2,3)、(2,4)、(2,6)、(3,4)、(3,6)、(4,6)有6种.
∴抽取的2组销售数据都是“有效数据”的概率为p=615=25.
【解析】本题考查回归直线方程、相关系数、古典概型的计算与应用,属于较难题.
(Ⅰ)利用公式求出r的值,即可求出结果;
(Ⅱ)由已知数据求出b,进一步求得a,可得线性回归方程;确定基本事件的个数,再由古典概型概率计算公式求解.
21.解:(1)由频率分布直方图得,
这1000个奉节脐橙中果径65~80mm的频率为5×(0.013+0.030+0.045)=0.44<0.5,
这1000个奉节脐橙中果径65~85mm的频率为5×(0.013+0.030+0.045+0.060)=0.74>0.5,
则这1000个奉节脐橙中果径的中位数在80~85中,
不妨设为a,则0.06(a-80)=0.5-0.44=0.06,解得a=81,
故估计这1000个奉节脐橙的果径的中位数为81.
(2)由频率分布直方图得,
这1000个奉节脐橙中果径70~75mm的频率为0.03×5=0.15,
这1000个奉节脐橙中果径75~80mm的频率为0.045×5=0.225,
这1000个奉节脐橙中果径80~85mm的频率为0.06×5=0.3,
则分层抽样过程中抽出9个脐橙中一级果、二级果、三级果个数分别为4、3、2,
在抽取的9个脐橙中再抽出3个,随机变量X的所有可能取值为0、1、2、3,
则P(X=0)=C53C93=542,P(X=1)=C52C41C93=1021,P(X=2)=C51C42C93=514,P(X=3)=C43C93=121,
所以X的分布列为
X
0
1
2
3
P
542
1021
514
121
故X的数学期望E(X)=0×542+1×1021+2×514+3×121=43.
(3)这批果实中一级果的概率为310,每个果实相互独立,则Y~B(100,310),
则P(Y=k)=C100k310k710100-k(0≤k≤100,且k∈N),
令P(Y=k+1)P(Y=k)=C100k+1310k+171099-kC100k310k710100-k=3100-k7k+1>1,解得k<29.3,
当k≤29时,P(Y=k+1)>P(Y=k),
即P(Y=30)>P(Y=29)>P(Y=28)>P(Y=27)>…>P(Y=0)
当k≥30时,P(Y=k+1) 即P(Y=30)>P(Y=31)>P(Y=32)>P(Y=33)>…>P(Y=100)
所以P(Y=k)max=P(Y=30),
综上所述:P(Y=k)=C100k310k710100-k(0≤k≤100,且k∈N);当Y=30时,P(Y=k)最大.
【解析】本题考查统计与概率的综合应用、频率分布直方图、组合与组合数公式、利用超几何分布求分布列、超几何分布的均值、分层随机抽样平均数、中位数、n次独立重复试验及其概率计算,属于较难题.
(1)根据频率分布直方图求出这1000个奉节脐橙中果径65~80mm和65~85mm的频率,分析得出中位数所在的区间,进而估计这1000个奉节脐橙的果径的中位数.
(2)先确定随机变量X的所有可能取值,然后利用超几何分布的概率公式求出X的所有可能取值对应的概率,得到X的分布列,再根据超几何分布的均值公式求出E(X).
(3)利用n次独立重复试验的概率公式求出P(Y=k)的表达式,根据P(Y=k+1)>P(Y=k)即可求解.
22.解:(1)计算得t=15×1+2+3+4+5=3,y=15×2.4+2.7+4.1+6.4+7.9=4.7,i=15tiyi=85.2,
i=15ti-t2=10,i=15yi-y2=22.78,
则r=i=15tiyi-5tyi=15(ti-t)2i=15(yi-y)2=14.7227.8=14.7256.95≈14.715.094≈0.97>0.75,
故y与t的线性相关程度很高,可用线性回归模型拟合;
(2)①顾客选择参加两次抽奖,设他获得100元现金奖励为事件A,P(A)=C21×25×35=1225;
②作为老板,选择让顾客参加三次抽奖,理由如下:
设X表示顾客在三次抽奖中中奖的次数,
由于顾客每次抽奖的结果相互独立,则X∼B(3,25),
所以E(X)=np=3×25=1.2,
由于顾客每中一次可获得100元现金奖励,
因此该顾客在三次抽奖中可获得的奖励金额的均值为1.2×100=120元,
由于顾客参加三次抽奖获得现金奖励的均值120元小于直接返现的150元,
所以专营店老板希望顾客参加三次抽奖.
【解析】本题考查相关系数,离散型随机变量的期望,相互独立事件同时发生的概率,二项分布,考查了分析和运算能力,属于中档题.
(1)由公式计算相关系数r,根据计算得到的数据与0.75的大小关系可得答案;
(2)①设他获得100元现金奖励为事件A,P(A)=C21×25×35;
②设X表示顾客在三次抽奖中中奖的次数,可知X∼B(3,25),求出E(X),可得该顾客在三次抽奖中可获得的奖励金额的均值,由此可得答案.
23. 解:(1)选择回归方程y=cedx,适宜预测未来几年我国区块链企业总数量;
(2)对y=cedx两边取自然对数,得lny=lnc+dx,
令z=lny,a=lnc,b=d,得z=a+bx,
由于i=15xi=15,x=15i=15xi=3,z=15i=15zi=2.196,
所以b^=i=1n(xizi)-nx⋅zi=1nxi2-n⋅x-2=40.457-5×3×2.19655-5×32≈0.752,
a=z-bx=-0.060,
所以,z关于x的回归方程为z=0.752x-0.060,
所以,y关于x的回归方程为:y=e0.752x-0.060.
(3)对于首场比赛的选择有以下三种情况:A——甲与乙先比;B——甲与丙先比;C——乙和丙先比;由于在每场比赛中,甲胜乙的概率为13,甲胜丙的概率为35,乙胜丙的概率为12,则甲公司获胜的概率分别是:
PA=13·35+13·1-35·12·13+1-13·1-12·35·13=1345,
P(B)=35·13+35·(1-13)·(1-12)·35+(1-35)·12·13·35=925,
P(C)=(1-12)·35·13+12·13·35=15,
由于925>1345>15,
所以甲与丙两公司进行首场比赛时,甲公司获得“优胜公司”的概率最大.
【解析】本题考查回归方程的求法及应用,考查了相互独立事件及其概率计算公式,考查运用概率知识解决实际问题的能力,是较难题.
(1)可以判断y=cedx更适宜作为预测未来几年我国区块链企业总数量的回归方程类型;
(2)对y=cedx两边取自然对数得lny=lnc+dx,令z=lny,a=lnc,b=d,得z=a+bx,由表中数据,能建立y关于x的回归方程;
(3)由题意得到首场比赛的选择有三种情况,利用相互独立事件及互斥事件的概率公式分别计算甲公司获得“优胜公司”的概率,从而求解.
24.(1)根据散点图可以判断,y=cedx更适宜作为平均产卵数y关于平均温度x的回归方程类型;
对y=cedx两边取自然对数,得lny=lnc+dx;
令z=lny,a=lnc,b=d,得z=a+bx;
∵b=i=17(xi-x)(zi-z)i=17(xi-x)2=40.1820147.7143≈0.272,
a=z-bx=3.612-0.272×27.429≈-3.849;
所以z关于x的回归方程为=0.272x-3.849;
所以y关于x的回归方程为=e0.272x-3.849;
(2)①由f(p)=C53·p3·(1-p)2,得f'(p)=C53·p2(1-p)(3-5p),
因为0
0,得3-5p>0,解得0
所以f(p)在0,35上单调递增,在35,1上单调递减,所以f(p)有唯一的极大值为f35,也是最大值;
所以当p=35时,f(p)max=f35=216625;
②由①知,当f(p)取最大值时,p=35,所以X~B5,35,
所以X的数学期望为E(X)=5×35=3,方差为D(X)=5×35×25=65.
【解析】本题考查线性回归方程的求法与应用问题,概率的计算与应用问题,数学期望与方差的计算问题,同时还涉及了利用导数求单调性及最值,是拔高题.
(1)由图象可知,y=cedx更适宜作为平均产卵数y关于平均温度x的回归方程类型,对y=cedx两边取自然对数,求出回归方程,再化为y关于x的回归方程;
(2)①由f(p)对其求导数,利用导数判断函数单调性,求出函数的最值以及对应p的值;
②由f(p)取最大值时的p的值,得出X~B5,35,计算得出答案.
25.解:(1)刚开始用药时,指标A的数量y变化明显,随着天数增加,y的变化趋缓,故y=a+blnx适宜作为y关于x的回归方程类型.
令u=lnx,得y=a+bu,于是b=i=15(ui-u)(yi-y)i=15(ui-u)2≈19.381.615=12,
因为i=15ui≈4.79,i=15yi=62,所以u≈0.958,y=12.4,
所以a=y-b⋅u≈12.4-0.958×12=0.904,y=0.904+12u,即y=0.904+12lnx;
(2)(i)设A=“随机抽取一件该企业生产的药品为不合格”,
B1=“随机抽取一件药品为第1条生生产线生产”,
B2=“随机抽取一件药品为第2条生生产线生产”,
则P(B1)=23,PB2=13,
又PAB1=0.012,P(A|B2)=0.009,
于是P(A)=P(AB1)+P(AB2)=P(B1)P(A|B1)+P(B2)P(A|B2)=23×0.012+13×0.009=0.011.
(ii)P(B1|A)=P(AB1)P(A)=P(B1)P(A|B1)P(A)=23×0.0120.011=811.
【解析】本题考查回归直线方程的求解,考查条件概率和全概率公式的应用.
(1)判断出y=a+bln x适宜作为y关于x的回归方程类型,利用公式求出y关于x的回归方程;
(2)(i)设出事件,利用全概率公式进行求解,(ii)在第一问的基础上,利用条件概率进行求解.
26.解:(1)2×2列联表为:
技术改造
设备连续正常运行天数
合计
超过30
不超过30
改造前
5
15
20
改造后
15
5
20
合计
20
20
40
零假设为H0:技术改造前后的连续正常运行时间无差异,
∴χ2=40(5×5-15×15)220×20×20×20=10>6.635,
∴依据小概率值α=0.010的独立性检验分析判断H0不成立,即技术改造前后的连续正常运行时间有差异.
(2)由题知,生产周期内有 4 个维护周期,一个维护周期为 30 天,一个维护周期内,生产线需保障维护的概率为P=14.
设一个生产周期内需保障维护的次数为ξ,则ξ~B(4,14);
一个生产周期内的正常维护费为0.5×4=2万元,保障维护费为 0.2ξ×(ξ+1)2=(0.1ξ2+0.1ξ)万元,
∴一个生产周期内需保障维护ξ次时的生产维护费为 (0.1ξ2+0.1ξ+2)万元.
设一个生产周期内的生产维护费为X,则X的所有可能取值为2,2.2,2.6,3.2,4,P(X=2)=(1-14)4=81256,
P(X=2.2)=C41(1-14)314=2764,
P(X=2.6)=C42(1-14)2(14)2=27128,
P(X=3.2)=C43(1-14)(14)3=364,
P(X=4)=(14)4=1256.
所以,X的分布列为:
X
2
2.2
2.6
3.2
4
P
81256
2764
27128
364
1256
E(X)=2×81256+2.2×2764+2.6×27128+3.2×364+4×1256=162+237.6+140.4+38.4+4256=582.4256=2.275,
∴一个生产周期内生产维护费的均值为2.275万元.
【解析】本题考查独立性检验以及离散型随机变量的概率分布列及期望,是中档题.
(1)根据题意完成2×2列联表,计算χ2,得出结论;
(2)求得X的可能取值及对应概率,完成分布列,进而求得数学期望.
相关试卷
备考2024届高考数学一轮复习分层练习第九章统计与成对数据的统计分析第3讲成对数据的统计分析:
这是一份备考2024届高考数学一轮复习分层练习第九章统计与成对数据的统计分析第3讲成对数据的统计分析,共10页。
高考数学一轮复习课时分层作业65成对数据的统计分析含答案:
这是一份高考数学一轮复习课时分层作业65成对数据的统计分析含答案,文件包含高考数学一轮复习课时分层作业65成对数据的统计分析含答案docx、高考数学一轮复习课时分层作业65参考答案docx等2份试卷配套教学资源,其中试卷共16页, 欢迎下载使用。
新高考数学一轮复习课时过关练习第09章 统计与成对数据的统计分析第3节 成对数据的统计分析 (含解析):
这是一份新高考数学一轮复习课时过关练习第09章 统计与成对数据的统计分析第3节 成对数据的统计分析 (含解析),共23页。试卷主要包含了了解样本相关系数的统计含义,样本相关系数,一元线性回归模型,列联表与独立性检验,1% B,069>6,616,8,1等内容,欢迎下载使用。