所属成套资源:十年高考真题(2013-2022)与优质模拟题汇编(新高考卷与全国理科)原卷版+解析版
- 专题13 平面解析几何选择填空题-大数据之十年高考真题(2013-2022)与优质模拟题汇编(新高考卷与全国理科) 试卷 0 次下载
- 专题14 平面解析几何解答题-大数据之十年高考真题(2013-2022)与优质模拟题汇编(新高考卷与全国理科) 试卷 0 次下载
- 专题15 概率统计与计数原理选择填空题-大数据之十年高考真题(2013-2022)与优质模拟题汇编(新高考卷与全国理科) 试卷 0 次下载
- 专题17 坐标系与参数方程-大数据之十年高考真题(2013-2022)与优质模拟题汇编(新高考卷与全国理科) 试卷 0 次下载
- 专题18 不等式选讲-大数据之十年高考真题(2013-2022)与优质模拟题汇编(新高考卷与全国理科) 试卷 0 次下载
专题16 概率统计解答题-大数据之十年高考真题(2013-2022)与优质模拟题汇编(新高考卷与全国理科)
展开这是一份专题16 概率统计解答题-大数据之十年高考真题(2013-2022)与优质模拟题汇编(新高考卷与全国理科),文件包含专题16概率统计解答题解析版docx、专题16概率统计解答题原卷版docx等2份试卷配套教学资源,其中试卷共89页, 欢迎下载使用。
大数据之十年高考真题(2013-2022)与优质模拟题(新高考卷与新课标理科卷)
专题16概率统计解答题
真题汇总命题趋势
1.【2022年全国甲卷理科19】甲、乙两个学校进行体育比赛,比赛共设三个项目,每个项目胜方得10分,负方得0分,没有平局.三个项目比赛结束后,总得分高的学校获得冠军.已知甲学校在三个项目中获胜的概率分别为0.5,0.4,0.8,各项目的比赛结果相互独立.
(1)求甲学校获得冠军的概率;
(2)用X表示乙学校的总得分,求X的分布列与期望.
【答案】(1)0.6;
(2)分布列见解析,EX=13.
【解析】
(1)设甲在三个项目中获胜的事件依次记为A,B,C,所以甲学校获得冠军的概率为
P=PABC+PABC+PABC+PABC
=0.5×0.4×0.8+0.5×0.4×0.8+0.5×0.6×0.8+0.5×0.4×0.2
=0.16+0.16+0.24+0.04=0.6.
(2)依题可知,X的可能取值为0,10,20,30,所以,
PX=0=0.5×0.4×0.8=0.16,
PX=10=0.5×0.4×0.8+0.5×0.6×0.8+0.5×0.4×0.2=0.44,
PX=20=0.5×0.6×0.8+0.5×0.4×0.2+0.5×0.6×0.2=0.34,
PX=30=0.5×0.6×0.2=0.06.
即X的分布列为
X
0
10
20
30
P
0.16
0.44
0.34
0.06
期望EX=0×0.16+10×0.44+20×0.34+30×0.06=13.
2.【2022年全国乙卷理科19】某地经过多年的环境治理,已将荒山改造成了绿水青山.为估计一林区某种树木的总材积量,随机选取了10棵这种树木,测量每棵树的根部横截面积(单位:m2)和材积量(单位:m3),得到如下数据:
样本号i
1
2
3
4
5
6
7
8
9
10
总和
根部横截面积xi
0.04
0.06
0.04
0.08
0.08
0.05
0.05
0.07
0.07
0.06
0.6
材积量yi
0.25
0.40
0.22
0.54
0.51
0.34
0.36
0.46
0.42
0.40
3.9
并计算得i=110xi2=0.038,i=110yi2=1.6158,i=110xiyi=0.2474.
(1)估计该林区这种树木平均一棵的根部横截面积与平均一棵的材积量;
(2)求该林区这种树木的根部横截面积与材积量的样本相关系数(精确到0.01);
(3)现测量了该林区所有这种树木的根部横截面积,并得到所有这种树木的根部横截面积总和为186m2.已知树木的材积量与其根部横截面积近似成正比.利用以上数据给出该林区这种树木的总材积量的估计值.
附:相关系数r=i=1n(xi−x)(yi−y)i=1n(xi−x)2i=1n(yi−y)2,1.896≈1.377.
【答案】(1)0.06m2;0.39m3
(2)0.97
(3)1209m3
【解析】
(1)样本中10棵这种树木的根部横截面积的平均值x=0.610=0.06
样本中10棵这种树木的材积量的平均值y=3.910=0.39
据此可估计该林区这种树木平均一棵的根部横截面积为0.06m2,
平均一棵的材积量为0.39m3
(2)r=i=110(xi−x)(yi−y)i=110(xi−x)2i=110(yi−y)2=i=110xiyi−10xyi=110xi2−10x2i=110yi2−10y2
=0.2474−10×0.06×0.39(0.038−10×0.062)(1.6158−10×0.392)=0.01340.0001896≈0.01340.01377≈0.97
则r≈0.97
(3)设该林区这种树木的总材积量的估计值为Ym3,
又已知树木的材积量与其根部横截面积近似成正比,
可得0.060.39=186Y,解之得Y=1209m3.
则该林区这种树木的总材积量估计为1209m3
3.【2022年新高考1卷20】一医疗团队为研究某地的一种地方性疾病与当地居民的卫生习惯(卫生习惯分为良好和不够良好两类)的关系,在已患该疾病的病例中随机调查了100例(称为病例组),同时在未患该疾病的人群中随机调查了100人(称为对照组),得到如下数据:
不够良好
良好
病例组
40
60
对照组
10
90
(1)能否有99%的把握认为患该疾病群体与未患该疾病群体的卫生习惯有差异?
(2)从该地的人群中任选一人,A表示事件“选到的人卫生习惯不够良好”,B表示事件“选到的人患有该疾病”.P(B|A)P(B|A)与P(B|A)P(B|A)的比值是卫生习惯不够良好对患该疾病风险程度的一项度量指标,记该指标为R.
(ⅰ)证明:R=P(A|B)P(A|B)⋅P(A|B)P(A|B);
(ⅱ)利用该调查数据,给出P(A|B),P(A|B)的估计值,并利用(ⅰ)的结果给出R的估计值.
附K2=n(ad−bc)2(a+b)(c+d)(a+c)(b+d),
PK2≥k
0.050
0.010
0.001
k
3.841
6.635
10.828
【答案】(1)答案见解析
(2)(i)证明见解析;(ii)R=6;
【解析】
(1)由已知K2=n(ad−bc)2(a+b)(c+d)(a+c)(b+d)=200(40×90−60×10)250×150×100×100=24,
又P(K2≥6.635)=0.01,24>6.635,
所以有99%的把握认为患该疾病群体与未患该疾病群体的卫生习惯有差异.
(2)(i)因为R=P(B|A)P(B|A)⋅P(B|A)P(B|A)=P(AB)P(A)⋅P(A)P(AB)⋅P(AB)P(A)⋅P(A)P(AB),
所以R=P(AB)P(B)⋅P(B)P(AB)⋅P(AB)P(B)⋅P(B)P(AB)
所以R=P(A|B)P(A|B)⋅P(A|B)P(A|B),
(ii) 由已知P(A|B)=40100,P(A|B)=10100,
又P(A|B)=60100,P(A|B)=90100,
所以R=P(A|B)P(A|B)⋅P(A|B)P(A|B)=6
4.【2022年新高考2卷19】在某地区进行流行病学调查,随机调查了100位某种疾病患者的年龄,得到如下的样本数据的频率分布直方图:
(1)估计该地区这种疾病患者的平均年龄(同一组中的数据用该组区间的中点值为代表);
(2)估计该地区一位这种疾病患者的年龄位于区间[20,70)的概率;
(3)已知该地区这种疾病的患病率为0.1%,该地区年龄位于区间[40,50)的人口占该地区总人口的16%.从该地区中任选一人,若此人的年龄位于区间[40,50),求此人患这种疾病的概率.(以样本数据中患者的年龄位于各区间的频率作为患者的年龄位于该区间的概率,精确到0.0001).
【答案】(1)44.65岁;
(2)0.89;
(3)0.0014.
【解析】
(1)平均年龄x=(5×0.001+15×0.002+25×0.012+35×0.017+45×0.023
+55×0.020+65×0.012+75×0.006+85×0.002)×10=44.65(岁).
(2)设A={一人患这种疾病的年龄在区间[20,70)},所以
P(A)=1−P(A)=1−(0.001+0.002+0.006+0.002)×10=1−0.11=0.89.
(3)设B={任选一人年龄位于区间[40,50),C={任选一人患这种疾病},
则由条件概率公式可得
P(C|B)=P(BC)P(B)=0.1%×0.023×1016%=0.001×0.230.16=0.0014375≈0.0014.
5.【2021年全国甲卷理科17】甲、乙两台机床生产同种产品,产品按质量分为一级品和二级品,为了比较两台机床产品的质量,分别用两台机床各生产了200件产品,产品的质量情况统计如下表:
一级品
二级品
合计
甲机床
150
50
200
乙机床
120
80
200
合计
270
130
400
(1)甲机床、乙机床生产的产品中一级品的频率分别是多少?
(2)能否有99%的把握认为甲机床的产品质量与乙机床的产品质量有差异?
附:K2=n(ad−bc)2(a+b)(c+d)(a+c)(b+d)
P(K2≥k)
0.050
0.010
0.001
k
3.841
6.635
10.828
【答案】(1)75%;60%;
(2)能.
(1)甲机床生产的产品中的一级品的频率为150200=75%,
乙机床生产的产品中的一级品的频率为120200=60%.
(2)K2=400(150×80−120×50)2270×130×200×200=40039>10>6.635,
故能有99%的把握认为甲机床的产品与乙机床的产品质量有差异.
6.【2021年新高考1卷18】某学校组织“一带一路”知识竞赛,有A,B两类问题,每位参加比赛的同学先在两类问题中选择一类并从中随机抽取一个问题回答,若回答错误则该同学比赛结束;若回答正确则从另一类问题中再随机抽取一个问题回答,无论回答正确与否,该同学比赛结束.A类问题中的每个问题回答正确得20分,否则得0分;B类问题中的每个问题回答正确得80分,否则得0分,己知小明能正确回答A类问题的概率为0.8,能正确回答B类问题的概率为0.6,且能正确回答问题的概率与回答次序无关.
(1)若小明先回答A类问题,记X为小明的累计得分,求X的分布列;
(2)为使累计得分的期望最大,小明应选择先回答哪类问题?并说明理由.
【答案】(1)见解析;(2)B类.
(1)由题可知,X的所有可能取值为0,20,100.
P(X=0)=1−0.8=0.2;
P(X=20)=0.8(1−0.6)=0.32;
P(X=100)=0.8×0.6=0.48.
所以X的分布列为
X
0
20
100
P
0.2
0.32
0.48
(2)由(1)知,E(X)=0×0.2+20×0.32+100×0.48=54.4.
若小明先回答B问题,记Y为小明的累计得分,则Y的所有可能取值为0,80,100.
P(Y=0)=1−0.6=0.4;
P(Y=80)=0.6(1−0.8)=0.12;
P(X=100)=0.8×0.6=0.48.
所以E(Y)=0×0.4+80×0.12+100×0.48=57.6.
因为54.4<57.6,所以小明应选择先回答B类问题.
7.【2021年全国乙卷理科17】某厂研制了一种生产高精产品的设备,为检验新设备生产产品的某项指标有无提高,用一台旧设备和一台新设备各生产了10件产品,得到各件产品该项指标数据如下:
旧设备
9.8
10.3
10.0
10.2
9.9
9.8
10.0
10.1
10.2
9.7
新设备
10.1
10.4
10.1
10.0
10.1
10.3
10.6
10.5
10.4
10.5
旧设备和新设备生产产品的该项指标的样本平均数分别记为x和y,样本方差分别记为S12和S22.
(1)求x,y,S12,S22;
(2)判断新设备生产产品的该项指标的均值较旧设备是否有显著提高(如果y−x≥2S12+S2210,则认为新设备生产产品的该项指标的均值较旧设备有显著提高,否则不认为有显著提高).
【答案】(1)x=10,y=10.3,S12=0.036,S22=0.04;(2)新设备生产产品的该项指标的均值较旧设备没有显著提高.
(1)x=9.8+10.3+10+10.2+9.9+9.8+10+10.1+10.2+9.710=10,
y=10.1+10.4+10.1+10+10.1+10.3+10.6+10.5+10.4+10.510=10.3,
S12=0.22+0.32+0+0.22+0.12+0.22+0+0.12+0.22+0.3210=0.036,
S22=0.22+0.12+0.22+0.32+0.22+0+0.32+0.22+0.12+0.2210=0.04.
(2)依题意,y−x=0.3=2×0.15=20.152=20.025,20.036+0.042=20.038,
y−x<2s12+s2210,所以新设备生产产品的该项指标的均值较旧设备没有显著提高.
8.【2021年新高考2卷21】一种微生物群体可以经过自身繁殖不断生存下来,设一个这种微生物为第0代,经过一次繁殖后为第1代,再经过一次繁殖后为第2代……,该微生物每代繁殖的个数是相互独立的且有相同的分布列,设X表示1个微生物个体繁殖下一代的个数,P(X=i)=pi(i=0,1,2,3).
(1)已知p0=0.4,p1=0.3,p2=0.2,p3=0.1,求E(X);
(2)设p表示该种微生物经过多代繁殖后临近灭绝的概率,p是关于x的方程:p0+p1x+p2x2+p3x3=x的一个最小正实根,求证:当E(X)≤1时,p=1,当E(X)>1时,p<1;
(3)根据你的理解说明(2)问结论的实际含义.
【答案】(1)1;(2)见解析;(3)见解析.
(1)E(X)=0×0.4+1×0.3+2×0.2+3×0.1=1.
(2)设f(x)=p3x3+p2x2+(p1−1)x+p0,
因为p3+p2+p1+p0=1,故f(x)=p3x3+p2x2−(p2+p0+p3)x+p0,
若E(X)≤1,则p1+2p2+3p3≤1,故p2+2p3≤p0.
f'(x)=3p3x2+2p2x−(p2+p0+p3),
因为f'(0)=−(p2+p0+p3)<0,f'(1)=p2+2p3−p0≤0,
故f'(x)有两个不同零点x1,x2,且x1<0<1≤x2,
且x∈(−∞,x1)∪(x2,+∞)时,f'(x)>0;x∈(x1,x2)时,f'(x)<0;
故f(x)在(−∞,x1),(x2,+∞)上为增函数,在(x1,x2)上为减函数,
若x2=1,因为f(x)在(x2,+∞)为增函数且f(1)=0,
而当x∈(0,x2)时,因为f(x)在(x1,x2)上为减函数,故f(x)>f(x2)=f(1)=0,
故1为p0+p1x+p2x2+p3x3=x的一个最小正实根,
若x2>1,因为f(1)=0且在(0,x2)上为减函数,故1为p0+p1x+p2x2+p3x3=x的一个最小正实根,
综上,若E(X)≤1,则p=1.
若E(X)>1,则p1+2p2+3p3>1,故p2+2p3>p0.
此时f'(0)=−(p2+p0+p3)<0,f'(1)=p2+2p3−p0>0,
故f'(x)有两个不同零点x3,x4,且x3<0
故f(x)在(−∞,x3),(x4,+∞)上为增函数,在(x3,x4)上为减函数,
而f(1)=0,故f(x4)<0,
又f(0)=p0>0,故f(x)在(0,x4)存在一个零点p,且p<1.
所以p为p0+p1x+p2x2+p3x3=x的一个最小正实根,此时p<1,
故当E(X)>1时,p<1.
(3)意义:每一个该种微生物繁殖后代的平均数不超过1,则若干代必然灭绝,若繁殖后代的平均数超过1,则若干代后被灭绝的概率小于1.
9.【2020年全国1卷理科19】甲、乙、丙三位同学进行羽毛球比赛,约定赛制如下:累计负两场者被淘汰;比赛前抽签决定首先比赛的两人,另一人轮空;每场比赛的胜者与轮空者进行下一场比赛,负者下一场轮空,直至有一人被淘汰;当一人被淘汰后,剩余的两人继续比赛,直至其中一人被淘汰,另一人最终获胜,比赛结束.经抽签,甲、乙首先比赛,丙轮空.设每场比赛双方获胜的概率都为12,
(1)求甲连胜四场的概率;
(2)求需要进行第五场比赛的概率;
(3)求丙最终获胜的概率.
【答案】(1)116;(2)34;(3)716.
【解析】
(1)记事件M:甲连胜四场,则PM=124=116;
(2)记事件A为甲输,事件B为乙输,事件C为丙输,
则四局内结束比赛的概率为
P'=PABAB+PACAC+PBCBC+PBABA=4×124=14,
所以,需要进行第五场比赛的概率为P=1−P'=34;
(3)记事件A为甲输,事件B为乙输,事件C为丙输,
记事件M:甲赢,记事件N:丙赢,
则甲赢的基本事件包括:BCBC、ABCBC、ACBCB、
BABCC、BACBC、BCACB、BCABC、BCBAC,
所以,甲赢的概率为PM=124+7×125=932.
由对称性可知,乙赢的概率和甲赢的概率相等,
所以丙赢的概率为PN=1−2×932=716.
10.【2020年全国2卷理科18】某沙漠地区经过治理,生态系统得到很大改善,野生动物数量有所增加.为调查该地区某种野生动物的数量,将其分成面积相近的200个地块,从这些地块中用简单随机抽样的方法抽取20个作为样区,调查得到样本数据(xi,yi)(i=1,2,…,20),其中xi和yi分别表示第i个样区的植物覆盖面积(单位:公顷)和这种野生动物的数量,并计算得i=120xi=60,i=120yi=1200,i=120(xi−x)2=80,i=120(yi−y)2=9000,i=120(xi−x)(yi−y)=800.
(1)求该地区这种野生动物数量的估计值(这种野生动物数量的估计值等于样区这种野生动物数量的平均数乘以地块数);
(2)求样本(xi,yi)(i=1,2,…,20)的相关系数(精确到0.01);
(3)根据现有统计资料,各地块间植物覆盖面积差异很大.为提高样本的代表性以获得该地区这种野生动物数量更准确的估计,请给出一种你认为更合理的抽样方法,并说明理由.
附:相关系数r=i=1n(xi−x)(yi−y)i=1n(xi−x)2i=1n(yi−y)2,2=1.414.
【答案】(1)12000;(2)0.94;(3)详见解析
【解析】
(1)样区野生动物平均数为120i=120yi=120×1200=60,
地块数为200,该地区这种野生动物的估计值为200×60=12000
(2)样本(xi,yi)的相关系数为
r=i=120(xi−x)(yi−y)i=120(xi−x)2i=120(yi−y)2=80080×9000=223≈0.94,
(3)
由于各地块间植物覆盖面积差异较大,为提高样本数据的代表性,应采用分层抽样
先将植物覆盖面积按优中差分成三层,
在各层内按比例抽取样本,
在每层内用简单随机抽样法抽取样本即可.
11.【2020年全国3卷理科18】某学生兴趣小组随机调查了某市100天中每天的空气质量等级和当天到某公园锻炼的人次,整理数据得到下表(单位:天):
锻炼人次
空气质量等级
[0,200]
(200,400]
(400,600]
1(优)
2
16
25
2(良)
5
10
12
3(轻度污染)
6
7
8
4(中度污染)
7
2
0
(1)分别估计该市一天的空气质量等级为1,2,3,4的概率;
(2)求一天中到该公园锻炼的平均人次的估计值(同一组中的数据用该组区间的中点值为代表);
(3)若某天的空气质量等级为1或2,则称这天“空气质量好”;若某天的空气质量等级为3或4,则称这天“空气质量不好”.根据所给数据,完成下面的2×2列联表,并根据列联表,判断是否有95%的把握认为一天中到该公园锻炼的人次与该市当天的空气质量有关?
人次≤400
人次>400
空气质量好
空气质量不好
附:K2=n(ad−bc)2(a+b)(c+d)(a+c)(b+d),
P(K2≥k)
0.050
0.010
0.001
k
3.841
6.635
10.828
【答案】(1)该市一天的空气质量等级分别为1、2、3、4的概率分别为0.43、0.27、0.21、0.09;(2)350;(3)有,理由见解析.
【解析】
(1)由频数分布表可知,该市一天的空气质量等级为1的概率为2+16+25100=0.43,等级为2的概率为5+10+12100=0.27,等级为3的概率为6+7+8100=0.21,等级为4的概率为7+2+0100=0.09;
(2)由频数分布表可知,一天中到该公园锻炼的人次的平均数为100×20+300×35+500×45100=350
(3)2×2列联表如下:
人次≤400
人次>400
空气质量不好
33
37
空气质量好
22
8
K2=100×33×8−37×22255×45×70×30≈5.820>3.841,
因此,有95%的把握认为一天中到该公园锻炼的人次与该市当天的空气质量有关.
12.【2020年山东卷19】为加强环境保护,治理空气污染,环境监测部门对某市空气质量进行调研,随机抽查了100天空气中的PM2.5和SO2浓度(单位:μg/m3),得下表:
SO2
PM2.5
[0,50]
(50,150]
(150,475]
[0,35]
32
18
4
(35,75]
6
8
12
(75,115]
3
7
10
(1)估计事件“该市一天空气中浓度不超过,且浓度不超过”的概率;
(2)根据所给数据,完成下面的列联表:
PM2.5
(75,115]
(3)根据(2)中的列联表,判断是否有99%的把握认为该市一天空气中PM2.5浓度与SO2浓度有关?
附:K2=n(ad−bc)2(a+b)(c+d)(a+c)(b+d),
P(K2≥k)
0.050 0.010 0.001
k
3.841 6.635 10.828
【答案】(1)0.64;(2)答案见解析;(3)有.
【解析】
(1)由表格可知,该市100天中,空气中的PM2.5浓度不超过75,且SO2浓度不超过150的天数有32+6+18+8=64天,
所以该市一天中,空气中的PM2.5浓度不超过75,且SO2浓度不超过150的概率为64100=0.64;
(2)由所给数据,可得2×2列联表为:
SO2
PM2.5
0,150
150,475
合计
0,75
64
16
80
75,115
10
10
20
合计
74
26
100
(3)根据2×2列联表中的数据可得
K2=n(ad−bc)2(a+b)(c+d)(a+c)(b+d)=100×(64×10−16×10)280×20×74×26=3600481≈7.4844>6.635,
因为根据临界值表可知,有99%的把握认为该市一天空气中PM2.5浓度与SO2浓度有关.
13.【2020年海南卷19】为加强环境保护,治理空气污染,环境监测部门对某市空气质量进行调研,随机抽查了100天空气中的PM2.5和SO2浓度(单位:μg/m3),得下表:
SO2
PM2.5
[0,50]
(50,150]
(150,475]
[0,35]
32
18
4
(35,75]
6
8
12
(75,115]
3
7
10
(1)估计事件“该市一天空气中PM2.5浓度不超过75,且SO2浓度不超过150”的概率;
(2)根据所给数据,完成下面的2×2列联表:
SO2
PM2.5
[0,150]
(150,475]
[0,75]
(75,115]
(3)根据(2)中的列联表,判断是否有99%的把握认为该市一天空气中PM2.5浓度与SO2浓度有关?
附:K2=n(ad−bc)2(a+b)(c+d)(a+c)(b+d),
P(K2≥k)
0.050
0.010
0.001
k
3.841
6.635
10.828
【答案】(1)0.64;(2)答案见解析;(3)有.
【解析】
(1)由表格可知,该市100天中,空气中的PM2.5浓度不超过75,且SO2浓度不超过150的天数有32+6+18+8=64天,
所以该市一天中,空气中的PM2.5浓度不超过75,且SO2浓度不超过150的概率为64100=0.64;
(2)由所给数据,可得2×2列联表为:
SO2
PM2.5
0,150
150,475
合计
0,75
64
16
80
75,115
10
10
20
合计
74
26
100
(3)根据2×2列联表中的数据可得
K2=n(ad−bc)2(a+b)(c+d)(a+c)(b+d)=100×(64×10−16×10)280×20×74×26=3600481≈7.4844>6.635,
因为根据临界值表可知,有99%的把握认为该市一天空气中PM2.5浓度与SO2浓度有关.
14.【2019年新课标3理科17】为了解甲、乙两种离子在小鼠体内的残留程度,进行如下试验:将200只小鼠随机分成A、B两组,每组100只,其中A组小鼠给服甲离子溶液,B组小鼠给服乙离子溶液.每只小鼠给服的溶液体积相同、摩尔浓度相同.经过一段时间后用某种科学方法测算出残留在小鼠体内离子的百分比.根据试验数据分别得到如图直方图:
记C为事件:“乙离子残留在体内的百分比不低于5.5”,根据直方图得到P(C)的估计值为0.70.
(1)求乙离子残留百分比直方图中a,b的值;
(2)分别估计甲、乙离子残留百分比的平均值(同一组中的数据用该组区间的中点值为代表).
【答案】解:(1)C为事件:“乙离子残留在体内的百分比不低于5.5”,
根据直方图得到P(C)的估计值为0.70.
则由频率分布直方图得:
a+0.20+0.15=0.70.05+b+0.15=1−0.7,
解得乙离子残留百分比直方图中a=0.35,b=0.10.
(2)估计甲离子残留百分比的平均值为:
x甲=2×0.15+3×0.20+4×0.30+5×0.20+6×0.10+7×0.05=4.05.
乙离子残留百分比的平均值为:
x乙=3×0.05+4×0.1+5×0.15+6×0.35+7×0.2+8×0.15=6.
15.【2019年全国新课标2理科18】11分制乒乓球比赛,每赢一球得1分,当某局打成10:10平后,每球交换发球权,先多得2分的一方获胜,该局比赛结束.甲、乙两位同学进行单打比赛,假设甲发球时甲得分的概率为0.5,乙发球时甲得分的概率为0.4,各球的结果相互独立.在某局双方10:10平后,甲先发球,两人又打了X个球该局比赛结束.
(1)求P(X=2);
(2)求事件“X=4且甲获胜”的概率.
【答案】解:(1)设双方10:10平后的第k个球甲获胜为事件Ak(k=1,2,3,…),
则P(X=2)=P(A1A2)+P(A1A2)
=P(A1)P(A2)+P(A1)P(A2)
=0.5×0.4+0.5×0.6=0.5.
(2)P(X=4且甲获胜)=P(A1A2A2A4)+P(A1A2A3A4)
=P(A1)P(A2)P(A3)P(A4)+P(A1)P(A2)P(A3)P(A4)
=(0.5×0.4+0.5×0.6)×0.5×0.4=0.1.
16.【2019年新课标1理科21】为治疗某种疾病,研制了甲、乙两种新药,希望知道哪种新药更有效,为此进行动物试验.试验方案如下:每一轮选取两只白鼠对药效进行对比试验.对于两只白鼠,随机选一只施以甲药,另一只施以乙药.一轮的治疗结果得出后,再安排下一轮试验.当其中一种药治愈的白鼠比另一种药治愈的白鼠多4只时,就停止试验,并认为治愈只数多的药更有效.为了方便描述问题,约定:对于每轮试验,若施以甲药的白鼠治愈且施以乙药的白鼠未治愈则甲药得1分,乙药得﹣1分;若施以乙药的白鼠治愈且施以甲药的白鼠未治愈则乙药得1分,甲药得﹣1分;若都治愈或都未治愈则两种药均得0分.甲、乙两种药的治愈率分别记为α和β,一轮试验中甲药的得分记为X.
(1)求X的分布列;
(2)若甲药、乙药在试验开始时都赋予4分,pi(i=0,1,…,8)表示“甲药的累计得分为i时,最终认为甲药比乙药更有效”的概率,则p0=0,p8=1,pi=api﹣1+bpi+cpi+1(i=1,2,…,7),其中a=P(X=﹣1),b=P(X=0),c=P(X=1).假设α=0.5,β=0.8.
(i)证明:{pi+1﹣pi}(i=0,1,2,…,7)为等比数列;
(ii)求p4,并根据p4的值解释这种试验方案的合理性.
【答案】(1)解:X的所有可能取值为﹣1,0,1.
P(X=﹣1)=(1﹣α)β,P(X=0)=αβ+(1﹣α)(1﹣β),P(X=1)=α(1﹣β),
∴X的分布列为:
X
﹣1
0
1
P
(1﹣α)β
αβ+(1﹣α)(1﹣β)
α(1﹣β)
(2)(i)证明:∵α=0.5,β=0.8,
∴由(1)得,a=0.4,b=0.5,c=0.1.
因此pi=0.4pi﹣1+0.5pi+0.1pi+1(i=1,2,…,7),
故0.1(pi+1﹣pi)=0.4(pi﹣pi﹣1),即(pi+1﹣pi)=4(pi﹣pi﹣1),
又∵p1﹣p0=p1≠0,∴{pi+1﹣pi}(i=0,1,2,…,7)为公比为4,首项为p1的等比数列;
(ii)解:由(i)可得,
p8=(p8﹣p7)+(p7﹣p6)+…+(p1﹣p0)+p0=p1(1−48)1−4=48−13P1,
∵p8=1,∴p1=348−1,
∴P4=(p4﹣p3)+(p3﹣p2)+(p2﹣p1)+(p1﹣p0)+p0=44−13p1=1257.
P4表示最终认为甲药更有效的概率.
由计算结果可以看出,在甲药治愈率为0.5,乙药治愈率为0.8时,认为甲药更有效的概率为P4=1257≈0.0039,此时得出错误结论的概率非常小,说明这种试验方案合理.
17.【2018年新课标1理科20】某工厂的某种产品成箱包装,每箱200件,每一箱产品在交付用户之前要对产品作检验,如检验出不合格品,则更换为合格品.检验时,先从这箱产品中任取20件作检验,再根据检验结果决定是否对余下的所有产品作检验.设每件产品为不合格品的概率都为p(0<p<1),且各件产品是否为不合格品相互独立.
(1)记20件产品中恰有2件不合格品的概率为f(p),求f (p)的最大值点p0.
(2)现对一箱产品检验了20件,结果恰有2件不合格品,以(1)中确定的p0作为p的值.已知每件产品的检验费用为2元,若有不合格品进入用户手中,则工厂要对每件不合格品支付25元的赔偿费用.
(i)若不对该箱余下的产品作检验,这一箱产品的检验费用与赔偿费用的和记为X,求EX;
(ⅱ)以检验费用与赔偿费用和的期望值为决策依据,是否该对这箱余下的所有产品作检验?
【答案】解:(1)记20件产品中恰有2件不合格品的概率为f(p),
则f(p)=C202p2(1−p)18,
∴f'(p)=C202[2p(1−p)18−18p2(1−p)17]=2C202p(1−p)17(1−10p),
令f′(p)=0,得p=0.1,
当p∈(0,0.1)时,f′(p)>0,
当p∈(0.1,1)时,f′(p)<0,
∴f (p)的最大值点p0=0.1.
(2)(i)由(1)知p=0.1,
令Y表示余下的180件产品中的不合格品数,依题意知Y~B(180,0.1),
X=20×2+25Y,即X=40+25Y,
∴E(X)=E(40+25Y)=40+25E(Y)=40+25×180×0.1=490.
(ii)如果对余下的产品作检验,由这一箱产品所需要的检验费为400元,
∵E(X)=490>400,
∴应该对余下的产品进行检验.
18.【2018年新课标2理科18】如图是某地区2000年至2016年环境基础设施投资额y(单位:亿元)的折线图.
为了预测该地区2018年的环境基础设施投资额,建立了y与时间变量t的两个线性回归模型.根据2000年至2016年的数据(时间变量t的值依次为1,2,…,17)建立模型①:y^=−30.4+13.5t;根据2010年至2016年的数据(时间变量t的值依次为1,2,…,7)建立模型②:y^=99+17.5t.
(1)分别利用这两个模型,求该地区2018年的环境基础设施投资额的预测值;
(2)你认为用哪个模型得到的预测值更可靠?并说明理由.
【答案】解:(1)根据模型①:y^=−30.4+13.5t,
计算t=19时,y^=−30.4+13.5×19=226.1;
利用这个模型,求出该地区2018年的环境基础设施投资额的预测值是226.1亿元;
根据模型②:y^=99+17.5t,
计算t=9时,y^=99+17.5×9=256.5;.
利用这个模型,求该地区2018年的环境基础设施投资额的预测值是256.5亿元;
(2)模型②得到的预测值更可靠;
因为从总体数据看,该地区从2000年到2016年的环境基础设施投资额是逐年上升的,
而从2000年到2009年间递增的幅度较小些,
从2010年到2016年间递增的幅度较大些,
所以,利用模型②的预测值更可靠些.
19.【2018年新课标3理科18】某工厂为提高生产效率,开展技术创新活动,提出了完成某项生产任务的两种新的生产方式.为比较两种生产方式的效率,选取40名工人,将他们随机分成两组,每组20人.第一组工人用第一种生产方式,第二组工人用第二种生产方式.根据工人完成生产任务的工作时间(单位:min)绘制了如下茎叶图:
(1)根据茎叶图判断哪种生产方式的效率更高?并说明理由;
(2)求40名工人完成生产任务所需时间的中位数m,并将完成生产任务所需时间超过m和不超过m的工人数填入下面的列联表:
超过m
不超过m
第一种生产方式
第二种生产方式
(3)根据(2)中的列联表,能否有99%的把握认为两种生产方式的效率有差异?
附:K2=n(ad−bc)2(a+b)(c+d)(a+c)(b+d),
P(K2≥k)
0.050
0.010
0.001
k
3.841
6.635
10.828
【答案】解:(1)根据茎叶图中的数据知,
第一种生产方式的工作时间主要集中在72~92之间,
第二种生产方式的工作时间主要集中在65~85之间,
所以第二种生产方式的工作时间较少些,效率更高;
(2)这40名工人完成生产任务所需时间按从小到大的顺序排列后,
排在中间的两个数据是79和81,计算它们的中位数为m=79+812=80;
由此填写列联表如下;
超过m
不超过m
总计
第一种生产方式
15
5
20
第二种生产方式
5
15
20
总计
20
20
40
(3)根据(2)中的列联表,计算
K2=n(ad−bc)2(a+b)(c+d)(a+c)(b+d)=40×(15×15−5×5)220×20×20×20=10>6.635,
∴能有99%的把握认为两种生产方式的效率有差异.
20.【2017年新课标1理科19】为了监控某种零件的一条生产线的生产过程,检验员每天从该生产线上随机抽取16个零件,并测量其尺寸(单位:cm).根据长期生产经验,可以认为这条生产线正常状态下生产的零件的尺寸服从正态分布N(μ,σ2).
(1)假设生产状态正常,记X表示一天内抽取的16个零件中其尺寸在(μ﹣3σ,μ+3σ)之外的零件数,求P(X≥1)及X的数学期望;
(2)一天内抽检零件中,如果出现了尺寸在(μ﹣3σ,μ+3σ)之外的零件,就认为这条生产线在这一天的生产过程可能出现了异常情况,需对当天的生产过程进行检查.
(ⅰ)试说明上述监控生产过程方法的合理性;
(ⅱ)下面是检验员在一天内抽取的16个零件的尺寸:
9.95
10.12
9.96
9.96
10.01
9.92
9.98
10.04
10.26
9.91
10.13
10.02
9.22
10.04
10.05
9.95
经计算得x=116i=116 xi=9.97,s=116i=116 (xi−x)2=116(i=116 xi2−16x2)≈0.212,其中xi为抽取的第i个零件的尺寸,i=1,2,…,16.
用样本平均数x作为μ的估计值μ̂,用样本标准差s作为σ的估计值σ̂,利用估计值判断是否需对当天的生产过程进行检查?剔除(μ̂−3σ̂,μ̂+3σ̂)之外的数据,用剩下的数据估计μ和σ(精确到0.01).
附:若随机变量Z服从正态分布N(μ,σ2),则P(μ﹣3σ<Z<μ+3σ)=0.9974,0.997416≈0.9592,0.008≈0.09.
【答案】解:(1)由题可知尺寸落在(μ﹣3σ,μ+3σ)之内的概率为0.9974,
则落在(μ﹣3σ,μ+3σ)之外的概率为1﹣0.9974=0.0026,
因为P(X=0)=C160×(1﹣0.9974)0×0.997416≈0.9592,
所以P(X≥1)=1﹣P(X=0)=0.0408,
又因为X~B(16,0.0026),
所以E(X)=16×0.0026=0.0416;
(2)(ⅰ)如果生产状态正常,一个零件尺寸在(μ̂−3σ̂,μ̂+3σ̂)之外的概率只有0.0026,一天内抽取的16个零件中,出现尺寸在(μ̂−3σ̂,μ̂+3σ̂)之外的零件的概率只有0.0408,发生的概率很小.因此一旦发生这种状况,就有理由认为这条生产线在这一天的生产过程可能出现了异常情况,需对当天的生产过程进行检查,可见上述监控生产过程的方法是合理的.
(ⅱ)由x=9.97,s≈0.212,得μ的估计值为μ̂=9.97,σ的估计值为σ̂=0.212,由样本数据可以看出一个
零件的尺寸在(μ̂−3σ̂,μ̂+3σ̂)之外,因此需对当天的生产过程进行检查.
剔除(μ̂−3σ̂,μ̂+3σ̂)之外的数据9.22,剩下的数据的平均数为
115(16×9.97﹣9.22)=10.02,
因此μ的估计值为10.02.
i=116 xi2=16×0.2122+16×9.972≈1591.134,
剔除(μ̂−3σ̂,μ̂+3σ̂)之外的数据9.22,剩下的数据的样本方差为
115(1591.134﹣9.222﹣15×10.022)≈0.008,
因此σ的估计值为0.008≈0.09.
21.【2017年新课标2理科18】海水养殖场进行某水产品的新、旧网箱养殖方法的产量对比,收获时各随机抽取了100个网箱,测量各箱水产品的产量(单位:kg),其频率分布直方图如图:
(1)设两种养殖方法的箱产量相互独立,记A表示事件“旧养殖法的箱产量低于50kg,新养殖法的箱产量不低于50kg”,估计A的概率;
(2)填写下面列联表,并根据列联表判断是否有99%的把握认为箱产量与养殖方法有关:
箱产量<50kg
箱产量≥50kg
旧养殖法
新养殖法
(3)根据箱产量的频率分布直方图,求新养殖法箱产量的中位数的估计值(精确到0.01).
附:
P(K2≥k)
0.050
0.010
0.001
k
3.841
6.635
10.828
K2=n(ad−bc)2(a+b)(c+d)(a+c)(b+d).
【答案】解:(1)记B表示事件“旧养殖法的箱产量低于50kg”,C表示事件“新养殖法的箱产量不低于50kg”,
由P(A)=P(BC)=P(B)P(C),
则旧养殖法的箱产量低于50kg:(0.012+0.014+0.024+0.034+0.040)×5=0.62,
故P(B)的估计值0.62,
新养殖法的箱产量不低于50kg:(0.068+0.046+0.010+0.008)×5=0.66,
故P(C)的估计值为,
则事件A的概率估计值为P(A)=P(B)P(C)=0.62×0.66=0.4092;
∴A发生的概率为0.4092;
(2)2×2列联表:
箱产量<50kg
箱产量≥50kg
总计
旧养殖法
62
38
100
新养殖法
34
66
100
总计
96
104
200
则K2=200(62×66−38×34)2100×100×96×104≈15.705,
由15.705>6.635,
∴有99%的把握认为箱产量与养殖方法有关;
(3)由新养殖法的箱产量频率分布直方图中,箱产量低于50kg的直方图的面积:
(0.004+0.020+0.044)×5=0.34,
箱产量低于55kg的直方图面积为:
(0.004+0.020+0.044+0.068)×5=0.68>0.5,
故新养殖法产量的中位数的估计值为:50+0.5−0.340.068≈52.35(kg),
新养殖法箱产量的中位数的估计值52.35(kg).
22.【2017年新课标3理科18】某超市计划按月订购一种酸奶,每天进货量相同,进货成本每瓶4元,售价每瓶6元,未售出的酸奶降价处理,以每瓶2元的价格当天全部处理完.根据往年销售经验,每天需求量与当天最高气温(单位:℃)有关.如果最高气温不低于25,需求量为500瓶;如果最高气温位于区间[20,25),需求量为300瓶;如果最高气温低于20,需求量为200瓶.为了确定六月份的订购计划,统计了前三年六月份各天的最高气温数据,得下面的频数分布表:
最高气温
[10,15)
[15,20)
[20,25)
[25,30)
[30,35)
[35,40)
天数
2
16
36
25
7
4
以最高气温位于各区间的频率代替最高气温位于该区间的概率.
(1)求六月份这种酸奶一天的需求量X(单位:瓶)的分布列;
(2)设六月份一天销售这种酸奶的利润为Y(单位:元),当六月份这种酸奶一天的进货量n(单位:瓶)为多少时,Y的数学期望达到最大值?
【答案】解:(1)由题意知X的可能取值为200,300,500,
P(X=200)=2+1690=0.2,
P(X=300)=3690=0.4,
P(X=500)=25+7+490=0.4,
∴X的分布列为:
X
200
300
500
P
0.2
0.4
0.4
(2)由题意知这种酸奶一天的需求量至多为500瓶,至少为200瓶,
∴只需考虑200≤n≤500,
当300≤n≤500时,
若最高气温不低于25,则Y=6n﹣4n=2n;
若最高气温位于区间[20,25),则Y=6×300+2(n﹣300)﹣4n=1200﹣2n;
若最高气温低于20,则Y=6×200+2(n﹣200)﹣4n=800﹣2n,
∴EY=2n×0.4+(1200﹣2n)×0.4+(800﹣2n)×0.2=640﹣0.4n,
当200≤n≤300时,
若最高气温不低于20,则Y=6n﹣4n=2n,
若最高气温低于20,则Y=6×200+2(n﹣200)﹣4n=800﹣2n,
∴EY=2n×(0.4+0.4)+(800﹣2n)×0.2=160+1.2n.
∴n=300时,Y的数学期望达到最大值,最大值为520元.
23.【2016年新课标1理科19】某公司计划购买2台机器,该种机器使用三年后即被淘汰.机器有一易损零件,在购进机器时,可以额外购买这种零件作为备件,每个200元.在机器使用期间,如果备件不足再购买,则每个500元.现需决策在购买机器时应同时购买几个易损零件,为此搜集并整理了100台这种机器在三年使用期内更换的易损零件数,得如图柱状图:
以这100台机器更换的易损零件数的频率代替1台机器更换的易损零件数发生的概率,记X表示2台机器三年内共需更换的易损零件数,n表示购买2台机器的同时购买的易损零件数.
(Ⅰ)求X的分布列;
(Ⅱ)若要求P(X≤n)≥0.5,确定n的最小值;
(Ⅲ)以购买易损零件所需费用的期望值为决策依据,在n=19与n=20之中选其一,应选用哪个?
【答案】解:(Ⅰ)由已知得X的可能取值为16,17,18,19,20,21,22,
P(X=16)=(20100)2=125,
P(X=17)=20100×40100×2=425,
P(X=18)=(40100)2+2(20100)2=625,
P(X=19)=2×40100×20100+2×(20100)2=625,
P(X=20)=(20100)2+2×40100×20100=525=15,
P(X=21)=2×(20100)2=225,
P(X=22)=(20100)2=125,
∴X的分布列为:
X
16
17
18
19
20
21
22
P
125
425
625
625
15
225
125
(Ⅱ)由(Ⅰ)知:
P(X≤18)=P(X=16)+P(X=17)+P(X=18)
=125+425+625=1125.
P(X≤19)=P(X=16)+P(X=17)+P(X=18)+P(X=19)
=125+425+625+625=1725.
∴P(X≤n)≥0.5中,n的最小值为19.
(Ⅲ)解法一:由(Ⅰ)得P(X≤19)=P(X=16)+P(X=17)+P(X=18)+P(X=19)
=125+425+625+625=1725.
买19个所需费用期望:
EX1=200×19×1725+(200×19+500)×525+(200×19+500×2)×225+(200×19+500×3)×125=4040,
买20个所需费用期望:
EX2=200×20×2225+(200×20+500)×225+(200×20+2×500)×125=4080,
∵EX1<EX2,
∴买19个更合适.
解法二:购买零件所用费用含两部分,一部分为购买零件的费用,
另一部分为备件不足时额外购买的费用,
当n=19时,费用的期望为:19×200+500×0.2+1000×0.08+1500×0.04=4040,
当n=20时,费用的期望为:20×200+500×0.08+1000×0.04=4080,
∴买19个更合适.
24.【2016年新课标2理科18】某保险的基本保费为a(单位:元),继续购买该保险的投保人成为续保人,续保人本年度的保费与其上年度出险次数的关联如下:
上年度出险次数
0
1
2
3
4
≥5
保费
0.85a
a
1.25a
1.5a
1.75a
2a
设该险种一续保人一年内出险次数与相应概率如下:
一年内出险次数
0
1
2
3
4
≥5
概率
0.30
0.15
0.20
0.20
0.10
0.05
(Ⅰ)求一续保人本年度的保费高于基本保费的概率;
(Ⅱ)若一续保人本年度的保费高于基本保费,求其保费比基本保费高出60%的概率;
(Ⅲ)求续保人本年度的平均保费与基本保费的比值.
【答案】解:(Ⅰ)∵某保险的基本保费为a(单位:元),
上年度出险次数大于等于2时,续保人本年度的保费高于基本保费,
∴由该险种一续保人一年内出险次数与相应概率统计表得:
一续保人本年度的保费高于基本保费的概率:
p1=1﹣0.30﹣0.15=0.55.
(Ⅱ)设事件A表示“一续保人本年度的保费高于基本保费”,事件B表示“一续保人本年度的保费比基本保费高出60%”,
由题意P(A)=0.55,P(AB)=0.10+0.05=0.15,
由题意得若一续保人本年度的保费高于基本保费,
则其保费比基本保费高出60%的概率:
p2=P(B|A)=P(AB)P(A)=0.150.55=311.
(Ⅲ)由题意,续保人本年度的平均保费与基本保费的比值为:
0.85a×0.30+a×0.15+1.25a×0.2+1.5a×0.20+1.75a×0.1+2a×0.05a=1.23,
∴续保人本年度的平均保费与基本保费的比值为1.23.
25.【2016年新课标3理科18】如图是我国2008年至2014年生活垃圾无害化处理量(单位:亿吨)的折线图.
注:年份代码1﹣7分别对应年份2008﹣2014.
(Ⅰ)由折线图看出,可用线性回归模型拟合y与t的关系,请用相关系数加以证明;
(Ⅱ)建立y关于t的回归方程(系数精确到0.01),预测2016年我国生活垃圾无害化处理量.
附注:
参考数据:i=17 yi=9.32,i=17 tiyi=40.17,i=17 (yi−y)2=0.55,7≈2.646.
参考公式:相关系数r=i=1n (ti−t)(yi−y)i=1n (ti−t)2i=1n (yi−y)2,
回归方程y^=a^+b^t中斜率和截距的最小二乘估计公式分别为:
b^=i=1n (ti−t)(yi−y)i=1n (ti−t)2,a^=y−b^t.
【答案】解:(1)由折线图看出,y与t之间存在较强的正相关关系,理由如下:
∵r=i=17 (ti−t)(yi−y)i=17 (ti−t)2i=17 (yi−y)2=i=17 tiyi−7tyi=17 (ti−t)2i=17 (yi−y)2≈40.17−4×9.3227⋅0.55≈2.892.9106≈0.993,
∵0.993>0.75,
故y与t之间存在较强的正相关关系;
(2)b^=i=1n (ti−t)(yi−y)i=1n (ti−t)2=i=17 tiyi−7tyi=17 ti2−7t2≈2.8928≈0.103,
a^=y−b^t≈1.331﹣0.103×4≈0.92,
∴y关于t的回归方程ŷ=0.10t+0.92,
2016年对应的t值为9,
故ŷ=0.10×9+0.92=1.82,
预测2016年我国生活垃圾无害化处理量为1.82亿吨.
26.【2015年新课标1理科19】某公司为确定下一年度投入某种产品的宣传费,需了解年宣传费x(单位:千元)对年销售量y(单位:t)和年利润z(单位:千元)的影响,对近8年的年宣传费xi和年销售量yi(i=1,2,…,8)数据作了初步处理,得到下面的散点图及一些统计量的值.
x
y
w
i=18 (xi−x)2
i=18 (wi−w)2
i=18 (xi−x)(yi−y)
i=18 (wi−w)(yi−y)
46.6
563
6.8
289.8
1.6
1469
108.8
表中wi=xi,w=18i=18 wi
(Ⅰ)根据散点图判断,y=a+bx与y=c+dx哪一个适宜作为年销售量y关于年宣传费x的回归方程类型?(给出判断即可,不必说明理由)
(Ⅱ)根据(Ⅰ)的判断结果及表中数据,建立y关于x的回归方程;
(Ⅲ)已知这种产品的年利润z与x、y的关系为z=0.2y﹣x.根据(Ⅱ)的结果回答下列问题:
(i)年宣传费x=49时,年销售量及年利润的预报值是多少?
(ii)年宣传费x为何值时,年利润的预报值最大?
附:对于一组数据(u1v1),(u2v2)…..(unvn),其回归线v=α+βu的斜率和截距的最小二乘估计分别为:β^=i=1n (ui−u)(vi−v)i=1n (ui−u)2,α^=v−β^u.
【答案】解:(Ⅰ)由散点图可以判断,y=c+dx适宜作为年销售量y关于年宣传费x的回归方程类型;
(Ⅱ)令w=x,先建立y关于w的线性回归方程,由于d^=108.81.6=68,
c^=y−d^w=563﹣68×6.8=100.6,
所以y关于w的线性回归方程为y^=100.6+68w,
因此y关于x的回归方程为y^=100.6+68x,
(Ⅲ)(i)由(Ⅱ)知,当x=49时,年销售量y的预报值y^=100.6+6849=576.6,
年利润z的预报值z^=576.6×0.2﹣49=66.32,
(ii)根据(Ⅱ)的结果可知,年利润z的预报值z^=0.2(100.6+68x)﹣x=﹣x+13.6x+20.12,
当x=13.62=6.8时,即当x=46.24时,年利润的预报值最大.
27.【2015年新课标2理科18】某公司为了解用户对其产品的满意度,从A,B两地区分别随机调查了20个用户,得到用户对产品的满意度评分如下:
A地区:62 73 81 92 95 85 74 64 53 76
78 86 95 66 97 78 88 82 76 89
B地区:73 83 62 51 91 46 53 73 64 82
93 48 65 81 74 56 54 76 65 79
(1)根据两组数据完成两地区用户满意度评分的茎叶图,并通过茎叶图比较两地区满意度评分的平均值及分散程度(不要求计算出具体值,给出结论即可);
(2)根据用户满意度评分,将用户的满意度从低到高分为三个等级:
满意度评分
低于70分
70分到89分
不低于90分
满意度等级
不满意
满意
非常满意
记事件C:“A地区用户的满意度等级高于B地区用户的满意度等级”,假设两地区用户的评价结果相互独立,根据所给数据,以事件发生的频率作为相应事件发生的概率,求C的概率.
【答案】解:(1)两地区用户满意度评分的茎叶图如下
通过茎叶图可以看出,A地区用户满意评分的平均值高于B地区用户满意评分的平均值;A地区用户满意度评分比较集中,B地区用户满意度评分比较分散;
(2)记CA1表示事件“A地区用户满意度等级为满意或非常满意”,
记CA2表示事件“A地区用户满意度等级为不满意”,
记CB1表示事件“B地区用户满意度等级为不满意”,
记CB2表示事件“B地区用户满意度等级为满意”,
则CA1与CB1独立,CA2与CB2独立,CB1与CB2互斥,
则C=CA1CB1∪CA2CB2,
P(C)=P(CA1CB1)+P(CA2CB2)=P(CA1)P(CB1)+P(CA2)P(CB2),
由所给的数据CA1,CA2,CB1,CB2,发生的频率为1620,420,1020,820,
所以P(CA1)=1620,P(CA2)=420,P(CB1)=1020,P(CB2)=820,
所以P(C)=1620×1020+820×420=0.48.
28.【2014年新课标1理科18】从某企业生产的某种产品中抽取500件,测量这些产品的一项质量指标值,由测量结果得如下频率分布直方图:
(Ⅰ)求这500件产品质量指标值的样本平均数x和样本方差s2(同一组中数据用该组区间的中点值作代表);
(Ⅱ)由直方图可以认为,这种产品的质量指标值Z服从正态分布N(μ,σ2),其中μ近似为样本平均数x,σ2近似为样本方差s2.
(i)利用该正态分布,求P(187.8<Z<212.2);
(ii)某用户从该企业购买了100件这种产品,记X表示这100件产品中质量指标值位于区间(187.8,212.2)的产品件数,利用(i)的结果,求EX.
附:150≈12.2.
若Z~N(μ,σ2)则P(μ﹣σ<Z<μ+σ)=0.6826,P(μ﹣2σ<Z<μ+2σ)=0.9544.
【答案】解:(Ⅰ)抽取产品的质量指标值的样本平均数x和样本方差s2分别为:
x=170×0.02+180×0.09+190×0.22+200×0.33+210×0.24+220×0.08+230×0.02=200,
s2=(﹣30)2×0.02+(﹣20)2×0.09+(﹣10)2×0.22+0×0.33+102×0.24+202×0.08+302×0.02=150.
(Ⅱ)(i)由(Ⅰ)知Z~N(200,150),从而P(187.8<Z<212.2)=P(200﹣12.2<Z<200+12.2)=0.6826;
(ii)由(i)知一件产品的质量指标值位于区间(187.8,212.2)的概率为0.6826,
依题意知X~B(100,0.6826),所以EX=100×0.6826=68.26.
29.【2014年新课标2理科19】某地区2007年至2013年农村居民家庭人均纯收入y(单位:千元)的数据如表:
年份
2007
2008
2009
2010
2011
2012
2013
年份代号t
1
2
3
4
5
6
7
人均纯收入y
2.9
3.3
3.6
4.4
4.8
5.2
5.9
(Ⅰ)求y关于t的线性回归方程;
(Ⅱ)利用(Ⅰ)中的回归方程,分析2007年至2013年该地区农村居民家庭人均纯收入的变化情况,并预测该地区2015年农村居民家庭人均纯收入.
附:回归直线的斜率和截距的最小二乘估计公式分别为:b̂=i=1n (ti−t)(yi−y)i=1n (ti−t)2,â=y−b̂t.
【答案】解:(Ⅰ)由题意,t=17×(1+2+3+4+5+6+7)=4,
y=17×(2.9+3.3+3.6+4.4+4.8+5.2+5.9)=4.3,
∴b̂=(−3)×(−1.4)+(−2)×(−1)+(−1)×(−0.7)+0×0.1+1×0.5+2×0.9+3×1.69+4+1+0+1+4+9=1428=0.5,
â=y−b̂t=4.3﹣0.5×4=2.3.
∴y关于t的线性回归方程为ŷ=0.5t+2.3;
(Ⅱ)由(Ⅰ)知,b=0.5>0,故2007年至2013年该地区农村居民家庭人均纯收入逐年增加,平均每年增加0.5千元.
将2015年的年份代号t=9代入ŷ=0.5t+2.3,得:
ŷ=0.5×9+2.3=6.8,
故预测该地区2015年农村居民家庭人均纯收入为6.8千元.
30.【2013年新课标1理科19】一批产品需要进行质量检验,检验方案是:先从这批产品中任取4件作检验,这4件产品中优质品的件数记为n.如果n=3,再从这批产品中任取4件作检验,若都为优质品,则这批产品通过检验;如果n=4,再从这批产品中任取1件作检验,若为优质品,则这批产品通过检验;其他情况下,这批产品都不能通过检验.假设这批产品的优质品率为50%,即取出的产品是优质品的概率都为12,且各件产品是否为优质品相互独立.
(Ⅰ)求这批产品通过检验的概率;
(Ⅱ)已知每件产品检验费用为100元,凡抽取的每件产品都需要检验,对这批产品作质量检验所需的费用记为X(单位:元),求X的分布列及数学期望.
【答案】解:(Ⅰ)设第一次取出的4件产品中恰有3件优质品为事件A1,第一次取出的4件产品全是优质品为事件A2,
第二次取出的4件产品全是优质品为事件B1,第二次取出的1件产品是优质品为事件B2,
这批产品通过检验为事件A,依题意有A=(A1B1)∪(A2B2),且A1B1与A2B2互斥,
所以P(A)=P(A1B1)+P(A2B2)=P(A1)P(B1|A1)+P(A2)P(B2|A2)
=416×116+116×12=364
(Ⅱ)X可能的取值为400,500,800,并且P(X=800)=14,P(X=500)=116,
P(X=400)=1−116−14=1116,故X的分布列如下:
X
400
500
800
P
1116
116
14
故EX=400×1116+500×116+800×14=506.25
31.【2013年新课标2理科19】经销商经销某种农产品,在一个销售季度内,每售出1t该产品获利润500元,未售出的产品,每1t亏损300元.根据历史资料,得到销售季度内市场需求量的频率分布直方图,如图所示.经销商为下一个销售季度购进了130t该农产品.以x(单位:t,100≤x≤150)表示下一个销售季度内的市场需求量,T(单位:元)表示下一个销售季度内经销该农产品的利润.
(Ⅰ)将T表示为x的函数;
(Ⅱ)根据直方图估计利润T不少于57000元的概率;
(Ⅲ)在直方图的需求量分组中,以各组的区间中点值代表该组的各个值,并以需求量落入该区间的频率作为需求量取该区间中点值的概率(例如:若x∈[100,110))则取x=105,且x=105的概率等于需求量落入[100,110)的频率,求T的数学期望.
【答案】解:(Ⅰ)由题意得,当x∈[100,130)时,T=500x﹣300(130﹣x)=800x﹣39000,
当x∈[130,150)时,T=500×130=65000,
∴T=800x−39000,x∈[100,130)65000,x∈[130,150].
(Ⅱ)由(Ⅰ)知,利润T不少于57000元,当且仅当120≤x≤150.
由直方图知需求量X∈[120,150]的频率为0.7,
所以下一个销售季度的利润T不少于57000元的概率的估计值为0.7.
(Ⅲ)依题意可得T的分布列如图,
T
45000
53000
61000
65000
p
0.1
0.2
0.3
0.4
所以ET=45000×0.1+53000×0.2+61000×0.3+65000×0.4=59400.
模拟好题
1.某汽车生产厂家为了解某型号电动汽车的“实际平均续航里程数”,收集了使用该型号电动汽车1年以上的部分客户的相关数据,得到他们的电动汽车的“实际平均续航里程数”.从年龄在40岁以下的客户中抽取10位归为A组,从年龄在40岁及以上的客户中抽取10位归为B组,将他们的电动汽车的“实际平均续航里程数”整理成下图,其中“+”表示A组的客户,“⊙”表示B组的客户.
注:“实际平均续航里程数”是指电动汽车的行驶总里程与充电次数的比值.
(1)记A,B两组客户的电动汽车的“实际平均续航里程数”的平均值分别为m,n,根据图中数据,试比较m,n的大小(结论不要求证明);
(2)从抽取的20位客户中随机抽取2位,求其中至少有1位是A组的客户的概率;
(3)如果客户的电动汽车的“实际平均续航里程数”不小于350,那么称该客户为“驾驶达人”,现从该市使用这种电动汽车的所有客户中,随机抽取年龄40岁以下和40岁以上的客户各1位,记“驾驶达人”的人数为X,求随机变量X的分布列和数学期望.
【答案】(1)m
(3)分布列答案见解析,EX=310.
【解析】
(1)m
“实际平均里程续航数”大于250的A组有5个,B组有5个,且B组数据也整体大于A组,
所以B组的数据总和大于A组数据总和,即A组客户的电动汽车的“实际平均续航里程数”的平均值n小于B组客户的电动汽车的“实际平均续航里程数”的平均值m;
(2)设“从抽取的20位客户中随机抽取2位,至少有1位是A组的客户”为事件M,则PM=C101C101+C102C202=2938,
所以从抽取的20位客户中随机抽取2位,至少有1位是A组的客户的概率是2938;
(3)由题图,知A组“驾驶达人”的人数为1人,B组“驾驶达人”的人数为2人,
则可估计该市使用这种电动汽车的所有客户中,在年龄40岁以下的客户中随机抽取1位,该客户为“驾驶达人”的概率为110,在年龄40岁以上的客户中随机抽取1位,该客户为“驾驶达人”的概率为210=15;
依题意,X所有可能取值为0,1,2.
则PX=0=1−110×1−15=1825,
PX=1=1−110×15+110×1−15=1350,
PX=2=110×15=150,
所以随机变量X的分布列为
X
0
1
2
P
1825
1350
150
故X数学期望为E(X)=0×1825+1×1350+2×150=310.
2.北京市某区针对高三年级的一次测试做调研分析,随机抽取同时选考物理、化学的学生330名,下表是物理、化学成绩等级和人数的数据分布情况:
物理成绩等级
A
B
C
化学成绩等级
A
B
C
A
B
C
A
B
C
人数(名)
110
53
2
55
70
15
3
12
10
(1)从该区高三年级同时选考物理、化学的学生中随机抽取1人,已知该生的物理成绩等级为A,估计该生的化学成绩等级为A的概率;
(2)从该区高三年级同时选考物理、化学的学生中随机抽取2人,以X表示这2人中物理、化学成绩等级均为A的人数,求X的分布列和数学期望(以上表中物理、化学成绩等级均为A的频率作为每名学生物理、化学成绩等级均为A的概率);
(3)记抽取的330名学生在这次考试中数学成绩(满分150分)的方差为s2,排名前50%的成绩方差为s12,排名后50%的成绩方差为s22,则s2不可能同时大于s12和s22,这种判断是否正确.(直接写出结论).
【答案】(1)23
(2)分布列答案见解析,数学期望为23
(3)不正确
【解析】
(1)设事件A为“该生物理成绩等级为A的情况下,化学成绩等级为A”,
样本中物理成绩等级为A的人数为110+53+2=165,在该群体中化学成绩等级为A的人数为110,所以频率为110165=23,由样本估计总体可得PA=23,
故该生物理成绩等级为A,估计该生化学成绩等级为A的概率为23.
(2)从该区高三年级同时选考物理、化学的学生随机选取一名,物理、化学成绩等级均为A的概率估计为110330=13.
由题意随机变量X的取值范围是0,1,2
PX=0=232=49
PX=1=C21×13×23=49
PX=2=132=19
则X的分布列:
X
0
1
2
P
49
49
19
E(X)=0×49+1×49+2×19=23
(3)不正确;
举例:,排名前50%的成绩均为150分,方差为s12=0,排名后50%的成绩均为0分,方差为s22=0,显然s2>0,所以s2>s12,s2>s22,故s2同时大于s12和s22.
3.2022 年春节后,新冠肺炎的新变种奥密克戎在我国部分地区爆发. 该病毒是一种人传人,不易被人们直接发现,潜伏期长且传染性极强的病毒. 我们把与该病毒感染者有过密切接触的人群称为密切接触者. 一旦发现感染者,社区会立即对其进行流行性病医学调查,找到其密切接触者进行隔离观察. 调查发现某位感染者共有 10 位密切接触者,将这 10 位密切接触者隔离之后立即进行核酸检测. 核酸检测方式既可以采用单样本检测,又可以采用 “ k 合 1 检测法”. “ k 合 1 检测法” 是将 k 个样本混合在一起检测,若混合样本呈阳性,则该组中各个样本再全部进行单样本检测; 若混合样本呈阴性,则可认为该混合样本中每个样本都是阴性. 通过病毒指标检测,每位密切按触者为阴性的概率为 p0 (1)现对 10 个样本进行单样本检测,求检测结果最多有1个样本为阳性的概率 fp 的表达式;
(2)若对 10 个样本采用 “5合1检测法” 进行核酸检测. 用 p 表示以下结论:
①求某个混合样本呈阳性的概率;
②设总检测次数为X,求X的分布列和数学期望 EX.
【答案】(1)fp=−9p10+10p9;
(2)①1−p5;②分布列见解析,EX=12−10p5.
【解析】
(1)由题意可知,对10个样本进行逐个检测属于独立重复试验,所以最多有1个阳性样本的概率为:
fp=C1001−p0p10+C1011−p1p9=−9p10+10p9,
所以fp=−9p10+10p9
(2)①设“某个混合样本呈阳性”为事件A,则A表示事件“某个混合样本呈阴性”,而混合样本呈阴性即为该混合样本全部为阴性,PA=p5.
故PA=1−PA=1−p5
②X的可能取值为2,7,12.
当两个混合样本都呈阴性时,X=2.
PX=2=p5⋅p5=p10
当两个混合样本一个呈阳性,一个呈阴性时,X=7.
PX=7=C21p5⋅1−p5=2p5−2p10
当两个混合样本都呈阳性时,X=12.
PX=12=1−p5⋅1−p5=1−2p5+p10
故X的分布列为:
X
2
7
12
P
p10
2p5−2p10
1−2p5+p10
X的数学期望EX=2p10+72p5−2p10+121−2p5+p10=12−10p5,
所以X的数学期望为EX=12−10p5
4.某市高一招生,对初中毕业学生进行体育测试,是激发学生、家长和学校积极开展体育活动,保证学生健康成长的有效措施.该市2022年初中毕业升学体育考试规定,考生必须参加立定跳远、掷实心球、1分钟跳绳等三项测试,三项考试总分为50分,其中立定跳远15分,掷实心球15分,1分钟跳绳20分.该市一初中学校为了在初三上学期开始时掌握全年级学生每分钟跳绳的情况,随机抽取了100名学生进行测试,得到每段人数的频率分布直方图(如图),且规定计分规则如表:
每分钟跳绳个数
[155,165)
[165,175)
[175,185)
[185,+∞)
得分
17
18
19
20
若该初中学校初三年级所有学生的跳绳个数X服从正态分布Nμ,σ2,用样本数据的平均值和方差估计总体的期望和方差,已知样本方差S2≈169(各组数据用中点值代替).根据往年经验,该初中学校初三年级学生经过一年的训练,正式测试时每人每分钟跳绳个数都有明显进步,假设今年正式测试时每人每分钟跳绳个数比初三上学期开始时个数增加10个,现利用所得正态分布模型:
(1)预估全年级恰好有2000名学生时,正式测试每分钟跳182个以上的人数;(结果四舍五入到整数)
(2)若在全年级所有学生中任意选取3人,记正式测试时每分钟跳195个以上的人数为ξ,求随机变量ξ的分布列和期望.附:若随机变量X服从正态分布Nμ,σ2,则P(μ−σ
(2)分布列见解析,1.5
【解析】
(1)X=160×0.06+170×0.12+180×0.34+190×0.30+200×0.1+210×0.08=185
又σ2≈169, σ=13所以正式测试时,μ=185, σ=13, ∴μ−σ=172.
∴P(ξ>182)=1−1−0.68262=0.8413,∴0.8413×2000=1682.6≈1683(人)
(2)由正态分布模型,全年级所有学生中任取1人,每分钟跳绳个数195以上的概率为0.5,
即ξ~B(3,0.5),∴P(ξ=0)=C30(1−0.5)3=0.125, P(ξ=1)=C310.5(1−0.5)2=0.375,
P(ξ=2)=C320.52(1−0.5)=0.375P(ξ=3)=C330.53=0.125, ∴ξ的分布列为.
ξ
0
1
2
3
P
0.125
0.375
0.375
0.125
所以,E(ξ)=3×0.5=1.5
5.为落实体育总局和教育部发布的《关于深化体教融合,促进青少年健康发展的意见》,某校组织学生加强100米短跑训练.在某次短跑测试中,抽取100名男生作为样本,统计他们的成绩(单位:秒),整理得到如图所示的频率分布直方图(每组区间包含左端点,不包含右端点).
(1)若规定男生短跑成绩小于13.5秒为优秀,求样本中男生短跑成绩优秀的概率.
(2)估计样本中男生短跑成绩的平均数.(同一组的数据用该组区间的中点值为代表)
(3)根据统计分析,该校男生的短跑成绩X服从正态分布Nμ,1.222,以(2)中所求的样本平均数作为μ的估计值.若从该校男生中随机抽取10人,记其中短跑成绩在12.56,17.44以外的人数为Y,求PY≥1.
附:若Z~Nμ,σ2,则Pμ−2σ≤Z≤μ+2σ=0.9545.0.954510≈0.6277.
【答案】(1)0.11
(2)15
(3)0.3723
【解析】
(1)由频率分布直方图可得2a+0.08+0.09+0.22+0.24+0.33=1,
解得a=0.02,
所以样本中男生短跑成绩优秀的概率为0.02+0.09=0.11.
(2)估计样本中男生短跑成绩的平均数为
12×0.02+13×0.09+14×0.22+15×0.33+16× 0.24+17×0.08+18×0.02=15.
(3)由(2)知μ=15,所以X~N15,1.222,
所以该校男生短跑成绩在12.56,17.44以外的概率为
1−P(12.56≤X≤17.44)=1−0.9545=0.0455.
根据题意Y~B(10,0.0455),
所以P(Y≥1)=1−P(Y=0)=1−0.954510≈1−0.6277=0.3723.
6.随着时代发展和社会进步,教师职业越来越受青睐,考取教师资格证成为不少人的就业规划之一.当前,中小学教师资格考试分笔试和面试两部分.已知某市2021年共有10000名考生参加了中小学教师资格考试的笔试,现从中随机抽取100人的笔试成绩(满分视为100分)作为样本,整理得到如下频数分布表:
笔试成绩X
40,50
50,60
60,70
70,80
80,90
90,100
人数
5
15
35
30
10
5
(1)假定笔试成绩不低于90分为优秀,若从上述样本中笔试成绩不低于80分的考生里随机抽取2人,求至少有1人笔试成绩为优秀的概率;
(2)由频数分布表可认为该市全体考生的笔试成绩X近似服从正态分布Nμ,δ2,其中μ近似为100名样本考生笔试成绩的平均值(同一组中的数据用该组区间的中点值代替),δ2=180,据此估计该市全体考生中笔试成绩不低于82.4的人数(结果四舍五入精确到个位);
(3)考生甲为提升综合素养报名参加了某拓展知识竞赛,该竞赛要回答3道题,前两题是哲学知识,每道题答对得3分,答错得0分;最后一题是心理学知识,答对得4分,答错得0分.已知考生甲答对前两题的概率都是12,答对最后一题的概率为23,且每道题答对与否相互独立,求考生甲的总得分Y的分布列及数学期望.(参考数据:180≈13.4;若X~Nμ,δ2,则Pμ−δ
(2)1587人
(3)分布列见解析,173
【解析】
(1)由已知,样本中笔试成绩不低于80分的考生共有15人,其中成绩优秀的10人.
故至少有1人笔试成绩为优秀的概率为P=C51C101+C52C152=47.
(2)由表格中的数据可知,μ=0.05×45+0.15×55+0.35×65+0.3×75+0.10×85+0.05×95=69,
又σ2=180,即σ≈13.4,
∴PX≥82.4=PX≥μ+δ=121−Pμ−σ
(3)考生甲的总得分Y的所有可能取值为0,3,4,6,7,10,
则P(Y=0)=122×13=112, P(Y=3)=C21122×13=16, P(Y=4)=122×23=16,
P(Y=6)=122×13=112, P(Y=7)=C21122×23=13, P(Y=10)=122×23=16,
故Y的分布列为:
Y
0
3
4
6
7
10
P
112
16
16
112
13
16
∴E(Y)=0×112+3×16+4×16+6×112+7×13+10×16=173.
7.在党中央的英明领导下,在全国人民的坚定支持下,中国的抗击“新型冠状肺炎”战役取得了阶段性胜利,现在摆在我们大家面前的是有序且安全的复工复产.某商场为了提振顾客的消费信心,对某中型商品实行分期付款方式销售,根据以往资料统计,顾客购买该商品选择分期付款的期数5的分布列如下,其中0 ξ
4
5
6
P
0.4
a
b
(1)求购买该商品的3位顾客中,恰有1位选择分4期付款的概率;
(2)商场销售一件该商品,若顾客选择分4期付款,则商场获得的利润为2000元;若顾客选择分5期付款,则商场获得的利润为2500元;若顾客选择分6期付款,则商场获得的利润为3000元,假设该商场销售两件该商品所获得的利润为X(单位:元).当X=5500的概率取得最大值时,求利润X的分布列和数学期望.
【答案】(1)0.432
(2)分布列见解析,数学期望为4900.
【解析】
(1)由于3位顾客中恰有1位选择“分4期付款”,则另外两位均不选“分4期付款”.
所以P=3×0.4×(1−0.4)×(1−0.4)=0.432.
(2)由题可得X的值分别为4000,4500,5000,5500,6000.
P(X=4000)=0.4×0.4=0.16,P(X=4500)=2×0.4×a=0.8a,
P(X=5000)=a2+2×0.4×b=a2+0.8b,P(X=5500)=2ab,P(X=6000)=b2,
所以P(X=5500)=2ab≤2×a+b22=0.362=0.18,取最大值的条件为a=b=0.3,
所以分布列为:
X
4000
4500
5000
5500
6000
P
0.16
0.24
0.33
0.18
0.09
E(X)=4000×0.16+4500×0.24+5000×0.33+5500×0.18+6000×0.09=4900.
8.2022年冬季奥林匹克运动会主办城市是北京,北京成为第一个举办过夏季奥林匹克运动会和冬季奥林匹克运动会以及亚洲运动会三项国际赛事的城市!为迎接冬奥会的到来,某地很多中小学开展了模拟冬奥会赛事的活动,为了深入了解学生在“自由式滑雪”和“单板滑雪”两项活动的参与情况,在该地随机选取了10所学校进行研究,得到如下数据:
(1)“单板滑雪”与“自由式滑雪”每项参与人数都超过30人的学校可以作为“参与冬奥运动积极学校”,现在从这10所学校中随机选岀3所,记X为选岀“参与冬奥运动积极学校”的学校个数,求X的分布列和数学期望;
(2)现在有一个“单板滑雪”集训营,对“滑行、转弯、跳跃、停止”这4个动作技巧进行集训,且在集训中进行了多轮测试.规定:在一轮测试中,这4个动作中至少有3个动作达到“优秀”,则该轮测试记为“优秀”.在集训测试中,小明同学“滑行”这个动作达到“优秀”的概率均为23,其余每个动作达到“优秀”的概率都为13,每个动作互不影响且每轮测试互不影响.如果小明同学在集训测试中要想获得“优秀”的次数的平均值达到5次,那么理论上至少要进行多少轮测试?
【答案】(1)分布列见解析,期望为32
(2)27轮
【解析】
(1)解:“单板滑雪”与“自由式滑雪”每项参与人数超过30人的学校共5所,X的所有可能取值为0、1、2、3,
所以PX=0=C53C103=112,PX=1=C52C51C103=512,PX=2=C52C51C103=512,PX=3=C53C103=112,
所以X的分布列如下表:
X
0
1
2
3
P
112
512
512
112
所以EX=0×112+1×512+2×512+3×112=32.
(2)解:记“小明同学在一轮测试中要想获得优秀”为事件A,
PA=23×C32×132×23+13×C33×133+23×C33×133=527,
由题意,小明同学在集训测试中获得“优秀”的次数服从二项分布Bn,527,
由题意可得527×n≥5,得到n≥27,因为n∈N∗,所以n的最小值为27,故至少要进行27轮测试.
9.为了监控某台机器的生产过程,检验员每天从该机器生产的零件中随机抽取若干零件,并测量其尺寸(单位:cm).根据长期生产经验,可以认为这台机器正常状态下生产的零件的尺寸服从正态分布Nμ,σ2.检验员某天从生产的零件中随机抽取16个零件,并测量其尺寸(单位:cm)如下:
9.9510.129.969.9610.019.929.9810.0410.269.9110.1310.029.2210.0410.059.95
将样本的均值x作为总体均值μ的估计值,样本标准差s作为总体标准差σ的估计值.
根据生产经验,在一天抽检的零件中,如果出现了尺寸在μ−3σ,μ+3σ之外的零件,就认为该机器可能出现故障,需要停工检修.
(1)试利用估计值判断该机器是否可能出现故障;
(2)若一台机器出现故障,则立即停工并申报维修,直到维修日都不工作.
根据长期生产经验,一台机器停工n天的总损失额y=3000+2000n−1+100n−12,n=1、2、3、4(单位:元).现有2种维修方案(一天完成维修)可供选择:
方案一:加急维修单,维修人员会在机器出现故障的当天上门维修,维修费用为3000元;
方案二:常规维修单,维修人员会在机器出现故障当天或者之后3天中的任意一天上门维修,维修费用为500元.
现统计该工厂最近100份常规维修单,获得机器在第nn=1,2,3,4天得到维修的数据如下:
n
1
2
3
4
频数
10
30
50
10
将频率视为概率,若机器出现故障,以机器维修所需费用与机器停工总损失额的和的期望值为决策依据,应选择哪种维修方案?
参考数据:i=116xi=159.52,116i=116xi−x2≈0.212.参考公式:x=1ni=1nxi,s=1ni=1nxi−x2.
【答案】(1)该机器出现了故障
(2)方案一
【解析】
(1)解:由已知可得x=116i=116xi=159.5216=9.97,s=116i=116xi−x2≈0.212,
所以,μ=x=9.97,σ=s≈0.212,所以,μ−3σ≈9.334,μ+3σ≈10.606,
∴9.22∉μ−3σ,μ+3σ,故该机器出现了故障.
(2)解:当n=1时,一台机器的总损失额为y=3000元;
当n=2时,一台机器的总损失额为y=5100元;
当n=3时,一台机器的总损失额为y=7400元;
当n=4时,一台机器的总损失额为y=9900元.
设选择方案一、方案二的维修所需费用与机器停工总损失额分别为X、Y元,
选择方案一,则EX=3000+3000=6000元,
选择方案二,则Y的可能取值有:3500、5600、7900、10400,
所以,PY=3500=110,PY=5600=310,PY=7900=12,PY=10400=110,
所以,随机变量Y的分布列如下表所示:
Y
3500
5600
7900
10400
P
110
310
12
110
所以,EY=3500×110+5600×310+7900×12+10400×110=7020元,
所以,EX
(1)求5名志愿者中的“小明”,在这3批次安装活动中有且只有一次被抽选到的概率;
(2)求第二次抽选时,选到没有安装经验志愿者的人数最有可能是几人?请说明理由;
(3)现在需要2名志愿者完成某项特殊教学任务,每次只能派一个人,且每个人只派一次,如果前一位志愿者一定时间内不能完成教学任务,则再派另一位志愿者.若有A、B两个志愿者可派,他们各自完成任务的概率分别为P1,P2,假设1>P1>P2,且假定各人能否完成任务的事件相互独立.若按某种指定顺序派人,这两个人各自能完成任务的概率依次为q1,q2,其中q1,q2是P1、P2的一个排列,试分析以怎样的顺序派出志愿者,可使所需派出志愿者的人员数目的数学期望达到最小.
【答案】(1)54125
(2)最有可能是1人;理由见解析
(3)按照先A后B的顺序所需人数期望最小
【解析】
(1)5名志愿者的“小明”在每轮抽取中,被抽取到概率为25,
则三次抽取中,“小明”恰有一次被抽取到的概率P=C31×251352=54125;
(2)第二次抽取到的没有安装经验志愿者人数最有可能是1人.
设ω表示第一次抽取到的没有安装经验志愿者人数,ω可能的取值有0,1,2,
则P(ω=0)=C22C52=110;P(ω=1)=C21C31C52=610;P(ω=2)=C32C52=310.
设ξ表示第二次抽取到的没有安装经验志愿者的人数,ξ可能的取值有0,1,2,则
p(ξ=0)=C22C52⋅C22C52+C21C31C52⋅C32C52+C32C52⋅C42C52=37100
P(ξ=1)=C22C52⋅C21C31C52+C21C31C52⋅C21C31C52+C32C52⋅C41C11C52=54100
P(ξ=2)=C22C52⋅C32C52+C21C31C52⋅C22C52+C32C52⋅0=9100
因为P(ξ=1)>P(ξ=0)>P(ξ=2),
故第二次抽取到的没有安装经验志愿者人数最有可能是1人.
(3)按照先A后B的顺序所需人数期望最小:
①设X表示先A后B完成任务所需人员数目,则
X
1
2
P
P1
1−P1
E(X)=P1+21−P1=2−P1,
①设Y表示B先后A完成任务所需人员数目,则
X
1
2
P
P2
1−P2
E(Y)=P2+21−P2=2−P2,E(Y)−E(X)=P1−P2>0,
故按照先A后B的顺序所需人数期望最小.
11.哈三中从甲、乙两个班级中选拔一个班级代表学校参加知识竞赛,在校内组织预测试,为测试两班平均水准,要求每班参加预测试的代表学生应按班级人数的15随机选出.现甲班在籍学生50人,乙班在籍学生40人
(1)若乙班将学生进行编号,编号分别为1,2,3,…,40,采用系统抽样的方法等距抽取,若第二段被抽取的学生编号为7,求第四段抽取的学生的编号(直接写出结果,无需过程);
(2)现从甲乙两班代表学生中利用分层抽样共选取9人,再从这9人中随机抽取3人参加加试,记其中甲班学生人数为随机变量X,求X的分布列与期望.
【答案】(1)17
(2)分布列答案见解析,数学期望:53
【解析】
(1)乙班在籍学生40人,每班参加预测试的代表学生应按班级人数的15,则乙班应选取8人.
则将40人分成8组,每组5人,若第二段被抽取的学生编号为7,
则第四段抽取的学生的编号为:7+2×5=17
(2)由题意得,X的可能取值为0,1,2,3
P(X=0)=C50C43C93=121,P(X=1)=C51C42C93=514
P(X=2)=C52C41C93=1021,P(X=3)=C53C40C93=542
X
0
1
2
3
P
121
514
1021
542
E(X)=1×514+2×1021+3×542=53
12.当下,大量的青少年沉迷于各种网络游戏,极大地毒害了青少年的身心健康.为了引导青少年抵制不良游戏,适度参与益脑游戏,某游戏公司开发了一款益脑游戏,在内测时收集了玩家对每一关的平均过关时间,如下表:
关卡x
1
2
3
4
5
6
平均过关时间y(单位:秒)
50
78
124
121
137
352
计算得到一些统计量的值为:i=16ui=28.5,i=16xiui=106.05,其中,ui=lnyi.
(1)若用模型y=aebx拟合y与x的关系,根据提供的数据,求出y与x的经验回归方程;
(2)制定游戏规则如下:玩家在每关的平均过关时间内通过可获得积分2分并进入下一关,否则获得−1分且该轮游戏结束.甲通过练习,前3关都能在平均时间内过关,后面3关能在平均时间内通过的概率均为45,若甲玩一轮此款益脑游戏,求“甲获得的积分X”的分布列和数学期望.
参考公式:对于一组数据xi,yi(i=1,2,3,⋅⋅⋅,n),其经验回归直线y=bx+a的斜率和截距的最小二乘估计分别为b=i=1nxiyi−nxyi=1nxi2−nx−2,a=y−bx.
【答案】(1)y=e0.36x+3.49
(2)分布列答案见解析,数学期望:1177125
【解析】
(1)解:因为y=aebx两边取对数可得lny=lnaebx=lna+lnebx,即lny=lna+bx,
令ui=lnyi,所以u=bx+lna,由u=16i=16ui=4.75,
x=161+2+3+4+5+6=3.5,i=1nxi2=12+22+32+42+52+62=91.
所以b=i=1nxiui−nxui=1nxi2−nx2=106.05−6×3.5×4.7591−6×3.52=0.36,
又u=bx+lna,即4.75=0.36×3.5+lna,
所以lna=3.49,所以a=e3.49.
所以y关于x的经验回归方程为y=e0.36x+3.49.
(2)解:由题知,甲获得的积分X的所有可能取值为5,7,9,12,
所以PX=5=15,PX=7=45×15=425,
PX=9=452×15=16125,PX=12=453=64125,
所以X的分布列为
X
5
6
9
12
P
15
425
16125
64125
所以EX=5×15+6×425+9×16125+12×64125=1177125
13.《山东省高考改革试点方案》规定:2022年高考总成绩由语文、数学、外语三门统考科目和思想政治、历史、地理、物理、化学、生物六门选考科目组成,将每门选考科目的考生原始成绩从高到低划分为A、B+、B、C+、C、D+、D、E共8个等级,参照正态分布原则,确定各等级人数所占比例分别为3%、7%、16%、24%、24%、16%、7%、3%,选择科目成绩计入考生总成绩时,将A至E等级内的考生原始成绩X,依照Y=X−μσ(μ、σ分别为正态分布的均值和标准差)分别转换到91,100、81,90、71,80、61,70、51,60、41,50、31,40、21,30八个分数区间,得到考生的等级成绩.如果山东省2022年某次学业水平模拟考试物理科目的原始成绩X∼N77.8,256,Y∼N0,1.
(1)若规定等级A、B+、B、C+、C、D+为合格,D、E为不合格,需要补考,估计这次学业水平模拟考试物理合格线的最低原始分是多少;
(2)现随机抽取了该省1000名参加此次物理学科学业水平测试的原始分,若这些学生的原始分相互独立,记ξ为被抽到的原始分不低于65分的学生人数,求ξ的数学期望和方差.
附:当Y∼N0,1时,PY≤1.3≈0.9,PY≤0.8≈0.788.
【答案】(1)57;
(2)Eξ=788,Dξ=167.056.
【解析】
(1)解:由题意可知,学业水平模拟考试物理科目合格的比例为90%,
由PY≤1.3≈0.9且Y~N0,1,可得PY≥−1.3≈0.9,
由Y=X−77.816≥−1.3,可得X≥57,
估计这次学业水平模拟考试物理合格线的最低原始分为57分.
(2)解:若X≥65,则Y=X−77.816≥−0.8,PY≥−0.8=PY≤0.8≈0.788,
由题意可知ξ~B1000,0.788,
∴Eξ=1000×0.788=788,Dξ=1000×0.788×0.212=167.056.
14.某次知识竞赛共有两道不定项选择题,每小题有4个选项,并有多个选项符合题目要求.评分标准如下:全部选对得10分,部分选对得4分,有选错得0分.由于准备不充分,小明在竞赛中只能随机选择,且每种选法是等可能的(包括一个也不选).
(1)已知两题都设置了3个正确选项,求小明这两题合计得分为14分的概率;
(2)已知其中一题设置了2个正确选项,另一题设置了3个正确选项.小明准备从以下两个方案中选择一种进行答题.为使得得分的期望最大,小明应选择哪一种方案?并说明理由.
方案一:每道题都随机选1个选项;
方案二:每道题都随机选2个选项.
【答案】(1)364
(2)应选择方案一作答;理由见解析
【解析】
(1)合计得14分的情形为一题全部选对,一题部分选对,P=C21⋅124⋅C31+C3224=364
(2)若选方案一,小明得分X的所有可能取值为0,4,8,
小明对有2个正确选项那题部分选对的概率P1=12,选错的概率P1'=12
小明对有3个正确选项那题部分选对的概率P1=34,选错的概率P2'=14
∴P(X=0)=12×14=18,P(X=4)=12×14+12×34=12,P(X=8)=12×34=38
得分X的数学期望为:E(X)=0×18+4×12+8×38=5
若选方案二,小明得分X'的所有可能取值为0,4,10,14,
小明对有2个正确选项那题选错的概率为:56,全部选对的概率为16
小明对有3个正确选项那题选错的概率为:12,部分选对的概率为12
∴P(X'=0)=56×12=512,P(X'=4)=56×12=512
P(X'=10)=16×12=112,P(X'=14)=16×12=112
∴得分X'的期望为E(X')=0×512+4×512+10×112+14×112=113,
∵E(X')
15.大米根据颗粒、质地、色泽、香味等评分指标打分,得分在区间0,25、25,50、50,75、75,100内分别评定为四级大米、三级大米、二级大米、一级大米.某经销商从农民手中收购一批大米,共400袋(每袋25kg),并随机抽取20袋分别进行检测评级,得分数据的频率分布直方图如图所示:
(1)求a的值,并用样本估计,该经销商采购的这批大米中,一级大米和二级大米的总量能否达到采购总量一半以上;
(2)该经销商计划在下面两个方案中选择一个作为销售方案:
方案1:将采购的400袋大米不经检测,统一按每袋300元直接售出;
方案2:将采购的400袋大米逐袋检测分级,并将每袋大米重新包装成5包(每包5kg),检测分级所需费用和人工费共8000元,各等级大米每包的售价和包装材料成本如下表所示:
大米等级
四级
三级
二级
一级
售价(元/包)
55
68
85
98
包装材料成本(元/包)
2
2
4
5
该经销商采用哪种销售方案所得利润更大?通过计算说明理由.
【答案】(1)a=0.010,一级大米和二级大米的总量能够达到采购总量的一半以上
(2)经销商采用方案2所得利润更大,理由见解析
【解析】
(1)解:∵0.004+0.012+0.014+a×25=1,∴a=0.010.
∵0.014+0.010×25=0.6>0.5,
所以,估计经销商采购的这批大米中,一级大米和二级大米的总量能够达到采购总量的一半以上.
(2)解:若经销商采用方案1,则收入为400×300=120000元.
若经销商采用方案2,
400袋大米中四级大米约400×0.004×25=40袋,40×5=200包,
三级大米约400×0.012×25=120袋,120×5=600包,
二级大米约400×0.014×25=140袋,140×5=700包,
一级大米约400×0.010×25=100袋,100×5=500包,
400袋大米共卖200×55+600×68+700×85+500×98=160300元.
400袋大米的包装袋成本为200×2+600×2+700×4+500×5=6900元,
则收入为160300−6900−8000=145400元,
∵145400>120000,且400袋大米成本相同,
所以,该经销商采用方案2所得利润更大.
16.某汽车公司最近研发了一款新能源汽车,并在出厂前对100辆汽车进行了单次最大续航里程的测试.现对测试数据进行分析,得到如图所示的频率分布直方图:
(1)估计这100辆汽车的单次最大续航里程的平均值(同一组中的数据用该组区间的中点值代表);
(2)经计算第(1)问中样本标准差S的近似值为50,根据大量的测试数据,可以认为这款汽车的单次最大续航里程X近似地服从正态分布Nμ,σ2(用样本平均数x和标准差s分别作为μ、σ的近似值),现任取一辆汽车,求它的单次最大续航里程X∈250,400的概率;
(参考数据:若随机变量X∼Nμ,σ2,则Pμ−σ⩽X⩽μ+σ≈0.6827,Pμ−2σ⩽X⩽μ+2σ≈0.9545,Pμ−3σ⩽X⩽μ+3σ≈0.9973)
(3)某汽车销售公司为推广此款新能源汽车,现面向意向客户推出“玩游戏,送大奖”活动,客户可根据抛掷硬币的结果,操控微型遥控车在方格图上(方格图上依次标有数字0、1、2、3、……、20)移动,若遥控车最终停在“胜利大本营”(第19格),则可获得购车优惠券3万元;若遥控车最终停在“微笑大本营”(第20格),则没有任何优优惠券.已知硬币出现正、反面的概率都是12,遥控车开始在第0格,客户每掷一次硬币,遥控车向前移动一次:若掷出正面,遥控车向前移动一格(从k到k+1);若掷出反面,遥控车向前移动两格(从k到k+2),直到遥控车移到“胜利大本营”或“微笑大本营”时,游戏结束.设遥控车移到第n1⩽n⩽19格的概率为Pn,试证明Pn−Pn−1是等比数列,并求参与游戏一次的顾客获得优惠券全额的期望值(精确到0.1万元).
【答案】(1)300;
(2)0.8186;
(3)证明见解析,参与游戏一次的顾客获得优惠券金额的期望值为2.0万元.
【解析】
(1)估计这100辆汽车的单次最大续航里程的平均值为:
x=205×0.01+255×0.02+305×0.45+355×0.02+405×0.05=300;
(2)∵X∼N(300,502),
∴P(250⩽X⩽400)=P(μ−σ⩽X⩽μ+2σ)≈0.68272+0.95452=0.8186.
(3)由题可知P0=1,P1=12
遥控车移到第n(2≤n≤19)格有两种可能:
①遥控车先到第n−2格,又掷出反面,其概率为12Pn−2;
②遥控车先到第n−1格,又掷出正面,其概率为12Pn−1,
∴Pn=12Pn−2+12Pn−1,
∴2≤n≤19时,Pn−Pn−1=−12(Pn−1−Pn−2),又∵P1−P0=−12≠0,
∴当1≤n≤19时,数列{Pn−Pn−1}首项为−12,公比为−12的等比数列,
∴P1−P0=−12,P2−P1=(−12)2,P3−P2=(−12)3,⋯,Pn−Pn−1=(−12)n,
以上各式相加,得Pn−1=(−12)+(−12)2+(−12)3+⋯+(−12)n=(−13)⋅[1−(−12)n],
∴1≤n≤19时,Pn=23+13(−12)n,
∴到达“胜利大本营”的概率P19=23−13⋅1219,
∴设参与游戏一次的顾客获得优惠券金额为Y万元,则Y=3或0,
∴Y的期望E(Y)=3⋅P19+0⋅(1−P19)=3⋅(23−13⋅1219)=2−1219,
∴参与游戏一次的顾客获得优惠券金额的期望值为2.0万元
17.治疗慢性乙肝在医学上一直都是一个难题,因为基本不能治愈,只是可以让肝功能正常,不可以清除病毒,而且发展严重后还具有传染性,所以在各种体检中肝功能的检查是必不可少的.在对某学校初中一个班上64名学生进行体检后,不小心将2份携带乙肝的血液样本和62份正常样本(都用试管独立装好的)混在了一起,现在要将它们找出来,试管上都有标签,采用将共64份样品采用混检的方式,先将其平均分成两组,每组32份,将每组的32份进行混检,若携带病毒的在同一组,则将这一组继续取两份平均分组的混合样本进行检验,若携带病毒的样本不在同一组,则将两组都继续平均分组混检下去,直到最后将两份携带病毒的样本找出为止(样品检验时可以很快出结果,每次含病毒的那一组进行平均分组时,每个含病毒的样本被分到任意一组的概率都是12,且互不影响),设共需检验的次数为X.
(1)求随机变量X的分布列和期望;
(2)若5岁以上的乙肝患者急性和慢性的比例约为9:1 ,急性乙肝炎症治愈率可达910 ,没有治愈的会转为慢性乙肝,慢性乙肝炎症治愈率只有3100 ,在找出两个乙肝样本后通知其进行治疗,求两人最后至少有一人痊愈的概率Po .(结果保留两位有效数字)
【答案】(1)分布列见解析,期望为20;
(2)0.97
【解析】
(1)病毒被分在同一组的概率为12×12×2=12,不被分在同一组的概率为12×12×2=12;
若病毒被分在同一组,则下次需要进行2次检验,若病毒不被分在同一组,则下次需要进行4次检验;
若每次病毒均在同一组,则需要进行5次分组,最后一次每组有2份样品,即进行10次检验,P(X=10)=125=132;
若前4次病毒均在同一组,第5次病毒不在同一组,此时每组有2份样品,还需要再进行1次分组,再进行4次检验,即进行14次检验,P(X=14)=124×12=132;
若前3次病毒均在同一组,第4次病毒不在同一组,此时每组有4份样品,还需要再进行2次分组,再进行8次检验,即进行16次检验,P(X=16)=123×12=116;
若前2次病毒均在同一组,第3次病毒不在同一组,此时每组有8份样品,还需要再进行3次分组,再进行12次检验,即进行18次检验,P(X=18)=122×12=18;
若第1次病毒在同一组,第2次病毒不在同一组,此时每组有16份样品,还需要再进行4次分组,再进行16次检验,即进行20次检验,P(X=20)=12×12=14;
若第1次病毒不在同一组,此时每组有32份样品,还需要再进行5次分组,再进行20次检验,即进行22次检验,P(X=22)=12;故随机变量X的分布列为:
X
10
14
16
18
20
22
P
132
132
116
18
14
12
则EX=10×132+14×132+16×116+18×18+20×14+22×12=20;
(2)由题意知是急性乙肝的概率为910,慢性乙肝的概率为110,则乙肝患者治愈的概率为910×910+910×110+110×3100=815710000,
没有治愈的概率为1−815710000=184310000,则两人最后至少有一人痊愈的概率Po=1−1843100002≈0.97.
18.2022年2月6日,中国女足在两球落后的情况下,以3比2逆转击败韩国女足,成功夺得亚洲杯冠军,在之前的半决赛中,中国女足通过点球大战6:5惊险战胜日本女足,其中门将朱钰两度扑出日本队员的点球,表现神勇.
(1)扑点球的难度一般比较大,假设罚点球的球员会等可能地随机选择球门的左、中、右三个方向射门,门将也会等可能地随机选择球门的左、中、右三个方向来扑点球,而且门将即使方向判断正确也有12的可能性扑不到球.不考虑其它因素,在一次点球大战中,求门将在前三次扑出点球的个数X的分布列和期望;
(2)好成绩的取得离不开平时的努力训练,甲、乙、丙、丁4名女足队员在某次传接球的训练中,球从甲脚下开始,等可能地随机传向另外3人中的1人,接球者接到球后再等可能地随机传向另外3人中的1人,如此不停地传下去,假设传出的球都能接住.记第n次传球之前球在甲脚下的概率为pn,易知p1=1,p2=0.
①试证明{pn−14}为等比数列;
②设第n次传球之前球在乙脚下的概率为qn,比较p10与q10的大小.
【答案】(1)分布列见解析,E(X)=12
(2)①证明见解析;②p10
(1)解析1:分布列与期望
依题意可得,门将每次可以扑出点球的概率为p=13×13×3×12=16,
门将在前三次扑出点球的个数X可能的取值为0,1,2,3,
P(X=0)=C30×(16)0×(56)3=125216,P(X=1)=C31×(16)1×(56)2=2572,
P(X=2)=C32×(16)2×(56)1=572,P(X=3)=C33×(16)3×(56)0=1216,X的分布列为:
X
0
1
2
3
P
125216
2572
572
1216
期望E(X)=0×125216+1×2572+2×572+3×1216=12.
(1)解析2:二项分布
依题意可得,门将每次可以扑出点球的概率为p=13×13×3×12=16,门将在前三次扑出点球的个数X可能的取值为0,1,2,3,易知X∼B(3,16),P(X=k)=C3k×(16)k×(56)3−k,k=0,1,2,3.X的分布列为:
X
0
1
2
3
P
125216
2572
572
1216
期望E(X)=3×16=12.
(2)解析:递推求解
①第n次传球之前球在甲脚下的概率为pn,则当n≥2时,第n−1次传球之前球在甲脚下的概率为pn−1,
第n−1次传球之前球不在甲脚下的概率为1−pn−1,则pn=pn−1⋅0+(1−pn−1)⋅13=−13pn−1+13,
从而pn−14=−13(pn−1−14),又p1−14=34,∴{pn−14}是以34为首项.公比为−13的等比数列.
②由①可知pn=34(−13)n−1+14,p10=34(−13)9+14<14,q10=13(1−p10)>14,故p10
(1)若在犯错误的概率不超过0.001的前提下认为“所患疾病类型”与“性别”有关,求男性患者至少有多少人?
(2)某药品研发公司欲安排甲乙两个研发团队来研发此疾病的治疗药物.两个团队各至多安排2个接种周期进行试验.甲团队研发的药物每次接种后产生抗体的概率为p0
0元,每人每次接种每个周期至多接种3次,第一个周期连续2次出现抗体则终止本接种周期进入第二个接种周期,否则需依次接种至第一周期结束,再进入第二周期:第二接种周期连续2次出现抗体则终止试验,否则需依次接种至至试验结束;乙团队研发的药物每次接种后产生抗体的概率为q00元,每个周期接种3次,每个周期必须完成3次接种,若一个周期内至少出现2次抗体,则该周期结束后终止试验,否则进入第二个接种周期,假设两个研发团队每次接种后产生抗体与否均相互独立.当n=23m,p=q时,从两个团队试验的平均花费考虑,公司应选择哪个团队?
(3)乙团队为奖励参与研发的工作人员,特地给参与本次研发的工作人员每人发放价值1000元的购物卡,并推出一档“勇闯关,送大奖”的活动.规则是:在某张方格图上标有第0格、第1格、第2格、…第30格共31个方格.棋子开始在第0格,然后掷一枚均匀的硬币(已知硬币出现正、反面的概率都是12,其中P0=1).
若掷出正面,将棋子向前移动一格(从k到k+1),若掷出反面,则将棋子向前移动两格(从k到k+2).重复多次,若这枚棋子最终停在第29格,则认为“闯关成功”,并赠送1000元购物卡;若这枚棋子最终停在第30格,则认为“闯关失败”,不再获得其他奖励,活动结束.设棋子移到第n格的概率为Pn,若某员工参与这档“闯关游戏”,试比较一名员工闯关成功和失败的概率,并说明理由.
附:K2=nad−bc2a+bc+da+cb+d,
PK2≥k0
0.10
0.05
0.01
0.005
0.001
k0
2.706
3.841
6.635
7.879
10.828
【答案】(1)18人
(2)该公司选择乙团队进行药品研发
(3)该大学生闯关成功的概率大于闯关失败的概率,理由见解析
【解析】
(1)设男性患者有a人,则女性患者有2a人,列联表如下:
Ⅰ型病
Ⅱ型病
合计
男
5a6
a6
a
女
2a3
4a3
2a
合计
3a2
3a2
3a
要使在犯错误的概率不超过0.001的前提下认为“所患疾病类型”与“性别”有关,
则K2=3a5a6×4a3−a6×2a323a2×3a2×2a×a=2a3>10.828,解得a>16.242.
∵a6∈Z,a3∈Z,∴a的最小整数值为18,因此.男性患者至少有18人
(2)设甲研发团队试验总花费为X元,则X的可能取值为4m、5m、6m,
∵PX=4m=p2⋅p2=p4,
Px=5m=p2⋅1−p2+1−p2⋅p2=2p2−p4,
PX=6m=1−p22=p4−2p2+1,
∴EX=4mp4+10m(p2−p4)+6mp4−2p2+1=−2mp2+6m,
函数fp=−2mp2+6m在0,1递减,∴EX>4m,
设乙研发团队试验总花费为Y元,则Y的可能取值为3n、6n,
∴PY=3n=C32q21−q+q3=−2q3+3q2,PY=6n=1+2q3−3q2,
∴EY=3n⋅−2q3+3q2+6n⋅1+2q3−3q2=6nq3−9nq2+6n,
设gq=6nq3−9nq2+6n,(0
函数gq=6nq3−9nq2+6n在0,1递减,EY<6n=4m,
∴EX>EY恒成立,所以,该公司选择乙团队进行药品研发
(3)棋子开始在第0格为必然事件,P0=1.
第一次掷硬币出现正面,棋子移到第1格,其概率为12,P1=12.
棋子移到第n2≤n≤29格的情况是下列两种,而且也只有两种:
棋子先到第n−2格,又掷出反面,其概率为12Pn−2;
棋子先到第n−1格,又掷出正面,其概率为12Pn−1,
所以Pn=12Pn−2+12Pn−1,即Pn−Pn−1=−12Pn−1−Pn−2,且P1−P0=−12,
所以当1≤n≤29时,数列Pn−Pn−1是首项P1−P0=−12,公比为−12的等比数列.
则P1−1=−12,P2−P1=−122,P3−P2=−123,…,Pn−Pn−1=−12n,
以上各式相加,得Pn−1=−12+−122+⋯+−12n,
所以Pn=1+−12+−122+⋯+−12n=231−−12n+1n=0,1,2,⋯,29.
所以闯关成功(即这枚棋子最终停在第29格)的概率为
P29=231−−1230=231−1230,
闯关失败(即这枚棋子最终停在第30格)的概率为
P30=12P28=12×231−−1229=131+1229.
P29−P30=231−1230−131+1229=131−1228>0
所以该大学生闯关成功的概率大于闯关失败的概率.
20.“学习强国”学习平台的答题竞赛包括三项活动,分别为“四人赛”“双人对战”和“挑战答题”.在一天内参与“四人赛”活动,每局第一名积3分,第二、三名各积2分,第四名积1分,每局比赛相互独立. 在一天内参与“双人对战”活动,每局比赛有积分,获胜者得2分,失败者得1分,每局比赛相互独立. 已知甲参加“四人赛”活动,每局比赛获得第一名、第二名的概率均为13,获得第四名的概率为16;甲参加“双人对战”活动,每局比赛获胜的概率为34.
(1)记甲在一天中参加“四人赛”和“双人对战”两项活动(两项活动均只参加一局)的总得分为X ,求X的分布列与数学期望;
(2)“挑战答题”比赛规则如下:每位参赛者每次连续回答5道题,在答对的情况下可以持续答题,若第一次答错时,答题结束,积分为0分,只有全部答对5道题可以获得5个积分.某市某部门为了吸引更多职工参与答题,设置了一个“得积分进阶”活动,从1阶到n (n≥10)阶,规定每轮答题获得5个积分进2阶,没有获得积分进1阶,按照获得的阶级给予相应的奖品,记乙每次获得5个积分的概率互不影响,均为56,记乙进到n阶的概率为pn,求p12.
【答案】(1)分布列见解析,E(X)=4712
(2)P12=16+4111+(56)11
【解析】
(1)甲参加“四人赛”时,每局比赛获得第三名的概率为1−(13+13+16)=16,
依题意,X所有可能的取值为5,4,3,2
P(X=5)=13×34=14 ,
P(X=4)=13×14+13×34+16×34=1124
P(X=3)=16×34+13×14+16×14=14
P(X=2)=16×14=124
所以X 的分布列如表所示
X
5
4
3
2
P
14
1124
14
124
所以E(X)=5×14+4×1124+3×14+2×124=4712 ;
(2)依题意,P1=16 ,P2=56 ,
“进到n+1阶”的情况包括:第一种情况是进到n阶后下一轮未获得5个积分,其概率为16Pn;第二种情况是进到n−1阶后下一轮获得5个积分,其概率为56Pn-1,两种情况互斥,所以Pn+1=16Pn+56Pn−1(n≥2) ,
则Pn+1−Pn=16Pn+56Pn−1−Pn=−56(Pn−Pn−1)
所以Pn+1−PnPn−Pn−1=−56(n≥2,n∈N∗)
又P2−P1=23 ,
所以数列Pn+1−Pn是首项为23,公比为−56的等比数列,所以Pn+1−Pn=23×(−56)n−1,
故P12=P1+(P2−P1)+⋅⋅⋅+(P11−P10)+(P12−P11)
=16+23+23×(−56)+⋅⋅⋅+23×(−56)10
=16+23×1−(−56)111+56=16+4111−(−56)11
即P12=16+4111+(56)11 ;
综上,为E(X)=4712 ,P12=16+4111+(56)11.
相关试卷
这是一份专题16 概率统计解答题-大数据之十年高考真题(2013-2022)与优质模拟题汇编(新高考卷与全国理科)学生版及教师版,文件包含专题16概率统计解答题-大数据之十年高考真题2013-2022与优质模拟题汇编新高考卷与全国理科教师版pdf、专题16概率统计解答题-大数据之十年高考真题2013-2022与优质模拟题汇编新高考卷与全国理科学生版pdf等2份试卷配套教学资源,其中试卷共81页, 欢迎下载使用。
这是一份专题15 概率统计与计数原理选择填空题-大数据之十年高考真题(2013-2022)与优质模拟题汇编(新高考卷与全国理科)学生及教师版,文件包含专题15概率统计与计数原理选择填空题-大数据之十年高考真题2013-2022与优质模拟题汇编新高考卷与全国理科教师版pdf、专题15概率统计与计数原理选择填空题-大数据之十年高考真题2013-2022与优质模拟题汇编新高考卷与全国理科学生版pdf等2份试卷配套教学资源,其中试卷共53页, 欢迎下载使用。
这是一份专题16概率与统计解答题-大数据之十年高考真题(2013-2022)与优质模拟题汇编(全国文科),文件包含专题16概率与统计解答题解析版docx、专题16概率与统计解答题原卷版docx等2份试卷配套教学资源,其中试卷共79页, 欢迎下载使用。