高考数学一轮复习高考大题专项练六高考中的概率与统计含解析新人教A版理
展开高考大题专项练六 高考中的概率与统计
一、非选择题
1.(2020山东,19)为加强环境保护,治理空气污染,环境监测部门对某市空气质量进行调研,随机抽查了100天空气中的PM2.5和SO2浓度(单位:μg/m3),得下表:
PM2.5 | SO2 | ||
[0,50] | (50,150] | (150,475] | |
[0,35] | 32 | 18 | 4 |
(35,75] | 6 | 8 | 12 |
(75,115] | 3 | 7 | 10 |
(1)估计事件“该市一天空气中PM2.5浓度不超过75,且SO2浓度不超过150”的概率;
(2)根据所给数据,完成下面的2×2列联表:
PM2.5 | SO2 | |
[0,150] | (150,475] | |
[0,75] |
|
|
(75,115] |
|
|
(3)根据(2)中的列联表,判断能否在犯错误的概率不超过0.01的前提下认为该市一天空气中PM2.5浓度与SO2浓度有关?
附:K2=,
P(K2≥k) | 0.050 | 0.010 | 0.001 |
k | 3.841 | 6.635 | 10.828 |
解:(1)根据抽查数据,该市100天空气中PM2.5浓度不超过75,且SO2浓度不超过150的天数为32+18+6+8=64,因此,该市一天空气中PM2.5浓度不超过75,且SO2浓度不超过150的概率的估计值为=0.64.
(2)根据抽查数据,可得2×2列联表:
PM2.5 | SO2 | |
[0,150] | (150,475] | |
[0,75] | 64 | 16 |
(75,115] | 10 | 10 |
(3)根据(2)的列联表得K2的观测值k=≈7.484.
由于7.484>6.635,故在犯错误的概率不超过0.01的前提下认为该市一天空气中PM2.5浓度与SO2浓度有关.
2.(2020全国Ⅱ,理18)某沙漠地区经过治理,生态系统得到很大改善,野生动物数量有所增加,为调查该地区某种野生动物的数量,将其分成面积相近的200个地块,从这些地块中用简单随机抽样的方法抽取20个作为样区,调查得到样本数据(xi,yi)(i=1,2,…,20),其中xi和yi分别表示第i个样区的植物覆盖面积(单位:公顷)和这种野生动物的数量,并计算得xi=60,yi=1 200,(xi-)2=80,(yi-)2=9 000,(xi-)(yi-)=800.
(1)求该地区这种野生动物数量的估计值(这种野生动物数量的估计值等于样区这种野生动物数量的平均数乘以地块数);
(2)求样本(xi,yi)(i=1,2,…,20)的相关系数(精确到0.01);
(3)根据现有统计资料,各地块间植物覆盖面积差异很大.为提高样本的代表性以获得该地区这种野生动物数量更准确的估计,请给出一种你认为更合理的抽样方法.并说明理由.
附:相关系数r=≈1.414.
解:(1)由已知得样本平均数yi=60,
从而该地区这种野生动物数量的估计值为60×200=12000.
(2)样本(xi,yi)(i=1,2,…,20)的相关系数
r=≈0.94.
(3)分层抽样:根据植物覆盖面积的大小对地块分层,再对200个地块进行分层抽样.
理由如下:由(2)知各样区的这种野生动物数量与植物覆盖面积有很强的正相关.由于各地块间植物覆盖面积差异很大,从而各地块间这种野生动物数量差异也很大,采用分层抽样的方法较好地保持了样本结构与总体结构的一致性,提高了样本的代表性,从而可以获得该地区这种野生动物数量更准确的估计.
3.已知某单位甲、乙、丙三个部门的员工人数分别为24,16,16.现采用分层抽样的方法从中抽取7人,进行睡眠时间的调查.
(1)应从甲、乙、丙三个部门的员工中分别抽取多少人?
(2)若抽出的7人中有4人睡眠不足,3人睡眠充足,现从这7人中随机抽取3人做进一步的身体检查.
①用X表示抽取的3人中睡眠不足的员工人数,求随机变量X的分布列与数学期望;
②设A为事件“抽取的3人中,既有睡眠充足的员工,也有睡眠不足的员工”,求事件A发生的概率.
解:(1)由已知,甲、乙、丙三个部门的员工人数之比为3∶2∶2,由于采用分层抽样的方法从中抽取7人,因此应从甲、乙、丙三个部门的员工中分别抽取3人、2人、2人.
(2)①随机变量X的所有可能取值为0,1,2,3.
P(X=k)=(k=0,1,2,3).
所以,随机变量X的分布列为
X | 0 | 1 | 2 | 3 |
P |
随机变量X的数学期望E(X)=0×+1×+2×+3×.
②设事件B为“抽取的3人中,睡眠充足的员工有1人,睡眠不足的员工有2人”;事件C为“抽取的3人中,睡眠充足的员工有2人,睡眠不足的员工有1人”,则A=B∪C,且B与C互斥.由①知,P(B)=P(X=2),P(C)=P(X=1),故P(A)=P(B∪C)=P(X=2)+P(X=1)=.
所以,事件A发生的概率为.
4.为治疗某种疾病,研制了甲、乙两种新药,希望知道哪种新药更有效,为此进行动物试验.试验方案如下:每一轮选取两只白鼠对药效进行对比试验.对于两只白鼠,随机选一只施以甲药,另一只施以乙药.一轮的治疗结果得出后,再安排下一轮试验.当其中一种药治愈的白鼠比另一种药治愈的白鼠多4只时,就停止试验,并认为治愈只数多的药更有效.为了方便描述问题,约定:对于每轮试验,若施以甲药的白鼠治愈且施以乙药的白鼠未治愈则甲药得1分,乙药得-1分;若施以乙药的白鼠治愈且施以甲药的白鼠未治愈则乙药得1分,甲药得-1分;若都治愈或都未治愈则两种药均得0分.甲、乙两种药的治愈率分别记为α和β,一轮试验中甲药的得分记为X.
(1)求X的分布列;
(2)若甲药、乙药在试验开始时都赋予4分,pi(i=0,1,…,8)表示“甲药的累计得分为i时,最终认为甲药比乙药更有效”的概率,则p0=0,p8=1,pi=api-1+bpi+cpi+1(i=1,2,…,7),其中a=P(X=-1),b=P(X=0),c=P(X=1).假设α=0.5,β=0.8.
(ⅰ)证明:{pi+1-pi}(i=0,1,2,…,7)为等比数列;
(ⅱ)求p4,并根据p4的值解释这种试验方案的合理性.
解:(1)X的所有可能取值为-1,0,1.
P(X=-1)=(1-α)β,
P(X=0)=αβ+(1-α)(1-β),
P(X=1)=α(1-β).
所以X的分布列为
X | -1 | 0 | 1 |
P | (1-α)β | αβ+(1-α)(1-β) | α(1-β) |
(2)(ⅰ)由(1)得a=0.4,b=0.5,c=0.1.
因此pi=0.4pi-1+0.5pi+0.1pi+1,
故0.1(pi+1-pi)=0.4(pi-pi-1),
即pi+1-pi=4(pi-pi-1).
又因为p1-p0=p1≠0,
所以{pi+1-pi}(i=0,1,2,…,7)为公比为4,首项为p1的等比数列.
(ⅱ)由(ⅰ)可得p8=p8-p7+p7-p6+…+p1-p0+p0
=(p8-p7)+(p7-p6)+…+(p1-p0)
=p1.
由于p8=1,故p1=,
所以p4=(p4-p3)+(p3-p2)+(p2-p1)+(p1-p0)=p1=.
p4表示最终认为甲药更有效的概率.由计算结果可以看出,在甲药治愈率为0.5,乙药治愈率为0.8时,认为甲药更有效的概率为p4=≈0.0039,此时得出错误结论的概率非常小,说明这种试验方案合理.
5.某公司为确定下一年度投入某种产品的宣传费,需了解年宣传费x(单位:千元)对年销售量y(单位:t)和年利润z(单位:千元)的影响.对近8年的年宣传费xi和年销售量yi(i=1,2,…,8)数据作了初步处理,得到下面的散点图及一些统计量的值.
(xi-)2 | (wi-)2 | (xi-)(yi-) | (wi-)(yi-) | |||
46.6 | 563 | 6.8 | 289.8 | 1.6 | 1 469 | 108.8 |
表中wi=wi.
(1)根据散点图判断,y=a+bx与y=c+d哪一个适宜作为年销售量y关于年宣传费x的回归方程类型?(给出判断即可,不必说明理由)
(2)根据(1)的判断结果及表中数据,建立y关于x的回归方程;
(3)已知这种产品的年利润z与x,y的关系为z=0.2y-x.根据(2)的结果回答下列问题:
①当年宣传费x=49时,年销售量及年利润的预报值是多少?
②当年宣传费x为何值时,年利润的预报值最大?
附:对于一组数据(u1,v1),(u2,v2),…,(un,vn),其回归直线v=α+βu的斜率和截距的最小二乘估计分别为.
解:(1)由散点图可以判断,y=c+d适宜作为年销售量y关于年宣传费x的回归方程类型.
(2)令w=,先建立y关于w的线性回归方程.
因为==68,
=563-68×6.8=100.6,
所以y关于w的线性回归方程为=100.6+68w,
因此y关于x的回归方程为=100.6+68.
(3)①由(2)知,当x=49时,年销售量y的预报值=100.6+68=576.6,
年利润z的预报值=576.6×0.2-49=66.32.
②根据(2)的结果知,年利润z的预报值
=0.2(100.6+68)-x=-x+13.6+20.12.
所以当=6.8,即x=46.24时,取得最大值.
故当年宣传费为46.24千元时,年利润的预报值最大.
6.为了监控某种零件的一条生产线的生产过程,检验员每天从该生产线上随机抽取16个零件,并测量其尺寸(单位:cm).根据长期生产经验,可以认为这条生产线正常状态下生产的零件的尺寸服从正态分布N(μ,σ2).
(1)假设生产状态正常,记X表示一天内抽取的16个零件中其尺寸在(μ-3σ,μ+3σ)之外的零件数,求P(X≥1)及X的数学期望;
(2)一天内抽检零件中,如果出现了尺寸在(μ-3σ,μ+3σ)之外的零件,就认为这条生产线在这一天的生产过程可能出现了异常情况,需对当天的生产过程进行检查.
(ⅰ)试说明上述监控生产过程方法的合理性;
(ⅱ)下面是检验员在一天内抽取的16个零件的尺寸:
9.95 | 10.12 | 9.96 | 9.96 | 10.01 | 9.92 | 9.98 | 10.04 |
10.26 | 9.91 | 10.13 | 10.02 | 9.22 | 10.04 | 10.05 | 9.95 |
经计算得xi=9.97,s=≈0.212,其中xi为抽取的第i个零件的尺寸,i=1,2,…,16.
用样本平均数作为μ的估计值,用样本标准差s作为σ的估计值,利用估计值判断是否需对当天的生产过程进行检查?剔除(-3+3)之外的数据,用剩下的数据估计μ和σ(精确到0.01).
附:若随机变量Z服从正态分布N(μ,σ2),
则P(μ-3σ<Z<μ+3σ)≈0.997 3.
0.997 316≈0.957 7,≈0.09.
解:(1)抽取的一个零件的尺寸在(μ-3σ,μ+3σ)之内的概率为0.9973,从而零件的尺寸在(μ-3σ,μ+3σ)之外的概率为0.0027,
故X~B(16,0.0027).
因此P(X≥1)=1-P(X=0)=1-0.997316≈0.0423.
X的数学期望为E(X)=16×0.0027=0.0432.
(2)(ⅰ)如果生产状态正常,一个零件尺寸在(μ-3σ,μ+3σ)之外的概率只有0.0027,一天内抽取的16个零件中,出现尺寸在(μ-3σ,μ+3σ)之外的零件的概率只有0.0423,发生的概率很小.因此一旦发生这种情况,就有理由认为这条生产线在这一天的生产过程可能出现了异常情况,需对当天的生产过程进行检查,可见上述监控生产过程的方法是合理的.
(ⅱ)由=9.97,s≈0.212,得μ的估计值为=9.97,σ的估计值为=0.212,由样本数据可以看出有一个零件的尺寸在(-3+3)之外,因此需对当天的生产过程进行检查.
剔除(-3+3)之外的数据9.22,剩下数据的平均数为(16×9.97-9.22)=10.02,因此μ的估计值为10.02.
=16×0.2122+16×9.972≈1 591.134,剔除(-3+3)之外的数据9.22,剩下数据的样本方差为(1 591.134-9.222-15×10.022)≈0.008,
因此σ的估计值为≈0.09.
高考数学一轮复习高考大题专项练五高考中的解析几何含解析新人教A版理: 这是一份高考数学一轮复习高考大题专项练五高考中的解析几何含解析新人教A版理,共11页。试卷主要包含了非选择题等内容,欢迎下载使用。
高考数学一轮复习高考大题专项练四高考中的立体几何含解析新人教A版理: 这是一份高考数学一轮复习高考大题专项练四高考中的立体几何含解析新人教A版理,共16页。试卷主要包含了非选择题等内容,欢迎下载使用。
高考数学一轮复习高考大题专项练三高考中的数列含解析新人教A版理: 这是一份高考数学一轮复习高考大题专项练三高考中的数列含解析新人教A版理,共8页。试卷主要包含了非选择题等内容,欢迎下载使用。