还剩16页未读,
继续阅读
2019版高考数学(理)创新大一轮人教A全国通用版讲义:专题探究课六
展开
高考导航 1.概率与统计是高考中相对独立的一块内容,处理问题的方式、方法体现了较高的思维含量.该类问题以应用题为载体,注重考查学生的应用意识及阅读理解能力、化归转化能力;2.概率问题的核心是概率计算.其中事件的互斥、对立、独立是概率计算的核心,排列组合是进行概率计算的工具.统计问题的核心是样本数据的获得及分析方法,重点是频率分布直方图、茎叶图和样本的数字特征;3.离散型随机变量的分布列及其期望的考查是历来高考的重点,难度多为中低档类题目,特别是与统计内容的渗透,背景新颖,充分体现了概率与统计的工具性和交汇性.
热点一 常见概率模型的概率
几何概型、古典概型、相互独立事件与互斥事件的概率、条件概率是高考的热点,几何概型主要以客观题形式考查,求解的关键在于找准测度(面积、体积或长度);相互独立事件、互斥事件常作为解答题的一问考查,也是进一步求分布列、期望与方差的基础,求解该类问题要正确理解题意,准确判定概率模型,恰当选择概率公式.
【例1】 (2017·全国Ⅰ卷)为了监控某种零件的一条生产线的生产过程,检验员每天从该生产线上随机抽取16个零件,并测量其尺寸(单位:cm).根据长期生产经验,可以认为这条生产线正常状态下生产的零件的尺寸服从正态分布N(μ,σ2).
(1)假设生产状态正常,记X表示一天内抽取的16个零件中其尺寸在(μ-3σ,μ+3σ)之外的零件数,求P(X≥1)及X的数学期望;
(2)一天内抽检零件中,如果出现了尺寸在(μ-3σ,μ+3σ)之外的零件,就认为这条生产线在这一天的生产过程可能出现了异常情况,需对当天的生产过程进行检查.
(ⅰ)试说明上述监控生产过程方法的合理性;
(ⅱ)下面是检验员在一天内抽取的16个零件的尺寸:
9.95 10.12 9.96 9.96 10.01 9.92 9.98 10.04
10.26 9.91 10.13 10.02 9.22 10.04 10.05 9.95
经计算得=i=9.97,s==≈0.212,其中xi为抽取的第i个零件的尺寸,i=1,2,…,16.
用样本平均数作为μ的估计值,用样本标准差s作为σ的估计值,利用估计值判断是否需对当天的生产过程进行检查?剔除(-3,+3)之外的数据,用剩下的数据估计μ和σ(精确到0.01).
附:若随机变量Z服从正态分布N(μ,σ2),则P(μ-3σ
解 (1)由题可知抽取的一个零件的尺寸落在(μ-3σ,μ+3σ)之内的概率为0.997 4,从而零件的尺寸落在 (μ-3σ,μ+3σ)之外的概率为0.002 6,故X~B(16,0.002 6).
因此P(X≥1)=1-P(X=0)=1-0.997 416≈1-0.959 2=0.040 8.
X的数学期望E(X)=16×0.002 6=0.041 6.
(2)(ⅰ)如果生产状态正常,一个零件尺寸在(μ-3σ,μ+3σ)之外的概率只有0.002 6,一天内抽取的16个零件中,出现尺寸在(μ-3σ,μ+3σ)之外的零件的概率只有0.040 8,发生的概率很小,因此一旦发生这种情况,就有理由认为这条生产线在这一天的生产过程可能出现了异常情况,需对当天的生产过程进行检查,可见上述监控生产过程的方法是合理的.
(ⅱ)由x=9.97,s≈0.212,得μ的估计值为=9.97,σ的估计值为=0.212,由样本数据可以看出有一个零件的尺寸在(-3,+3)之外,因此需对当天的生产过程进行检查.
剔除(-3,+3)之外的数据9.22,剩下数据的平均数为×(16×9.97-9.22)=10.02,
因此μ的估计值为10.02.
=16×0.2122+16×9.972≈1 591.134,
剔除(-3,+3)之外的数据9.22,剩下数据的样本方差为×(1 591.134-9.222-15×10.022)≈0.008,
因此σ的估计值为≈0.09.
探究提高 1.解第(1)题的关键是认清随机变量X服从二项分布,并能够应用E(X)=np求解,易出现的失误是由于题干较长,不能正确理解题意.
2.解第(2)题的关键是理解正态分布的意义,能够利用3σ原则求解,易出现的失误有两个方面,一是不清楚正态分布N(μ,σ2)中μ和σ的意义及其计算公式,二是计算失误.
【训练1】 (2018·石家庄调研)甲、乙两班进行消防安全知识竞赛,每班出3人组成甲乙两支代表队,首轮比赛每人一道必答题,答对则为本队得1分,答错或不答都得0分,已知甲队3人每人答对的概率分别为,,,乙队每人答对的概率都是,设每人回答正确与否相互之间没有影响,用ξ表示甲队总得分.
(1)求ξ=2的概率;
(2)求在甲队和乙队得分之和为4的条件下,甲队比乙队得分高的概率.
解 (1)ξ=2,则甲队有两人答对,一人答错,
故P(ξ=2)=××+××+××=.
(2)设甲队和乙队得分之和为4为事件A,甲队比乙队得分高为事件B.设乙队得分为η,则η~B.
P(ξ=1)=××+××+××=,
P(ξ=3)=××=,
P(η=1)=C··=,
P(η=2)=C··=,
P(η=3)=C=,
∴P(A)=P(ξ=1)P(η=3)+P(ξ=2)P(η=2)+P(ξ=3)·P(η=1)
=×+×+×=,
P(AB)=P(ξ=3)·P(η=1)=×=,
∴所求概率为P(B|A)===.
热点二 概率统计与函数的交汇问题(教材VS高考)
高考数学试题中对概率统计的考查有这样一类试题,题目非常新颖,又非常符合生活实际,这就是概率统计与函数的交汇问题,一般是以统计图表为载体,离散型随机变量的期望是某一变量的函数,利用函数的性质求期望的最值.
【例2】 (满分12分)(2017·全国Ⅲ卷)某超市计划按月订购一种酸奶,每天进货量相同,进货成本每瓶4元,售价每瓶6元,未售出的酸奶降价处理,以每瓶2元的价格当天全部处理完.根据往年销售经验,每天需求量与当天最高气温(单位:℃)有关.如果最高气温不低于25,需求量为500瓶;如果最高气温位于区间[20,25),需求量为300瓶;如果最高气温低于20,需求量为200瓶.为了确定六月份的订购计划,统计了前三年六月份各天的最高气温数据,得下面的频数分布表:
最高
气温
[10,15)
[15,20)
[20,25)
[25,30)
[30,35)
[35,40)
天数
2
16
36
25
7
4
以最高气温位于各区间的频率估计最高气温位于该区间的概率.
(1)求六月份这种酸奶一天的需求量X(单位:瓶)的分布列;
(2)设六月份一天销售这种酸奶的利润为Y(单位:元),当六月份这种酸奶一天的进货量n(单位:瓶)为多少时,Y的数学期望达到最大值?
教材探源 本题第(2)问需对酸奶的需求量n进行分类讨论,以确定利润的最大值,这种分类讨论的思想源自于人教版教材选修2-3 P63例3.
满分解答 解 (1)由题意知,X所有的可能取值为200,300,500,1分(得分点1)
由表格数据知
P(X=200)==0.2,2分(得分点2)
P(X=300)==0.4,3分(得分点3)
P(X=500)==0.4.4分(得分点4)
因此X的分布列为
X
200
300
500
P
0.2
0.4
0.4
5分(得分点5)
(2)由题意知,这种酸奶一天的需求量至多为500,至少为200,因此只需考虑200≤n≤500.
当300≤n≤500时,
若最高气温不低于25,则Y=6n-4n=2n,
若最高气温位于区间[20,25),则Y=6×300+2(n-300)-4n=1 200-2n;
若最高气温低于20,则Y=6×200+2(n-200)-4n=800-2n;
因此E(Y)=2n×0.4+(1 200-2n)×0.4+(800-2n)×0.2=640-0.4n.8分(得分点6)
当200≤n<300时,
若最高气温不低于20,则Y=6n-4n=2n;
若最高气温低于20,则Y=6×200+2(n-200)-4n=800-2n;
因此E(Y)=2n×(0.4+0.4)+(800-2n)×0.2=160+1.2n.
11分(得分点7)
所以n=300时,Y的数学期望达到最大值,最大值为520元.12分(得分点8)
❶得步骤分:抓住得分点的步骤、步步为赢:如第(1)问,指出随机变量X所有的可能取值,有则得1分,无则没有分;随机变量X的各个值对应的概率也是每个1分,列出其分布列是1分,也是每个步骤都有分,都是得分点,第(2)问也是如此.
❷得关键分:解题过程的关键点,有则给分,无则没分,如第(2)问中,根据n的范围求E(Y),即当300≤n≤500时,E(Y)=640-2n;当200≤n≤300时,E(Y)=160+1.2n,若这两个关键运算结果有误,即使有计算过程和步骤也不得分.
❸得计算分:解题过程中计算正确,是得满分的保证,如第(1)问中三个概率值的计算要正确,否则不得分.
1.求离散型随机变量的均值和方差问题的一般步骤
第一步:确定随机变量的所有可能值;
第二步:求每一个可能值所对应的概率;
第三步:列出离散型随机变量的分布列;
第四步:求均值和方差;
第五步:反思回顾、查看关键点、易错点和答题规范.
2.概率统计与函数交汇问题的解题步骤
第一步:通读题目,仔细审题,理解题意;
第二步:根据题目所要解决的问题,确定自变量及其取值范围;
第三步:构建函数模型,写出函数的解析式;
第四步:利用函数模型,求解目标函数的最值或最优解.
【训练2】 (2018·武汉模拟)我国是世界上严重缺水的国家,城市缺水问题较为突出.某市政府为了鼓励居民节约用水,计划在本市试行居民生活用水定额管理,即确定一个合理的居民月用水量标准x(吨),用水量不超过x的部分按平价收费,超出x的部分按议价收费,为了了解全市市民用水量的分布情况,通过抽样,获得了100位居民某年的月均用水量(单位:吨),将数据按照[0,0.5),[0.5,1),…,[4,4.5]分成9组,制成了如图所示的频率分布直方图.
(1)求频率分布直方图中a的值;
(2)若该市政府希望使85%的居民每月的用水量不超过标准x(吨),估计x的值,并说明理由;
(3)已知平价收费标准为4元/吨,议价收费标准为8元/吨.当x=3时,估计该市居民的月平均水费(同一组中的数据用该组区间的中点值代替).
解 (1)由频率分布直方图,可得(0.08+0.16+a+0.40+0.52+a+0.12+0.08+0.04)×0.5=1,解得a=0.30.
(2)∵前6组的频率之和为(0.08+0.16+0.30+0.40+0.52+0.30)×0.5=0.88>0.85,
而前5组的频率之和为(0.08+0.16+0.30+0.40+0.52)×0.5=0.73<0.85,
∴2.5≤x<3.
由0.3×(x-2.5)=0.85-0.73,解得x=2.9.
因此,估计月用水量标准为2.9吨时,85%的居民每月的用水量不超过标准.
(3)设居民月用水量为t吨,相应的水费为y元,则
y=即y=
由题设条件及月均用水量的频率分布直方图,得居民每月的水费数据分组与频率分布表如下:
组号
1
2
3
4
5
6
7
8
9
分组
[0,2)
[2,4)
[4,6)
[6,8)
[8,10)
[10,12)
[12,16)
[16,20)
[20,24]
频率
0.04
0.08
0.15
0.20
0.26
0.15
0.06
0.04
0.02
根据题意,该市居民的月平均水费估计为
1×0.04+3×0.08+5×0.15+7×0.20+9×0.26+11×0.15+14×0.06+18×0.04+22×0.02=8.42(元).
热点三 概率统计与统计案例的交汇问题
近几年的高考数学试题对统计案例的考查一般不单独命题,而是与概率、随机变量的数学期望交汇命题,高考对此类题目的要求是能根据给出的或通过统计图表给出的相关数据求线性回归方程,了解独立性检验的思想方法,会判断两个分类变量是否有关.
【例3】 (2017·全国Ⅱ卷)海水养殖场进行某水产品的新、旧网箱养殖方法的产量对比,收获时各随机抽取了100个网箱,测量各箱水产品的产量(单位:kg),其频率分布直方图如下:
(1)设两种养殖方法的箱产量相互独立,记A表示事件:旧养殖法的箱产量低于50 kg,新养殖法的箱产量不低于50 kg,估计A的概率;
(2)填写下面列联表,并根据列联表判断是否有99%的把握认为箱产量与养殖方法有关:
箱产量<50 kg
箱产量≥50 kg
旧养殖法
新养殖法
(3)根据箱产量的频率分布直方图,求新养殖法箱产量的中位数的估计值(精确到0.01).
附:
K2=
解 (1)记B表示事件“旧养殖法的箱产量低于50 kg”,
C表示事件“新养殖法的箱产量不低于50 kg”.
由题意知,P(A)=P(BC)=P(B)P(C).
旧养殖法的箱产量低于50 kg的频率为
(0.012+0.014+0.024+0.034+0.040)×5=0.62,
故P(B)的估计值为0.62.
新养殖法的箱产量不低于50 kg的频率为
(0.068+0.046+0.010+0.008)×5=0.66,
故P(C)的估计值为0.66.
因此,事件A的概率估计值为0.62×0.66=0.409 2.
(2)根据箱产量的频率分布直方图得列联表
箱产量<50 kg
箱产量≥50 kg
旧养殖法
62
38
新养殖法
34
66
K2的观测值为k=≈15.705.
由于15.705>6.635,故有99%的把握认为箱产量与养殖方法有关.
(3)因为新养殖法的箱产量的频率分布直方图中,箱产量低于50 kg的直方图面积为
(0.004+0.020+0.044)×5=0.34<0.5,
箱产量低于55 kg的直方图面积为
(0.004+0.020+0.044+0.068)×5=0.68>0.5,
故新养殖法箱产量的中位数的估计值为
50+≈52.35 (kg).
探究提高 1.解答此类问题的关键是读懂所给的统计图表,从统计图表中得解题所需的相关数据,以频率为概率,结合互斥事件、对立事件的概率求解.
2.应用独立性检验的方法解决问题,要特别注意计算K2时计算量大,小心出错.
【训练3】 (2018·梅州模拟)中石化集团获得了某地深海油田区块的开采权,集团在该地区随机初步勘探了部分油井中的几口井,取得了地质资料,进入全面勘探时期后,集团按网络点来布置井位进行全面勘探.由于勘探一口井的费用很高,如果新设计的井位与原有井位重合或接近,便利用旧井的地质资料,不必打这口新井,以节约勘探费用,勘探初期数据资料见下表:
井号Ⅰ
1
2
3
4
5
6
坐标(x,y)(km)
(2,30)
(4,40)
(5,60)
(6,50)
(8,70)
(1,y)
钻探深度(km)
2
4
5
6
8
10
出油量(L)
40
70
110
90
160
205
(1)1~6号旧井位置线性分布,借助前5组数据求得回归直线方程为y=6.5x+a,求a,并估计y的预报值;
(2)现准备勘探新井7(1,25),若通过1,3,5,7号井计算出的,的值(,精确到0.01)相比于(1)中b,a的值之差都不超过10%,则使用位置最接近的已有旧井6(1,y),否则在新位置打井,请判断可否使用旧井?
(3)设出油量与勘探深度的比值k 不低于20的勘探井称为优质井,那么在原有6口中任意勘探4口井,求勘探优质井数X 的分布列与数学期望.
解 (1)因为=5,=50.
回归直线必过样本中心点(,),则a=-b=50-6.5×5=17.5,故回归直线方程为y=6.5 x+17.5.
当x=1时, y=6.5+17.5=24,即y的预报值为24.
(2)因为=4, =46.25.
=-=46.25-6.83×4=18.93.
即=6.83,=18.93,b=6.5,a=17.5.
≈5%,≈8%,均不超过10%,
因此可以使用位置最接近的已有旧井6(1,24).
(3)由题意,1,3,5,6这4口井是优质井,2,4这两口井是非优质井,
∴勘察优质井数X的可能取值为2,3,4,
P(X=2)==,P(X=3)==,
P(X=4)==.
∴X的分布列为:
X
2
3
4
P
E(X)=2×+3×+4×=.
1.(2018·晋城模拟)宝宝的健康成长是妈妈们最关心的问题,父母亲为婴儿选择什么品牌的奶粉一直以来都是育婴中的一个重要话题.为了解国产奶粉的知名度和消费者的信任度,某调查小组特别调查记录了某大型连锁超市2015年与2016年这两年销量前5名的五个品牌奶粉的销量(单位:罐),绘制出如下的管状图:
(1)根据给出的这两年销量的管状图,对该超市这两年品牌奶粉销量的前五强进行排名;
(2)分别计算这5个品牌奶粉2016年所占总销量(仅指这5个品牌奶粉的总销量)的百分比(百分数精确到个位),并将数据填入如下饼状图中的括号内;
(3)试以(2)中的百分比作为概率,若随机选取2名购买这5个品牌中任意1个品牌的消费者进行采访,记X为被采访中购买飞鹤奶粉的人数,求X的分布列及数学期望.
解 (1)该超市这两年品牌奶粉销量的前五强排名分别为:飞鹤奶粉,伊利奶粉,贝因美奶粉,雅士利奶粉,完达山奶粉.
(2)
(3)由(2)知,购买飞鹤奶粉的概率为,X的可能取值为0,1,2.
则P(X=0)==,P(X=1)=C××=,P(X=2)==.
X的分布列为
X
0
1
2
P
故E(X)=0×+1×+2×=.
2.(2018·佛山模拟)某公司为招聘新员工设计了一个面试方案:应聘者从6道备选题中一次性随机抽取3道题,按照题目要求独立完成.规定:至少正确完成其中2道题的便可通过.已知6道备选题中应聘者甲有4道题能正确完成,2道题不能完成;应聘者乙每题正确完成的概率都是,且每题正确完成与否互不影响.
(1)分别求甲、乙两人正确完成面试题数的分布列及数学期望;
(2)请分析比较甲、乙两人谁面试通过的可能性大?
解 (1)设甲正确完成面试的题数为ξ,则ξ的可能取值为1,2,3.
P(ξ=1)==;
P(ξ=2)==;
P(ξ=3)==.
应聘者甲正确完成题数ξ的分布列为
ξ
1
2
3
P
E(ξ)=1×+2×+3×=2.
设乙正确完成面试的题数为η,则η的可能取值为0,1,2,3.
P(η=0)=C=;
P(η=1)=C=;
P(η=2)=C=;
P(η=3)=C=.
应聘者乙正确完成题数η的分布列为
η
0
1
2
3
P
E(η)=0×+1×+2×+3×=2.
(或因为η~B,所以E(η)=3×=2)
(2)因为D(ξ)=(1-2)2×+(2-2)2×+(3-2)2×=,D(η)=3××=.
所以D(ξ)
综上所述,从做对题数的数学期望考查,两人水平相当;
从做对题数的方差考查,甲较稳定;
从至少完成2道题的概率考查,甲面试通过的可能性大.
3.(2018·合肥模拟)美团外卖和百度外卖两家公司其“骑手”的日工资方案如下:美团外卖规定底薪70元,每单抽成1元;百度外卖规定底薪100元,每日前45单无抽成,超出45单的部分每单抽成6元.假设同一公司的“骑手”一日送餐单数相同,现从两家公司各随机抽取一名“骑手”并记录其100天的送餐单数,得到如下条形图:
(1)求百度外卖公司的“骑手”一日工资y(单位:元)与送餐单数n的函数关系;
(2)若将频率视为概率,回答以下问题:
①记百度外卖的“骑手”日工资为X(单位:元),求X的分布列和数学期望;
②小明拟到这两家公司中的一家应聘“骑手”的工作,如果仅从日收入的角度考虑,请你利用所学的统计学知识为他做出选择,并说明理由.
解 (1)y=
(2)①根据条形图,当送单数为42,44时,X=100,频数为10+10=20,频率为=0.2;
当送单数为46时,X=100+(46-45)×6=106,频数为30,频率为=0.3;
当送单数为48时,X=100+(48-45)×6=118,频数为40,频率为=0.4;
当送单数为50时,X=100+(50-45)×6=130,频数为10,频率为=0.1.
故百度外卖的“骑手”一日工资X的分布列如表所示
X
100
106
118
130
P
0.2
0.3
0.4
0.1
数学期望E(X)=100×0.2+106×0.3+118×0.4+130×0.1=112(元).
②根据条形图,美团外卖“骑手”日平均送餐单数为:42×0.2+44×0.4+46×0.2+48×0.1+50×0.1=45,
所以美团外卖“骑手”日平均工资为:70+45=115(元).
由①知,百度外卖“骑手”日平均工资为112元,故推荐小明去美团外卖应聘.
4.(2018·洛阳模拟)以下是新兵训练时,某炮兵连8周中炮弹对同一目标的命中情况的柱状图:
(1)计算该炮兵连这8周中总的命中频率p0,并确定第几周的命中频率最高;
(2)以(1)中的p0作为该炮兵连炮兵甲对同一目标的命中率,若每次发射相互独立,且炮兵甲发射3次,记命中的次数为X,求X的数学期望;
(3)以(1)中的p0作为该炮兵连炮兵对同一目标的命中率,试问至少要用多少枚这样的炮弹同时对该目标发射一次,才能使目标被击中的概率超过0.99?(取lg 0.4=-0.398)
解 (1)这8周总命中炮数为40+45+46+49+47+49+53+52=381,总未命中炮数为32+34+30+32+35+33+30+28=254.
∴p0==0.6,
∵>,∴根据表中数据易知第8周的命中频率最高.
(2)由题意可知X~B(3,0.6),
则X的数学期望为E(X)=3×0.6=1.8.
(3)由1-(1-p0)n>0.99,
即1-0.4n>0.99得0.4n<0.01,
∴n>log0.40.01==-=≈5.025,
故至少要用6枚这样的炮弹同时对该目标发射一次,才能使目标被击中的概率超过0.99.
5.(2018·沈阳模拟)某企业有甲、乙两个分厂生产某种产品,按规定该产品的某项质量指标值落在[45,75)的为优质品.从两个分厂生产的产品中各随机抽取500件,测量这些产品的该项质量指标值,结果如下表:
指标值
分组
[25,35)
[35,45)
[45,55)
[55,65)
[65,75)
[75,85)
[85,95]
甲厂频数
10
40
115
165
120
45
5
乙厂频数
5
60
110
160
90
70
5
(1)根据以上统计数据完成下面2×2列联表,并回答是否有99%的把握认为“两个分厂生产的产品的质量有差异?”
甲厂
乙厂
合计
优质品
760
非优质品
240
合计
500
500
1 000
(2)求优质品率较高的分厂的500件产品质量指标值的样本平均数x(同一组数据用该区间的中点值作代表);
(3)经计算,甲分厂的500件产品质量指标值的样本方差s=142,乙分厂的500件产品质量指标值的样本方差s=162.可认为优质品率较高的分厂的产品质量指标值X服从正态分布N(μ,σ2),其中μ近似为样本平均数x,σ2近似为样本方差s2.由优质品率较高的分厂的抽样数据,能否认为该分厂生产的产品中,质量指标值不低于71.92的产品至少占全部产品的18%(取≈11.92)?
附注:
P(K2≥k)
0.05
0.01
0.001
k
3.841
6.635
10.828
参考数据:≈11.92,≈12.73.
参考公式:K2=.
若X~N(μ,σ2),则P(μ-σ
P(μ-2σ
解 (1)由以上统计数据填下面2×2列联表
甲厂
乙厂
合计
优质品
400
360
760
非优质品
100
140
240
合计
500
500
1 000
K2=≈8.772>6.635,
所以有99%的把握认为“两个分厂生产的零件的质量有差异”.
(2)甲分厂优质品率==0.8,乙分厂优质品率==0.72,
所以甲分厂优质品率高.
甲分厂的500件产品质量指标值的样本平均数
x=(30×10+40×40+50×115+60×165+70×120+80×45+90×5)
=30×0.02+40×0.08+50×0.23+60×0.33+70×0.24+80×0.09+90×0.01=60.
(3)由(2)知μ=60,σ2=142,
甲分厂的产品的质量指标值X服从正态分布X~N(60,142),
又σ=≈11.92,
则P(60-11.92
P(X≥71.92)===0.158 7<0.18,
故不能认为甲分厂生产的产品中,质量指标值不低于71.92的产品至少占全部产品的18%.
6.(2018·河南百校联盟模拟)国内某知名连锁店分店开张营业期间,在固定的时间段内消费达到一定标准的顾客可参加一次抽奖活动,随着抽奖活动的有效开展,参与抽奖活动的人数越来越多,该分店经理对开业前7天参加抽奖活动的人数进行统计,y表示开业第x天参加抽奖活动的人数,得到统计表格如下:
x
1
2
3
4
5
6
7
y
5
8
8
10
14
15
17
经过进一步统计分析,发现y与x具有线性相关关系.
(1)根据上表提供的数据,用最小二乘法求出y关于x的线性回归方程=x+;
(2)若该分店此次抽奖活动自开业起,持续10天,参加抽奖的每位顾客抽到一等奖(奖品价值200元)的概率为,抽到二等奖(奖品价值100元)的概率为,抽到三等奖(奖品价值10元)的概率为.试估计该分店在此次抽奖活动结束时共送出价值多少元的奖品.
解 (1)依题意知=×(1+2+3+4+5+6+7)=4,
=×(5+8+8+10+14+15+17)=11,
=-=11-2×4=3,
则y关于x的线性回归方程为=2x+3.
(2)设一位参加抽奖的顾客获得的奖品价值X元,则X的分布列为
X
200
100
10
P
E(X)=200×+100×+10×=.
由y关于x的线性回归方程为=2x+3,
得x=8时,=19;x=9时,=21;x=10时,=23,
则此次活动参加抽奖的人数约为
5+8+8+10+14+15+17+19+21+23=140,又140×=8 800,
所以估计该分店在此次抽奖活动结束时共送出价值8 800元的奖品.
高考导航 1.概率与统计是高考中相对独立的一块内容,处理问题的方式、方法体现了较高的思维含量.该类问题以应用题为载体,注重考查学生的应用意识及阅读理解能力、化归转化能力;2.概率问题的核心是概率计算.其中事件的互斥、对立、独立是概率计算的核心,排列组合是进行概率计算的工具.统计问题的核心是样本数据的获得及分析方法,重点是频率分布直方图、茎叶图和样本的数字特征;3.离散型随机变量的分布列及其期望的考查是历来高考的重点,难度多为中低档类题目,特别是与统计内容的渗透,背景新颖,充分体现了概率与统计的工具性和交汇性.
热点一 常见概率模型的概率
几何概型、古典概型、相互独立事件与互斥事件的概率、条件概率是高考的热点,几何概型主要以客观题形式考查,求解的关键在于找准测度(面积、体积或长度);相互独立事件、互斥事件常作为解答题的一问考查,也是进一步求分布列、期望与方差的基础,求解该类问题要正确理解题意,准确判定概率模型,恰当选择概率公式.
【例1】 (2017·全国Ⅰ卷)为了监控某种零件的一条生产线的生产过程,检验员每天从该生产线上随机抽取16个零件,并测量其尺寸(单位:cm).根据长期生产经验,可以认为这条生产线正常状态下生产的零件的尺寸服从正态分布N(μ,σ2).
(1)假设生产状态正常,记X表示一天内抽取的16个零件中其尺寸在(μ-3σ,μ+3σ)之外的零件数,求P(X≥1)及X的数学期望;
(2)一天内抽检零件中,如果出现了尺寸在(μ-3σ,μ+3σ)之外的零件,就认为这条生产线在这一天的生产过程可能出现了异常情况,需对当天的生产过程进行检查.
(ⅰ)试说明上述监控生产过程方法的合理性;
(ⅱ)下面是检验员在一天内抽取的16个零件的尺寸:
9.95 10.12 9.96 9.96 10.01 9.92 9.98 10.04
10.26 9.91 10.13 10.02 9.22 10.04 10.05 9.95
经计算得=i=9.97,s==≈0.212,其中xi为抽取的第i个零件的尺寸,i=1,2,…,16.
用样本平均数作为μ的估计值,用样本标准差s作为σ的估计值,利用估计值判断是否需对当天的生产过程进行检查?剔除(-3,+3)之外的数据,用剩下的数据估计μ和σ(精确到0.01).
附:若随机变量Z服从正态分布N(μ,σ2),则P(μ-3σ
因此P(X≥1)=1-P(X=0)=1-0.997 416≈1-0.959 2=0.040 8.
X的数学期望E(X)=16×0.002 6=0.041 6.
(2)(ⅰ)如果生产状态正常,一个零件尺寸在(μ-3σ,μ+3σ)之外的概率只有0.002 6,一天内抽取的16个零件中,出现尺寸在(μ-3σ,μ+3σ)之外的零件的概率只有0.040 8,发生的概率很小,因此一旦发生这种情况,就有理由认为这条生产线在这一天的生产过程可能出现了异常情况,需对当天的生产过程进行检查,可见上述监控生产过程的方法是合理的.
(ⅱ)由x=9.97,s≈0.212,得μ的估计值为=9.97,σ的估计值为=0.212,由样本数据可以看出有一个零件的尺寸在(-3,+3)之外,因此需对当天的生产过程进行检查.
剔除(-3,+3)之外的数据9.22,剩下数据的平均数为×(16×9.97-9.22)=10.02,
因此μ的估计值为10.02.
=16×0.2122+16×9.972≈1 591.134,
剔除(-3,+3)之外的数据9.22,剩下数据的样本方差为×(1 591.134-9.222-15×10.022)≈0.008,
因此σ的估计值为≈0.09.
探究提高 1.解第(1)题的关键是认清随机变量X服从二项分布,并能够应用E(X)=np求解,易出现的失误是由于题干较长,不能正确理解题意.
2.解第(2)题的关键是理解正态分布的意义,能够利用3σ原则求解,易出现的失误有两个方面,一是不清楚正态分布N(μ,σ2)中μ和σ的意义及其计算公式,二是计算失误.
【训练1】 (2018·石家庄调研)甲、乙两班进行消防安全知识竞赛,每班出3人组成甲乙两支代表队,首轮比赛每人一道必答题,答对则为本队得1分,答错或不答都得0分,已知甲队3人每人答对的概率分别为,,,乙队每人答对的概率都是,设每人回答正确与否相互之间没有影响,用ξ表示甲队总得分.
(1)求ξ=2的概率;
(2)求在甲队和乙队得分之和为4的条件下,甲队比乙队得分高的概率.
解 (1)ξ=2,则甲队有两人答对,一人答错,
故P(ξ=2)=××+××+××=.
(2)设甲队和乙队得分之和为4为事件A,甲队比乙队得分高为事件B.设乙队得分为η,则η~B.
P(ξ=1)=××+××+××=,
P(ξ=3)=××=,
P(η=1)=C··=,
P(η=2)=C··=,
P(η=3)=C=,
∴P(A)=P(ξ=1)P(η=3)+P(ξ=2)P(η=2)+P(ξ=3)·P(η=1)
=×+×+×=,
P(AB)=P(ξ=3)·P(η=1)=×=,
∴所求概率为P(B|A)===.
热点二 概率统计与函数的交汇问题(教材VS高考)
高考数学试题中对概率统计的考查有这样一类试题,题目非常新颖,又非常符合生活实际,这就是概率统计与函数的交汇问题,一般是以统计图表为载体,离散型随机变量的期望是某一变量的函数,利用函数的性质求期望的最值.
【例2】 (满分12分)(2017·全国Ⅲ卷)某超市计划按月订购一种酸奶,每天进货量相同,进货成本每瓶4元,售价每瓶6元,未售出的酸奶降价处理,以每瓶2元的价格当天全部处理完.根据往年销售经验,每天需求量与当天最高气温(单位:℃)有关.如果最高气温不低于25,需求量为500瓶;如果最高气温位于区间[20,25),需求量为300瓶;如果最高气温低于20,需求量为200瓶.为了确定六月份的订购计划,统计了前三年六月份各天的最高气温数据,得下面的频数分布表:
最高
气温
[10,15)
[15,20)
[20,25)
[25,30)
[30,35)
[35,40)
天数
2
16
36
25
7
4
以最高气温位于各区间的频率估计最高气温位于该区间的概率.
(1)求六月份这种酸奶一天的需求量X(单位:瓶)的分布列;
(2)设六月份一天销售这种酸奶的利润为Y(单位:元),当六月份这种酸奶一天的进货量n(单位:瓶)为多少时,Y的数学期望达到最大值?
教材探源 本题第(2)问需对酸奶的需求量n进行分类讨论,以确定利润的最大值,这种分类讨论的思想源自于人教版教材选修2-3 P63例3.
满分解答 解 (1)由题意知,X所有的可能取值为200,300,500,1分(得分点1)
由表格数据知
P(X=200)==0.2,2分(得分点2)
P(X=300)==0.4,3分(得分点3)
P(X=500)==0.4.4分(得分点4)
因此X的分布列为
X
200
300
500
P
0.2
0.4
0.4
5分(得分点5)
(2)由题意知,这种酸奶一天的需求量至多为500,至少为200,因此只需考虑200≤n≤500.
当300≤n≤500时,
若最高气温不低于25,则Y=6n-4n=2n,
若最高气温位于区间[20,25),则Y=6×300+2(n-300)-4n=1 200-2n;
若最高气温低于20,则Y=6×200+2(n-200)-4n=800-2n;
因此E(Y)=2n×0.4+(1 200-2n)×0.4+(800-2n)×0.2=640-0.4n.8分(得分点6)
当200≤n<300时,
若最高气温不低于20,则Y=6n-4n=2n;
若最高气温低于20,则Y=6×200+2(n-200)-4n=800-2n;
因此E(Y)=2n×(0.4+0.4)+(800-2n)×0.2=160+1.2n.
11分(得分点7)
所以n=300时,Y的数学期望达到最大值,最大值为520元.12分(得分点8)
❶得步骤分:抓住得分点的步骤、步步为赢:如第(1)问,指出随机变量X所有的可能取值,有则得1分,无则没有分;随机变量X的各个值对应的概率也是每个1分,列出其分布列是1分,也是每个步骤都有分,都是得分点,第(2)问也是如此.
❷得关键分:解题过程的关键点,有则给分,无则没分,如第(2)问中,根据n的范围求E(Y),即当300≤n≤500时,E(Y)=640-2n;当200≤n≤300时,E(Y)=160+1.2n,若这两个关键运算结果有误,即使有计算过程和步骤也不得分.
❸得计算分:解题过程中计算正确,是得满分的保证,如第(1)问中三个概率值的计算要正确,否则不得分.
1.求离散型随机变量的均值和方差问题的一般步骤
第一步:确定随机变量的所有可能值;
第二步:求每一个可能值所对应的概率;
第三步:列出离散型随机变量的分布列;
第四步:求均值和方差;
第五步:反思回顾、查看关键点、易错点和答题规范.
2.概率统计与函数交汇问题的解题步骤
第一步:通读题目,仔细审题,理解题意;
第二步:根据题目所要解决的问题,确定自变量及其取值范围;
第三步:构建函数模型,写出函数的解析式;
第四步:利用函数模型,求解目标函数的最值或最优解.
【训练2】 (2018·武汉模拟)我国是世界上严重缺水的国家,城市缺水问题较为突出.某市政府为了鼓励居民节约用水,计划在本市试行居民生活用水定额管理,即确定一个合理的居民月用水量标准x(吨),用水量不超过x的部分按平价收费,超出x的部分按议价收费,为了了解全市市民用水量的分布情况,通过抽样,获得了100位居民某年的月均用水量(单位:吨),将数据按照[0,0.5),[0.5,1),…,[4,4.5]分成9组,制成了如图所示的频率分布直方图.
(1)求频率分布直方图中a的值;
(2)若该市政府希望使85%的居民每月的用水量不超过标准x(吨),估计x的值,并说明理由;
(3)已知平价收费标准为4元/吨,议价收费标准为8元/吨.当x=3时,估计该市居民的月平均水费(同一组中的数据用该组区间的中点值代替).
解 (1)由频率分布直方图,可得(0.08+0.16+a+0.40+0.52+a+0.12+0.08+0.04)×0.5=1,解得a=0.30.
(2)∵前6组的频率之和为(0.08+0.16+0.30+0.40+0.52+0.30)×0.5=0.88>0.85,
而前5组的频率之和为(0.08+0.16+0.30+0.40+0.52)×0.5=0.73<0.85,
∴2.5≤x<3.
由0.3×(x-2.5)=0.85-0.73,解得x=2.9.
因此,估计月用水量标准为2.9吨时,85%的居民每月的用水量不超过标准.
(3)设居民月用水量为t吨,相应的水费为y元,则
y=即y=
由题设条件及月均用水量的频率分布直方图,得居民每月的水费数据分组与频率分布表如下:
组号
1
2
3
4
5
6
7
8
9
分组
[0,2)
[2,4)
[4,6)
[6,8)
[8,10)
[10,12)
[12,16)
[16,20)
[20,24]
频率
0.04
0.08
0.15
0.20
0.26
0.15
0.06
0.04
0.02
根据题意,该市居民的月平均水费估计为
1×0.04+3×0.08+5×0.15+7×0.20+9×0.26+11×0.15+14×0.06+18×0.04+22×0.02=8.42(元).
热点三 概率统计与统计案例的交汇问题
近几年的高考数学试题对统计案例的考查一般不单独命题,而是与概率、随机变量的数学期望交汇命题,高考对此类题目的要求是能根据给出的或通过统计图表给出的相关数据求线性回归方程,了解独立性检验的思想方法,会判断两个分类变量是否有关.
【例3】 (2017·全国Ⅱ卷)海水养殖场进行某水产品的新、旧网箱养殖方法的产量对比,收获时各随机抽取了100个网箱,测量各箱水产品的产量(单位:kg),其频率分布直方图如下:
(1)设两种养殖方法的箱产量相互独立,记A表示事件:旧养殖法的箱产量低于50 kg,新养殖法的箱产量不低于50 kg,估计A的概率;
(2)填写下面列联表,并根据列联表判断是否有99%的把握认为箱产量与养殖方法有关:
箱产量<50 kg
箱产量≥50 kg
旧养殖法
新养殖法
(3)根据箱产量的频率分布直方图,求新养殖法箱产量的中位数的估计值(精确到0.01).
附:
K2=
解 (1)记B表示事件“旧养殖法的箱产量低于50 kg”,
C表示事件“新养殖法的箱产量不低于50 kg”.
由题意知,P(A)=P(BC)=P(B)P(C).
旧养殖法的箱产量低于50 kg的频率为
(0.012+0.014+0.024+0.034+0.040)×5=0.62,
故P(B)的估计值为0.62.
新养殖法的箱产量不低于50 kg的频率为
(0.068+0.046+0.010+0.008)×5=0.66,
故P(C)的估计值为0.66.
因此,事件A的概率估计值为0.62×0.66=0.409 2.
(2)根据箱产量的频率分布直方图得列联表
箱产量<50 kg
箱产量≥50 kg
旧养殖法
62
38
新养殖法
34
66
K2的观测值为k=≈15.705.
由于15.705>6.635,故有99%的把握认为箱产量与养殖方法有关.
(3)因为新养殖法的箱产量的频率分布直方图中,箱产量低于50 kg的直方图面积为
(0.004+0.020+0.044)×5=0.34<0.5,
箱产量低于55 kg的直方图面积为
(0.004+0.020+0.044+0.068)×5=0.68>0.5,
故新养殖法箱产量的中位数的估计值为
50+≈52.35 (kg).
探究提高 1.解答此类问题的关键是读懂所给的统计图表,从统计图表中得解题所需的相关数据,以频率为概率,结合互斥事件、对立事件的概率求解.
2.应用独立性检验的方法解决问题,要特别注意计算K2时计算量大,小心出错.
【训练3】 (2018·梅州模拟)中石化集团获得了某地深海油田区块的开采权,集团在该地区随机初步勘探了部分油井中的几口井,取得了地质资料,进入全面勘探时期后,集团按网络点来布置井位进行全面勘探.由于勘探一口井的费用很高,如果新设计的井位与原有井位重合或接近,便利用旧井的地质资料,不必打这口新井,以节约勘探费用,勘探初期数据资料见下表:
井号Ⅰ
1
2
3
4
5
6
坐标(x,y)(km)
(2,30)
(4,40)
(5,60)
(6,50)
(8,70)
(1,y)
钻探深度(km)
2
4
5
6
8
10
出油量(L)
40
70
110
90
160
205
(1)1~6号旧井位置线性分布,借助前5组数据求得回归直线方程为y=6.5x+a,求a,并估计y的预报值;
(2)现准备勘探新井7(1,25),若通过1,3,5,7号井计算出的,的值(,精确到0.01)相比于(1)中b,a的值之差都不超过10%,则使用位置最接近的已有旧井6(1,y),否则在新位置打井,请判断可否使用旧井?
(3)设出油量与勘探深度的比值k 不低于20的勘探井称为优质井,那么在原有6口中任意勘探4口井,求勘探优质井数X 的分布列与数学期望.
解 (1)因为=5,=50.
回归直线必过样本中心点(,),则a=-b=50-6.5×5=17.5,故回归直线方程为y=6.5 x+17.5.
当x=1时, y=6.5+17.5=24,即y的预报值为24.
(2)因为=4, =46.25.
=-=46.25-6.83×4=18.93.
即=6.83,=18.93,b=6.5,a=17.5.
≈5%,≈8%,均不超过10%,
因此可以使用位置最接近的已有旧井6(1,24).
(3)由题意,1,3,5,6这4口井是优质井,2,4这两口井是非优质井,
∴勘察优质井数X的可能取值为2,3,4,
P(X=2)==,P(X=3)==,
P(X=4)==.
∴X的分布列为:
X
2
3
4
P
E(X)=2×+3×+4×=.
1.(2018·晋城模拟)宝宝的健康成长是妈妈们最关心的问题,父母亲为婴儿选择什么品牌的奶粉一直以来都是育婴中的一个重要话题.为了解国产奶粉的知名度和消费者的信任度,某调查小组特别调查记录了某大型连锁超市2015年与2016年这两年销量前5名的五个品牌奶粉的销量(单位:罐),绘制出如下的管状图:
(1)根据给出的这两年销量的管状图,对该超市这两年品牌奶粉销量的前五强进行排名;
(2)分别计算这5个品牌奶粉2016年所占总销量(仅指这5个品牌奶粉的总销量)的百分比(百分数精确到个位),并将数据填入如下饼状图中的括号内;
(3)试以(2)中的百分比作为概率,若随机选取2名购买这5个品牌中任意1个品牌的消费者进行采访,记X为被采访中购买飞鹤奶粉的人数,求X的分布列及数学期望.
解 (1)该超市这两年品牌奶粉销量的前五强排名分别为:飞鹤奶粉,伊利奶粉,贝因美奶粉,雅士利奶粉,完达山奶粉.
(2)
(3)由(2)知,购买飞鹤奶粉的概率为,X的可能取值为0,1,2.
则P(X=0)==,P(X=1)=C××=,P(X=2)==.
X的分布列为
X
0
1
2
P
故E(X)=0×+1×+2×=.
2.(2018·佛山模拟)某公司为招聘新员工设计了一个面试方案:应聘者从6道备选题中一次性随机抽取3道题,按照题目要求独立完成.规定:至少正确完成其中2道题的便可通过.已知6道备选题中应聘者甲有4道题能正确完成,2道题不能完成;应聘者乙每题正确完成的概率都是,且每题正确完成与否互不影响.
(1)分别求甲、乙两人正确完成面试题数的分布列及数学期望;
(2)请分析比较甲、乙两人谁面试通过的可能性大?
解 (1)设甲正确完成面试的题数为ξ,则ξ的可能取值为1,2,3.
P(ξ=1)==;
P(ξ=2)==;
P(ξ=3)==.
应聘者甲正确完成题数ξ的分布列为
ξ
1
2
3
P
E(ξ)=1×+2×+3×=2.
设乙正确完成面试的题数为η,则η的可能取值为0,1,2,3.
P(η=0)=C=;
P(η=1)=C=;
P(η=2)=C=;
P(η=3)=C=.
应聘者乙正确完成题数η的分布列为
η
0
1
2
3
P
E(η)=0×+1×+2×+3×=2.
(或因为η~B,所以E(η)=3×=2)
(2)因为D(ξ)=(1-2)2×+(2-2)2×+(3-2)2×=,D(η)=3××=.
所以D(ξ)
从做对题数的方差考查,甲较稳定;
从至少完成2道题的概率考查,甲面试通过的可能性大.
3.(2018·合肥模拟)美团外卖和百度外卖两家公司其“骑手”的日工资方案如下:美团外卖规定底薪70元,每单抽成1元;百度外卖规定底薪100元,每日前45单无抽成,超出45单的部分每单抽成6元.假设同一公司的“骑手”一日送餐单数相同,现从两家公司各随机抽取一名“骑手”并记录其100天的送餐单数,得到如下条形图:
(1)求百度外卖公司的“骑手”一日工资y(单位:元)与送餐单数n的函数关系;
(2)若将频率视为概率,回答以下问题:
①记百度外卖的“骑手”日工资为X(单位:元),求X的分布列和数学期望;
②小明拟到这两家公司中的一家应聘“骑手”的工作,如果仅从日收入的角度考虑,请你利用所学的统计学知识为他做出选择,并说明理由.
解 (1)y=
(2)①根据条形图,当送单数为42,44时,X=100,频数为10+10=20,频率为=0.2;
当送单数为46时,X=100+(46-45)×6=106,频数为30,频率为=0.3;
当送单数为48时,X=100+(48-45)×6=118,频数为40,频率为=0.4;
当送单数为50时,X=100+(50-45)×6=130,频数为10,频率为=0.1.
故百度外卖的“骑手”一日工资X的分布列如表所示
X
100
106
118
130
P
0.2
0.3
0.4
0.1
数学期望E(X)=100×0.2+106×0.3+118×0.4+130×0.1=112(元).
②根据条形图,美团外卖“骑手”日平均送餐单数为:42×0.2+44×0.4+46×0.2+48×0.1+50×0.1=45,
所以美团外卖“骑手”日平均工资为:70+45=115(元).
由①知,百度外卖“骑手”日平均工资为112元,故推荐小明去美团外卖应聘.
4.(2018·洛阳模拟)以下是新兵训练时,某炮兵连8周中炮弹对同一目标的命中情况的柱状图:
(1)计算该炮兵连这8周中总的命中频率p0,并确定第几周的命中频率最高;
(2)以(1)中的p0作为该炮兵连炮兵甲对同一目标的命中率,若每次发射相互独立,且炮兵甲发射3次,记命中的次数为X,求X的数学期望;
(3)以(1)中的p0作为该炮兵连炮兵对同一目标的命中率,试问至少要用多少枚这样的炮弹同时对该目标发射一次,才能使目标被击中的概率超过0.99?(取lg 0.4=-0.398)
解 (1)这8周总命中炮数为40+45+46+49+47+49+53+52=381,总未命中炮数为32+34+30+32+35+33+30+28=254.
∴p0==0.6,
∵>,∴根据表中数据易知第8周的命中频率最高.
(2)由题意可知X~B(3,0.6),
则X的数学期望为E(X)=3×0.6=1.8.
(3)由1-(1-p0)n>0.99,
即1-0.4n>0.99得0.4n<0.01,
∴n>log0.40.01==-=≈5.025,
故至少要用6枚这样的炮弹同时对该目标发射一次,才能使目标被击中的概率超过0.99.
5.(2018·沈阳模拟)某企业有甲、乙两个分厂生产某种产品,按规定该产品的某项质量指标值落在[45,75)的为优质品.从两个分厂生产的产品中各随机抽取500件,测量这些产品的该项质量指标值,结果如下表:
指标值
分组
[25,35)
[35,45)
[45,55)
[55,65)
[65,75)
[75,85)
[85,95]
甲厂频数
10
40
115
165
120
45
5
乙厂频数
5
60
110
160
90
70
5
(1)根据以上统计数据完成下面2×2列联表,并回答是否有99%的把握认为“两个分厂生产的产品的质量有差异?”
甲厂
乙厂
合计
优质品
760
非优质品
240
合计
500
500
1 000
(2)求优质品率较高的分厂的500件产品质量指标值的样本平均数x(同一组数据用该区间的中点值作代表);
(3)经计算,甲分厂的500件产品质量指标值的样本方差s=142,乙分厂的500件产品质量指标值的样本方差s=162.可认为优质品率较高的分厂的产品质量指标值X服从正态分布N(μ,σ2),其中μ近似为样本平均数x,σ2近似为样本方差s2.由优质品率较高的分厂的抽样数据,能否认为该分厂生产的产品中,质量指标值不低于71.92的产品至少占全部产品的18%(取≈11.92)?
附注:
P(K2≥k)
0.05
0.01
0.001
k
3.841
6.635
10.828
参考数据:≈11.92,≈12.73.
参考公式:K2=.
若X~N(μ,σ2),则P(μ-σ
甲厂
乙厂
合计
优质品
400
360
760
非优质品
100
140
240
合计
500
500
1 000
K2=≈8.772>6.635,
所以有99%的把握认为“两个分厂生产的零件的质量有差异”.
(2)甲分厂优质品率==0.8,乙分厂优质品率==0.72,
所以甲分厂优质品率高.
甲分厂的500件产品质量指标值的样本平均数
x=(30×10+40×40+50×115+60×165+70×120+80×45+90×5)
=30×0.02+40×0.08+50×0.23+60×0.33+70×0.24+80×0.09+90×0.01=60.
(3)由(2)知μ=60,σ2=142,
甲分厂的产品的质量指标值X服从正态分布X~N(60,142),
又σ=≈11.92,
则P(60-11.92
故不能认为甲分厂生产的产品中,质量指标值不低于71.92的产品至少占全部产品的18%.
6.(2018·河南百校联盟模拟)国内某知名连锁店分店开张营业期间,在固定的时间段内消费达到一定标准的顾客可参加一次抽奖活动,随着抽奖活动的有效开展,参与抽奖活动的人数越来越多,该分店经理对开业前7天参加抽奖活动的人数进行统计,y表示开业第x天参加抽奖活动的人数,得到统计表格如下:
x
1
2
3
4
5
6
7
y
5
8
8
10
14
15
17
经过进一步统计分析,发现y与x具有线性相关关系.
(1)根据上表提供的数据,用最小二乘法求出y关于x的线性回归方程=x+;
(2)若该分店此次抽奖活动自开业起,持续10天,参加抽奖的每位顾客抽到一等奖(奖品价值200元)的概率为,抽到二等奖(奖品价值100元)的概率为,抽到三等奖(奖品价值10元)的概率为.试估计该分店在此次抽奖活动结束时共送出价值多少元的奖品.
解 (1)依题意知=×(1+2+3+4+5+6+7)=4,
=×(5+8+8+10+14+15+17)=11,
=-=11-2×4=3,
则y关于x的线性回归方程为=2x+3.
(2)设一位参加抽奖的顾客获得的奖品价值X元,则X的分布列为
X
200
100
10
P
E(X)=200×+100×+10×=.
由y关于x的线性回归方程为=2x+3,
得x=8时,=19;x=9时,=21;x=10时,=23,
则此次活动参加抽奖的人数约为
5+8+8+10+14+15+17+19+21+23=140,又140×=8 800,
所以估计该分店在此次抽奖活动结束时共送出价值8 800元的奖品.
相关资料
更多