还剩27页未读,
继续阅读
所属成套资源:2020高考人教A版理科数学一轮复习文档《微点教程》学案
成套系列资料,整套一键下载
2020版《微点教程》高考人教A版理科数学一轮复习文档:第十章第八节 离散型随机变量的均值与方差 学案
展开
第八节 离散型随机变量的均值与方差
2019考纲考题考情
1.离散型随机变量的均值与方差
若离散型随机变量X的分布列为
X
x1
x2
…
xi
…
xn
P
p1
p2
…
pi
…
pn
(1)均值:称E(X)=x1p1+x2p2+…+xipi+…+xnpn为随机变量X的均值或数学期望,它反映了离散型随机变量取值的平均水平。
(2)D(X)=(xi-E(X))2pi为随机变量X的方差,它刻画了随机变量X与其均值E(X)的平均偏离程度,其算术平方根为随机变量X的标准差。
2.均值与方差的性质
(1)E(aX+b)=aE(X)+b。
(2)D(aX+b)=a2D(X)(a,b为常数)。
3.两点分布与二项分布的均值、方差
X
X服从两点分布
X~B(n,p)
E(X)
p(p为成功概率)
np
D(X)
p(1-p)
np(1-p)
1.均值E(X)是一个实数,由X的分布列唯一确定,即X作为随机变量是可变的,而E(X)是不变的,它描述X值的取值平均状态。
2.已知随机变量的分布列求它的均值、方差和标准差,可直接按定义(公式)求解。若所给随机变量服从两点分布或二项分布等,则可直接利用它们的均值、方差公式求解。
一、走进教材
1.(选修2-3P68A组T1改编)已知X的分布列为
X
-1
0
1
P
设Y=2X+3,则E(Y)的值为( )
A. B.4 C.-1 D.1
解析 E(X)=-+=-,E(Y)=E(2X+3)=2E(X)+3=-+3=。故选A。
答案 A
2.(选修2-3P68A组T5改编)甲、乙两工人在一天生产中出现的废品数分别是两个随机变量X,Y,其分布列分别为:
X
0
1
2
3
P
0.4
0.3
0.2
0.1
Y
0
1
2
P
0.3
0.5
0.2
若甲、乙两人的日产量相等,则甲、乙两人中技术较好的是________。
解析 E(X)=0×0.4+1×0.3+2×0.2+3×0.1=1。E(Y)=0×0.3+1×0.5+2×0.2=0.9,因为E(Y)
答案 乙
二、走近高考
3.(2018·浙江高考)设0 ξ
0
1
2
P
则当p在(0,1)内增大时( )
A.D(ξ)减小 B.D(ξ)增大
C.D(ξ)先减小后增大 D.D(ξ)先增大后减小
解析 由题可得E(ξ)=+p,所以D(ξ)=-p2+p+=-2+,所以当p在(0,1)内增大时,D(ξ)先增大后减小。故选D。
答案 D
三、走出误区
微提醒:①期望、方差的性质不熟导致错误;②二项分布的数学期望公式用法不当;③求错分布列,导致E(ξ)出错。
4.已知两个随机变量X,Y满足X+2Y=4,且X~N(1,22),则E(Y),D(Y)依次是________。
解析 由X~N(1,22)得E(X)=1,D(X)=4。又X+2Y=4,所以Y=2-,所以E(Y)=2-E(X)=,D(Y)=D(X)=1。
答案 ,1
5.在一次招聘中,主考官要求应聘者从6道备选题中一次性随机抽取3道题,并独立完成所抽取的3道题。乙能正确完成每道题的概率为,且每道题完成与否互不影响。记乙能答对的题数为Y,则Y的数学期望为________。
解析 由题意知Y的可能取值为0,1,2,3,且Y~B,则E(Y)=3×=2。
答案 2
6.某学生在参加政治、历史、地理三门课程的学业水平考试中,取得A等级的概率分别为,,,且三门课程的成绩是否取得A等级相互独立。记ξ为该学生取得A等级的课程数,则ξ的数学期望E(ξ)的值为__________。
解析 ξ的可能取值为0,1,2,3。因为P(ξ=0)=××=,P(ξ=1)=××+××+××=,P(ξ=2)=××+××+××=,P(ξ=3)=××=,所以E(ξ)=0×+1×+2×+3×=。
答案
考点一 离散型随机变量的均值
【例1】 (2019·贵阳监测)从A地到B地共有两条路径L1和L2,经过这两条路径所用的时间互不影响,且经过L1和L2所用时间的频率分布直方图分别如图①和②。现甲选择L1或L2在40分钟内从A地到B地,乙选择L1或L2在50分钟内从A地到B地。
(1)求图①中a的值;并回答,为了尽最大可能在各自允许的时间内赶到B地,甲和乙应如何选择各自的路径?
(2)用X表示甲、乙两人中在允许的时间内能赶到B地的人数,针对(1)中的选择方案,求X的分布列和数学期望。
解 (1)(0.01+0.02×3+a)×10=1,解得a=0.03,
用Ai表示甲选择Li(i=1,2)在40分钟内从A地到B地,用Bi表示乙选择Li(i=1,2)在50分钟内从A地到B地,则P(A1)=(0.01+0.02+0.03)×10=0.6,
P(A2)=(0.01+0.04)×10=0.5,
P(A1)>P(A2),所以甲应选择L1。
又P(B1)=(0.01+0.02+0.03+0.02)×10=0.8,P(B2)=(0.01+0.04+0.04)×10=0.9,P(B2)>P(B1),所以乙应选择L2。
(2)用M,N分别表示针对(1)的选择方案,甲、乙两人在各自允许的时间内赶到B地,由(1)知P(M)=0.6,P(N)=0.9,X的可能取值为0,1,2。
由题意知,M,N相互独立,
所以P(X=0)=0.4×0.1=0.04,
P(X=1)=0.4×0.9+0.6×0.1=0.42,
P(X=2)=0.6×0.9=0.54,
所以X的分布列为
X
0
1
2
P
0.04
0.42
0.54
所以E(X)=0×0.04+1×0.42+2×0.54=1.5。
求离散型随机变量的均值与方差关键是确定随机变量的所有可能值,写出随机变量的分布列,正确运用均值、方差公式进行计算。
【变式训练】 随着网络营销和电子商务的兴起,人们的购物方式更具多样化。某调查机构随机抽取10名购物者进行采访,5名男性购物者中有3名倾向于选择网购,2名倾向于选择实体店,5名女性购物者中有2名倾向于选择网购,3名倾向于选择实体店。
(1)若从10名购物者中随机抽取2名,其中男、女各一名,求至少1名倾向于选择实体店的概率;
(2)若从这10名购物者中随机抽取3名,设X表示抽到倾向于选择网购的男性购物者的人数,求X的分布列和数学期望。
解 (1)设“随机抽取2名,其中男、女各一名,至少1名倾向于选择实体店”为事件A,则表示事件“随机抽取2名,其中男、女各一名,都倾向于选择网购”,
则P(A)=1-P()=1-=。
(2)X所有可能的取值为0,1,2,3,
且P(X=k)=,
则P(X=0)==,
P(X=1)==,
P(X=2)==,
P(X=3)==。
所以X的分布列为
X
0
1
2
3
P
E(X)=0×+1×+2×+3×=。
考点二 二项分布的均值与方差
【例2】 (2019·陕西质检)为了解共享单车在A市的使用情况,某调查机构借助网络进行了问卷调查,并从参与调查的网友中随机抽取了200人进行分析,得到如下列联表(单位:人)。
经常使用
偶尔使用或不使用
合计
30岁及以下
70
30
100
30岁以上
60
40
100
合计
130
70
200
(1)根据以上数据,能否在犯错误的概率不超过0.15的前提下认为A市使用共享单车的情况与年龄有关?
(2)①现从所选取的30岁以上的网友中,采用分层抽样的方法选取10人,再从这10人中随机选出3人赠送优惠券,将频率视为概率,求选出的3人中至少有2人经常使用共享单车的概率;
②将频率视为概率,从A市所有参与调查的网友中随机选取10人赠送礼品,记其中经常使用共享单车的人数为X,求X的数学期望和方差。
参考公式:K2=,其中n=a+b+c+d。
参考数据:
P(K2≥k0)
0.15
0.10
0.05
0.025
0.010
k0
2.072
2.706
3.841
5.024
6.635
解 (1)由列联表可知,
K2=≈2.198。
因为2.198>2.072,
所以能在犯错误的概率不超过0.15的前提下认为A市使用共享单车的情况与年龄有关。
(2)①依题意,可知所选取的10名30岁以上的网友中,经常使用共享单车的有10×=6人,偶尔使用或不使用共享单车的有10×=4人。
则选出的3人中至少有2人经常使用共享单车的概率P=+=。
②由列联表可知选到经常使用共享单车的网友的频率为=,
将频率视为概率,即从A市所有参与调查的网友中任意选取1人,恰好选到经常使用共享单车的网友的概率为。
由题意得X~B,
所以E(X)=10×=,
D(X)=10××=。
二项分布的期望与方差
1.如果ξ~B(n,p),则用公式E(ξ)=np;D(ξ)=np(1-p)求解,可大大减少计算量。
2.有些随机变量虽不服从二项分布,但与之具有线性关系的另一随机变量服从二项分布,这时,可以综合应用E(aξ+b)=aE(ξ)+b以及E(ξ)=np求出E(aξ+b),同样还可求出D(aξ+b)。
【变式训练】 电子商务在我国发展迅猛,网上购物成为很多人的选择。某购物网站组织了一次促销活动,在网页的界面上打出广告:高级口香糖,10元钱三瓶,有8种口味供您选择(其中有1种为草莓口味)。小王点击进入网页一看,只见有很多包装完全相同的瓶装口香糖排在一起,看不见具体口味,由购买者随机点击进行选择(各种口味的高级口香糖均超过三瓶,且各种口味的瓶数相同,每点击选择一瓶后,网页自动补充相应的口香糖)。
(1)小王花10元钱买三瓶,请问小王收到货的组合方式共有多少种?
(2)小王花10元钱买三瓶,由小王随机点击三瓶,请列出有小王喜欢的草莓味口香糖的瓶数ξ的分布列,并计算其数学期望和方差。
解 (1)若三瓶口味均不一样,有C=56(种);
若其中两瓶口味一样,有CC=56(种);
若三瓶口味一样,有8种。
故小王收到货的组合方式共有56+56+8=120(种)。
(2)ξ所有可能的取值为0,1,2,3。
因为各种口味的高级口香糖均超过3瓶,且各种口味的瓶数相同,有8种不同口味,所以小王随机点击一次是草莓味口香糖的概率为,
即随机变量ξ服从二项分布,即ξ~B。
P(ξ=0)=C×0×3=,
P(ξ=1)=C×1×2=,
P(ξ=2)=C×2×1=,
P(ξ=3)=C×3×0=。
所以ξ的分布列为
ξ
0
1
2
3
P
数学期望E(ξ)=np=3×=,
方差D(ξ)=np(1-p)=3××=。
考点三 均值与方差在实际决策中的应用
【例3】 (2019·广东六校联考)某市大力推广纯电动汽车,对购买用户依照车辆出厂续驶里程R(单位:千米)的行业标准,予以地方财政补贴,其补贴标准如下表:
出厂续驶里程R/千米
补贴/(万元/辆)
150≤R<250
3
250≤R<350
4
R≥350
4.5
2017年底某部门随机调查该市1 000辆纯电动汽车,统计其出厂续驶里程R,得到频率分布直方图如图所示,用样本估计总体,频率估计概率,解决如下问题:
(1)求该市每辆纯电动汽车2017年地方财政补贴的均值;
(2)某企业统计2017年其充电站100天中各天充电车辆数,得如下频数分布表:
车辆
[5 500,6 500)
[6 500,7 500)
[7 500,8 500)
[8 500,9 500]
天数
20
30
40
10
(同一组中的数据用该组区间的中点值作代表)
2018年2月,国家出台政策,将纯电动汽车财政补贴逐步转移到充电基础设施建设上来,该企业拟将转移补贴资金用于添置新型充电设备。现有直流、交流两种充电桩可供购置,直流充电桩5万元/台,每台每天最多可以充电30辆车,每天维护费用500元/台;交流充电桩1万元/台,每台每天最多可以充电4辆车,每天维护费用80元/台。
该企业现有两种购置方案:
方案一,购买100台直流充电桩和900台交流充电桩;
方案二,购买200台直流充电桩和400台交流充电桩。
假设车辆充电时优先使用新设备,且充电一辆车产生25元的收入,用2017年的统计数据,分别估计该企业在两种方案下新设备产生的日利润(日利润=日收入-日维护费用)。
解 (1)依题意可得纯电动汽车地方财政补贴的分布列为
补贴/(万元/辆)
3
4
4.5
概率
0.2
0.5
0.3
所以该市每辆纯电动汽车2017年地方财政补贴的均值为3×0.2+4×0.5+4.5×0.3=3.95(万元)。
(2)由频数分布表得每天需要充电车辆数的分布列为
辆数
6 000
7 000
8 000
9 000
概率
0.2
0.3
0.4
0.1
若采用方案一,100台直流充电桩和900台交流充电桩每天可充电车辆数为30×100+4×900=6 600,
可得实际充电车辆数的分布列为
实际充电车辆数
6 000
6 600
概率
0.2
0.8
于是估计方案一下新设备产生的日利润为
25×(6 000×0.2+6 600×0.8)-500×100-80×900=40 000(元)。
若采用方案二,200台直流充电桩和400台交流充电桩每天可充电车辆数为30×200+4×400=7 600,
可得实际充电车辆数的分布列为
实际充电车辆数
6 000
7 000
7 600
概率
0.2
0.3
0.5
于是估计方案二下新设备产生的日利润为
25×(6 000×0.2+7 000×0.3+7 600×0.5)-500×200-80×400=45 500(元)。
随机变量的均值反映了随机变量取值的平均水平,方差反映了随机变量稳定于均值的程度,它们从整体和全局上刻画了随机变量,是生产实际中用于方案取舍的重要理论依据。一般先比较均值,若均值相同,再用方差来决定。
【变式训练】 某投资公司在2020年年初准备将1 000万元投资到“低碳”项目上,现有两个项目供选择:
项目一:新能源汽车。据市场调研,投资到该项目上,到年底可能获利30%,也可能亏损15%,且这两种情况发生的概率分别为和;
项目二:通信设备。据市场调研,投资到该项目上,到年底可能获利50%,可能损失30%,也可能不赔不赚,且这三种情况发生的概率分别为,和。
针对以上两个投资项目,请你为投资公司选择一个合理的项目,并说明理由。
解 若按“项目一”投资,设获利为X1万元,则X1的分布列为
X1
300
-150
P
所以E(X1)=300×+(-150)×=200(万元)。
若按“项目二”投资,设获利X2万元,
则X2的分布列为:
X2
500
-300
0
P
所以E(X2)=500×+(-300)×+0×=200(万元)。
D(X1)=(300-200)2×+(-150-200)2×=35 000,
D(X2)=(500-200)2×+(-300-200)2×+(0-200)2×=140 000。
所以E(X1)=E(X2),D(X1)
这说明虽然项目一、项目二获利相等,但项目一更稳妥。
综上所述,建议该投资公司选择项目一投资。
1.(配合例1使用)PM2.5是衡量空气污染程度的一个指标,为了了解某市空气质量情况,从去年每天的PM2.5值的数据中随机抽取40天的数据,其频率分布直方图如图所示。
现将PM2.5的值划分为如下等级
PM2.5值
[0,100)
[100,150)
[150,200)
[200,250]
等级
一级
二级
三级
四级
用频率估计概率。
(1)估计该市在下一年的360天中空气质量为一级天气的天数;
(2)在样本中,按照分层抽样的方法抽取8天的PM2.5值的数据,再从这8个数据中随机抽取5个,求一级、二级、三级、四级天气都有的概率;
(3)如果该市对环境进行治理,治理后经统计,每天PM2.5值X近似满足X~N(115,752),则治理后的PM2.5值的均值比治理前大约下降了多少?
解 (1)由样本空气质量PM2.5的数据的频率分布直方图可知,其频率分布如下表:
PM2.5值
[0,50)
[50,100)
[100,150)
[150,200)
[200,250]
频率
0.125
0.125
0.375
0.25
0.125
由上表可知,如果该市维持现状不变,则该市下一年的某一天空气质量为一级天气的概率为0.25,
因此在360天中约有360×0.25=90天。
(2)在样本中,按照分层抽样的方法抽取8天的PM2.5值数据,则这8个数据中一级、二级、三级、四级天气的数据分别有2个、3个、2个、1个。
从这8个数据中随机抽取5个,则这四种天气都有三种情况:一级天气的数据有2个,其余的均为1个;二级天气的数据有2个,其余的均为1个;三级天气的数据有2个,其余的均为1个。
共有的情况有:CCCC+CCCC+CCCC=24种。
而从8个数据中随机抽取5个,有C=56种情况。
故所求概率为=。
(3)如果该市维持现状不变,则该市的PM2.5值的均值约为E(Y)=25×0.125+75×0.125+125×0.375+175×0.25+225×0.125=131.25。
如果该市对环境进行治理,则该市的PM2.5值X的均值为E(X)=115,
因此该市治理后的PM2.5值的均值比治理前大约下降了16.25。
2.(配合例3使用)某产品按行业生产标准分成8个等级,等级系数X依次为1,2,…,8,其中X≥5为标准A,X≥3为标准B,已知甲厂执行标准A生产该产品,产品的零售价为6元/件;乙厂执行标准B生产该产品,产品的零售价为4元/件。假定甲、乙两厂的产品都符合相应的执行标准。
(1)已知甲厂产品的等级系数X1的概率分布列如下表所示:
X1
5
6
7
8
P
0.4
a
b
0.1
且X1的数学期望E(X1)=6,求a,b的值;
(2)为分析乙厂产品的等级系数X2,从该厂生产的产品中随机抽取30件,相应的等级系数组成一个样本,数据如下:
用这个样本的频率分布估计总体分布,将频率视为概率,求等级系数X2的数学期望。
(3)在(1),(2)的条件下,若以“性价比”为判断标准,则哪个工厂的产品更具可购买性?说明理由。
注:①产品的“性价比”=产品的等级系数的数学期望/产品的零售价;
②“性价比”大的产品更具可购买性。
解 (1)因为E(X1)=6,
所以5×0.4+6a+7b+8×0.1=6,
即6a+7b=3.2,
又0.4+a+b+0.1=1,即a+b=0.5,
所以由得
(2)由已知,用这个样本的频率分布估计总体分布,将频率视为概率,可得等级系数X2的概率分布列如下:
X2
3
4
5
6
7
8
P
0.3
0.2
0.2
0.1
0.1
0.1
所以E(X2)=3×0.3+4×0.2+5×0.2+6×0.1+7×0.1+8×0.1=4.8,即乙厂产品的等级系数X2的数学期望等于4.8。
(3)乙厂的产品更具可购买性,理由如下:
因为甲厂产品的等级系数的数学期望等于6,价格为6元/件,所以其性价比为=1;
因为乙厂产品的等级系数的数学期望等于4.8,价格为4元/件,所以其性价比为=1.2。
又1.2>1,所以乙厂的产品更具可购买性。
概率统计综合问题是高考应用型问题,解决问题需要经历收集数据、整理数据、分析数据、处理数据、得出有用的结论几个复杂过程。如果这几个过程书写步骤缺失则会造成丢分;如果数据处理不当则会陷入庞大的数据运算中,因此解决这类问题首先需要根据题目条件提取有用数据,然后根据统计思想对数据进行相关处理、运算,并按照一定的书写步骤准确无误书写出来,做到步骤不缺失、表述准确无误,下面就如何从概率统计综合问题中迅速提取数据,并作出正确处理及模型构建提供四类典例展示。
类型一 频率分布直方图数据的提取、处理及运算
【例1】 某市某中学的环保社团参照国家环境标准制定了该市空气质量指数与空气质量等级对应关系,如下表(假设该区域空气质量指数不会超过300)。
该社团将该市在2018年100天的空气质量指数监测数据作为样本,绘制的频率分布直方图如图,把该直方图所得频率估计为概率。
(1)请估算2018年(以365天计算)全年该市空气质量优良的天数(未满一天按一天计算);
(2)该市将于2018年12月25、26、27日举办一场国际会议,若这三天中某天出现5级重度污染,则该天需要净化空气费用10万元,出现6级严重污染,则该天需要净化空气费用20万元,假设每天的空气质量等级相互独立,记这三天净化空气总费用为X万元,求X的分布列及数学期望。
解 (1)由直方图可得2018年(以365天计算)全年该市空气质量优良的天数为(0.002+0.004)×50×365=0.3×365=109.5≈110。
(2)由题可知,X的所有可能取值为0,10,20,30,40,50,60,
则P(X=0)=3=,
P(X=10)=C××2=,
P(X=20)=C×2×1+C××2==,
P(X=30)=3+C××C××=,
P(X=40)=C×2×+C×2×=,
P(X=50)=C×2×=,
P(X=60)=3=,
X的分布列为
X
0
10
20
30
40
50
60
P
E(X)=0×+10×+20×+30×+40×+50×+60×=9(万元)。
频率分布直方图是考查数据收集和整理的常用依据,掌握频率分布直方图中常见数据的提取方法是解决这类问题的关键。
类型二 茎叶图数据的提取、处理及运算
【例2】 (2018·武汉调研)甲、乙两名运动员参加“选拔测试赛”,在相同条件下,两人6次测试的成绩(单位:分)记录如下:
甲 86 77 92 72 78 84
乙 78 82 88 82 95 90
(1)用茎叶图表示这两组数据,现要从中选派一名运动员参加比赛,你认为选派谁参赛更好?说明理由(不用计算)。
(2)若将频率视为概率,对运动员甲在今后3次测试中的成绩进行预测,记这3次测试的成绩高于85分的次数为X,求X的分布列和数学期望E(X)及方差D(X)。
解 (1)茎叶图如图:
由图可知乙的平均水平比甲高,故选派乙参赛更好。
(2)由题意得,甲运动员每次测试的成绩高于85分的概率是,3次测试的成绩高于85分的次数X服从二项分布,X~B,X所有可能的取值为0,1,2,3,
所以P(X=0)=C×0×3=,
P(X=1)=C×1×2=,
P(X=2)=C×2×1=,
P(X=3)=C×3×0=,
X的分布列为
X
0
1
2
3
P
E(X)=3×=1,D(X)=3××=。
茎叶图提供了具体的数据,找准各组数据共同的茎及各自的叶是处理此类问题的关键。如果所有数据过大,在计算平均数时,可以将所有数据同时减去一个数字再计算,减去一个数后方差不变,另外除了要掌握各类数据的计算方法以外,还要能从提供的数据的趋势分析预测结果。茎叶图数据很具体,常联系古典概型进行考查。
类型三 表格数据的提取、处理及运算
【例3】 (2019·洛阳高三统考)甲、乙两家外卖公司,其送餐员的日工资方案如下:甲公司,底薪80元,每单送餐员抽成4元;乙公司,无底薪,40单以内(含40单)的部分送餐员每单抽成6元,超出40单的部分送餐员每单抽成7元。假设同一公司的送餐员一天的送餐单数相同,现从这两家公司各随机选取一名送餐员,并分别记录其50天的送餐单数,得到如下频数表:
甲公司送餐员送餐单数频数表
送餐单数
38
39
40
41
42
天数
10
15
10
10
5
乙公司送餐员送餐单数频数表
送餐
单数
38
39
40
41
42
天数
5
10
10
20
5
(1)现从记录甲公司的50天送餐单数中随机抽取3天的送餐单数,求这3天送餐单数都不小于40的概率。
(2)若将频率视为概率,回答下列两个问题:
①记乙公司送餐员日工资为X(单位:元),求X的分布列和数学期望E(X);
②小王打算到甲、乙两家公司中的一家应聘送餐员,如果仅从日工资的角度考虑,请利用所学的统计学知识为小王做出选择,并说明理由。
解 (1)设抽取的3天送餐单数都不小于40为事件M,甲公司记录的50天中,有10+10+5=25天送餐单数不小于40,
则P(M)==。
(2)①设乙公司送餐员的送餐单数为a,
当a=38时,X=38×6=228,
当a=39时,X=39×6=234,
当a=40时,X=40×6=240,
当a=41时,X=40×6+1×7=247,
当a=42时,X=40×6+2×7=254,
所以X的所有可能取值为228,234,240,247,254。
故X的分布列为
X
228
234
240
247
254
P
所以E(X)=228×+234×+240×+247×+254×=241.8。
②依题意,甲公司送餐员的日平均送餐单数为
38×0.2+39×0.3+40×0.2+41×0.2+42×0.1=39.7,
所以甲公司送餐员的日平均工资为80+4×39.7=238.8元。
由①得乙公司送餐员的日平均工资为241.8元。
因为238.8<241.8,所以推荐小王去乙公司应聘。
处理表格数据的关键是搞清表格中各行、各列数的意义,特别表格中最后一行或最后一列中的数据多为合计(或总计)。
类型四 折线图中数据的提取、处理及运算
【例4】 (2019·广州高三调研)某基地蔬菜大棚采用无土栽培方式种植各类蔬菜。根据过去50周的资料显示,该地周光照量X(小时)都在30小时以上,其中不足50小时的有5周,不低于50小时且不超过70小时的有35周,超过70小时的有10周。根据统计,该基地的西红柿增加量y(千克)与使用某种液体肥料的质量x(千克)之间的关系为如图所示的折线图。
(1)依据折线图,是否可用线性回归模型拟合y与x的关系?请计算相关系数r并加以说明(精确到0.01)。(若|r|>0.75,则线性相关程度很高,可用线性回归模型拟合)
(2)蔬菜大棚对光照要求较大,某光照控制仪商家为该基地提供了部分光照控制仪,但每周光照控制仪运行台数受周光照量X限制,并有如下关系:
周光照量X
(单位:小时)
30
50≤X≤70
X>70
光照控制仪最多
可运行台数
3
2
1
若某台光照控制仪运行,则该台光照控制仪周利润为3 000元;若某台光照控制仪未运行,则该台光照控制仪周亏损1 000元。以频率作为概率,商家欲使周总利润的均值达到最大,应安装光照控制仪多少台?
附:相关系数公式r=,
参考数据:≈0.55,≈0.95。
解 (1)由已知数据可得
==5,
==4。
因为(xi-)(yi-)=(-3)×(-1)+0+0+0+3×1=6,
==2,
==。
所以相关系数
r=
== ≈0.95。
因为r>0.75,所以可用线性回归模型拟合y与x的关系。
(2)记商家周总利润为Y元,由条件可知至少需安装1台,最多安装3台光照控制仪。
①安装1台光照控制仪可获得周总利润3 000元。②安装2台光照控制仪的情形:
当X>70时,只有1台光照控制仪运行,此时周总利润Y=3 000-1 000=2 000(元),P(Y=2 000)==0.2,
当30
故Y的分布列为
Y
2 000
6 000
P
0.2
0.8
所以E(Y)=2 000×0.2+6 000×0.8=5 200(元)。
③安装3台光照控制仪的情形:
当X>70时,只有1台光照控制仪运行,此时周总利润Y=1×3 000-2×1 000=1 000(元),P(Y=1 000)==0.2,
当50≤X≤70时,有2台光照控制仪运行,此时周总利润Y=2×3 000-1×1 000=5 000(元),P(Y=5 000)==0.7,
当30
故Y的分布列为
Y
1 000
5 000
9 000
P
0.2
0.7
0.1
所以E(Y)=1 000×0.2+5 000×0.7+9 000×0.1=4 600(元)。
综上可知,为使商家周总利润的均值达到最大,应该安装2台光照控制仪。
1.折线图中拐点处的坐标是我们提取数据的关键点,注意横坐标、纵坐标的意义即可。
2.“最小二乘法”求回归方程,计算是这类问题的难点,需要根据题目中提供的数据进行分析,从而求解回归方程=x+,其中求是问题的关键,计算出后,可以将样本点的中心(,)代入方程求解出。
第八节 离散型随机变量的均值与方差
2019考纲考题考情
1.离散型随机变量的均值与方差
若离散型随机变量X的分布列为
X
x1
x2
…
xi
…
xn
P
p1
p2
…
pi
…
pn
(1)均值:称E(X)=x1p1+x2p2+…+xipi+…+xnpn为随机变量X的均值或数学期望,它反映了离散型随机变量取值的平均水平。
(2)D(X)=(xi-E(X))2pi为随机变量X的方差,它刻画了随机变量X与其均值E(X)的平均偏离程度,其算术平方根为随机变量X的标准差。
2.均值与方差的性质
(1)E(aX+b)=aE(X)+b。
(2)D(aX+b)=a2D(X)(a,b为常数)。
3.两点分布与二项分布的均值、方差
X
X服从两点分布
X~B(n,p)
E(X)
p(p为成功概率)
np
D(X)
p(1-p)
np(1-p)
1.均值E(X)是一个实数,由X的分布列唯一确定,即X作为随机变量是可变的,而E(X)是不变的,它描述X值的取值平均状态。
2.已知随机变量的分布列求它的均值、方差和标准差,可直接按定义(公式)求解。若所给随机变量服从两点分布或二项分布等,则可直接利用它们的均值、方差公式求解。
一、走进教材
1.(选修2-3P68A组T1改编)已知X的分布列为
X
-1
0
1
P
设Y=2X+3,则E(Y)的值为( )
A. B.4 C.-1 D.1
解析 E(X)=-+=-,E(Y)=E(2X+3)=2E(X)+3=-+3=。故选A。
答案 A
2.(选修2-3P68A组T5改编)甲、乙两工人在一天生产中出现的废品数分别是两个随机变量X,Y,其分布列分别为:
X
0
1
2
3
P
0.4
0.3
0.2
0.1
Y
0
1
2
P
0.3
0.5
0.2
若甲、乙两人的日产量相等,则甲、乙两人中技术较好的是________。
解析 E(X)=0×0.4+1×0.3+2×0.2+3×0.1=1。E(Y)=0×0.3+1×0.5+2×0.2=0.9,因为E(Y)
二、走近高考
3.(2018·浙江高考)设0 ξ
0
1
2
P
则当p在(0,1)内增大时( )
A.D(ξ)减小 B.D(ξ)增大
C.D(ξ)先减小后增大 D.D(ξ)先增大后减小
解析 由题可得E(ξ)=+p,所以D(ξ)=-p2+p+=-2+,所以当p在(0,1)内增大时,D(ξ)先增大后减小。故选D。
答案 D
三、走出误区
微提醒:①期望、方差的性质不熟导致错误;②二项分布的数学期望公式用法不当;③求错分布列,导致E(ξ)出错。
4.已知两个随机变量X,Y满足X+2Y=4,且X~N(1,22),则E(Y),D(Y)依次是________。
解析 由X~N(1,22)得E(X)=1,D(X)=4。又X+2Y=4,所以Y=2-,所以E(Y)=2-E(X)=,D(Y)=D(X)=1。
答案 ,1
5.在一次招聘中,主考官要求应聘者从6道备选题中一次性随机抽取3道题,并独立完成所抽取的3道题。乙能正确完成每道题的概率为,且每道题完成与否互不影响。记乙能答对的题数为Y,则Y的数学期望为________。
解析 由题意知Y的可能取值为0,1,2,3,且Y~B,则E(Y)=3×=2。
答案 2
6.某学生在参加政治、历史、地理三门课程的学业水平考试中,取得A等级的概率分别为,,,且三门课程的成绩是否取得A等级相互独立。记ξ为该学生取得A等级的课程数,则ξ的数学期望E(ξ)的值为__________。
解析 ξ的可能取值为0,1,2,3。因为P(ξ=0)=××=,P(ξ=1)=××+××+××=,P(ξ=2)=××+××+××=,P(ξ=3)=××=,所以E(ξ)=0×+1×+2×+3×=。
答案
考点一 离散型随机变量的均值
【例1】 (2019·贵阳监测)从A地到B地共有两条路径L1和L2,经过这两条路径所用的时间互不影响,且经过L1和L2所用时间的频率分布直方图分别如图①和②。现甲选择L1或L2在40分钟内从A地到B地,乙选择L1或L2在50分钟内从A地到B地。
(1)求图①中a的值;并回答,为了尽最大可能在各自允许的时间内赶到B地,甲和乙应如何选择各自的路径?
(2)用X表示甲、乙两人中在允许的时间内能赶到B地的人数,针对(1)中的选择方案,求X的分布列和数学期望。
解 (1)(0.01+0.02×3+a)×10=1,解得a=0.03,
用Ai表示甲选择Li(i=1,2)在40分钟内从A地到B地,用Bi表示乙选择Li(i=1,2)在50分钟内从A地到B地,则P(A1)=(0.01+0.02+0.03)×10=0.6,
P(A2)=(0.01+0.04)×10=0.5,
P(A1)>P(A2),所以甲应选择L1。
又P(B1)=(0.01+0.02+0.03+0.02)×10=0.8,P(B2)=(0.01+0.04+0.04)×10=0.9,P(B2)>P(B1),所以乙应选择L2。
(2)用M,N分别表示针对(1)的选择方案,甲、乙两人在各自允许的时间内赶到B地,由(1)知P(M)=0.6,P(N)=0.9,X的可能取值为0,1,2。
由题意知,M,N相互独立,
所以P(X=0)=0.4×0.1=0.04,
P(X=1)=0.4×0.9+0.6×0.1=0.42,
P(X=2)=0.6×0.9=0.54,
所以X的分布列为
X
0
1
2
P
0.04
0.42
0.54
所以E(X)=0×0.04+1×0.42+2×0.54=1.5。
求离散型随机变量的均值与方差关键是确定随机变量的所有可能值,写出随机变量的分布列,正确运用均值、方差公式进行计算。
【变式训练】 随着网络营销和电子商务的兴起,人们的购物方式更具多样化。某调查机构随机抽取10名购物者进行采访,5名男性购物者中有3名倾向于选择网购,2名倾向于选择实体店,5名女性购物者中有2名倾向于选择网购,3名倾向于选择实体店。
(1)若从10名购物者中随机抽取2名,其中男、女各一名,求至少1名倾向于选择实体店的概率;
(2)若从这10名购物者中随机抽取3名,设X表示抽到倾向于选择网购的男性购物者的人数,求X的分布列和数学期望。
解 (1)设“随机抽取2名,其中男、女各一名,至少1名倾向于选择实体店”为事件A,则表示事件“随机抽取2名,其中男、女各一名,都倾向于选择网购”,
则P(A)=1-P()=1-=。
(2)X所有可能的取值为0,1,2,3,
且P(X=k)=,
则P(X=0)==,
P(X=1)==,
P(X=2)==,
P(X=3)==。
所以X的分布列为
X
0
1
2
3
P
E(X)=0×+1×+2×+3×=。
考点二 二项分布的均值与方差
【例2】 (2019·陕西质检)为了解共享单车在A市的使用情况,某调查机构借助网络进行了问卷调查,并从参与调查的网友中随机抽取了200人进行分析,得到如下列联表(单位:人)。
经常使用
偶尔使用或不使用
合计
30岁及以下
70
30
100
30岁以上
60
40
100
合计
130
70
200
(1)根据以上数据,能否在犯错误的概率不超过0.15的前提下认为A市使用共享单车的情况与年龄有关?
(2)①现从所选取的30岁以上的网友中,采用分层抽样的方法选取10人,再从这10人中随机选出3人赠送优惠券,将频率视为概率,求选出的3人中至少有2人经常使用共享单车的概率;
②将频率视为概率,从A市所有参与调查的网友中随机选取10人赠送礼品,记其中经常使用共享单车的人数为X,求X的数学期望和方差。
参考公式:K2=,其中n=a+b+c+d。
参考数据:
P(K2≥k0)
0.15
0.10
0.05
0.025
0.010
k0
2.072
2.706
3.841
5.024
6.635
解 (1)由列联表可知,
K2=≈2.198。
因为2.198>2.072,
所以能在犯错误的概率不超过0.15的前提下认为A市使用共享单车的情况与年龄有关。
(2)①依题意,可知所选取的10名30岁以上的网友中,经常使用共享单车的有10×=6人,偶尔使用或不使用共享单车的有10×=4人。
则选出的3人中至少有2人经常使用共享单车的概率P=+=。
②由列联表可知选到经常使用共享单车的网友的频率为=,
将频率视为概率,即从A市所有参与调查的网友中任意选取1人,恰好选到经常使用共享单车的网友的概率为。
由题意得X~B,
所以E(X)=10×=,
D(X)=10××=。
二项分布的期望与方差
1.如果ξ~B(n,p),则用公式E(ξ)=np;D(ξ)=np(1-p)求解,可大大减少计算量。
2.有些随机变量虽不服从二项分布,但与之具有线性关系的另一随机变量服从二项分布,这时,可以综合应用E(aξ+b)=aE(ξ)+b以及E(ξ)=np求出E(aξ+b),同样还可求出D(aξ+b)。
【变式训练】 电子商务在我国发展迅猛,网上购物成为很多人的选择。某购物网站组织了一次促销活动,在网页的界面上打出广告:高级口香糖,10元钱三瓶,有8种口味供您选择(其中有1种为草莓口味)。小王点击进入网页一看,只见有很多包装完全相同的瓶装口香糖排在一起,看不见具体口味,由购买者随机点击进行选择(各种口味的高级口香糖均超过三瓶,且各种口味的瓶数相同,每点击选择一瓶后,网页自动补充相应的口香糖)。
(1)小王花10元钱买三瓶,请问小王收到货的组合方式共有多少种?
(2)小王花10元钱买三瓶,由小王随机点击三瓶,请列出有小王喜欢的草莓味口香糖的瓶数ξ的分布列,并计算其数学期望和方差。
解 (1)若三瓶口味均不一样,有C=56(种);
若其中两瓶口味一样,有CC=56(种);
若三瓶口味一样,有8种。
故小王收到货的组合方式共有56+56+8=120(种)。
(2)ξ所有可能的取值为0,1,2,3。
因为各种口味的高级口香糖均超过3瓶,且各种口味的瓶数相同,有8种不同口味,所以小王随机点击一次是草莓味口香糖的概率为,
即随机变量ξ服从二项分布,即ξ~B。
P(ξ=0)=C×0×3=,
P(ξ=1)=C×1×2=,
P(ξ=2)=C×2×1=,
P(ξ=3)=C×3×0=。
所以ξ的分布列为
ξ
0
1
2
3
P
数学期望E(ξ)=np=3×=,
方差D(ξ)=np(1-p)=3××=。
考点三 均值与方差在实际决策中的应用
【例3】 (2019·广东六校联考)某市大力推广纯电动汽车,对购买用户依照车辆出厂续驶里程R(单位:千米)的行业标准,予以地方财政补贴,其补贴标准如下表:
出厂续驶里程R/千米
补贴/(万元/辆)
150≤R<250
3
250≤R<350
4
R≥350
4.5
2017年底某部门随机调查该市1 000辆纯电动汽车,统计其出厂续驶里程R,得到频率分布直方图如图所示,用样本估计总体,频率估计概率,解决如下问题:
(1)求该市每辆纯电动汽车2017年地方财政补贴的均值;
(2)某企业统计2017年其充电站100天中各天充电车辆数,得如下频数分布表:
车辆
[5 500,6 500)
[6 500,7 500)
[7 500,8 500)
[8 500,9 500]
天数
20
30
40
10
(同一组中的数据用该组区间的中点值作代表)
2018年2月,国家出台政策,将纯电动汽车财政补贴逐步转移到充电基础设施建设上来,该企业拟将转移补贴资金用于添置新型充电设备。现有直流、交流两种充电桩可供购置,直流充电桩5万元/台,每台每天最多可以充电30辆车,每天维护费用500元/台;交流充电桩1万元/台,每台每天最多可以充电4辆车,每天维护费用80元/台。
该企业现有两种购置方案:
方案一,购买100台直流充电桩和900台交流充电桩;
方案二,购买200台直流充电桩和400台交流充电桩。
假设车辆充电时优先使用新设备,且充电一辆车产生25元的收入,用2017年的统计数据,分别估计该企业在两种方案下新设备产生的日利润(日利润=日收入-日维护费用)。
解 (1)依题意可得纯电动汽车地方财政补贴的分布列为
补贴/(万元/辆)
3
4
4.5
概率
0.2
0.5
0.3
所以该市每辆纯电动汽车2017年地方财政补贴的均值为3×0.2+4×0.5+4.5×0.3=3.95(万元)。
(2)由频数分布表得每天需要充电车辆数的分布列为
辆数
6 000
7 000
8 000
9 000
概率
0.2
0.3
0.4
0.1
若采用方案一,100台直流充电桩和900台交流充电桩每天可充电车辆数为30×100+4×900=6 600,
可得实际充电车辆数的分布列为
实际充电车辆数
6 000
6 600
概率
0.2
0.8
于是估计方案一下新设备产生的日利润为
25×(6 000×0.2+6 600×0.8)-500×100-80×900=40 000(元)。
若采用方案二,200台直流充电桩和400台交流充电桩每天可充电车辆数为30×200+4×400=7 600,
可得实际充电车辆数的分布列为
实际充电车辆数
6 000
7 000
7 600
概率
0.2
0.3
0.5
于是估计方案二下新设备产生的日利润为
25×(6 000×0.2+7 000×0.3+7 600×0.5)-500×200-80×400=45 500(元)。
随机变量的均值反映了随机变量取值的平均水平,方差反映了随机变量稳定于均值的程度,它们从整体和全局上刻画了随机变量,是生产实际中用于方案取舍的重要理论依据。一般先比较均值,若均值相同,再用方差来决定。
【变式训练】 某投资公司在2020年年初准备将1 000万元投资到“低碳”项目上,现有两个项目供选择:
项目一:新能源汽车。据市场调研,投资到该项目上,到年底可能获利30%,也可能亏损15%,且这两种情况发生的概率分别为和;
项目二:通信设备。据市场调研,投资到该项目上,到年底可能获利50%,可能损失30%,也可能不赔不赚,且这三种情况发生的概率分别为,和。
针对以上两个投资项目,请你为投资公司选择一个合理的项目,并说明理由。
解 若按“项目一”投资,设获利为X1万元,则X1的分布列为
X1
300
-150
P
所以E(X1)=300×+(-150)×=200(万元)。
若按“项目二”投资,设获利X2万元,
则X2的分布列为:
X2
500
-300
0
P
所以E(X2)=500×+(-300)×+0×=200(万元)。
D(X1)=(300-200)2×+(-150-200)2×=35 000,
D(X2)=(500-200)2×+(-300-200)2×+(0-200)2×=140 000。
所以E(X1)=E(X2),D(X1)
综上所述,建议该投资公司选择项目一投资。
1.(配合例1使用)PM2.5是衡量空气污染程度的一个指标,为了了解某市空气质量情况,从去年每天的PM2.5值的数据中随机抽取40天的数据,其频率分布直方图如图所示。
现将PM2.5的值划分为如下等级
PM2.5值
[0,100)
[100,150)
[150,200)
[200,250]
等级
一级
二级
三级
四级
用频率估计概率。
(1)估计该市在下一年的360天中空气质量为一级天气的天数;
(2)在样本中,按照分层抽样的方法抽取8天的PM2.5值的数据,再从这8个数据中随机抽取5个,求一级、二级、三级、四级天气都有的概率;
(3)如果该市对环境进行治理,治理后经统计,每天PM2.5值X近似满足X~N(115,752),则治理后的PM2.5值的均值比治理前大约下降了多少?
解 (1)由样本空气质量PM2.5的数据的频率分布直方图可知,其频率分布如下表:
PM2.5值
[0,50)
[50,100)
[100,150)
[150,200)
[200,250]
频率
0.125
0.125
0.375
0.25
0.125
由上表可知,如果该市维持现状不变,则该市下一年的某一天空气质量为一级天气的概率为0.25,
因此在360天中约有360×0.25=90天。
(2)在样本中,按照分层抽样的方法抽取8天的PM2.5值数据,则这8个数据中一级、二级、三级、四级天气的数据分别有2个、3个、2个、1个。
从这8个数据中随机抽取5个,则这四种天气都有三种情况:一级天气的数据有2个,其余的均为1个;二级天气的数据有2个,其余的均为1个;三级天气的数据有2个,其余的均为1个。
共有的情况有:CCCC+CCCC+CCCC=24种。
而从8个数据中随机抽取5个,有C=56种情况。
故所求概率为=。
(3)如果该市维持现状不变,则该市的PM2.5值的均值约为E(Y)=25×0.125+75×0.125+125×0.375+175×0.25+225×0.125=131.25。
如果该市对环境进行治理,则该市的PM2.5值X的均值为E(X)=115,
因此该市治理后的PM2.5值的均值比治理前大约下降了16.25。
2.(配合例3使用)某产品按行业生产标准分成8个等级,等级系数X依次为1,2,…,8,其中X≥5为标准A,X≥3为标准B,已知甲厂执行标准A生产该产品,产品的零售价为6元/件;乙厂执行标准B生产该产品,产品的零售价为4元/件。假定甲、乙两厂的产品都符合相应的执行标准。
(1)已知甲厂产品的等级系数X1的概率分布列如下表所示:
X1
5
6
7
8
P
0.4
a
b
0.1
且X1的数学期望E(X1)=6,求a,b的值;
(2)为分析乙厂产品的等级系数X2,从该厂生产的产品中随机抽取30件,相应的等级系数组成一个样本,数据如下:
用这个样本的频率分布估计总体分布,将频率视为概率,求等级系数X2的数学期望。
(3)在(1),(2)的条件下,若以“性价比”为判断标准,则哪个工厂的产品更具可购买性?说明理由。
注:①产品的“性价比”=产品的等级系数的数学期望/产品的零售价;
②“性价比”大的产品更具可购买性。
解 (1)因为E(X1)=6,
所以5×0.4+6a+7b+8×0.1=6,
即6a+7b=3.2,
又0.4+a+b+0.1=1,即a+b=0.5,
所以由得
(2)由已知,用这个样本的频率分布估计总体分布,将频率视为概率,可得等级系数X2的概率分布列如下:
X2
3
4
5
6
7
8
P
0.3
0.2
0.2
0.1
0.1
0.1
所以E(X2)=3×0.3+4×0.2+5×0.2+6×0.1+7×0.1+8×0.1=4.8,即乙厂产品的等级系数X2的数学期望等于4.8。
(3)乙厂的产品更具可购买性,理由如下:
因为甲厂产品的等级系数的数学期望等于6,价格为6元/件,所以其性价比为=1;
因为乙厂产品的等级系数的数学期望等于4.8,价格为4元/件,所以其性价比为=1.2。
又1.2>1,所以乙厂的产品更具可购买性。
概率统计综合问题是高考应用型问题,解决问题需要经历收集数据、整理数据、分析数据、处理数据、得出有用的结论几个复杂过程。如果这几个过程书写步骤缺失则会造成丢分;如果数据处理不当则会陷入庞大的数据运算中,因此解决这类问题首先需要根据题目条件提取有用数据,然后根据统计思想对数据进行相关处理、运算,并按照一定的书写步骤准确无误书写出来,做到步骤不缺失、表述准确无误,下面就如何从概率统计综合问题中迅速提取数据,并作出正确处理及模型构建提供四类典例展示。
类型一 频率分布直方图数据的提取、处理及运算
【例1】 某市某中学的环保社团参照国家环境标准制定了该市空气质量指数与空气质量等级对应关系,如下表(假设该区域空气质量指数不会超过300)。
该社团将该市在2018年100天的空气质量指数监测数据作为样本,绘制的频率分布直方图如图,把该直方图所得频率估计为概率。
(1)请估算2018年(以365天计算)全年该市空气质量优良的天数(未满一天按一天计算);
(2)该市将于2018年12月25、26、27日举办一场国际会议,若这三天中某天出现5级重度污染,则该天需要净化空气费用10万元,出现6级严重污染,则该天需要净化空气费用20万元,假设每天的空气质量等级相互独立,记这三天净化空气总费用为X万元,求X的分布列及数学期望。
解 (1)由直方图可得2018年(以365天计算)全年该市空气质量优良的天数为(0.002+0.004)×50×365=0.3×365=109.5≈110。
(2)由题可知,X的所有可能取值为0,10,20,30,40,50,60,
则P(X=0)=3=,
P(X=10)=C××2=,
P(X=20)=C×2×1+C××2==,
P(X=30)=3+C××C××=,
P(X=40)=C×2×+C×2×=,
P(X=50)=C×2×=,
P(X=60)=3=,
X的分布列为
X
0
10
20
30
40
50
60
P
E(X)=0×+10×+20×+30×+40×+50×+60×=9(万元)。
频率分布直方图是考查数据收集和整理的常用依据,掌握频率分布直方图中常见数据的提取方法是解决这类问题的关键。
类型二 茎叶图数据的提取、处理及运算
【例2】 (2018·武汉调研)甲、乙两名运动员参加“选拔测试赛”,在相同条件下,两人6次测试的成绩(单位:分)记录如下:
甲 86 77 92 72 78 84
乙 78 82 88 82 95 90
(1)用茎叶图表示这两组数据,现要从中选派一名运动员参加比赛,你认为选派谁参赛更好?说明理由(不用计算)。
(2)若将频率视为概率,对运动员甲在今后3次测试中的成绩进行预测,记这3次测试的成绩高于85分的次数为X,求X的分布列和数学期望E(X)及方差D(X)。
解 (1)茎叶图如图:
由图可知乙的平均水平比甲高,故选派乙参赛更好。
(2)由题意得,甲运动员每次测试的成绩高于85分的概率是,3次测试的成绩高于85分的次数X服从二项分布,X~B,X所有可能的取值为0,1,2,3,
所以P(X=0)=C×0×3=,
P(X=1)=C×1×2=,
P(X=2)=C×2×1=,
P(X=3)=C×3×0=,
X的分布列为
X
0
1
2
3
P
E(X)=3×=1,D(X)=3××=。
茎叶图提供了具体的数据,找准各组数据共同的茎及各自的叶是处理此类问题的关键。如果所有数据过大,在计算平均数时,可以将所有数据同时减去一个数字再计算,减去一个数后方差不变,另外除了要掌握各类数据的计算方法以外,还要能从提供的数据的趋势分析预测结果。茎叶图数据很具体,常联系古典概型进行考查。
类型三 表格数据的提取、处理及运算
【例3】 (2019·洛阳高三统考)甲、乙两家外卖公司,其送餐员的日工资方案如下:甲公司,底薪80元,每单送餐员抽成4元;乙公司,无底薪,40单以内(含40单)的部分送餐员每单抽成6元,超出40单的部分送餐员每单抽成7元。假设同一公司的送餐员一天的送餐单数相同,现从这两家公司各随机选取一名送餐员,并分别记录其50天的送餐单数,得到如下频数表:
甲公司送餐员送餐单数频数表
送餐单数
38
39
40
41
42
天数
10
15
10
10
5
乙公司送餐员送餐单数频数表
送餐
单数
38
39
40
41
42
天数
5
10
10
20
5
(1)现从记录甲公司的50天送餐单数中随机抽取3天的送餐单数,求这3天送餐单数都不小于40的概率。
(2)若将频率视为概率,回答下列两个问题:
①记乙公司送餐员日工资为X(单位:元),求X的分布列和数学期望E(X);
②小王打算到甲、乙两家公司中的一家应聘送餐员,如果仅从日工资的角度考虑,请利用所学的统计学知识为小王做出选择,并说明理由。
解 (1)设抽取的3天送餐单数都不小于40为事件M,甲公司记录的50天中,有10+10+5=25天送餐单数不小于40,
则P(M)==。
(2)①设乙公司送餐员的送餐单数为a,
当a=38时,X=38×6=228,
当a=39时,X=39×6=234,
当a=40时,X=40×6=240,
当a=41时,X=40×6+1×7=247,
当a=42时,X=40×6+2×7=254,
所以X的所有可能取值为228,234,240,247,254。
故X的分布列为
X
228
234
240
247
254
P
所以E(X)=228×+234×+240×+247×+254×=241.8。
②依题意,甲公司送餐员的日平均送餐单数为
38×0.2+39×0.3+40×0.2+41×0.2+42×0.1=39.7,
所以甲公司送餐员的日平均工资为80+4×39.7=238.8元。
由①得乙公司送餐员的日平均工资为241.8元。
因为238.8<241.8,所以推荐小王去乙公司应聘。
处理表格数据的关键是搞清表格中各行、各列数的意义,特别表格中最后一行或最后一列中的数据多为合计(或总计)。
类型四 折线图中数据的提取、处理及运算
【例4】 (2019·广州高三调研)某基地蔬菜大棚采用无土栽培方式种植各类蔬菜。根据过去50周的资料显示,该地周光照量X(小时)都在30小时以上,其中不足50小时的有5周,不低于50小时且不超过70小时的有35周,超过70小时的有10周。根据统计,该基地的西红柿增加量y(千克)与使用某种液体肥料的质量x(千克)之间的关系为如图所示的折线图。
(1)依据折线图,是否可用线性回归模型拟合y与x的关系?请计算相关系数r并加以说明(精确到0.01)。(若|r|>0.75,则线性相关程度很高,可用线性回归模型拟合)
(2)蔬菜大棚对光照要求较大,某光照控制仪商家为该基地提供了部分光照控制仪,但每周光照控制仪运行台数受周光照量X限制,并有如下关系:
周光照量X
(单位:小时)
30
X>70
光照控制仪最多
可运行台数
3
2
1
若某台光照控制仪运行,则该台光照控制仪周利润为3 000元;若某台光照控制仪未运行,则该台光照控制仪周亏损1 000元。以频率作为概率,商家欲使周总利润的均值达到最大,应安装光照控制仪多少台?
附:相关系数公式r=,
参考数据:≈0.55,≈0.95。
解 (1)由已知数据可得
==5,
==4。
因为(xi-)(yi-)=(-3)×(-1)+0+0+0+3×1=6,
==2,
==。
所以相关系数
r=
== ≈0.95。
因为r>0.75,所以可用线性回归模型拟合y与x的关系。
(2)记商家周总利润为Y元,由条件可知至少需安装1台,最多安装3台光照控制仪。
①安装1台光照控制仪可获得周总利润3 000元。②安装2台光照控制仪的情形:
当X>70时,只有1台光照控制仪运行,此时周总利润Y=3 000-1 000=2 000(元),P(Y=2 000)==0.2,
当30
Y
2 000
6 000
P
0.2
0.8
所以E(Y)=2 000×0.2+6 000×0.8=5 200(元)。
③安装3台光照控制仪的情形:
当X>70时,只有1台光照控制仪运行,此时周总利润Y=1×3 000-2×1 000=1 000(元),P(Y=1 000)==0.2,
当50≤X≤70时,有2台光照控制仪运行,此时周总利润Y=2×3 000-1×1 000=5 000(元),P(Y=5 000)==0.7,
当30
Y
1 000
5 000
9 000
P
0.2
0.7
0.1
所以E(Y)=1 000×0.2+5 000×0.7+9 000×0.1=4 600(元)。
综上可知,为使商家周总利润的均值达到最大,应该安装2台光照控制仪。
1.折线图中拐点处的坐标是我们提取数据的关键点,注意横坐标、纵坐标的意义即可。
2.“最小二乘法”求回归方程,计算是这类问题的难点,需要根据题目中提供的数据进行分析,从而求解回归方程=x+,其中求是问题的关键,计算出后,可以将样本点的中心(,)代入方程求解出。
相关资料
更多