专题17 随机变量及其分布(公式、定理、结论图表)-备战2024年新高考数学必背知识手册
展开 随机变量及其分布(公式、定理、结论图表)
一、 条件概率的概念
1.定义
条件概率揭示了P(A),P(AB),P()三者之间“知二求一”的关系
设、为两个事件,且,在已知事件发生的条件下,事件B发生的概率叫做条件概率。用符号表示。读作:发生的条件下B发生的概率。
2.P(A|B)、P(AB)、P(B)的区别
P(A|B)是在事件B发生的条件下,事件A发生的概率。
P(AB)是事件A与事件B同时发生的概率,无附加条件。
P(B)是事件B发生的概率,无附加条件.
它们的联系是:.
二、条件概率的公式与性质
1.计算事件B发生的条件下事件A发生的条件概率,常有以下两种方式:
①利用定义计算.
先分别计算概率P(AB)及P(B),然后借助于条件概率公式求解.
②利用缩小样本空间的观点计算.
在这里,原来的样本空间缩小为已知的条件事件B,原来的事件A缩小为事件AB,从而,即:,此法常应用于古典概型中的条件概率求解.
2.条件概率公式的变形.
公式揭示了P(B)、P(A|B)、P(AB)的关系,常常用于知二求一,即要熟练应用它的变形公式如,若P(B)>0,则P(AB)=P(B)·P(A|B),该式称为概率的乘法公式.
3.条件概率的性质
设P(A)>0,则
①
②如果B与C是两个互斥事件,则
③设和互为对立事件,则
三、相互独立事件
1.定义:
事件(或)是否发生对事件(或)发生的概率没有影响,即,这样的两个事件叫做相互独立事件。
若与是相互独立事件,则与,与,与也相互独立。
2.相互独立事件同时发生的概率公式:
对于事件A和事件B,用表示事件A、B同时发生。
(1)若与是相互独立事件,则;
(2)若事件相互独立,那么这个事件同时发生的概率,等于每个事件发生的概率的积,
即:。
3.相互独立事件与互斥事件的比较
互斥事件与相互独立事件是两个不同的概念,它们之间没有直接关系。
互斥事件是指两个事件不可能同时发生,而相互独立事件是指一个事件是否发生对另一个事件发生的概率没有影响。
一般地,两个事件不可能既互斥又相互独立,因为互斥事件是不可能同时发生的,而相互独立事件是以它们能够同时发生为前提的。相互独立事件同时发生的概率等于每个事件发生的概率的积,这一点与互斥事件的概率和也是不同的。
4. 几种事件的概率公式的比较
已知两个事件A,B,它们发生的概率为P(A),P(B),将A,B中至少有一个发生记为事件A+B,都发生记为事件A·B,都不发生记为事件,恰有一个发生记为事件,至多有一个发生记为事件,则它们的概率间的关系如下表所示:
概率
A,B互斥
A,B相互独立
P(A+B)
P(A)+P(B)
P(A·B)
0
P(A)·P(B)
1-[P(A)+P(B)]
P(A)+P(B)
1
1-P(A)·P(B)
四、全概率公式
1.全概率公式的定义
一般地,设是一组两两互斥的事件,,且,,则对任意的事件,有
.
我们称上面的公式为全概率公式(total probability formula).全概率公式是概率论中最基本的公式之一.
2.贝叶斯公式
*贝叶斯公式:设A1,A2,…,An是一组两两互斥的事件,A1∪A2∪…∪An=Ω,且P(Ai)>0,i=1,2,…,n,则对任意的事件B⊆Ω,P(B)>0,有P(Ai|B)==,i=1,2,…,n.
贝叶斯公式的内含
(1)公式P(A1|B)==反映了P(A1B),P(A1),P(B),P(A1|B),P(B|A1)之间的互化关系.
(2)P(A1)称为先验概率,P(A1|B)称为后验概率,其反映了事情A1发生的可能在各种可能原因中的比重.
五、随机变量和离散型随机变量
1. “随机试验”的概念
一般地,一个试验如果满足下列条件:
a.试验可以在相同的情形下重复进行.
B.试验的所有可能结果是明确可知的,并且不止一个.
c.每次试验总是恰好出现这些可能结果中的一个,但在试验之前却不能肯定这次试验会出现哪一个结果.
这种试验就是一个随机试验,为了方便起见,也简称试验.
2.随机变量的定义
一般地,如果随机试验的结果,可以用一个变量来表示,那么这样的变量叫做随机变量.
通常用大写拉丁字母X,Y,Z(或小写希腊字母ξ,η,ζ)等表示。
3.离散型随机变量的定义
如果对于随机变量可能取的值,可以按一定次序一一列出,这样的随机变量叫做离散型随机变量。
离散型随机变量的例子很多.例如某人射击一次可能命中的环数 X 是一个离散型随机变量,它的所有可能取值为0,1,…,10;某网页在24小时内被浏览的次数Y也是一个离散型随机变量,它的所有可能取值为0, 1,2,….
4. 随机变量的分类
随机变量有以下两种:
(1) 离散型随机变量:
(2) 连续型随机变量: 如果随机变量可以取其一区间内的一切值,这样的随机变量叫做连续型随机变量.
5. 若是随机变量,其中a,b是常数,则也是随机变量,并且不改变其属性(离散型、连续型)。
六、离散性随机变量的分布列
1. 分布列定义:
设离散型随机变量所有可能取得的值为x1,x2,…,x3,…xn,若取每一个值xi(i=1,2,…,n)的概率为,则称表
x1
x2
…
xi
…
xn
P
P1
P2
…
Pi
…
Pn
为随机变量的概率分布,简称的分布列.
2.分布列的性质
离散型随机变量的分布列都具有下面两个性质:
(1)Pi≥0,i=1,2,…,n;
(2)P1+P2+…+Pn=1
3. 离散型随机变量函数及其分布列
一般地,若ξ是随机变量,f(x)是连续函数或单调函数,则f(ξ)也是随机变量,也就是说,随机变量的某些函数也是随机变量。
已知离散型随机变量的分布列,求离散型随机变量函数的分布列:
①ξ与η一一对应时,ξ的每个取值的概率就对应着η的每个取值的概率;
②如果ξ有多个取值对应一个η的值,那么这个η值的概率就是这多个ξ值的概率的和。
七、离散性随机变量的分布列的求法
1.求随机变量的概率分布有以下几步:
(1)要确定随机变量的可能取值有哪些.明确取每个值所表示的意义;
(2)分清概率类型,计算取得每一个值时的概率(取球、抽取产品等问题还要注意是放回抽样还是不放回抽样);
(3)列表对应,给出分布列,并用分布列的性质验证.
八、n次独立重复试验
每次试验只考虑两种可能结果与,并且事件发生的概率相同。在相同的条件下重复地做次试验,各次试验的结果相互独立,称为次独立重复试验。
总之,独立重复试验,是在同样的条件下重复的,各次之间相互独立地进行的一种试验,在这种试验中,每一次的试验结果只有两种,即某事件要么发生,要么不发生,并且任何一次试验中发生的概率都是一样的。
九、二项分布与超几何分布
1. 定义:
在一次随机试验中,事件A可能发生也可能不发生,在次独立重复试验中事件A发生的次数是一个离散型随机变量.如果在一次试验中事件A发生的概率是,则此事件不发生的概率为,那么在次独立重复试验中事件A恰好发生次的概率是
,().
于是得到离散型随机变量的概率分布如下:
ξ
0
1
…
k
…
n
P
…
…
由于表中第二行恰好是二项展开式
中各对应项的值,所以称这样的随机变量服从参数为,的二项分布,记作.
2.如何求有关的二项分布
(1)分清楚在n次独立重复试验中,共进行了多少次重复试验,即先确定n的值,然后确定在一次试验中某事件A发生的概率是多少,即确定p的值,最后再确定某事件A恰好发生了多少次,即确定k的值;
(2)准确算出每一种情况下,某事件A发生的概率;
(3)用表格形式列出随机变量的分布列。
3、几何分布:
独立重复试验中,若事件在每一次试验中发生的概率都为,事件第一次发生时所做的试验次数是随机变量,且,,称离散型随机变量服从几何分布,记作:。
若离散型随机变量服从几何分布,且则
期望
方差
4、超几何分布:
若离散型随机变量服从参数为的超几何分布,则期望
十、离散型随机变量的期望
1.定义:
一般地,若离散型随机变量的概率分布为
…
…
P
…
…
则称…… 为的均值或数学期望,简称期望.
2.性质:
①;
②若(a、b是常数),是随机变量,则也是随机变量,有;
的推导过程如下::
的分布列为
…
…
…
…
P
…
…
于是……
=……)……)=
∴。
十一、离散型随机变量的方差与标准差
1.一组数据的方差的概念:
已知一组数据,,…,,它们的平均值为,那么各数据与的差的平方的平均数
++…+叫做这组数据的方差。
2.离散型随机变量的方差:
一般地,若离散型随机变量的概率分布为
…
…
P
…
…
则称=++…++…称为随机变量的方差,式中的是随机变量的期望.
的算术平方根叫做随机变量的标准差,记作.
3.期望和方差的关系:
4.方差的性质:
若(a、b是常数),是随机变量,则也是随机变量,;
十二、正态分布
1.正态变量的概率密度函数
正态变量的概率密度函数表达式为:,()
其中x是随机变量的取值;μ为正态变量的期望;是正态变量的标准差.
2.正态分布
(1)定义
如果对于任何实数随机变量满足:,
则称随机变量服从正态分布。记为。
(2)正态分布的期望与方差
若,则的期望与方差分别为:,。
3. 正态曲线
如果随机变量X的概率密度函数为,其中实数和为参数(),则称函数的图象为正态分布密度曲线,简称正态曲线。
4.正态曲线的性质:
①曲线位于轴上方,与轴不相交;
②曲线是单峰的,它关于直线对称;
③曲线在时达到峰值;
④当时,曲线上升;当时,曲线下降.并且当曲线向左、右两边无限延伸时,以x轴为渐近线,向它无限靠近.
⑤曲线与轴之间的面积为1;
⑥决定曲线的位置和对称性;
当一定时,曲线的对称轴位置由确定;如下图所示,曲线随着的变化而沿轴平移。
⑦确定曲线的形状;
当一定时,曲线的形状由确定。越小,曲线越“高瘦”,表示总体的分布越集中;越大,曲线越“矮胖”,表示总体的分布越分散。如下图所示。
典例1:某企业拟对某条生产线进行技术升级,现有两种方案可供选择:方案 A 是报废原有生产线,重建一条新的生产线;方案 B 是对原有生产线进行技术改造.由于受诸多不可控因素的影响,市场销售状态可能会发生变化.该企业管理者对历年产品销售市场行情及回报率进行了调研,编制出下表:
市场销售状态
畅销
平销
滞销
市场销售状态概率 (0 2p
1-3p
p
预期平均年利润(单位:万元)
方案 A
700
400
-400
方案 B
600
300
-100
(1)以预期平均年利润的期望值为决策依据,问:该企业应选择哪种方案?
(2)记该生产线升级后的产品(以下简称“新产品”)的年产量为 x (万件),通过核算,实行方案 A 时新产品的年度总成本 y1 (万元)为 y1=23x3-8x2+10x+160 ,实行方案 B 时新产品的年度总成本 y2 (万元)为 y2=13x3-3x2+20x+100 .已知 p=0.2 , x≤20 .若按(1)的标准选择方案,则市场行情为畅销、平销和滞销时,新产品的单价 t (元)分别为60, 60-34x , 60-x ,且生产的新产品当年都能卖出去.试问:当 x 取何值时,新产品年利润 ξ 的期望取得最大值?并判断这一年利润能否达到预期目标.
【答案】 (1)解:∵ {0 E(A)=1400p+400-1200p-400p=400-200p ,
E(B)=1200p+300-900p-100p=300+200p ,
E(A)>E(B)⇒0 E(A)=E(B)⇒p=14 ; E(A)
y1=23x3-8x2+10x+160 .
(2)解:设市场行情为畅销、平销和滞销时,新产品的年利润分别为 ξ1 , ξ2 和 ξ3 ,
则 ξ1=60x-y1 , ξ2=(60-34x)x-y1 , ξ3=(60-x)x-y1 ,
∴ ξ 的分布列为
ξ
60x-y1
(60-34x)x-y1
(60-x)x-y1
p
0.4
0.4
0.2
Eξ=0.4×(60x-y1)+0.4×[(60-34x)x-y1]+0.2×[(60-x)x-y1]
=-23x3+152x2+50x-160 .
设 f(x)=Eξ=-23x3+152x2+50x-160 , 0
f'(x)>0⇒0
∴当 x=10 时, f(x) 取得最大值,即年产量为10万件时, E(ξ) 取得最大值,
此时 f(x)max=f(10)≈423.3 (万元).
由(1)知,预期平均年利润的期望 E(A)=400-200p=360 (万元).
因为 423.3>360 ,所以在年产量为10万件的情况下,可以达到甚至超过预期的平均年利润.
典例2:某班级60名学生的考试分数x分布在区间 [90,150] 内.设考试分数x的频率分布为 f(x) ,且满足 f(x)={n12-23,10n≤x<10(n+1),n=9,10,11-n8+t,10n≤x<10(n+1),n=12,13,14 ,考试成绩采用“6分制”,规定:考试分数在区间 [90,100) , [100,110) , [110,120) , [120,130) , [130,140) , [140,150] 内的成绩依次记为1分,2分,3分,4分,5分,6分.在60名学生中用分层抽样的方法从成绩为1,2,3分的学生中随机抽取6人,再在这6人中随机抽查3人,记这3人成绩之和为 ξ .
(1)求t的值;
(2)求 ξ 的分布列及数学期望.
【答案】 (1)解:依题意“6分制”得分及其频率关系为下表
得分
1
2
3
4
5
6
频率
112
212
312
t-128
t-138
t-148
所以 112+212+312+t-128+t-138+t-148=1
解得 t=4324
(2)解:在60名学生中用分层抽样的方法从成绩为1,2,3分的学生中随机抽取6人,则成绩为1分的抽取1人,2分的抽取2人,3分的抽取3人;
所以 ξ 的可能取值为5,6,7,8,9
则 P(ξ=5)=C11C22C63=120 , P(ξ=6)=C11C21C31C63=620 , P(ξ=7)=C11C32+C22C31C63=620 , P(ξ=8)=C21C32C63=620 , P(ξ=9)=C33C63=120
ξ 的分布列如下:
ξ
5
6
7
8
9
P
120
620
620
620
120
∴E(ξ)=5×120+(6+7+8)×620+9×120=7
典例3:在迎来中国共产党成立100周年的重要时刻,我国脱贫攻坚战取得全面胜利,创造了又一个彪炳史册的人间奇迹习近平总书记指出:“脱贫摘帽不是终点,而是新生活、新奋斗的起点.”某农户计划于2021年初开始种植某新型农作物.已知该农作物每年每亩的种植成本为2000元,根据前期各方面调查发现,该农作物的市场价格和亩产量均具有随机性,且两者互不影响,其具体情况如下表:
该农作物亩产量( kg )
900
1200
概率
0.5
0.5
该农作物市场价格(元/ kg )
30
40
概率
0.4
0.6
(1)设2021年该农户种植该农作物一亩的纯收入为 X 元,求 X 的分布列;
(2)若该农户从2021年开始,连续三年种植该农作物,假设三年内各方面条件基本不变,求这三年中该农户种植该农作物一亩至少有两年的纯收入不少于30000元的概率.
【答案】 (1)解:由题意知:
900×30-2000=25000 , 1200×30-2000=34000 ,
900×40-2000=34000 , 1200×40-2000=46000 .
所以 X 的所有可能值为:25000,34000,46000.
设 A 表示事件“作物亩产量为 900kg ”,则 P(A)=0.5 ;
B 表示事件“作物市场价格为30元 /kg ”,则 P(B)=0.4 .
则: P(X=25000)=P(A⋅B)=0.5×0.4=0.2 ,
P(X=34000)=P(A⋅B)+P(A⋅B)=(1-0.5)×0.4+0.5×(1-0.4)=0.5 ,
P(X=46000)=P(A⋅B)=(1-0.4)(1-0.5)=0.3 ,
所以 X 的分布列为:
X
25000
34000
46000
P
0.2
0.5
0.3
(2)解:设 C 表示事件“种植该农作物一亩一年的纯收入不少于30000元”,
则 P(C)=P(X≥30000)=P(X=34000)+P(X=46000)=0.5+0.3=0.8 .
设这三年中有 Y 年的纯收入不少于30000元,
则有: Y~B(3,0.8)
所以这三年中至少有两年的纯收入不少于30000元的概率为:
P(Y≥2)=C32×0.82×0.2+C33×0.83=0.896
典例4:年前某市质监部门根据质量管理考核指标对本地的500家食品生产企业进行考核,然后通过随机抽样抽取其中的50家,统计其考核成绩(单位:分),并制成如下频率分布直方图.
(1)求这50家食品生产企业考核成绩的平均数 x (同一组中的数据用该组区间的中点值为代表)及中位数a(精确到0.01)
(2)该市质监部门打算举办食品生产企业质量交流会,并从这50家食品生产企业中随机抽取4家考核成绩不低于88分的企业发言,记抽到的企业中考核成绩在 [92,100] 的企业数为X,求X的分布列与数学期望
(3)若该市食品生产企业的考核成绩X服从正态分布 N(μ,σ2) 其中 μ 近似为50家食品生产企业考核成绩的平均数 x , σ2 近似为样本方差 s2 ,经计算得 s2=27.68 ,利用该正态分布,估计该市500家食品生产企业质量管理考核成绩高于90.06分的有多少家?(结果保留整数).
附参考数据与公式:
27.68≈5.26 X-N(μ,σ2)
则 P(μ-σ
x=74×0.04+78×0.12+82×0.28+86×0.36+90×0.10+94×0.06
+98×0.04=84.90 (分),
由频率分布图可知 a∈[84,88] 内,所以 0.04+0.12+0.28+0.09×(a-84)=0.5 ,
解得 a≈84.67 分.
(2)解:根据题意,这50家食品生产企业中考核成绩不低于88分的企业有:
50×(0.1+0.06+0.04)=10 (家),
其中考核成绩在 [92,100] 内的企业有 50×(0.06+0.04)=5 (家),
所以X可能取值有0,1,2,3,4
则 P(X=0)=C54C104=142 , P(X=1)=C51C53C104=521 , P(X=2)=C52C52C104=1021 , P(X=3)=C53C51C104=521 , P(X=4)=C54C104=142 ,
所以X的分布列为
X
0
1
2
3
4
P
142
521
1021
521
142
所以 E(X)=0×142+1×521+2×1021+3×521+4×142=2 .
(3)解:由题意得 X∼N(84.80,27.68) ,所以 μ+σ≈84.80+5.26=90.06 ,
所以 P(X>μ+σ)≈12-0.68272≈0.1587 ,所以 500×0.1587≈79 (家),
所以500家食品生产企业质量管理考核成绩高于90.06分的有79家.
专题16 计数原理(公式、定理、结论图表)-备战2024年新高考数学必背知识手册: 这是一份专题16 计数原理(公式、定理、结论图表)-备战2024年新高考数学必背知识手册,共11页。试卷主要包含了计数原理,排列,组合,二项式定理,杨辉三角形等内容,欢迎下载使用。
专题15 导数及其应用(公式、定理、结论图表)-备战2024年新高考数学必背知识手册: 这是一份专题15 导数及其应用(公式、定理、结论图表)-备战2024年新高考数学必背知识手册,共8页。试卷主要包含了曲线在点处切线,曲线过点处切线,利用导数求最值,.解决优化问题的步骤,))等内容,欢迎下载使用。
专题14 数列(公式、定理、结论图表)-备战2024年新高考数学必背知识手册: 这是一份专题14 数列(公式、定理、结论图表)-备战2024年新高考数学必背知识手册,共13页。试卷主要包含了定义, 前n项和公式法等内容,欢迎下载使用。