所属成套资源:2026年高考数学二轮复习高效培优讲义(全国通用)(学生版+解析)
2026年高考数学二轮复习高效培优讲义(全国通用)专题7.3概率与统计题型归纳(培优热点专练)(学生版+解析)
展开 这是一份2026年高考数学二轮复习高效培优讲义(全国通用)专题7.3概率与统计题型归纳(培优热点专练)(学生版+解析),共23页。试卷主要包含了分成六段,的散点图等内容,欢迎下载使用。
互斥、对立、独立事件的概率
1.(多选)(2025·湖北武汉·模拟预测)已知事件,且,则( )
A.事件与事件互为对立事件
B.若事件与事件互斥,则
C.若事件与事件互斥,则
D.若,则事件与事件相互独立
【答案】BD
【分析】根据对立事件的定义,互斥事件概率公式、相互独立事件的性质及概率公式计算判断作答即可.
【详解】对于A,由于对立事件概率和为1,但,A错误,
对于B、C,由事件与事件互斥,,,
所以B正确 ,C错误
对于D,因为,,故事件与事件相互独立,所以事件与事件相互独立,D正确.
故选:BD
2.(多选)(2025·江苏镇江·模拟预测)为响应校团委发起的“青年大学习”号召,某班组织了有奖知识竞答活动.决赛准备了4道选择题和2道填空题,每位参赛者从6道题中不放回地随机抽取三次,每次抽取1道题作答.设事件为“第次抽到选择题”,则下列结论中正确的是( )
A.与互斥;与互斥
B.不管第几次抽取,抽到选择题的概率都相同
C.
D.
【答案】BC
【分析】根据互斥事件的定义判断A,由简单随机抽样的性质判断B,根据古典概型的概率公式判断CD.
【详解】由题意可知第1次抽到选择题与第2次抽到选择题可能同时发生,
所以与不是互斥事件,同理与也不是互斥事件,A说法错误;
从6道题中不放回地随机抽取三次,满足简单随机抽样,每次抽取时各个个体被抽到的概率相等,B说法正确;
第二次抽到选择题且第三次也抽到选择题的概率,C说法正确;
第1次抽到选择题或第2次抽到选择题的概率,D说法错误;
故选:BC
3.(多选)(2026·云南大理·二模)已知甲盒中有2个白球和4个红球,乙盒中有3个白球和2个红球.先从甲盒随机取出一球放入乙盒,设“从甲盒取出的球是白球”为事件,“从甲盒取出的球是红球”为事件;再从乙盒中随机取出一球,设“从乙盒取出的球是白球”为事件,“从乙盒取出的球是红球”为事件,下列说法正确的是( )
A.,是互斥事件B.,是独立事件
C.D.
【答案】AC
【分析】A根据互斥事件的定义判断;BD根据概率的乘法公式计算;C根据全概率公式计算.
【详解】由题可知,,,,,
,,
因为,不可能同时发生,故,是互斥事件,故A正确;
,故D错误;
,
则,故,不是独立事件,故B错误;
,故C正确.
故选:AC
4.(2026·新疆·二模)已知事件的概率均不为0,下列说法正确的是( )
A.若,则事件与为对立事件
B.若,则事件与为相互独立事件
C.若,则
D.若,则
【答案】D
【分析】由概率加法公式,条件概率公式,对立事件和独立事件的定义可选答案.
【详解】对于A:因为,由,只能得到,并不能得到事件与为对立事件,故A错误;
对于B:因为,
由,只能得到,并不能得到,从而不能得出事件与为相互独立事件,故B错误;
对于C:由可得或,当时不能得出,故C错误;
对于D:因为,
又,所以,故D正确.
故选:D.
5.(多选)(2025·四川泸州·一模)记为事件的对立事件,已知,下列结论正确的是( )
A.若,则
B.若与相互独立,则
C.若,则
D.若,则
【答案】ABD
【分析】由独立事件定义和性质、独立概率乘法公式、条件概率公式即可逐一计算判断各选项.
【详解】对于A选项:若,则,A正确;
对于B选项:若与相互独立,则与相互独立,
所以,B正确;
对于C选项:若,则,C错误;
对于D选项:若,则,
又,
所以,D正确.
故选:ABD.
古典概型的概率
1.(2026·四川巴中·一模)某学校围棋社团组织高一与高二的同学比赛,双方各挑选业余一段、业余二段、业余三段三位选手,段位越高水平越高.已知高二每个段位的选手都比高一相应段位的选手强一些.比赛胜负仅由段位决定,段位高者获胜;若段位相同,则高二选手获胜.比赛共三局,每局双方各派一名选手出场,且每名选手只赛一局,胜两局或三局的一方获得比赛胜利.在比赛之前,双方都不知道对方选手的出场顺序,则第一局比赛高一获胜的概率为 ,在一场比赛中高二获胜的概率为 .
【答案】
【分析】采用列举法列举出一局比赛中所有基本事件及高一取得胜利的基本事件,根据古典概型概率公式可求得结果;列举出一场比赛中高一获胜的基本事件个数,结合基本事件总数和对立事件概率公式可求得结果.
【详解】设为高一出场选手,为高二出场选手,其中表示段位,
第一局比赛中,有,,,,,,,,,共个基本事件,
其中高一能取得胜利的基本事件为,,,共个,
第一局比赛高一获胜的概率为.
在一场三局比赛中,共有不同的种安排方法,
其中高一能获胜的安排方法为,,,,,,共种,
在一场比赛中高二获胜的概率为.
故答案为:;.
2.(多选)(2026·湖南株洲·一模)某电脑程序每次等概率随机输出中的一个数,和分别表示输出的前个数中的最大值和最小值.已知每次输出都是独立的,且可以重复输出同一个数.则下列命题正确的是( )
A.B.
C.D.
【答案】ABD
【分析】根据独立事件的概率、条件概率及最大值、最小值的概率计算方法,结合加法公式、乘法公式计算即可.
【详解】选项A:表示第一个数的最大值,即该数本身;表示第一个数的最小值,也即该数本身;
所以,,A正确;
选项B:表示输出的前3个数的最大值为3,即需满足“输出的每个数,且至少有一个数为3”.
所有数均的概率:;所有数均的概率:.
所以,B正确;
选项C:表示输出的前3个数的最小值为3,即需满足“输出的每个数,且至少有一个数为3”.
所有数均的概率:;所有数均的概率:.
所以,C错误;
选项D:记为事件,即前4个数最大值为6,为事件,前4个数最小值为3.
则.
表示前4个数最大值为6且最小值为3,即所有数均在3到6之间(含3和6),
所以.
故,D正确.
故选:ABD.
3.(2026·山东·一模)已知盒中有10张纸条,分别写着1~10共10个数字,随机抽出一张,则恰好抽到3的倍数或抽到4的倍数的概率是( )
A.0.5B.0.4C.0.3D.0.2
【答案】A
【分析】根据古典概率模型直接计算即可.
【详解】随机抽出一张,则恰好抽到3的倍数或抽到4的倍数的数有:,共5张,
所以,根据古典概型,恰好抽到3的倍数或抽到4的倍数的概率是.
故选:A
4.(2026·广西南宁·一模)某市十景包含扬美古风、青山塔影、明山锦绣、望仙怀古、伊岭神宫、九龙戏珠、南湖情韵、凤江绿野、邕江春泛、龙虎猴趣,每个景点都有其独特的魅力.某游客计划从这10个景点中随机选择2个景点进行游玩,则青山塔影被选中的概率是 .
【答案】/
【分析】先求出从10个景点中随机选择2个景点的方法数,再求出青山塔影被选中的方法数,利用古典概型可得答案.
【详解】从10个景点中随机选择2个景点,
总共有 种选择方法,
若要确保青山塔影被选中,则需从剩余9个景点中再选1个,
有 种选择方法,
因此,青山塔影被选中的概率为 .
故答案为:
5.(2026·安徽淮南·一模)2025年12月11日淮南市科技馆正式开馆,淮南市某中学有甲、乙、丙、丁等7位学生约好2026年1月1日去科技馆志愿服务.现将7位学生随机分为3组,每组至少一人,则甲乙同组且丙丁同组的概率为( )
A.B.C.D.
【答案】A
【分析】由题意知不同的分组方法有5,1,1;4,2,1;3,2,2;3,3,1四种,利用不平均分组问题计算方法数,以及计算出符合题意的情况数,即可求得概率.
【详解】由题意,不同的分组方法有5,1,1;4,2,1;3,2,2;3,3,1四种,
当分组为5,1,1时,共有种,其中甲乙同组且丙丁同组有种;
当分组为4,2,1时,共有种,其中甲乙同组且丙丁同组有种;
当分组为3,2,2时,共有种,其中甲乙同组且丙丁同组有种;
当分组为3,3,1时,共有种,其中甲乙同组且丙丁同组有种;
甲乙同组且丙丁同组的概率为.
故选:A.
条件概率与全概率公式
1.(2026·重庆·一模)从1,2,3,4,5,6,7这 7 个数字中依次不放回地随机选取两个数字,记事件 : “第一次抽到的数字是奇数”,事件 : “第二次抽到的数字是偶数”,则 ( )
A.B.
C.D.
【答案】A
【分析】利用古典概率求出事件,的概率,再用条件概率公式计算即可.
【详解】:第一次抽到奇数的概率,总共有7个数字,奇数4个,故.
:第一次抽到奇数且第二次抽到偶数的概率,分步计算:第一次抽奇数有4种选择,第二次抽偶数有3种选择,总情况数为,故.
根据条件概率公式代入得:.
故选:A.
2.(2026·江苏镇江·模拟预测)两位游客慕名来江苏旅游,他们分别从太湖鼋头渚、苏州拙政园、镇江金山寺、常州恐龙园、南京夫子庙、扬州瘦西湖这6个景点中随机选择1个景点游玩.记事件“两位游客中至少有一人选择太湖鼋头渚”,事件“两位游客选择的景点不同”,则 .
【答案】
【分析】根据题设先求出事件和事件的概率,再利用对立事件的概率公式求出事件的概率,最后结合条件概率的公式即可求解.
【详解】依题意,事件“两位游客中至少有一人选择太湖鼋头渚,且两位游客选择的景点不同”,
所以;
事件“两位游客中没有一人选择太湖鼋头渚”,,
所以;
所以.
故答案为:
3.(2026·海南海口·一模)已知,是随机事件,若,,则( )
A.B.C.D.
【答案】D
【分析】由条件概率公式得出与的关系,然后代入公式化简即可.
【详解】由条件概率公式得,
因此,
将 代入得,
解得.
故选:D
4.(多选)(2026·山东济南·一模)现进行如下试验:从中任选一个数,记为,若,则试验结束;否则再从中任选一个数,记为,若,则试验结束;否则再从中任选一个数,依次类推,直至选中1为止.记事件“试验过程中,数字被选到”,表示事件发生的概率(),则( )
A.
B.
C.
D.且
【答案】BCD
【分析】对于选项A,可根据试验过程直接计算;对于选项B,需要根据试验过程分析表达式;对于选项C,根据条件概率公式判断与是否相等;对于选项D,时,有,得,可知,,则有,可得.
【详解】对于A,若数字9被选到,有两种情况:
第一次选数时,从1到10中选到9,概率为,
第一次选到10,第二次从1到9中选到9,概率为,
所以,选项A错误;
对于B,若数字8被选到,有以下几种情况:第一次就选到8,概率为;
发生后,下一次从1到8中选到8,概率为,
发生后,下一次从1到9中选到8,概率为,
这几种情况彼此互斥,所以,选项B正确;
对于C,根据条件概率公式,,
若发生,即数字9被选到,那么在选到9的情况下,
下一次从1到8中选到8的概率为,即,
若发生,即数字10被选到,那么在选到10的情况下,可以下一次从1到9中选到8,
也可以是下一次从1到9中选到9,再下一次从1到8中选到8,
即,
所以,选项C正确;
对于D,对于即选中的情况,设为选中数当中不小于的最小整数,
则
,
当时,有,,,
结合知,,
所以最大数选取是任意的,始终有,
对于同时选中情况,不妨设,可理解为从中按规则取数,
选中的概率,则有,
可得,选项D正确.
故选:BCD
5.(多选)(2025·江苏南通·模拟预测)甲、乙两个盒子中分别装有大小、形状、质地相同的1个黑球和2个红球.现从两个盒子中各任取一个球放入对方盒子中称为一次操作,重复进行次操作后,甲盒子中恰有0个黑球,1个黑球,2个黑球分别记为事件,,,则( )
A.B.
C.D.
【答案】ACD
【分析】通过分析单次操作中不同事件的概率,结合条件概率、全概率公式推导各选项;对于递推型概率,构造等比数列求解通项公式.
【详解】初始时,甲盒有1黑2红,乙盒有1黑2红.
选项A:一次操作后,甲盒恰有1黑球(事件)的情况:
从甲取红且从乙取红,或从甲取黑且从乙取黑.
甲取红的概率为,乙取红的概率为;甲取黑的概率为,乙取黑的概率为.
故,A正确.
选项B:表示“第二次操作后甲盒有1黑球的前提下,
第一次操作后甲盒有0黑球”的概率.
第一次操作后甲盒有0黑球():甲取黑、乙取红,概率.
第二次操作后甲盒有1黑球()的情况:若发生,甲盒0黑3红,乙盒2黑1红,
此时从甲取红、乙取黑的概率为,故.
若发生,甲盒1黑2红,乙盒1黑2红,此时(同).
若发生,甲盒2黑1红,乙盒0黑3红,此时(甲取黑、乙取红的概率为).
由全概率公式:.
由条件概率公式:,B错误.
选项C:表示“第一次操作后甲盒有0黑球,或第二次操作后甲盒有1黑球”的概率.
由概率的加法公式:.
其中.
代入得:,C正确.
选项D:递推关系:.
整理为:.
初始值,故.
因此,即,D正确.
故选:ACD
离散型随机变量的分布列
1.(2026·重庆·一模)甲、乙两位同学参加投篮练习,由他们的投篮位置和命中情况确定得分可能为3分、2分、0分,根据以往练习统计数据,甲一次投篮得3分、2分、0分的概率分别为,乙不投3分球,他一次投篮得2分、0分的概率分别为.若甲、乙各投篮一次称为一轮投篮,且甲、乙投篮相互独立,每次投篮也互不影响.
(1)记一轮投篮后,甲的得分为,乙的得分为,求;
(2)记一轮投篮后,甲乙所得分数之和为随机变量,求的分布列及数学期望.
【答案】(1)
(2)分布列见解析,
【分析】(1)分别按照,,求出概率,根据互斥事件概率的加法公式,可得的值.
(2)的可能取值为,分别求出相应的概率,列出的分布列,根据数学期望的公式求出的值.
【详解】(1)的取值为3,2,0,对应的概率分别为,,.
的取值为2,0,对应的概率分别为,.
当时,取2或0都满足,
此时概率为.
当时,取2或0都满足,
此时概率为.
当时,只有满足,
此时概率为.
根据互斥事件概率的加法公式,可得.
(2)的可能取值为0,2,3,4,5.
.
.
.
.
.
的分布列如下表所示:
可得.
2.(25-26高三上·江西·月考)人工智能,是引领新一轮科技革命与产业变革的战略技术,其研发过程融合了算法创新与工程实践的深度智慧.某科技公司计划开发三款不同的大语言模型.每款模型的研发分为两个主要阶段:算法设计评审和工程部署验收.只有算法设计评审通过后,才能进入工程部署验收,两个阶段相互独立.只有同时通过这两个阶段,模型才能正式上线发布.已知三款模型通过算法设计评审的概率依次为,通过工程部署验收的概率依次为.
(1)求三款中恰有两款通过算法设计评审的概率;
(2)若已知三款中恰有一款通过算法设计评审,求通过的模型为的概率;
(3)经过算法设计评审和工程部署验收两个阶段后,三款模型能成功上线的数量为随机变量,求的分布列及数学期望.
【答案】(1)
(2)
(3)分布列见解析,
【分析】(1)设出事件,利用独立事件概率乘法公式和互斥事件概率加法公式进行求解;
(2)由条件概率求解公式可得;
(3)先求出A,B,C三款模型能成功上线的概率,求出的可能取值及对应概率,得到分布列和数学期望.
【详解】(1)设A,B,C三款模型通过算法设计评审为事件,
A,B,C三款中恰有两款通过算法设计评审为事件,
则
;
(2)设A,B,C三款中恰有一款通过算法设计评审为事件,
则
;
由条件概率公式可得
;
(3)设A,B,C三款模型能成功上线为事件,
则,,,
的可能取值为,
则,
,
,
,
所以X的分布列如下:
数学期望为.
3.(2026·江苏徐州·一模)现有除颜色外都相同的3个红球和3个白球,随机取3个球放入一个不透明的袋中,记袋中红球的个数为.从袋中随机摸出一个球,并换入一个另一种颜色的球,经过次摸换,袋中的红球个数记为.
(1)求与;
(2)求;
(3)当时,求随机变量的数学期望.
【答案】(1),
(2)
(3)
【分析】(1)根据古典概型的概率公式可求概率;
(2)根据全概率公式可求;
(3)求出的分布列后可求的数学期望.
【详解】(1),.
(2)
,
故.
(3)当时,,,,,且,,
则
,
,
随机变量的数学期望.
4.(2026·四川巴中·一模)某素质训练营设计了一项闯关比赛.规定:三人组队参赛,每次只派一个人,且每人只派一次;如果一个人闯关失败,再派下一个人重新闯关;三人中只要有人闯关成功即视作比赛胜利,无需继续闯关.现有甲、乙、丙三人组队参赛,他们各自闯关成功的概率分别为、、,假定、、互不相等,且每人能否闯关成功的事件相互独立.
(1)计划依次派甲、乙、丙进行闯关,若,,,求该小组比赛胜利的概率;
(2)若依次派甲、乙、丙进行闯关,则写出所需派出的人员数目的分布,并求的期望;
(3)已知,若甲只能安排在第一个派出,要使派出人员数目的期望较小,试确定乙、丙谁先派出.
【答案】(1)
(2)分布列见解析,
(3)先派出乙.
【分析】(1)利用独立事件的概率乘法公式求解;
(2)由题意可知,的所有可能取值为1,2,3,利用独立事件的概率乘法公式求出相应的概率,进而得到的分布,再结合期望公式求解;
(3)分别计算出依次派甲乙丙进行闯关和依次派甲丙乙进行闯关所派出人员数目的期望,再利用作差法比较大小即可.
【详解】(1)设事件表示“该小组比赛胜利”,
则;
(2)由题意可知,的所有可能取值为1,2,3,
则,,,
所以的分布为:
所以;
(3)若依次派甲乙丙进行闯关,设派出人员数目的期望为.
由(2)可知,.
若依次派甲丙乙进行闯关,设派出人员数目的期望为,则.
从而,
.
因为,所以,,所以,即.
所以要使派出人员数目的期望较小,先派出乙.
5.(2026·重庆九龙坡·一模)在重庆轨道交通故障排查演练中,三名工程师分别检查三个不同的系统,假设甲发现故障的概率为,乙、丙两人同时发现故障的概率是,甲、丙两人均未发现故障的概率是,且三人各自能否发现故障相互独立.
(1)求乙、丙两人各自发现故障的概率;
(2)用X表示三人中发现故障的人数,求X的分布列和期望.
【答案】(1),
(2)分布列见解析,
【分析】(1)根据题意利用独立事件的乘法公式列方程,即可求得答案;
(2)确定X的可能取值,求出每个值对应的概率,即可得分布列,进而求得数学期望.
【详解】(1)记乙、丙各自发现故障为事件,,由于事件相互独立,
则有,,解得,,
所以乙、丙两人各自发现故障的概率分别为,.
(2)由题意可知X的可能取值为0,1,2,3
,
,
,
X的分布列为
.
二项分布及应用
1.(2026·全国·模拟预测)投壶游戏起源于中国古代六艺中的“射”艺,是射礼的演变和延续.甲、乙两位同学为了参加投壶游戏比赛,进行了大量的投壶训练.从这些训练数据中随机抽取甲乙各100次投壶数据,其中甲投中目标的次数为80次,乙投中目标的次数为85次.假设每次投壶相互独立,用频率估计概率.
(1)若现在让甲投壶4次,求甲投中目标的次数X的分布列及期望;
(2)通过分析甲、乙的训练数据发现:若甲发挥正常,投中目标的概率为0.9,发挥不正常,投中目标的概率为0.5;若乙发挥正常,投中目标的概率为0.95,发挥不正常,投中目标的概率为0.6.设甲、乙发挥正常的概率分别为p,q,计算并比较p与q的大小.
【答案】(1)分布列见解析,.
(2)
【分析】(1)用频率估计出甲每次投壶投中的概率,易知甲投中目标的次数X服从二项分布,由此求得分布列及期望;
(2)由条件概率公式及全概率公式计算出的值,即可比较其大小.
【详解】(1)用频率估计概率可得甲每次投中目标的概率是,
若现在让甲投壶4次,甲投中目标的次数X的取值为,
,,,
,.
所以甲投中目标的次数X的分布列是
因为,所以甲投中目标的次数X的期望是.
(2)记甲发挥正常为事件A,甲投中目标为事件B,
由题意得,
所以,即,解得.
记乙发挥正常为事件C,乙投中目标为事件D,
由题意得,
所以,即,解得.
,所以.
2.(2026·陕西宝鸡·一模)为了了解全市高中学生体育锻炼情况,现准备在某高中进行抽样调查.已知该高中共有学生1200人,其中男生720人.现按学生性别采用分层抽样方法抽取60人进行调查.调查中把每天锻炼时间超过60分钟的学生称为“锻炼积极者”,否则称为“锻炼不积极者”.已知在样本中:男性“锻炼积极者”共24人,女性“锻炼积极者”共12人.
(1)求抽取的60人中男生、女生各多少人.
(2)从抽取的60人中随机选取一人,设事件为“选到男生”,事件为“选到锻炼积极者”,试判断事件、是否相互独立,并说明理由.
(3)用上面的样本估计总体,若从全市学生中抽取3人,记抽取的3人中“锻炼积极者”的人数为X,求X的分布列和数学期望.
【答案】(1)男生36人,女生24人.
(2)不相互独立,理由见解析.
(3)分布列见解析,
【分析】(1)根据分层抽样的概念计算男、女生的人数.
(2)利用与的关系判断事件、是否相互独立.
(3)利用二项分布概率模型求分布列和期望.
【详解】(1)60人中,男生人数为人,女生人数为:人.
所以抽取的60人中男生36人,女生24人.
(2)由题意:,,
事件表示“选到男生且是锻炼积极者”,所以.
因为,所以事件、不相互独立.
(3)从全市学生中任意抽取1人是“锻炼积极者”的概率为.
从全市学生中抽取3人,“锻炼积极者”的人数服从二项分布,,
所以,,
,.
所以的分布列为:
所以.
3.(2026·湖北荆州·一模)某电商平台对其售卖的一款家电开展甲、乙两种促销活动,活动规则如下:参加活动的消费者只能在甲、乙两种活动中选择一个参加,且仅能参加一次,最多购买一台家电;活动甲设有4个不同的选择题、3个不同的填空题,活动乙设有3个不同的选择题、2个不同的填空题;参加活动的消费者在所选择的促销活动中先后抽取2个不同的题目作答,若两题都答对,则享受按2折购买的优惠,答对一题可享受按5折购买的优惠,全部答错只能享受按8折购买的优惠.小黄对该家电有购买需求,决定参加活动,其答对每道选择题的概率均为0.8,答对每道填空题的概率均为0.4,每次答题相互独立.
(1)若小黄选择参加活动乙,求第二题抽到的题目是填空题的概率;
(2)该款家电原价为a元/台,小黄应该选择参加甲、乙中的哪个活动?请说明理由.
【答案】(1)
(2)应该选择参加乙活动,理由见解析
【分析】(1)结合题意,分第1题抽到选择题、第1题抽到填空题两种情况求解即可;
(2)分别求出小黄参加甲、乙活动花费金额的数学期望,进而判断即可.
【详解】(1)由题意,小黄第1题抽到选择题的概率为,第1题抽到填空题的概率为,
则小黄第二题抽到的题目是填空题的概率为.
(2)由题意,小黄答对每道选择题的概率均为,答对每道填空题的概率均为,
若小黄选择参加甲活动,设答对题目数为,则的可能取值为,
所以,
,
,
则小黄参加甲活动花费金额的数学期望为;
若小黄选择参加乙活动,设答对题目数为,则的可能取值为,
所以,
,
,
则小黄参加乙活动花费金额的数学期望为.
由于,
所以小黄应该选择参加乙活动.
4.(2026·重庆九龙坡·一模)某企业为了提高生产效率和产品质量,更新了机器设备,为了检验新机器生产零件的质量,该企业质检部门要对新机器生产的零件抽样检测.
(1)在调试生产初期,质检部门抽检该机器生产的10个零件中有2个为次品,现从这10个零件中随机抽取3个零件,设抽取的零件为次品的个数为,求的分布列和数学期望;
(2)在正式生产后,质检部门从新机器生产的一批零件中随机抽取100件进行检验,其中有3件为次品. 用频率估计概率,现从新机器生产的这批零件中随机抽取个零件,记这个零件中恰有2件为次品的概率为,求取得最大值时的值.
【答案】(1)的分布列详见解析;
(2)66
【分析】(1)根据分布列、数学期望及超几何分布概率计算公式求解即可.
(2)根据二项分布求出,比较与1的大小关系,判断数列的单调性,从而找到最大值点.
【详解】(1)的可能取值为0,1,2.
,,.
所以的分布列为
数学期望为.
(2)由频率估计概率,单次抽到次品的概率为,
则个零件中恰有2件次品的概率为.
.
令,即,解得;令,解得.
因此,当时,,当时,,所以在时取得最大值.
故取得最大值时的值为66.
5.(2026·重庆·一模)一顾客参加某商场的抽奖活动,抽奖规则为:抛掷一枚质地均匀的骰子,若掷出的点数大于4,则中奖,否则不中奖,每次抛掷相互独立.设该顾客抽奖次,中奖次数为.
(1)若,求的分布列和期望;
(2)若,,1,2,3,,,求的最大值;
(3)设未出现连续两次不中奖的概率为.求,,,并说明当足够大时,的实际意义.
【答案】(1)分布列详见解析,
(2)5
(3)1,,
【分析】(1)利用二项分布概率计算公式可得分布列,期望;
(2)利用数列最大值的求法可得答案;
(3)根据题意建立递推公式,构造等比数列求通项即可.
【详解】(1)当 时,中奖次数 服从二项分布 .
,
,
故分布列为:
期望 .
(2)由于 ,即
因为 对所有 ,1,2,3,,成立,
所以需满足,
即,解得:,
故;
又当时,
当时,
,易知当时,,
故,即,
所以在单调递减,又由,
可得,当时,恒成立.
故的最大值为5.
(3)设 为 次抽奖中未出现连续两次不中奖的概率。考虑第一次抽奖结果:
若第一次中奖(概率 ),则后 次未出现连续两次不中奖的概率为 ;
若第一次不中奖(概率 ),则第二次必须中奖(概率 ),后 次未出现连续两次不中奖的概率为 ,
得递推关系:
初始条件:,,计算得:
构造等比数列求通项:
设存在常数 使得 ,代入递推式,比较系数得:
解方程 ,得 ,,
取 ,,则有:
令 ,则 ,且 ,
所以:,即:
另取 ,,同理可得:
令 ,则 ,且 ,
所以:即:
得:
当 足够大时:由于 和 ,故 .
实际意义:当抽奖次数 非常大时,未出现连续两次不中奖的概率趋近于 0,
即几乎必然会出现连续两次不中奖的情况.
超几何分布及应用
1.(2025·江西·模拟预测)为了保持某自然生态保护区的生态平衡,现用重捕法了解该保护区内某种动物的大致数量(单位:只),随机在保护区内捕捉了100只该动物并做上标记,一段时间后再随机捕捉100只,用表示第二次捕捉的100只中有标记的数量.若以使得的概率最大时的值作为该保护区内这种动物的数量的估计值,则的估计值是 .
【答案】
【分析】根据超几何分布,得到,求得,得到,结合,求得,进而得到答案.
【详解】由题意得,随机变量服从超几何分布,即,
记,则,
所以.
当时,,解得,
当时,,故当时,最大,的估计值为.
故答案为:.
2.(2025·河北·模拟预测)某校航模社团共有名学生,研究“战斗机航模”的有人,其中男生人女生人,另外人研究“无人机航模”.
(1)从研究“战斗机航模”的人中任意选出人宣传该社团,已知其中一位是女生,求另一位也是女生的概率;
(2)从航模社团中任意选出人参加航模设计大赛,设表示来自研究“无人机航模”的人数,求的数学期望.
【答案】(1)
(2)
【分析】(1)记事件:选出的人中至少有一个是女生,事件:选出的人都是女生,求出、的值,利用条件概率公式求出的值;
(2)由题意可知,随机变量的可能取值有、、、,求出随机变量在不同取值下的概率,即可求出的值.
【详解】(1)记事件:选出的人中至少有一个是女生,事件:选出的人都是女生,
所以,,
由条件概率公式可得;
(2)由题意可知,随机变量的可能取值有、、、,
,,,
,
所以随机变量的分布列如下表所示:
所以.
3.(25-26高三上·重庆·期中)甲、乙两工厂共同生产一种零件, 经过抽样调查, 质检人员发现: 甲工厂生产的一批零件的合格品率为 85%;乙工厂生产的另一批零件的合格品率为 95%;若将这两批零件混合放在一起,则合格品率为 89%.
(1)设甲工厂生产的这批零件有 件,乙工厂生产的这批零件有 件. 求证: ;
(2)按照分层随机抽样的方法从两个工厂生产的零件中随机抽取 5 个,再从这 5 个零件中抽取 3 个,记这 3 个零件中来自乙工厂的个数为 ,求 的分布列和数学期望.
【答案】(1)证明见解析;
(2)分布列见解析,数学期望为.
【分析】(1)求出甲、乙合格件数以及混合后合格件数,从而得到方程,即可证明;
(2)写出的可能取值,再利用超几何分布求出对应概率值即可,最后得到期望值.
【详解】(1)依题意,甲工厂生产的件零件的合格件数为,
乙工厂试生产的件的合格件数为,
又混合后,总零件数为,合格品率为,
则混合后合格零件数为,
解得,即(证毕).
(2)设甲工厂生产的这批零件有件,乙工厂试生产的这批零件有件,
由(1)可知,故抽出的5件产品中有3件来自甲工厂,2件来自乙工厂,
可能取值为0,1,2,
所以,
所以 的分布列为:
.
4.(2025·四川达州·模拟预测)年末促销是商场常用清理库存和资金回笼的一种措施.某商场对消费超过500元的消费者提供一次抽奖活动,抽奖箱中装有10个同种材质且大小相同的红球、黄球和绿球(绿球的个数最多),消费者从抽奖箱中同时抽取2个小球,若2个小球都是红球即获得一等奖,都是黄球即获得二等奖,其余情况,均是不获奖.若从抽奖箱中同时抽取2个小球,其中黄球和绿球各1个的概率是,某消费者抽奖一次.
(1)求其获得一等奖的概率;
(2)记抽到的绿球个数为,求的分布列及其期望.
【答案】(1);
(2)分布列见解析,1.
【分析】(1)根据题设确定10个小球中黄球、绿球的个数,再由古典概型的概率求法求概率;
(2)由题设的取值是,应用超几何的概率求法求对应概率值,写出分布列,进而求期望.
【详解】(1)设10个小球中黄球为个,绿球为个,且,
由题意得,,解得,则红球有2个,
记事件:某消费者抽奖一次获得一等奖,则,
所以该消费者获得一等奖的概率为.
(2)由题意,的取值是,则,,,
的分布列为:
期望.
5.(2025·山东济宁·一模)为了解高三,1班和2班的数学建模水平,现从两个班级中各随机抽取10名学生参加数学建模能力比赛(满分100分),成绩如下:
数据Ⅰ(高三,1班):68,80,58,75,65,70,54,90,88,92;
数据Ⅱ(高三,2班):72,55,83,59,56,90,83,52,80,95.
(1)求数据Ⅰ(高三,1班)的第80百分位数;
(2)从上述成绩在60分以下的学生中随机抽取3人作下一步调研,设被抽到的3人中来自于高三,2班的学生人数为,求的概率分布列和数学期望.
【答案】(1)89
(2)分布列见详解;
【分析】(1)将数据从小到大排列,根据百分位数的定义进行求解即可;
(2)的所有可能取值为1,2,3,求出对应的概率,即可得出分布列和数学期望.
【详解】(1)将数据Ⅰ从小到大排列为:54,58,65,68,70,75,80,88,90,92,
因为,所以数据Ⅰ的第80百分位数为.
(2)数据Ⅰ中60分以下的有54分,58分;
数据Ⅱ中60分以下的有52分,55分,56分,59分;
即符合题意共6人,其中高三,1班有2人,高三,2班有4人.
可知X的所有可能取值为1,2,3,
则,,,
所以X的概率分布列为
数学期望.
正态分布的应用
1.(2026·河北邢台·一模)若随机变量,且,则
【答案】/
【分析】根据题意结合正态分布的对称性运算求解即可.
【详解】因为随机变量,所以,
,
所以.
故答案为:.
2.(多选)(2026·湖北荆门·模拟预测)目前新能源汽车越来越受到人们的关注与喜爱,其中新能源汽车所配备电池的充电量及正常使用年限是人们购车时所要考虑的重要因素之一.某厂家生产的某一型号的新能源汽车配备了两组电池,且两组电池能否正常使用相互独立.每组电池的正常使用年限(单位:年),,,以下结论正确的是( )
A.B.
C.D.这两组电池正常使用年限都不超过20年的概率为0.75
【答案】AB
【分析】利用正态分布的性质及正态曲线求解出的值和的值,利用公式及求解,由两组电池能否正常使用相互独立,利用独立重复试验求概率.
【详解】对于选项A,,,,
,,
,,故选项A正确;
对于选项B,
,故选项B正确;
选项C,,,
故选项C错误;
选项D,,,,,
两组电池能否正常使用相互独立,
这两组电池正常使用年限都不超过20年的概率为,故选项D错误.
故选:AB.
3.(2026·湖南邵阳·一模)已知随机变量,正实数满足,则的最小值为( )
A.3B.4C.5D.6
【答案】D
【分析】先利用正态分布的对称性求的关系,进而利用基本不等式求最小值.
【详解】由,得正态曲线关于对称.
因为,
所以,得.
又,
当且仅当,即,时取等号.
故的最小值为6.
故选:D
4.(多选)(2026·广东肇庆·二模)已知随机变量,则( )
A.
B.越大,随机变量的方差越大
C.随机变量的分布越集中,的值越小
D.的取值在内是小概率事件
【答案】ACD
【分析】应用正态分布性质及对称性判断各个选项即可.
【详解】对于A,因为随机变量,所以,
所以,故A正确;
对于B,,而非方差,故B错误;
对于C,随机变量的分布越集中,说明数据的波动越小,方差越小,
而,则的值越小,故C正确;
对于D,根据原则,故D正确.
故选:ACD.
5.(多选)(2026·陕西延安·一模)陕西省某中学体能测试成绩服从正态分布,已知,则下列说法正确的是( )(参考数据:)
A.
B.
C.若随机抽取3名学生,则至少2人成绩超过75的概率为
D.若随机抽取100名学生,则成绩超过85的人数期望为20
【答案】BD
【分析】利用正态分布的对称性判断B;结合正态分布的原则判断A;利用二项分布的概率公式判断C;利用二项分布的期望公式判断D即可.
【详解】对于B,由正态分布性质得,
则,故B正确,
对于A,当时,则,,
由正态分布性质得,
而由已知得,与题意不符,故A错误;
对于C,由正态分布性质得,,
设成绩超过75的人数为,则,
由二项分布概率公式得,
则至少2人成绩超过75的概率为,故C错误,
对于D,设成绩超过85的人数为,且,
由题意得,由二项分布的期望公式得,
则成绩超过85的人数期望为20,故D正确.
故选:BD
随机抽样样本的数字特征
1.(多选)(2026·广东湛江·一模)一组互不相等的数据从小到大排列为,去掉后,则下列选项正确的有( )
A.极差变大B.平均数变大C.中位数变小D.分位数变大
【答案】BD
【分析】分别计算去掉前后的数据的极差,平均数,中位数及分位数并比较可得.
【详解】由题意,去掉后,极差为,极差变小,故A错误;
平均数,所以平均数变大,故B正确;
原数据和新数据的中位数分别为,且,故中位数变大,故C错误;
原数据的分位数:,取第5个数,新数据的分位数:,
取第4、5个数的平均,因为,所以,故分位数变大,故D正确.
和新数据
故选:BD.
2.(多选)(2026·河北·模拟预测)已知一组样本数据为7,1,3,4,5,1,5,6,则下列说法中正确的是( )
A.这组数据的极差是5B.这组数据的中位数是4.5
C.这组数据的第80百分位数是5.5D.这组数据的方差是4.25
【答案】BD
【分析】把数据从小到大排序,结合极差、中位数,百分位数,以及平均数和方差的计算公式,逐项计算求解,即可得到答案.
【详解】根据题意,把数据从小到大排序,可得,共有8个数,
对于A,这组样本数据的极差为,所以A错误
对于B,根据数据中位数的定义,可得样本数据的中位数为,所以B正确;
对于C,由,所以样本数据的第80百分位数为数据的第7个数,
即第80百分位数为,所以C错误;
对于D,由平均数的计算公式,可得,
所以方差为:
,所以D正确.
故选:BD.
3.(2026·云南昭通·模拟预测)棉花的纤维长度是棉花质量的重要指标.在一批棉花中随机抽测了400根棉花纤维的长度(单位:),整理得到下表数据:
根据表中数据,关于对样本数据的分析,下列结论中正确的是( )
A.棉花纤维的长度的极差估计值大于
B.棉花纤维中,其长度低于的棉花纤维数占三分之一
C.棉花纤维的长度的中位数估计值介于至之间
D.棉花纤维的长度的平均值估计值介于至之间
【答案】C
【分析】通过题目数据计算频数、极差、中位数、平均值,逐项分析即可.
【详解】根据表中数据,这400根棉花纤维的长度的极差估计值为,不满足选项A中‘大于’的要求,故A错误;
纤维长度低于44mm的棉花纤维数占比为,故B错误;
由于纤维长度小于44mm的纤维数量为130,纤维长度不低于51的纤维数量为150,
可知这400根棉花纤维的长度的中位数估计值介于44mm至51mm之间,故C正确;
方法一:400根棉花纤维的长度的平均值估计值为,故D错误,
故选:C.
4.(多选)(2026·四川泸州·二模)已知两组样本数据和,其中是的中位数,则这两组样本数据的( )
A.极差不相等B.中位数相等
C.平均数相等D.标准差可能相等
【答案】BD
【分析】不妨设,则,即可得新数据,结合极差、中位数的定义分析判断AB;举反例判断CD.
【详解】不妨设,则,
新数据按升序排列可得,
对于选项A:两组数据的极差均为,即极差相等,故A错误;
对于选项B:两组数据的中位数均为,即中位数相等,故B正确;
对于选项C:例如,则,平均数为,
新数据的平均数为,
显然,所以平均数不相等,故C错误;
对于选项D:例如,则,显然其标准差为0,
新数据的标准差也为0,两者相等,故D正确;
故选:BD.
5.(多选)(2026·全国·模拟预测)已知甲、乙两组样本各有1000个数据,甲、乙两组数据合并后得到一组新数据,则( )
A.若甲、乙两组数据的平均数都为a,则新数据的平均数等于a
B.若甲、乙两组数据的极差都为b,则新数据的极差可能大于b
C.若甲、乙两组数据的方差都为c,则新数据的方差可能小于c
D.若甲、乙两组数据的中位数都为d,则新数据的中位数等于d
【答案】ABD
【分析】根据平均数,极差,方差和中位数的定义和公式,逐个判断即可得.
【详解】设甲:,乙:,新数据为:,
A:因为,正确;
B:设甲:,乙:,两组数据极差均为,混合后数据的极差为,正确;
C:因为,
所以,,,
所以新数据的方差为,
因为,
即新数据的方差,当且仅当两组样本均值相等时取等号,错误.
D:不妨设,,
由它们的中位数相等,则,
将混合后数据按从小到大排列,
若,则,所以第1000,1001个数为和;
此时新数据的中位数为,
若,则,所以第1000,1001个数为和,
此时新数据的中位数为
两种情形下,新数据的中位数都等于,正确;
故选:ABD.
频率分布直方图
1.(2026·湖南株洲·一模)从某社区1万余名居民中随机调查了部分居民,获得了他们的每日运动时长数据,整理得到如下频率分布直方图.
(1)求的值;
(2)假设同组中的每个数据用该组区间的中点值代替,估计该社区全体居民的每日平均运动时长;
(3)若用样本的频率估计总体的概率,现从该社区居民中随机抽取4人,用表示每日运动时长在50分钟以上的居民人数,求随机变量的数学期望.
【答案】(1)
(2)42.5分钟
(3)1
【分析】(1)根据频率分布直方图中小长方形面积等于对应区间概率及所有小长方形面积之和为1求解;
(2)根据平均数等于组中值与对应概率乘积的和得平均值;
(3)由随机变量服从二项分布进行求解.
【详解】(1)根据题意得:,
解得.
(2)设样本中居民的运动时长的平均数为,
所以估计该社区全体居民的每日平均运动时长为42.5分钟.
(3)从该社区居民中随机抽取一名居民,根据直方图中的信息,
估计每日运动时长在50分钟以上的概率,
随机变量服从二项分布,.
2.(2026·河南南阳·模拟预测)某科技公司开发了一款AI绘画软件,为了测试该软件生成的人像照片的真实度,工程师邀请了100名用户对生成的照片进行评分(满分100分).将评分数据按,,,,,分成6组,并绘制了如下的频率分布直方图.
(1)求的值;
(2)试估计这100名用户评分的平均数;(同一组中的数据用该组区间的中点值作代表)
(3)若从评分在内的用户中,按分层随机抽样的方法抽取5人进行回访,再从这5人中随机抽取2人赠送会员,求这2人来自不同评分区间的概率.
【答案】(1)
(2)
(3)
【分析】(1)根据频率分布直方图结合频率和为1求得a;
(2)根据频率分布直方图和平均数的计算方法,可得答案;
(3)根据分层抽样的比例确定各组中的人数,列出所有基本事件,根据古典概型的概率公式可得答案.
【详解】(1)由频率分布直方图可知,
,∴;
(2)估计用户评分的平均数为:
;
(3)样本在,的人数分别为2,8,
利用分层抽样从的用户中随机抽取5人,
则在,的人数分别为1,4,
从中抽取的1人记为,从中抽取的4人记为1,2,3,4,
则从5人中随机抽取2人的样本空间,
记“这2人来自不同评分区间”为事件A,则有,,共4个基本事件,
∴.
3.(2026·辽宁大连·一模)从某小区抽取100户居民用户进行月用电量调查,发现他们的用电量都在之间,进行适当分组后(每组为左闭右开的区间),画出如图所示的频率分布直方图.
(1)求频率分布直方图中的值;
(2)估计月用电量样本数据的中位数;
(3)在该小区所有居民用户中随机抽取一用户,已知的月用电量落在区间中,估计的月用电量恰好落在区间中的概率.
【答案】(1)
(2)
(3)
【分析】(1)根据频率分布直方图中,所有矩形的面积之和为1,列式计算,即可得答案;
(2)判断出样本数据的中位数落在哪个区间内,进而根据中位数的求解方法列式,即可求得答案;
(3)先求出区间内的频率,再求出区间内的频率,根据概率的计算公式即可估计的月用电量恰好落在中的概率.
【详解】(1)频率分布直方图中,所有矩形的面积之和为1,每组的组距为50,
根据上述性质可得:
,
解得;
(2)首先计算前几组的频率:
区间的频率:,
区间的频率:,
区间的频率:,
前两组频率之和为,前三组频率之和为,
所以中位数在内,
设中位数为m,则,
解得;
(3)先计算区间的频率:
区间的频率:,
区间的频率:,
区间的频率:,
所以区间的频率为,区间的频率为0.18,
M的月用电量落在区间中时,
恰好落在区间中的概率为.
4.(2026·河北邢台·一模)某学校对某次高三质量检测化学考试成绩进行了汇总,并将化学成绩按赋分规则转换为等级分数(赋分后学生的等级分数全部位于内),整理后得到如图所示的频率分布直方图.
(1)求频率分布直方图中m的值,并估计该校高三学生化学等级分数的第70百分位数;
(2)用分层随机抽样的方法从等级分数位于内的学生中随机抽出8人,再从这8人中随机抽出3人,记ξ为这3人中等级分数位于内的人数,求ξ的分布列和数学期望.
【答案】(1),;
(2)分布列见详解,期望为
【分析】(1)根据频率分布直方图中频率和为1可求的值;根据百分位数的定义求第70百分位数;
(2)先按抽样比算出各层样本数,可得的可能取值为,写出分布列,算出期望即可.
【详解】(1)由题可得,解得;
数据小于70的占比为,
数据小于80的占比为,
所以第70百分位数位于区间内,记为,
则,解得.
所以估计该校高三学生化学等级分数的第70百分位数为75.
(2)因为,两组的频率之比为,
所以从,两组中抽取的人数分别为6,2.
由题意的可能取值为,
且,,,
所以的分布列为:
所以.
5.(2025·内蒙古赤峰·模拟预测)从某小区抽取100户居民用户进行用水量(单位:吨)调查,将他们的月用水量分成,五组,画出频率分布直方图,如图所示.
(1)求的值,并求在被调查的用户中,月用水量在内的户数;
(2)用比例分配的分层随机抽样方法从月用水量在和内的用户中选取6户,再从这6户居民中任选3户,记这3户居民中月用水量在内的用户数为,求的分布列与期望.
【答案】(1),月用水量在内的户数为30户.
(2)分布列见解析,.
【分析】(1)根据频率分布直方图的性质即可求出值及对应户数.
(2)通过分层抽样确定抽取数量,再分析随机变量的分布列并计算期望.
【详解】(1)频率分布直方图中,组距为5,所有矩形的面积和为1.
所以,解得.
月用水量在内的频率为,所以用户数为.
综上,,月用水量在内的户数为30户.
(2)月用水量在内的频率为,所以用户数为.
所以选取6户中月用水量在的户数为,月用水量在的户数为2户.
表示这3户居民中月用水量在内的用户数,可能取值为1,2,3.
;;,
所以的分布列为:
期望为:.
独立性检验
1.(多选)(2026·重庆·一模)某儿童医院用甲、乙两种疗法治疗小儿消化不良.为分析两种疗法效果是否有差异,采取有放回的简单随机抽样的方法对治疗情况进行检查,得到如下数据:
附常用小概率值及其相应的临界值表为:
计算得.则下列说法正确的是:( )
A.以频率估计概率,有
B.以频率估计概率,有
C.若取,可以认为疗效与疗法独立
D.若取,可以认为疗效与疗法独立
【答案】ABD
【分析】先由题设求出表格中各行各列总数,再由古典概型即可计算求解判断AB;再由独立性检验思想即可分析判断CD.
【详解】由题得下表:
以频率估计概率,有,故A正确;
以频率估计概率,有,故B正确;
零假设:认为疗效与疗法独立,由题且,
所以若取小概率值,则零假设不成立,即不可以认为疗效与疗法独立;
若取小概率值,则没有充分的证据推翻零假设,故可以认为疗效与疗法独立,
故C错误,D正确.
故选:ABD
2.(2026·湖北十堰·一模)某生态农场用精准农业技术种植番茄,研究两种智能灌溉系统(型与型)对果实品质的影响.农场随机选取200株番茄,记录灌溉类型及果实糖度达标情况,得如下列联表:
(1)根据小概率值的独立性检验,判断番茄果实糖度达标与灌溉类型是否有关联;
(2)该农场同时测试无土栽培技术对产量的影响,已知单株番茄产量()为,通过测试得到使用无土栽培时的分布列为:
使用传统土壤栽培时的分布列为:
从这两种方式栽培的番茄中随机各抽取1株,若使用无土栽培技术与使用传统土壤栽培时番茄的产量相互独立,求抽到的2株番茄总产量大于的概率.
附:,其中.
【答案】(1)有关联;
(2)0.28.
【分析】(1)利用给定列联表中数据求出的观测值,再与临界值比对即可得解.
(2)由给定的分布列,利用互斥事件及相互独立事件的概率公式计算得解.
【详解】(1)零假设为番茄果实糖度达标与灌溉类型没有关联,
根据列联表中的数据,经计算得到,
根据小概率值的独立性检验,推断不成立,
即认为番茄果实糖度达标与灌溉类型有关联,此推断犯错误的概率不大于0.05.
(2)令使用无土栽培的单株番茄产量为,使用传统土壤栽培的单株番茄产量为,
抽到的2株番茄总产量为,则,
则
,
所以抽到的2株番茄总产量大于的概率为0.28.
3.(2026·湖北·二模)某健身房为了解“是否喜欢健身操”与年龄的关联性,随机调查了80位会员,得到的数据如表所示(单位:人):
(1)根据小概率值的独立性检验,能否认为是否喜欢健身操与年龄有关联?
(2)已知会员小邹选择“动感单车”“瑜伽”“普拉提”三种项目的概率依次为,,;且小邹在这三种项目中达到“训练标准”的概率依次为,,.若小邹某次训练未达到目标,求他选择的是“瑜伽”项目的概率。
附:,.
【答案】(1)不能认为是否喜欢健身操与年龄有关联
(2)
【分析】(1)运用列联表进行独立性检验,通过计算卡方统计量与临界值比较,判断两个分类变量之间是否存在关联;
(2)使用全概率公式计算未达标总概率,再通过贝叶斯公式反推在未达标条件下选择特定项目的条件概率.
【详解】(1)零假设为:是否喜欢健身操与年龄无关联.
根据列联表中的数据,计算得到,
所以根据小概率值的独立性检验,不能认为是否喜欢健身操与年龄有关联.
(2)设表示“选动感单车”;表示“选瑜伽”;表示“选普拉提”;表示“未达到目标”.
,,,,
,
,
小邹训练没有达标的条件下,他选择瑜伽的概率为:
.
4.(2026·河北沧州·一模)2025年7月15日,搭载天舟九号货运飞船的长征七号遥十运载火箭成功发射,标志着我国航天事业又迈上了一个新台阶.某中学为了解学生对我国航天事业发展的关注度,随机地从该校学生中抽取一个容量为200的样本进行调查,调查结果如下表:
以频率估计概率,若在这200名学生中随机抽取1人,该学生高度关注我国航天事业发展的概率为.
(1)求的值;
(2)根据小概率值的独立性检验,判断该校学生对航天事业发展的高度关注是否与学生性别有关.
参考公式:,其中.
临界值表:
【答案】(1)
(2)该校学生高度关注我国航天事业发展与学生性别有关,
【分析】(1)利用古典概型列方程,解方程可得答案;
(2)利用独立性检验可得答案.
【详解】(1)因为在这200名学生中随机抽取1人,该学生高度关注我国航天事业发展的概率为,
所以,解得.
又,解得,所以
(2)由(1)得,列联表如下:
零假设为;该校学生高度关注我国航天事业发展与学生性别无关.
,
因为依据小概率值的独立性检验,判断不成立,
即认为该校学生高度关注我国航天事业发展与学生性别有关,此推断犯错误的概率不大于.
5.(2026·四川遂宁·一模)冬季气温骤降、空气干燥且气压变化大,慢性阻塞性肺疾病(慢阻肺),哮喘,间质性肺病、肺纤维化,肺炎、支气管炎患者等呼吸系统疾病患者对氧气需求增加,尤其需要制氧机辅助,近年来,我国制氧机产业迅速发展,下表是某地区某品牌制氧机的年销售量与年份的统计表:
(1)求这种品牌制氧机的销量关于年份代码的线性回归方程,并预测2027年这种品牌制氧机的销量;
(2)为了研究不同性别的学生对制氧机知识的了解情况,某校组织了一次有关制氧机知识的竞赛活动,随机抽取了男生和女生各100名,得到如下列联表:
(ⅰ)根据已知条件,填写列联表;
(ⅱ)根据小概率值的独立性检验,判断该校学生对制氧机知识的了解情况与性别是否有关联;
(3)从(2)的样本中按对制氧机知识了解和不了解的学生人数进行分层抽取10人,再从这10人中随机抽取4人做某项调查,记这4人中对制氧机知识不了解的人数为,试求的分布列和数学期望.
附:回归直线的斜率和截距的最小二乘估计公式分别为
【答案】(1),12.4万台
(2)(ⅰ)表格见解析;(ⅱ)有关联,理由见解析;
(3)分布列见解析,数学期望为
【分析】(1)计算出,得到线性回归方程,代入,从而预测2027年这种品牌制氧机的销量;
(2)(ⅰ)补全列联表;(ⅱ)计算出,从而得到结论;
(3)求出的可能取值并得到相应的概率,从而得到分布列,计算出数学期望.
【详解】(1)年份代码的平均数,销量的平均数,
所以,
,
所以,
所以,
所以这个地区某品牌制氧机的销量关于年份代码的线性回归方程为,
由于2027年对应的年份代码为,得,
所以预测2027年这个地区某品牌制氧机的销量约为12.4万台.
(2)(ⅰ)根据男生和女生各100名,补全列联表为:
(ⅱ)零假设:该校学生对制氧机知识的了解情况与性别无关.
根据(ⅰ)中的列联表中的数据可得,
.
根据小概率值的独立性检验,推断不成立,
即该校学生对制氧机知识的了解情况与性别有关联,此推断犯错误的概率不大于0.005.
(3)从(2)的样本中按对制氧机知识了解和不了解的比例选取10人,
则抽取的10人中,了解的人数为6人,不了解的人数为4人
再随机从中抽取4人,对制氧机知识不了解的人数的所有可能取值为0,1,2,3,4.
且,
,
,
则的分布列为
数学期望为
回归分析
1.(多选)(2025·广东·一模)一组样本数据.其中,求得其经验回归方程为:,残差为.对样本数据进行处理:,得到新的数据,求得其经验回归方程为:,其残差为,分布如图所示,且,则( )
A.样本负相关B.
C.D.处理后的决定系数变大
【答案】ABD
【分析】利用回归方程判断A;利用样本中心点计算判断B;利用图象的波动性判断CD.
【详解】对于A,经验回归方程中斜率,则样本负相关,A正确;
对于B,原样本均值:,由,得,B正确:
对于C,由图1的数据波动较大可得比更集中,则,C错误;
对于D,由图1的残差平方和较图2的残差平方和大知,处理后拟合效果更好,决定系数变大,D正确.
故选:ABD
2.(多选)(2025·河北·模拟预测)甲乙二人统计变量和变量,得到一组数据并进行回归分析,甲同学首先求出变量的8个数据平均值为2,回归直线方程,乙同学对甲的计算过程进行检查,发现甲将一数据错看成,甲乙二人将错误修正后得到正确回归直线方程,则( )
A.变量的8个数据正确平均值为
B.
C.变量和变量正相关
D.变量和变量的相关系数为4
【答案】ABC
【分析】根据回归方程过样本中心点,利用题干数据求出正确的样本中心点,判断AB;根据回归直线方程斜率的正负判断C;根据相关系数的范围判断D.
【详解】由甲同学所得错误的回归直线方程过点得,
并得到,,
所以,,
又甲将一数据错看成,
所以实际应为,,
故正确的,,故A正确;
又,,满足,所以,解得,故B正确;
又因为回归直线方程的斜率为,所以变量和变量正相关,故C正确;
根据变量和变量的相关系数的范围为,故,故D错误.
故选:ABC
3.(多选)(2025·河北秦皇岛·二模)某科技公司统计了一款App最近5个月的下载量,如下表所示,若与线性相关,且经验回归方程为,则( )
A.与负相关B.
C.第7个月的下载量估计为1.8万次D.残差绝对值的最大值为0.2
【答案】ABD
【分析】根据回归方程的增减性,可得A的正误;取得样本中心代入方程,可得B的正误,利用回归方程,代入求值,可得C的正误;由题意列表求得每个月的残差,可得D的正误.
【详解】对于A,由,则回归直线斜向下,故A正确;
对于B,由,,即样本中心为,
则,解得,故B正确;
对于C,将代入回归方程,解得,故C错误;
对于D,由题意可得下表:
则最大值为,故D正确.
故选:ABD.
4.(2026·陕西西安·一模)当前,人工智能技术以前所未有的速度迅猛发展,并逐步影响生活的方方面面,人工智能被认为是推动未来社会发展和解决人类面临的全球性问题的重要手段.某公司在这个领域逐年加大投入,以下是近年来该公司对产品研发年投入额(单位:百万元)与其年销售量(单位:千件)的数据统计表.
(1)根据统计表的数据及参考公式计算样本相关系数,推断两个变量的相关程度;
(2)根据(1)问的结果判断是否可以用一元线性回归模型来刻画年销售量和投入额之间的关系?如果可以,根据最小二乘法,建立销售量关于投入额的经验回归方程;如果不可以,请说明理由.
(3)该公司科研团队发现样本数据呈现出明显的非线性相关的特征,得到年销售量关于年投入额的非线性经验回归方程为,并计算出的残差平方和,请根据统计表的数据及参考公式,比较线性经验回归方程和非线性经验回归方程的拟合效果哪种更好?并选择拟合精度更高的方程,预测年投入额为6百万元时,产品的销售量约为多少?(计算结果保留到小数点后两位).
参考公式及数据:,,,,,,.
【答案】(1),正线性相关,且相关程度很强.
(2)可以,
(3)非线性经验回归方程的拟合效果更好,9.68千件
【分析】(1)根据表中数据,代入相关系数的计算公式求出,再根据相关系数的概念判断求解即可;
(2)根据相关系数的概念可知可以用一元线性回归模型来刻画年销售量和投入额之间的关系,利用最小二乘法的计算公式求出即可得解;
(3)计算线性经验回归方程残差和非线性经验回归方程残差比较可得非线性经验回归方程更好,再由所给方程求出预测值即可.
【详解】(1)由表得,,,
又因为,
所以,
由于的值接近1,所以可以推断年销售量和年投入额这两个变量正线性相关,且相关程度很强.
(2)由(1)得两个变量的线性相关程度很强,
所以可以用一元线性回归模型来刻画年销售量和投入额之间的关系,
设年销售量关于年投入额的经验回归方程为,
所以,,
所以年销售量关于年投入额的经验回归方程为.
(3)由(2)得,可得如下数据:
所以的残差平方和为,
由于,故非线性经验回归方程拟合效果更好,
当时,(千件),
故当年投入额为6百万元时,产品的销售量约为9.68千件.
5.(2025·湖南永州·模拟预测)某经济研究所为了解居民存款余额变化情况,对2009年至2024年居民存款余额进行统计分析,将2009年看成第1年,依次类推,得到第1~16年的居民存款余额(单位:万亿元)的散点图,如图所示:
(1)已知从2021年开始,居民存款余额超过100万亿元,若从2009年至2024年中任取2年,求这2年中恰有一年居民存款余额超过100万亿元的概率;
(2)由散点图知,和的关系可用经验回归模型进行拟合,求关于的经验回归方程.
参考数据:设,则.
参考公式:对于一组数据,其经验回归直线的斜率和截距的最小二乘估计分别为.
【答案】(1)
(2).
【分析】(1)16年中有4年居民存款余额超过100万亿元,根据组合知识求解概率;
(2)两边取对数,再根据公式求出,,从而,故.
【详解】(1)由题意,16年中有4年居民存款余额超过100万亿元,
故所求概率为.
(2),
由题知,,
,
,
,故.
(建议用时:30分钟)
1.(多选)(2025·云南昭通·模拟预测)甲罐中有5个红球,5个白球,乙罐中有2个红球,8个白球.先从甲罐中随机取出一球放入乙罐,再从乙罐中随机取出一球.表示事件“从甲罐取出的球是红球”,表示事件“从甲罐取出的球是白球”,表示事件“从乙罐取出的球是红球”.则下列结论正确的是( )
A.为对立事件
B.
C.
D.
【答案】ABD
【分析】根据对立事件定义可判断A;根据条件概率及全概率公式计算可判断BCD.
【详解】对于A,因为甲罐中只有红球和白球,即,
所以为对立事件,故A正确;
对于B,当发生时,乙罐中有3个红球,8个白球,此时,故B正确;
对于C,当发生时,乙罐中有2个红球,9个白球,此时,
所以,故C不正确;
对于D,,故D正确,
故选:ABD.
2.(多选)(2026·河南郑州·模拟预测)任意抛掷一枚骰子一次,观察它向上一面的点数,得到样本空间为,若事件,事件,事件满足,下列结论中正确的是( )
A.
B.事件,,两两独立
C.当事件时,
D.当事件时,事件包含10个样本点
【答案】AC
【分析】A.可以由古典概型的概率计算判断;B. 由事件独立性的判定推断;C. 利用题干条件求解;D. 利用事件子集的样本点上限判断
【详解】A,样本空间包含 6 个样本点,事件,因此,正确;
B,由题意得,故,而,
因,故事件A与B不独立,错误;
C,事件时,,已知,,
代入得,,解得,正确;
D,样本空间仅包含 6 个样本点,事件C是的子集,不可能包含 10 个样本点,错误.
故选:AC
3.(2026·四川雅安·一模)甲、乙两人分别从A,B,C,D,E五个景点中随机选择一个景点游玩,若这两人中至少有一人选择景点A,则他们选择的景点不相同的概率为 .
【答案】
【分析】记事件为“甲乙两人中至少有一人选择景点A”,事件为“甲乙两人选择的景点不相同”,根据古典概型概率公式求出,再由条件概率公式求解即可.
【详解】记事件为“甲乙两人中至少有一人选择景点A”,事件为“甲乙两人选择的景点不相同”,
甲乙两人从5个景点中随机选择1个景点游玩,每人都有5种不同的选法,共有种不同的选法,
甲乙两人都不选择景点A的方法有种,
因此甲乙两人中至少有一人选择景点A的方法共有 种,
甲乙两人中至少有一人选择景点A的概率,
表示甲乙两人中至少有一人选择景点A,且甲乙两人选择的景点不同,
即一人选择景点A,另一人选择其它景点,共有 种选法,则,
所以.
故答案为:
4.(2026·重庆九龙坡·一模)盒子中有4个红球,6个白球,从盒中每次取1个球,取出后将原球放回,再加入2个同色球,所有的球除颜色外其它均相同,则第2次取到红球的概率为 ;在第2次取到红球的前提下,第3次取到白球的概率为 .
【答案】 / /
【分析】根据条件概率及全概率公式即可求解.
【详解】记事件“第次取到红球”,
则,
,
所以,
即第2次取到红球的概率为;
,
所以,
即在第2次取到红球的前提下,第3次取到白球的概率为.
故答案为:;.
5.(多选)(2026·湖北宜昌·模拟预测)某人进行投篮游戏,每次投篮的命中率为,且投篮结果互不影响,如果出现连续次命中,那么停止投篮,游戏结束.则( )
A.当时,投篮2次游戏结束的概率为
B.当时,投篮3次游戏结束的概率大于投篮4次游戏结束的概率
C.当时,游戏结束时投篮总次数的数学期望为
D.设游戏结束时投篮总次数的数学期望为,则()
【答案】ACD
【分析】利用相互独立事件同时发生的概率公式可求AB;假定状态再分类讨论,利用递推法可求CD.
【详解】对于A, 由相互独立事件同时发生的概率公式可得,
投篮2次后游戏结束的概率为,故A正确;
对于B,当时,即出现连续次命中,那么停止投篮,游戏结束.
故投篮3次游戏结束的事件为“次投篮结果依次为:不中、命中、命中”,
则由相互独立事件同时发生的概率公式可得,
投篮3次游戏结束的概率;
投篮4次游戏结束,则第3、4次必须命中,且第2次必须不中(否则游戏在第3次或第2次就已结束),第1次投篮结果不影响,
故投篮4次游戏结束的概率为,
两者概率相等,故B错误;
对于C,当时,即出现连续次命中,那么停止投篮,游戏结束.
设投篮的总次数的数学期望,考虑第一次投篮的结果:
①第一次命中,
若第一次命中,第二次也命中(概率为),则投篮总次数为;
若第一次命中,第二次未命中(概率为),则游戏重置,投篮的总次数可看作;
②第一次未命中(概率为),则游戏重置,投篮的总次数可看作;
则,解得,故C正确;
对于D,由题意,为出现连续次命中停止投篮游戏结束时投篮总次数的数学期望.
在连续次命中停止的游戏中,考虑首次达到出现连续命中()次的时刻,
此时当前投篮的总次数期望为,且最后次都投篮命中.
现在从此状态开始,游戏还需要进行直至停止(即连续次命中),考虑下一次投篮的结果:
若下一次投篮命中(概率为),
则出现连续次命中停止投篮游戏结束,即投篮的总次数可看作次;
若下一次投篮命不中(概率为),
则游戏重置,需再进行次投篮游戏才能结束,即投篮的总次数可看作;
故,
整理得(),故D正确.
故选:ACD.
6.(2026·河南南阳·模拟预测)某大学某专业开设了《数据分析》课程,在期末的“APM数据挖掘”项目中,老师从提交的作业中随机抽取了10份样本进行分析,其中选择类方向作为研究对象的有6人(记为组),选择类方向作为研究对象的有4人(记为组).已知组样本APM数据的平均数为120,方差为8,组样本APM数据的平均数为100,方差为8,则这10份样本APM数据的平均数和方差分别是( )
A.112,104B.112,114C.114,104D.114,114
【答案】A
【分析】平均数的计算方法是所有数据的总和除以数据的总个数,由此可求得这10份样本APM数据的平均数,根据分组数据合并后的方差计算公式,即可求得方差.
【详解】由题意可得这10份样本APM数据的平均数为;
这10份样本APM数据的方差为
,
故选:A
7.(多选)(2026·福建·一模)设,且.若随机变量满足,则(已知若随机变量,则)( )
A.B.
C.D.
【答案】ABD
【分析】利用二项分布的期望与方差公式可判定A,利用随机变量的期望与方差公式可判定B、C,由正态分布的对称性可判定D.
【详解】依据二项分布相关公式,.
依据正态分布定义,.
故而由期望可加性,A选项正确.
由随机变量数学期望和方差的相关性质,,
,因此B选项正确,C选项错误.
由正态分布的相关性质,有,
而,所以,D选项正确.
故选:ABD
8.(2026·湖南邵阳·一模)国家近年来对机器人的研究,尤其是在人形机器人和具身智能领域方面,出台了一系列的政策,旨在推动技术创新、产业升级和规模化应用.某学校为响应国家号召,培养学生的创新能力,举办机器人比赛,经过初赛,甲班团队和乙班团队进入了决赛阶段.决赛阶段规定:对每一轮比赛,获胜方记1分,另一方记0分,无平局;当两团队累积得分的分差为3分时,比赛结束,累积得分高的团队获冠军.若每轮比赛中,甲班团队获胜的概率为,且每轮比赛的结果相互独立.
(1)若比赛结束时恰好进行了3轮比赛,求甲班团队获得冠军的概率;
(2)(i)若比赛最多进行5轮,求比赛结束时比赛轮数的分布列及数学期望;
(ii)若比赛轮数不限制,求甲班团队获得冠军的概率.
【答案】(1)
(2)(i)分布列见解析,(ii).
【分析】(1)由互斥事件和相互独立事件的概率公式进行计算.
(2)(i)先得到的所有可能取值为3,5,再结合互斥事件和相互独立事件的概率公式得到取每个值的概率,从而列出分布列,利用数学期望的计算公式得到.
(ii)设事件为“比赛轮数不限制,甲班团队获冠军称号”,设比赛过程中,甲班团队与乙班团队累积得分的差为,表示时最终甲班团队获“冠军”称号的概率,可得,结合全概率公式和迭代可得最终结果.
【详解】(1)设事件为“第轮比赛甲班团队获胜”,由题意得.设事件表示“当比赛结束时恰好进行了3轮比赛,且甲班团队获得冠军”,因为每轮比赛的结果相互独立,
则.
故甲班团队获得冠军的概率为.
(2)(i)由题意得,事件为“第轮比赛乙班团队获胜”,,
的所有可能值为3,5.
所以.
所以的分布列为
所以.
(ii)设事件表示“比赛轮数不限制,甲班团队获得冠军”.设比赛过程中,甲班团队与乙班团队累积得分的分差为表示时最终甲班团队获得冠军的概率,其中.由题意知.
根据全概率公式有
.
所以,
迭代得
所以,
,
.
累加得
所以.
故,
所以.
即.
故若比赛轮数不限制,甲班团队获得冠军的概率为.
9.(2025·上海徐汇·一模)某校高三年级学生参加了一次时政知识竞赛,为了了解本次竞赛的成绩情况,从所有答卷中随机抽取份作为样本进行统计,将样本的成绩(满分分,成绩均为不低于分的整数)分成六段:、、、得到如图所示的频率分布直方图.
(1)求实数的值;若年级准备选取分及以上的学生进入下一轮竞赛,已知该校高三年级有名学生,估计该校高三年级参加下一轮竞赛的人数;
(2)王老师抽取了名参加竞赛的学生,他们的分数为:、、、、.已知这个分数的平均数,标准差,若剔除其中的和这个分数,求剩余个分数的平均数与方差.
【答案】(1);人
(2)平均数为,方差为
【分析】(1)在频率分布直方图中,所有矩形的面积之和为,可求得的值;结合频率分布直方图可计算得出该校高三年级参加下一轮竞赛的人数;
(2)利用平均数和方差公式可求得剩余个分数的平均数与方差.
【详解】(1)在频率分布直方图中,所有矩形的面积之和为,
即,解得,
分及以上的学生所占的比例为,
故估计该校高三年级参加下一轮竞赛的人数为人.
(2)不妨设,,根据题意可得,
故剩余个分数的平均数为,
因为原数据的方差为,
所以,
故剩余个分数的方差为.
10.(2025·河北·模拟预测)为了提高利润,某果园每年投入一定的资金,对种植、采摘、包装、宣传等环节进行改进.如图,这是2016年至2025年该果园每年的投资金额(单位:万元)与年利润增量(单位:万元)的散点图.
模型①由最小二乘法可求得与的经验回归方程为;
模型②由图中样本点的分布,可以认为样本点集中在曲线的附近,令,则,且有.
(1)根据所给的统计量,求模型②中关于的经验回归方程;
(2)已知2025年的投资金额为20万,年利润增量为40万,分析这两种模型在2025年时哪个模型的预报效果更好.
参考公式与数据:.
【答案】(1);
(2)模型②.
【分析】(1)根据给定的数据,利用最小二乘法公式求出经验回归方程.
(2)分别求出模型①、模型②中年利润增量,再比较它们与40差的绝对值大小即可.
【详解】(1)由,得,
则,,
所以模型②中关于的经验回归方程为.
(2)模型①,,当时,年利润增量,
模型②,,当时,,
因此年利润增量,而,
所以模型②的预报效果更好.
近三年:
1、统计基础的稳定考查与深化理解。
对统计图表(频率分布直方图、散点图)和数字特征(均值、中位数、标准差、极差)的考查已成为“必选动作”。近三年的题目常将数据置于农业生产、社区调查、疾病研究等真实情境中,要求学生不仅能准确计算,更要能解读数据分布特征、理解统计量在实际决策中的含义。例如,2025年多套试卷均出现了要求判断频数分布表中的中位数、评估样本数据离散程度等题目。
2、概率模型的综合化与复杂化。
概率考查的重心已从单一古典概型,转向对复杂随机事件的建模与运算能力。核心趋势有两点:其一,离散型随机变量的分布列与期望是绝对高频考点,常与二项分布、超几何分布相结合。其二,“概率与数列递推”的深度融会贯通成为压轴题的标志性特征。无论是2023年新高考Ⅰ卷的投篮问题,还是2025年全国二卷(第19题)的乒乓球练习模型,都要求学生从动态随机过程中构建概率递推关系,并用数列知识求解,这极大地考查了化归与逻辑推理能力。
3、统计推断与数学建模的价值凸显。
命题强调数学的实际应用价值。独立性检验的考查趋于常规化,常以完善列联表、计算卡方值、下结论的形式出现。条件概率、全概率公式等新教材内容的重要性日益提升。更关键的是,题目设计常落脚于“优化决策”,例如要求比较不同方案下的数学期望,以做出最优选择(如2024年新高考Ⅱ卷的投篮比赛策略问题),或将概率统计与函数、不等式结合求最值,实现了从“算概率”到“用概率做决策”的思维跃升。
预测2026年:
基于以上分析,“在新颖、真实且跨学科的复杂情境中,完成数据驱动下的建模、推理与决策” 的能力,将是2026年高考概率统计模块的决胜关键。该板块的核心价值在于,它是最能体现数学学科应用性与思维性、并直接对接大数据时代核心素养的领域,其“反套路、反刷题”的命题导向与高考选拔创新人才的目标高度契合
解|题|策|略
1、互斥事件与对立事件的关系
①互斥事件是不可能同时发生的两个事件,而对立事件除要求这两个事件不同时发生外,还要求二者之一必须有一个发生.
②对立事件是互斥事件的特殊情况,而互斥事件未必是对立事件,即“互斥”是“对立”的必要不充分条件,而“对立”则是“互斥”的充分不必要条件.
判断互斥对立事件可根据
①利用互斥跟对立事件的定义来判断,互斥事件的定义比对立的更严。
②可以借助集合的方法来解决事件问题。
3、独立事件的概念与判断:设A,B为两个事件,若P(AB)=P(A)P(B),则称事件A与事件B相互独立.
如果事件A,B互相独立,那么A与B,A与B,A与B也都相互独立.
当P(B)>0时,A与B独立的充要条件是P(A|B)=P(A).
解|题|策|略
确认是否为古典概型:试验样本空间有限(样本点总数有限),每个样本点发生的可能性相等。
明确样本空间:列出或计算所有可能的基本事件总数 n。
确定目标事件:明确所求事件包含哪些基本事件,并计数 m。
4、计算概率:概率 P=mn。
检查是否需考虑顺序、分组等,注意计数时使用排列还是组合,确保分子分母一致。
解|题|策|略
1、条件概率:一般地,当事件B发生的概率大于0时(即P(B)>0),已知事件B发生的条件下事件A发生的概率,称为条件概率,记作P(A|B), 而且P(A|B)=PA∩BPB.
(1)如果B和C是两个互斥事件,则PB∪CA=PBA+PCA;
(2)设B和B互为对立事件,则PBA=1−PBA.
2、全概率公式:设A1,A2,…,An是一组两两互斥的事件,A1∪A2∪…∪An=Ω,且P(Ai)>0,i=1,2,…,n,则对任意的事件B⊆Ω,有PB=i=1nPAiPBAi,i=1,2,…,n
3、贝叶斯公式:设A1,A2,…,An是一组两两互斥的事件,A1∪A2∪…∪An=Ω,且P(Ai)>0,i=1,2,…,n,则对任意的事件B⊆Ω,PB>0,有PBAi=PAiPBAiPB=PAiPBAii=1nPAiPBAi,i=1,2,…,n
条件概率强调样本空间受限,全概率是由原因推结果的分解求和,贝叶斯是由结果推原因的概率修正。
解|题|策|略
1、判断分布类型
确认随机变量:明确问题中的随机变量 X 及其可能取值
识别分布类型:若为不放回抽样且关心“次品数”、“合格数”等 → 超几何分布
若为独立重复试验(每次成功概率相同) → 二项分布
若为有限等可能抽样且涉及特定计数 → 可考虑古典概型计算
2、确定参数并计算概率:根据类型选用公式,依次计算 X 取每一个可能值的概率
3、整理分布列,列成表格,验证概率和为1
应用与计算:求期望值或方差等。
注意:先判断类型再计算,避免公式误用,注意随机变量取值的完整性与互斥性计算后务必检查概率总和是否为 1(可避免计算错误)
0
2
3
4
5
0
1
2
3
1
2
3
X
0
1
2
3
P
解|题|策|略
1、判断是否为二项分布
满足以下3个条件可判定为二项分布:
试验次数固定:共进行 n 次独立试验
每次试验只关注两个结果:“成功”与“失败”,1与0,“正确”或“错误”等
成功概率恒定:每次试验中成功概率 p 保持不变
记作: X∼B(n,p)
确定参数与可能取值:明确参数n:试验总次数,p:每次试验的成功概率
确定随机变量取值:X(成功次数)的可能取值为0,1,2,…,n
概率的计算:使用二项分布概率公式:PX=k=Cnk⋅pk⋅1−pn−k,k=0,1,…,n
列出分布列并计算期望值等。
2、二项分布列概率最大值的取得
对二项分布列PX=k=Cnkpk1−pn−k,k=0,1,2,3……PX=k取最大项时有:
P(X=k)≥P(X=k−1)P(X=k)≥P(X=k+1) (类似二项展开式中系数最大项)
可解得pn+1−1≤k≤pn+1,k取这个范围内整数,当k由0增加到n 时,PX=k的值先由小到大,再由大到小。
0
1
2
3
4
0
1
2
3
0
1
2
0
1
2
3
解|题|策|略
超几何分布的解题步骤:
模型识别与参数确定
确认试验符合不放回抽样特征,并确定三个参数:总体容量 N,总体中“成功”元素个数 M,抽取样本量 n
则随机变量 XX 服从超几何分布 X∼H(N,M,n)。
2、概率计算
利用超几何概率公式直接计算 X=k 的概率:PX=k=MkN−Mn−kNn
3、分布列表示
将 X 的所有可能取值及其对应概率整理为分布列(通常用表格形式呈现)。
0
1
2
0
1
2
X
1
2
3
P
解|题|策|略
利用正态曲线的对称性求解相关概率问题,主要依据以下两个基本性质:
正态曲线关于直线 x=μ 对称;
2、曲线与 x 轴所围成的总面积为 1。
解|题|策|略
1、众数反映数据出现最频繁的取值,能够体现数据的“最大集中点”,但它对数据整体的分布不敏感,容易忽略其他取值的信息,因此无法全面、客观地反映总体特征。
2、中位数将样本数据按大小排列后位于中间位置,可视作频率累积分布的中心分割点,它不受极端值影响,对数据中的异常值具有较好的稳健性,适用于偏态分布或存在极端值的数据描述。
3、平均数综合考虑了样本中每一个数据的取值,能够反映出数据总体的集中趋势,包含较为丰富的总体信息。然而,平均数容易受到极端值(离群值)的影响,在数据分布严重偏斜或存在异常值时,其代表性可能会被削弱。
如果直方图的形状是对称的,那么平均数与中位数应该大体上差不多;但是如果直方图的性质不是对称的,那么和中位数相比,平均数总在“长尾巴”那边。
纤维长度()
频数
30
40
60
120
100
50
解|题|策|略
频率分布直方图的基本关系
(1)面积即频率:每个小矩形的面积 = 组距 × 频率/组距 = 该组数据的频率,且所有矩形面积之和为 1。
(2)频率、频数与样本容量的关系:频率=频数样本容量频率=样本容量频数
样本容量 = 频数 ÷ 频率 频数 = 样本容量 × 频率
2、利用直方图估计数字特征的方法
(1)中位数:寻找使得直方图左、右两侧面积均为 0.5 的横坐标值,即累积频率首次达到或超过 50% 的位置。
(2)平均数:取每个小矩形的面积乘以该组区间中点横坐标,再求和
(3)众数:最高矩形所在区间的组中值,代表数据出现最集中的位置。
补充说明
方差的估计:可先估算各组数据与平均数之差的平方,再结合频率加权计算。
图形理解:直方图的纵坐标(频率/组距)越高,表示该区间数据越密集;面积反映比例,是频率分析的基础。
1
2
3
1
2
3
解|题|策|略
独立性检验的基本步骤
(1) 提出零假设H0:X和Y相互独立(即X和Y无关)
(2) 根据2×2联表给出的数据算出χ2=nad−bc2(a+b)(c+d)(a+c)(b+d) (其中n=a+b+c+d),得到随机变量χ2,并与临界值xα比较.
(3) 根据实际问题需要的可信程度(小概率值α)确定临界值k0 “X与Y有关系”,这种推断犯错误的概率不超过P(K2≥k0)×100%,即成立;否则就说没有1−P(K2≥k0)×100%的把握认为“X与Y有关系”,即H0不成立.
疗法
疗效
未治愈
治愈
甲
15
52
乙
6
63
0.1
0.05
0.01
0.005
0.001
2.706
3.841
6.635
7.879
10.828
疗法
疗效
总数
未治愈
治愈
甲
15
52
67
乙
6
63
69
总数
21
115
136
灌溉系统
糖度达标
糖度不达标
合计
型
62
38
100
型
45
55
100
合计
107
93
200
1
1.5
2
0.2
0.5
0.3
0.8
1.2
1.6
0.4
0.4
0.2
0.05
0.01
0.001
3.841
6.635
10.828
年龄
是否喜欢健身操
合计
喜欢健身操
不喜欢健身操
青年
15
25
40
中年
20
20
40
合计
35
45
80
性别
关注情况
高度关注
非高度关注
女学生
30
男学生
90
0.1
0.05
0.01
0.005
0.001
2.706
3.841
6.635
7.879
10.828
性别
关注情况
合计
高度关注
非高度关注
女学生
70
30
100
男学生
90
10
100
合计
160
40
200
年份
2021
2022
2023
2024
2025
年份代码
1
2
3
4
5
销量(万台)
2
3.5
2.5
8
9
学生
制氧机知识
合计
了解
不了解
男生
20
女生
40
合计
0.10
0.05
0.010
0.005
0.001
2.706
3.841
6.635
7.879
10.828
学生
制氧机知识
合计
了解
不了解
男生
80
20
100
女生
40
60
100
合计
120
80
200
0
1
2
3
4
解|题|策|略
1、利用相关系数r判断变量的相关性,当|r|越趋近于1时,两变量的线性相关性越强.
当变量的线性相关性很强,或者从散点图分析符合线性相关时,可以用最小二乘法的方法求回归系数
计算出x,y,i=1n(xi−x)(yi−y),i=1nxi−x2的值;利用公式计算回归系数eq \(a,\s\up6(^)),eq \(b,\s\up6(^))
注意:样本点不一定在经验回归直线上,但点(x,y)一定在经验回归直线上.
残差分析: ei=yi−yi绘制残差图,残差点均匀分布在水平带状区域则模型合适;带状越窄精度越高
量化评价指标:
残差平方和 RSS:越小拟合越好
决定系数 R2 : 越接近 1,拟合效果越好(解释变量对预报变量变化的贡献率)
月份编号
1
2
3
4
5
下载量万次
5
4.5
4
3.5
2.5
(百万)
1
2
3
4
5
(千件)
0.5
1
1.5
3
5.5
1
2
3
4
5
0.5
1
1.5
3
5.5
1.1
2.3
3.5
4.7
3
5
相关试卷
这是一份2026年高考数学二轮复习高效培优讲义(全国通用)专题7.3概率与统计题型归纳(培优热点专练)(学生版+解析),共23页。试卷主要包含了分成六段,的散点图等内容,欢迎下载使用。
这是一份2026年高考数学二轮复习高效培优讲义(全国通用)专题08概率与统计解答题型全析(培优题型专练)(学生版+解析),共23页。
这是一份2026年高考数学二轮复习高效培优讲义(全国通用)专题7.2概率难点大题归纳(培优热点专练)(学生版+解析),共23页。
相关试卷 更多
- 1.电子资料成功下载后不支持退换,如发现资料有内容错误问题请联系客服,如若属实,我们会补偿您的损失
- 2.压缩包下载后请先用软件解压,再使用对应软件打开;软件版本较低时请及时更新
- 3.资料下载成功后可在60天以内免费重复下载
免费领取教师福利 

.png)




