所属成套资源:【查漏补缺】2024年高考数学二轮复习冲刺过关(新高考通用)
专题09 计数原理与概率统计(4考点+20题型)-【查漏补缺】2024年高考数学复习冲刺过关
展开
这是一份专题09 计数原理与概率统计(4考点+20题型)-【查漏补缺】2024年高考数学复习冲刺过关,文件包含专题09计数原理与概率统计4考点+20题型原卷版docx、专题09计数原理与概率统计4考点+20题型解析版docx等2份试卷配套教学资源,其中试卷共107页, 欢迎下载使用。
1、多加总结。当三年所有的数学知识点加在一起,可能会使有些基础不牢固的学生犯迷糊。
2、做题经验。哪怕同一题只改变数字,也能成为一道新的题目。
3、多刷错题。多刷错题能够进一步地扫清知识盲区,多加巩固之后自然也就掌握了知识点。
对于学生来说,三轮复习就相当于是最后的“救命稻草”,家长们同样是这样,不要老是去责怪孩子考试成绩不佳,相反,更多的来说,如果能够陪同孩子去反思成绩不佳的原因,找到问题的症结所在,更加重要。
专题09 计数原理与概率统计
考点一:计数原理
知识点1 排列与组合
1、两种计数原理
(1)分类加法计数原理:完成一件事有两类不同方案.在第1类方案中有m种不同的方法,在第2类方案中有n种不同的方法,完成这件事共有N=m+n种不同的方法。
(2)分步乘法计数原理:完成一件事需要两个步骤.做第1步有m种不同的方法,做第2步有n种不同的方法,完成这件事共有N=m·n种不同的方法。
2、排列与排列数
(1)定义:从个不同元素中取出个元素排成一列,叫做从个不同元素中取出个元素的一个排列.从个不同元素中取出个元素的所有排列的个数,叫做从个不同元素中取出个元素的排列数,用符号表示.
(2)排列数的公式:.
特例:当时,;规定:.
(3)排列数的性质:①;②;③.
3、组合与组合数
(1)定义:从个不同元素中取出个元素并成一组,叫做从个不同元素中取出个元素的一个组合.从个不同元素中取出个元素的所有组合的个数,叫做从个不同元素中取出个元素的组合数,用符号表示.
(2)组合数的主要性质:①;②.
知识点2 二项式定理
1、二项式定理
(1)二项式定理:,
(2)通项公式:,表示展开式的第项:,
(3)二项式系数:系数(r=0,1,2,…,n)叫做二项式系数,
(4)两个常用的二项展开式:
①()
②
2、二项式系数的性质
(1)二项式系数的对称性
= 1 \* GB3 ①每一行两端都是,即;其余每个数都等于它“肩上”两个数的和,即.
= 2 \* GB3 \* MERGEFORMAT ②对称性每一行中,与首末两端“等距离”的两个二项式系数相等,即.
(2)二项式系数的增减性
= 1 \* GB3 ①如果二项式的幂指数是偶数,则中间一项的二项式系数最大;
= 2 \* GB3 ②如果二项式的幂指数是奇数,则中间两项,的二项式系数,相等且最大.
【题型1 两种计数原理综合】
1.(2023·全国·高考真题)现有5名志愿者报名参加公益活动,在某一星期的星期六、星期日两天,每天从这5人中安排2人参加公益活动,则恰有1人在这两天都参加的不同安排方式共有( )
A.120B.60C.30D.20
【答案】B
【解析】不妨记五名志愿者为,
假设连续参加了两天公益活动,
再从剩余的4人抽取2人各参加星期六与星期天的公益活动,共有种方法,
同理:连续参加了两天公益活动,也各有种方法,
所以恰有1人连续参加了两天公益活动的选择种数有种.故选:B.
2.(2023·全国·高考真题)某学校开设了4门体育类选修课和4门艺术类选修课,学生需从这8门课中选修2门或3门课,并且每类选修课至少选修1门,则不同的选课方案共有 种(用数字作答).
【答案】64
【解析】(1)当从8门课中选修2门,则不同的选课方案共有种;
(2)当从8门课中选修3门,
①若体育类选修课1门,则不同的选课方案共有种;
②若体育类选修课2门,则不同的选课方案共有种;
综上所述:不同的选课方案共有种.
3.(2024·浙江宁波·二模)某快递公司将一个快件从寄件人甲处揽收开始直至送达收件人乙,需要经过5个转运环节,其中第1,2两个环节各有两种运输方式,第3,4两个环节各有两种运输方式,第5个环节有两种运输方式.则快件从甲送到乙恰用到4种运输方式的不同送达方式有 种.
【答案】16
【解析】快递从甲送到乙有4种运输方式,且第5个环节从d,e两种运输方式中选一种,
1,2,3,4个环节必须包含三种不同的运输方式,
若第1,2个环节运输方式相同,则只能都选,
则3,4个环节一个选,一个选,则有种,
若第1,2个环节运输方式不相同,则已经包含两种运输方式,
则3,4个环节一个选,一个选,或者都选,则由种,
快递从甲送到乙有4种运输方式的运输顺序共有种.
4.(2024·陕西汉中·二模)继淄博烧烤、哈尔滨冻梨后,最近天水麻辣烫又火了.据了解,天水麻辣烫店内菜品一般由竹签串起成捆摆放,人们按照自己的喜好选好后递给老板,进行调制,某麻辣烫店内有牛肉、羊肉、鸡肉、萝卜、木耳、菠菜、豆腐、香菇等菜品,一游客打算从以上8种菜品中选择一荤两素,其中萝卜,木耳只能选一种,菠菜,豆腐只能选一种,且羊肉必须与萝卜搭配,则他选择的种类共有 种.
【答案】19
【解析】1.若荤菜中没有羊肉,则荤菜为牛肉或鸡肉,
(1)若素菜选香菇,可选择的种类共有种;
(2)若素菜没有选香菇,可选择的种类共有种;
此时可选择的种类共有种;
2.若荤菜为羊肉,则素菜只能从菠菜、豆腐、香菇选一种,可选择的种类共有3种;
综上所述:他选择的种类共有种.
【题型2 排列组合问题】
1.(2024·四川巴中·一模)从0,1,2,3四个数字组成的没有重复数字的四位数中任取一个数,则该数为偶数的概率为( )
A.B.C.D.
【答案】B
【解析】从0,1,2,3四个数字组成的没有重复数字的四位数,
由于不能出现在千位,则的位置有种情况,再排其他三位数,共有种情况,
即可以组成没有重复数字的四位数共有种情况;
若该四位数为偶数,可以分为两类,
当个位数字是时,有中情况,
当个位数字是时,有种情况,
所以四位数的偶数共有种,
设事件表示从0,1,2,3四个数字组成的没有重复数字的四位数中任取一个数,
则.故选:B
2.(2024·辽宁·二模)甲、乙、丙、丁4人参加活动,4人坐在一排有12个空位的座位上,根据要求,任意两人之间需间隔至少两个空位,则不同的就座方法共有( )
A.120种B.240种C.360种D.480种
【答案】C
【解析】先假设每个人坐一个位置相当于去掉4个位置,
再将4个人中间任意两个人之间放入2个空位,此时空位一共还剩2个,
若将这两个空位连在一起插入4人之间和两侧空位,有5种放法;
若将这两个空位分开插入4人之间和两侧空位,有种放法,
故不同的就座方法共有种.故选:C.
3.(2024·河北邯郸·二模)某班联欢会原定5个节目,已排成节目单,开演前又增加了2个节目,现将这2个新节目插入节目单中,要求新节目既不排在第一位,也不排在最后一位,那么不同的插法种数为( )
A.12B.18C.20D.60.
【答案】C
【解析】根据题意,可分为两类:
①当新节目插在中间的四个空隙中的一个时,有种方法;
②当新节目插在中间的四个空隙中的两个时,有种方法,
由分类计数原理得,共有种不同的差法.故选:C.
4.(23-24高三下·山东菏泽·月考)球类运动对学生的身心发展非常重要现某高中为提高学生的身体素质,特开设了“乒乓球”,“排球”,“羽毛球”,“篮球”,“足球”五门选修课程,要求该校每位学生每学年至多选门,高一到高三三学年必须将五门选修课程选完,每门课程限选修一学年,一学年只上学期选择一次,则每位学生的不同的选修方式有( )
A.种B.种C.种D.种
【答案】A
【解析】根据题意,分种情况讨论:
五门选修课放在年选完,先将五门课程分为组,
再在三年中选出年来学习,有种安排方法,
五门选修课放在年选完,先将五门课程分为组,
再安排在三年中选完,有种安排方法,
则有种安排方法.故选:A.
5.(2024·山西晋中·模拟预测)(多选)某中学的3名男生和2名女生参加数学竞赛,比赛结束后,这5名同学排成一排合影留念,则下列说法正确的是( )
A.若要求2名女生相邻,则这5名同学共有48种不同的排法
B.若要求女生与男生相间排列,则这5名同学共有24种排法
C.若要求2名女生互不相邻,则这5名同学共有72种排法
D.若要求男生甲不在排头也不在排尾,则这5名同学共有72种排法
【答案】ACD
【解析】选项A,将2名女生捆绑在一起,再与3名男生进行全排列,
则有(种),故A正确;
选项B,要求女生与男生相间排列,采用插空法,
先将3名男生进行全排列,再将2名女生插到3名男生所形成的2个空中,
则有(种),故B错误;
选项C,先将3名男生进行全排列,再将2名女生插到3名男生所形成的4个空中,
则有(种),故C正确;
选项D,将5名同学排成一排,相当于将他们放到排成一排的5个空位中,
先将男生甲排在中间的3个空位中,再将剩下4名同学进行全排列,
则有(种),故D正确.故选:ACD.
【题型3 二项展开式中的特定项求解】
1.(22-23高三上·天津河西·月考)在的展开式中,项的系数为 .
【答案】
【解析】展开式的通项公式,
令可得,,
则项的系数为.
2.(2024·浙江·二模)展开式的常数项为( )
A.B.C.D.
【答案】A
【解析】展开式的通项公式为,
令,解得,
所以常数项为.故选:A.
3.(2024·云南昆明·一模)在的展开式中,含项的系数是( )
A.16B.19C.21D.24
【答案】B
【解析】因为展开式的通项为,
所以的展开式中含项为,
所以展开式中含项的系数是.故选:B
4.(23-24高三下·江西·月考)展开式中项系数为 .
【答案】
【解析】由题意得可化简为,
且其展开式通项为,
其中对于的展开式通项为,,
当时,此时,则的系数为,
当时,此时,则的系数为,
所以项系数为.
5.(2024·山西·二模)的展开式中的系数为 .
【答案】
【解析】对,有,则当时,有,
当时,有,则有,
故的展开式中的系数为.
【题型4 二项式系数和与各项系数和问题】
1.(2024·黑龙江吉林·二模)设,则 .
【答案】
【解析】令,则,
令,则,所以.
2.(23-24高三上·浙江金华·期末)若,则( )
A.B.2C.1D.0
【答案】C
【解析】令,则,即,
令,则,即,
故,
即,故.故选:C.
3.(2024·陕西西安·模拟预测)已知的展开式中,含项的系数为,.则 .
【答案】1023
【解析】的展开式的通项公式为,
令,则可得含项的系数,则,
对,令,解得;对,令,解得,
故.
4.(2024·天津·一模)已知,则 .(用数字作答)
【答案】
【解析】因为,
两边求导可得,
令,得到,即,
5.(2024·陕西汉中·二模)已知,则( )
A.32B.48C.16D.
【答案】D
【解析】因为,
两边同时求导可得:,
令,可得.故选:D.
【题型5 二项式系数与系数的最值】
1.(23-24高三上·全国·月考)已知的展开式中唯有第5项的系数最大,则a的取值范围是( )
A.B.C.D.
【答案】A
【解析】的展开式的通项为,
由题可知,解得.故选:A
2.(2024·河北廊坊·模拟预测)的展开式中只有第四项的二项式系数最大,则展开式中的常数项为( )
A.B.C.20D.160
【答案】A
【解析】因为的展开式中只有第四项的二项式系数最大,
则由二项式系数性质知:展开式共有7项,则,
则展开式的通项为,
展开式中常数项,必有,即,
所以展开式中常数项为.故选:A
3.(2024·江西·二模)(多选)在的展开式中( )
A.二项式系数之和为B.第项的系数最大
C.所有项系数之和为D.不含常数项
【答案】ABD
【解析】由于二项式系数之和为,故A正确.
设展开式第项为,
易知的系数均小于0,且,
故第项的系数最大,为80,故B正确,
令得所有项系数之和为,故C错误,
当,则,但,故展开式不含常数项,D正确.故选:ABD.
4.(22-23高三·河北衡水·月考)(多选)在二项式的展开式中( )
A.常数项是第4项B.所有项的系数和为1
C.第5项的二项式系数最大D.第4项的系数最小
【答案】BCD
【解析】二项式的展开式的通项为,
对于A,令,得,故常数项是第5项,故A错误;
对于B,令,则所有项的系数和是,故B正确;
对于C,二项式展开式共9项,则由二项式系数的性质知第5项的二项式系数最大,故C正确;
对于D,设第项的系数的绝对值最大,则,解得,
又,所以或,
当时,;当时,,
所以第4项的系数最小,故D正确.故选:BCD
考点二:概率
知识点1 随机事件的概率与古典概型
1、事件的相关概念
2、事件的关系与运算
(1)包含关系:一般地,对于事件和事件,如果事件发生,则事件一定发生,这时称事件包含事件(或者称事件包含于事件),记作或者.
(2)相等关系:一般地,若且,称事件与事件相等.
(3)并事件(和事件):若某事件发生当且仅当事件发生或事件发生,则称此事件为事件与事件的并事件(或和事件),记作(或).
(4)交事件(积事件):若某事件发生当且仅当事件发生且事件发生,则称此事件为事件A与事件B的交事件(或积事件),记作(或).
(5)互斥事件:在一次试验中,事件和事件不能同时发生,即,则称事件与事件互斥;
如果,,…,中任何两个都不可能同时发生,那么就说事件,..,…,彼此互斥.
(6)对立事件:若事件和事件在任何一次实验中有且只有一个发生,即不发生,则称事件和事件互为对立事件,事件的对立事件记为.
3、概率的基本性质
(1)对于任意事件都有:.
(2)必然事件的概率为,即;不可能事概率为,即.
(3)概率的加法公式:若事件与事件互斥,则.
推广:一般地,若事件,,…,彼此互斥,则事件发生(即,,…,中有一个发生)的概率等于这个事件分别发生的概率之和,即:.
(4)对立事件的概率:若事件与事件互为对立事件,则,,且.
(5)概率的单调性:若,则.
(6)若,是一次随机实验中的两个事件,则.
4、古典概型
(1)古典概型的定义:一般地,若试验具有以下特征:
①有限性:样本空间的样本点只有有限个;②等可能性:每个样本点发生的可能性相等.
称试验E为古典概型试验,其数学模型称为古典概率模型,简称古典概型.
2、古典概型的概率公式:一般地,设试验是古典概型,样本空间包含个样本点,事件包含其中的个样本点,则定义事件的概率.
知识点2 相互独立事件与条件概率、全概率
1、相互独立事件
(1)相互独立事件的概念
对于两个事件,,如果,则意味着事件的发生不影响事件发生的概率.设,根据条件概率的计算公式,,从而.
由此可得:设,为两个事件,若,则称事件与事件相互独立.
(2)概率的乘法公式:由条件概率的定义,对于任意两个事件与,若,则.我们称上式为概率的乘法公式.
(3)相互独立事件的性质:如果事件,互相独立,那么与,与,与也都相互独立.
(4)两个事件的相互独立性的推广:两个事件的相互独立性可以推广到个事件的相互独立性,即若事件,,…,相互独立,则这个事件同时发生的概率.
2、条件概率
(1)条件概率的定义:一般地,设,为两个事件,且,称为在事件发生的条件下,事件发生的条件概率.
(2)条件概率的性质
= 1 \* GB3 ①条件概率具有概率的性质,任何事件的条件概率都在和1之间,即.
= 2 \* GB3 ②必然事件的条件概率为1,不可能事件的条件概率为.
= 3 \* GB3 ③如果与互斥,则.
3、全概率公式
(1)全概率公式:;
(2)若样本空间中的事件,,…,满足:
①任意两个事件均互斥,即,,;②;
③,.
则对中的任意事件,都有,且.
4、贝叶斯公式
(1)一般地,当且时,有
(2)定理若样本空间中的事件满足:
①任意两个事件均互斥,即,,;
②;
③,.
则对中的任意概率非零的事件,都有,
且
【题型1 古典概型的概率计算】
1.(2023·全国·高考真题)某学校举办作文比赛,共6个主题,每位参赛同学从中随机抽取一个主题准备作文,则甲、乙两位参赛同学抽到不同主题概率为( )
A.B.C.D.
【答案】A
【解析】用1,2,3,4,5,6表示6个主题,甲、乙二人每人抽取1个主题的所有结果如下表:
共有36个不同结果,它们等可能,
其中甲乙抽到相同结果有,共6个,
因此甲、乙两位参赛同学抽到不同主题的结果有30个,概率.故选:A
2.(2024·陕西铜川·二模)从这九个数字中任取两个,这两个数的和为质数的概率为( )
A.B.C.D.
【答案】C
【解析】这九个数字中任取两个,有种取法,
和为质数有,
共14种情况,因此所求概率为.故选:C.
3.(2024·宁夏银川·一模)抛掷两枚质地均匀的骰子,已知两枚骰子向上的点数之和为偶数,则向上的点数之和为8的概率为( )
A.B.C.D.
【答案】B
【解析】抛掷两枚质地均匀的骰子,两枚骰子向上的点数之和为偶数,
基本事件总数为18,分别为:,,,,,,,,,
,,,,,,,,,
向上的点数之和为8包含的基本事件个数为5,分别为:,,,,,
则向上的点数之和为8的概率为.故选:B.
4.(2024·陕西西安·二模)甲、乙两名运动员各自等可能地从红、黄、白、蓝4种颜色的运动服中选择1种,则他们选择不同颜色运动服的概率为( )
A.B.C.D.
【答案】A
【解析】甲,乙两名运动员各自等可能地从红、黄、白、蓝种颜色的运动服中选择种有种不同的结果,
分别为(红,红),(红,黄),(红,白),(红,蓝),(黄,红),(黄,黄),
(黄,白),(黄,蓝),(白,红),(白,黄),(白,白),(白,蓝),
(蓝,红),(蓝,黄),(蓝,白),(蓝,蓝).
他们选择相同颜色运动服有种不同的结果,即(红,红),(黄,黄),(白,白),(蓝,蓝),
故他们选择相同颜色运动服的概率为,
所以他们选择不同颜色运动服的概率为.故选:A.
5.(2024·陕西西安·模拟预测)《西游记》《红楼梦》《水浒传》《三国演义》是我国著名的四大古典小说,某学校图书室将《西游记》《红楼梦》《水浒传》《三国演义》各一本赠送给三个不同的同学,每人至少一本,则《西游记》和《红楼梦》被分给同一个同学的概率为( )
A.B.C.D.
【答案】A
【解析】设《西游记》《红楼梦》《水浒传》《三国演义》这四本书分别为A、B、C、D.
将四本书分成三组的情况有、、、、
、共6种.其中A、B在一组的情况有1种,
所以《西游记》和《红楼梦》被分给同一个同学的概率为.故选:A
【题型2 条件概率与全概率公式】
1.(2023·全国·高考真题)某地的中学生中有的同学爱好滑冰,的同学爱好滑雪,的同学爱好滑冰或爱好滑雪.在该地的中学生中随机调查一位同学,若该同学爱好滑雪,则该同学也爱好滑冰的概率为( )
A.0.8B.0.6C.0.5D.0.4
【答案】A
【解析】同时爱好两项的概率为,
记“该同学爱好滑雪”为事件,记“该同学爱好滑冰”为事件,
则,所以.故选:.
2.(2024·全国·二模)某单位选派一支代表队参加市里的辩论比赛,现有“初心”“使命”两支预备队.选哪支队是随机的,其中选“初心”队获胜的概率为0.8,选“使命”队获胜的概率为0.7,单位在比赛中获胜的条件下,选“使命”队参加比赛的概率为( )
A.B.C.D.
【答案】D
【解析】依题意,记选“初心”队为事件,选“使命”队为事件,该单位获胜为事件,
则,
因此,
所以选“使命”队参加比赛的概率.故选:D
3.(2024·海南·一模)英国数学家贝叶斯在概率论研究方面成就显著,根据贝叶斯统计理论,随机事件,存在如下关系:.若某地区一种疾病的患病率是0.05,现有一种试剂可以检验被检者是否患病.已知该试剂的准确率为,即在被检验者患病的前提下用该试剂检测,有的可能呈现阳性;该试剂的误报率为,即在被检验者未患病的情况下用该试剂检测,有的可能会误报阳性.现随机抽取该地区的一个被检验者,已知检验结果呈现阳性,则此人患病的概率为( )
A.B.C.D.
【答案】C
【解析】依题意,设用该试剂检测呈现阳性为事件B,被检测者患病为事件A,未患病为事件,
则,,,,
故,
则所求概率为.故选:C.
4.(2024·辽宁沈阳·二模)我国古代典籍《周易》用“卦”描述万物的变化,每一“重卦”由从下到上排列的6个爻组成,爻分为阳爻“”和阴爻“”,如图就是一重卦.在所有重卦中随机取一重卦,记事件“取出的重卦中至少有1个阴爻”,事件“取出的重卦中至少有3个阳爻”.则( )
A.B.C.D.
【答案】C
【解析】,事件“取出的重卦中有3阳3阴或4阳2阴或5阳1阴”,
则,则故选:C
5.(2024·甘肃武威·模拟预测)某校高三(1)班和(2)班各有40名同学,其中参加数学兴趣社团的学生分别有10人和8人.现从这两个班中随机抽取一名同学,若抽到的是参加数学兴趣社团的学生,则他来自高三(1)班的概率是( )
A.B.C.D.
【答案】C
【解析】法一:因为抽到的参加数学兴趣社团的学生可能来自于高三(1)班和(2)班,
设“抽到的学生来自高三(1)班”,“抽到的学生来自高三(2)班”、
“抽到的是参加数学兴趣社团的学生”、
则,
由全概率公式得,
所以.
法二:由题得参加数学兴趣社团的学生共有人,由古典概型的概率公式,
则他来自高三(1)班的概率为.故选:C.
【题型3 对立、互斥事件的判断与概率求解】
1.(2023·四川眉山·模拟预测)袋中装有红球3个、白球2个、黑球1个,从中任取2个,则互斥而不对立的两个事件是( )
A.至少有一个白球;都是白球B.至少有一个白球;至少有一个红球
C.至少有一个白球;红、黑球各一个D.恰有一个白球;一个白球一个黑球
【答案】C
【解析】对于A,至少有一个白球和都是白球的两个事件能同时发生,不是互斥事件,A不是;
对于B,至少有一个白球和至少有一个红球的两个事件能同时发生,不是互斥事件,B不是;
对于C,至少有一个白球和红、黑球各一个的两个事件不能同时发生但能同时不发生,
是互斥而不对立的两个事件,C是;
对于D,恰有一个白球和一个白球一个黑球的两个事件能同时发生,不是互斥事件,D不是.故选:C
2.(2024·山西晋中·模拟预测)有6个相同的球,分别标有数字1,2,3,4,5,6,从中有放回地随机取两次,每次取1个球,甲表示事件“第一次取出的球的数字是1”,乙表示事件“第二次取出的球的数字是2”,丙表示事件“两次取出的球的数字之和是8”,丁表示事件“两次取出的球的数字之和是7”,则下列说法错误的是( )
A.丙与丁是互斥事件B.甲与丙是互斥事件
C.甲与丁相互独立D.(乙丙)(乙)+(丙)
【答案】D
【解析】对于A:丙与丁不可能同时发生,所以丙与丁是互斥事件,A正确;
对于B:若第一次取出的球的数字是1,则两次取出的球的数字之和不可能是8,
所以甲与丙不可能同时发生,是互斥事件,B正确;
对于C:(甲),(丁),(甲丁),
则(甲)(丁)(甲丁),所以甲与丁相互独立,C正确;
对于D:乙丙包含的基本事件有共10个,
乙包含的基本事件有共6个,
丙包含的基本事件有共5个,
所以P(乙丙)P(乙)+P(丙),D错误.故选:D.
3.(2023·辽宁·一模)口袋中装有大小重量完全相同的2个红球,3个白球,从口袋中一次摸出一个球,摸出的球不再放回,如果2个红球全部被摸出,就停止摸球,则恰好摸球三次就停止摸球的概率为( )
A.B.C.D.
【答案】A
【解析】根据题意恰好摸球三次就停止摸球的情况为第一次和第三次摸到红球,或者第二次和第三次摸到红球,
故概率为,故选:A
另解:摸球三次结果的所有可能情形有种,这三次符合题意的摸球可以分为两类,
第一类为第一次第三次摸到红球,可能情形有种,
第二类为第二次和第三次摸到红球,可能情形有种,
于是摸球三次就停止摸球的概率为,故选:A.
4.(2022·贵州贵阳·一模)甲、乙两个同学玩摸球游戏.袋子中装有3个黄球,3个绿球,甲先摸,乙再摸,每人每次只能摸一个球,若摸到黄球就放回袋子中,摸到绿球不放回,直到摸出所有的绿球游戏结束.则两个同学共摸球4次游戏结束的概率为( )
A.B.C.D.
【答案】B
【解析】由于袋中有3个黄球,3个绿球,若两个同学共摸球4次游戏结束,
则摸球的可能情况为前3次摸出2个绿球和1个黄球,第4次摸出的是绿球,
设事件“两个同学共摸球4次游戏结束”,有以下摸球情况:
①黄 绿 绿 绿;②绿 黄 绿 绿;③绿 绿 黄 绿;
由于摸到黄球就放回袋子中,摸到绿球不放回,
则.故选:B.
【题型4 事件的独立性及概率求解】
1.(2024·宁夏吴忠·模拟预测)投壶是从先秦延续至清末的汉民族传统礼仪和宴饮游戏,在春秋战国时期较为盛行.如图为一幅唐朝的投壶图,假设甲、乙、丙是唐朝的三位投壶游戏参与者,且甲、乙、丙每次投壶时,投中与不投中是等可能的.若甲、乙、丙各投壶1次,则这3人中至少有2人投中的概率为( )
A.B.C.D.
【答案】A
【解析】记甲、乙、丙投中分别即为事件,
由题知,
则3人中至少有2人投中的概率为:
.故选:A
2.(2024·海南省直辖县级单位·一模)若古典概型的样本空间,事件,事件,相互独立,则事件可以是( )
A.B.C.D.
【答案】A
【解析】由题意得,
A选项,,,故,
所以,故事件相互独立,A正确;
B选项,,,故,
所以,故事件不相互独立,B错误;
C选项,,,故,
所以,故事件不相互独立,C错误;
D选项,,,故,
所以,故事件不相互独立,D错误;故选:A
3.(2024·广东湛江·一模)在一次考试中有一道4个选项的双选题,其中B和C是正确选项,A和D是错误选项,甲、乙两名同学都完全不会这道题目,只能在4个选项中随机选取两个选项.设事件“甲、乙两人所选选项恰有一个相同”,事件“甲、乙两人所选选项完全不同”,事件“甲、乙两人所选选项完全相同”,事件“甲、乙两人均未选择B选项”,则( )
A.事件M与事件N相互独立B.事件X与事件Y相互独立
C.事件M与事件Y相互独立D.事件N与事件Y相互独立
【答案】C
【解析】依题意甲、乙两人所选选项有如下情形:
①有一个选项相同,②两个选项相同,③两个选项不相同,
所以,,,,
因为事件与事件互斥,所以,又,
所以事件M与事件N不相互独立,故A错误;
,故B错误;
由,则事件M与事件Y相互独立,故C正确;
因为事件N与事件Y互斥,所以,又,
所以事件N与事件Y不相互独立,故D错误.故选:C.
4.(23-24高三下·山东菏泽·月考)依次抛掷两枚质地均匀的骰子,记骰子向上的点数.用表示第一次抛掷骰子的点数,用表示第二次抛掷骰子的点数,用表示一次试验的结果.记“”为事件,“”为事件,“”为事件,则( )
A.与相互独立B.与对立
C.与相互独立D.与相互独立
【答案】C
【解析】依题意依次抛掷两枚质地均匀的骰子,基本事件总数为个;
其中事件“ ”包含的样本点有:
,,,,,共个;
事件 “ ”,包含的样本点有:
, , , ,,,,,共个,
事件 “”,包含的样本点有:,,,,,,
,,,,,,
,,,,,共个,
所以与不能同时发生,但是能同时不发生,故不是对立事件,故 B 错误;
因为与不能同时发生,所以与是互斥事件,则,
又 , ,所以,
所以与不相互独立,故A错误;
又事件包含的样本点有: ,,共个,
所以 , ,则 ,
所以 与 相互独立,故C正确;
事件包含的样本点有:, , ,,,共个,
因为,所以 与 不相互独立,故D 错误.故选:C
考点三:随机变量及其分布列
知识点1 随机变量的分布列
1、离散型随机变量分布列
(1)离散型随机变量分布列的表示:一般地,若离散型随机变量可能取的不同值为,取每一个值的概率,以表格的形式表示如下:
我们将上表称为离散型随机变量的概率分布列,简称为的分布列.有时为了简单起见,也用等式,表示的分布列.
(2)分布列的性质:(1),;(2).
2、离散型随机变量的均值与方差:
(1)均值:为随机变量的均值或数学期望,它反映了离散型随机变量取值的平均水平.
(2)均值的性质
= 1 \* GB3 ①(为常数).
= 2 \* GB3 ②若,其中为常数,则也是随机变量,且.
= 3 \* GB3 ③.
= 4 \* GB3 ④如果相互独立,则.
(3)方差:为随机变量的方差,它刻画了随机变量X与其均值E(X)的平均偏离程度,称其算术平方根为随机变量的标准差.
(4)方差的性质
= 1 \* GB3 ①若,其中为常数,则也是随机变量,且.
= 2 \* GB3 ②方差公式的变形:.
知识点2 常见分布列
1、两点分布:若随机变量X的分布列具有下表的形式,则称X服从两点分布,并称p=P(X=1)为成功概率.
2、二项分布
(1)次独立重复试验:一般地,在相同条件下重复做的次试验称为次独立重复试验.
(2)二项分布的表示:一般地,在次独立重复试验中,用表示事件发生的次数,设每次试验中事件发生的概率为,不发生的概率,那么事件恰好发生次的概率是(,,,…,),于是得到的分布列
由于表中第二行恰好是二项式展开式各对应项的值,称这样的离散型随机变量服从参数为,的二项分布,记作,并称为成功概率.
(3)二项分布的期望、方差:若,则,.
3、超几何分布:在含有件次品的件产品中,任取件,其中恰有件次品,则事件发生的概率为,,1,2,…,,其中,且,,,,,称分布列为超几何分布列.如果随机变量的分布列为超几何分布列,则称随机变量服从超几何分布.
4、正态曲线与正态分布
(1)正态曲线:我们把函数,(其中是样本均值,是样本标准差)的图象称为正态分布密度曲线,简称正态曲线.正态曲线呈钟形,即中间高,两边低.
(2)正态分布:一般地,如果对于任何实数,,随机变量满足,则称随机变量服从正态分布.正态分布完全由参数,确定,因此正态分布常记作.如果随机变量服从正态分布,则记为.
(3)原则:若,则对于任意的实数,为下图中阴影部分的面积,对于固定的和而言,该面积随着的减小而变大.这说明越小,落在区间的概率越大,即集中在周围的概率越大
特别地,有;;.
【题型1 分布列的均值、方差及性质】
1.(2024·陕西西安·模拟预测)已知某随机变量的分布列如图表,则随机变量X的方差( )
A.120B.160C.200D.260
【答案】C
【解析】由题可知:,解得,则;
故.故选:C.
2.(23-24高三上·河北·六调)已知随机变量,随机变量,若,,则( )
A.0.1B.0.2C.0.3D.0.4
【答案】C
【解析】因为,,,
所以,解得或(舍),
由,则,
所以.故选:C.
3.(2024·湖南·模拟预测)有一枚质地均匀点数为1到4的特制骰子,投掷时得到每种点数的概率均等,现在进行三次独立投掷,记X为得到最大点数与最小点数之差,则X的数学期望( )
A.B.C.D.
【答案】D
【解析】的所有可能取值为,记三次得到的数组成数组,
满足的数组有:,共4个,
所以,
满足的数组有:
,
,共18个,
所以,
满足的数组有:
,
,
,
,共24个,
所以,
满足的数组有:
,,
,,
,,共18个,
所以,
所以X的数学期望.故选:D.
4.(2024·广东·一模)已知随机变量的分布列如下:
则是的( )
A.充分不必要条件B.必要不充分条件
C.充要条件D.既不充分也不必要条件
【答案】A
【解析】由题意可知,
若,则,得,
故充分性满足;
若,则,解得或.
当时,,此时,
当时,,此时,
则或,故必要性不满足.故选:A.
5.(2024·广东广州·二模)设,随机变量取值的概率均为0.2,随机变量取值的概率也均为0.2,若记分别为的方差,则( )
A.
B.
C.
D.与的大小关系与的取值有关
【答案】C
【解析】由题意得,
,
故,
记
则
同理
因为,则,,,
故,
即得,与的大小关系与的取值无关,故选:C
【题型2 离散型随机变量的分布列】
1.(2024·甘肃定西·一模)甲、乙两人进行中国象棋比赛,采用五局三胜制,假设他们没有平局的情况,甲每局赢的概率均为,且每局的胜负相互独立,
(1)求该比赛三局定胜负的概率;
(2)在甲赢第一局的前提下,设该比赛还需要进行的局数为,求的分布列与数学期望.
【答案】(1);(2)分布列见解析;
【解析】(1)该比赛三局定胜负意味着甲、乙两人前面三局有一人连赢,
则该比赛三局定胜负的概率为.
(2)依题意,的可能取值为2,3,4,
则,,,
则的分布列为
故.
2.(2024·浙江绍兴·二模)盒中有标记数字1,2的小球各2个.
(1)若有放回地随机取出2个小球,求取出的2个小球上的数字不同的概率;
(2)若不放回地依次随机取出4个小球,记相邻小球上的数字相同的对数为(如1122,则),求的分布列及数学期望.
【答案】(1);(2)分布列见解析,1.
【解析】(1)设事件“取出的2个小球上的数字不同”,则.
(2)的所有可能取值为0,1,2.
①当相邻小球上的数字都不同时,如1212,有种,
则.
②当相邻小球上的数字只有1对相同时,如1221,有种,
则.
③当相邻小球上的数字有2对相同时,如1122,有种,
则.
所以的分布列为
所以的数学期望.
3.(2024·黑龙江双鸭山·模拟预测)中华茶文化源远流长,博大精深,不但包含丰富的物质文化,还包含深厚的精神文化.其中绿茶在制茶过程中,在采摘后还需要经过杀青、揉捻、干燥这三道工序.现在某绿茶厂将采摘后的茶叶进行加工,其中杀青、揉捻、干燥这三道工序合格的概率分别为,每道工序的加工都相互独立,且茶叶加工中三道工序至少有一道工序合格的概率为.三道工序加工都合格的绿茶为特级绿茶,恰有两道工序加工合格的绿茶为一级绿茶,恰有一道工序加工合格的绿茶为二级绿茶,其余的为不合格绿茶.
(1)在绿茶的三道工序中恰有两道工序加工合格的前提下,求杀青加工合格的概率;
(2)每盒绿茶(净重)原材料及制作成本为30元,其中特级绿茶、一级绿茶、二级绿茶的出厂价分别为90元,60元,40元,而不合格绿茶则不进入市场.记经过三道工序制成的一盒绿茶的利润为元,求随机变量的分布列及数学期望.
【答案】(1);(2)分布列见解析,38.
【解析】(1)由三道工序至少有一道工序合格的概率为,得,解得,
记杀青、揉捻、干燥这三道工序加工合格分别为事件A,B,C,
这三道工序加工中恰有两道工序合格记为事件,
则,
,
因此,
所以在绿茶的三道工序中恰有两道工序加工合格的前提下,杀青加工合格的概率为.
(2)由题意可知随机变量的所有可能取值为,
,
,
,
,
则随机变量的分布列为:
故的数学期望为.
4.(2024·浙江宁波·二模)三个人利用手机软件依次进行拼手气抢红包活动,红包的总金额数为个单位.第一个人抢到的金额数为1到个单位且等可能(记第一个人抢完后剩余的金额数为),第二个人在剩余的个金额数中抢到1到个单位且等可能,第三个人抢到剩余的所有金额数,并且每个人抢到的金额数均为整数个单位.三个人都抢完后,获得金额数最高的人称为手气王(若有多人金额数相同且最高,则先抢到最高金额数的人称为手气王).
(1)若,则第一个人抢到的金额数可能为个单位且等可能.
(i)求第一个人抢到金额数的分布列与期望;
(ii)求第一个人获得手气王的概率;
(2)在三个人抢到的金额数为的一个排列的条件下,求第一个人获得手气王的概率.
【答案】(1)(i)分布列见解析,2;(ii);(2).
【解析】(1)若第一个人抢到的金额数为个单位,第二个人抢到的金额数为个单位,
第三个人抢到的金额数为个单位,我们将三个人抢到的金额数记作.
(i),
所以的分布列为
.
(ii)第一个人获得手气王时,三个人抢到的金额数只可能为,
故第一个人获得手气王的概率
.
(2)记事件“三个人抢到的金额数为的一个排列”,事件“第一个人获得手气王”.
所要求的是条件概率,有.
当三个人抢到的金额数为的一个排列时,总金额数为9,
故第一个人抢到的金额数可能为.
又,
,
故.
【题型3 二项分布及其应用】
1.(2024·全国·模拟预测)如图所示,已知一质点在外力的作用下,从原点出发,每次向左移动的概率为,向右移动的概率为.若该质点每次移动一个单位长度,设经过5次移动后,该质点位于的位置,则( )
A.B.C.D.
【答案】D
【解析】依题意,当时,的可能取值为1,3,5,且,
所以.故选:D.
2.(2024·广东韶关·二模)小明参加社区组织的射击比赛活动,已知小明射击一次、击中区域甲的概率是,击中区域乙的概率是,击中区域丙的概率是,区域甲,乙、丙均没有重复的部分.这次射击比赛获奖规则是:若击中区域甲则获一等奖;若击中区域乙则有一半的机会获得二等奖,有一半的机会获得三等奖;若击中区域丙则获得三等奖;若击中上述三个区域以外的区域则不获奖.获得一等奖和二等奖的选手被评为“优秀射击手”称号.
(1)求小明射击1次获得“优秀射击手”称号的概率;
(2)小明在比赛中射击4次,每次射击的结果相互独立,设获三等奖的次数为X,求X分布列和数学期望.
【答案】(1);(2)分布列见解析;
【解析】(1)记“射击一次获得‘优秀射击手’称号”为事件;射击一次获得一等奖为事件;
射击一次获得一等奖为事件,所以有,
所以,,
所以.
(2)获得三等奖的次数为,的可能取值为,,,,;
记“获得三等奖”为事件,所以,
所以,,
,,
,所以
显然,.
3.(陕西省西安市鄠邑区2023-2024学年高三上学期期末考试(理科)数学试题)中医药学是中国古代科学的瑰宝,也是打开中华文明宝库的钥匙.为了调查某地市民对中医药文化的了解程度,某学习小组随机向该地100位不同年龄段的市民发放了有关中医药文化的调查问卷,得到的数据如下表所示:
规定成绩在内代表对中医药文化了解程度低,成绩在内代表对中医药文化了解程度高.
(1)从这100位市民中随机抽取1人,求抽到对中医药文化了解程度高的市民的频率;
(2)将频率视为概率,现从该地41岁50岁年龄段的市民中随机抽取3人,记为对中医药文化了解程度高的人数,求的分布列和期望.
【答案】(1);(2)分布列见解析,
【解析】(1)抽到对中医药文化了解程度高的市民的频率为.
(2)根据表格可知从41岁~50岁年龄段中随机抽取1人,
这个人是对中医药文化了解程度高的市民的概率,
了解程度低的概率.
由题意可知的可能取值为,
则,,
,,
故的分布列为
的数学期望.(也可以写成.)
4.(2024·河北邢台·一模)小张参加某知识竞赛,题目按照难度不同分为A类题和B类题,小张回答A类题正确的概率为0.9,小张回答B类题正确的概率为0.45.已知题库中B类题的数量是A类题的两倍.
(1)求小张在题库中任选一题,回答正确的概率;
(2)已知题库中的题目数量足够多,该知识竞赛需要小张从题库中连续回答10个题目,若小张在这10个题目中恰好回答正确k个(,1,2,,10)的概率为,则当k为何值时,最大?
【答案】(1)0.6;(2)6
【解析】(1)设小张回答A类题正确的概率为,小张回答B类题正确的概率为,
小张在题库中任选一题,回答正确的概率为,
由题意可得,
所以,
所以小张在题库中任选一题,回答正确的概率为0.6.
(2)由(1)可得,
设,即,
所以,即,解得,
又,所以时,最大.
【题型4 超几何分布及其应用】
1.(2024·辽宁·二模)小明从4双鞋中,随机一次取出2只,
(1)求取出的2只鞋都不来自同一双的概率;
(2)若这4双鞋中,恰有一双是小明的,记取出的2只鞋中含有小明的鞋的个数为X,求X的分布列及数学期望,
【答案】(1);(2)分布列见解析;
【解析】(1)由题可得:取出2只都不来自同一双的概率为:.
(2)由题可知X的取值为:0,1,2,
,,,
故X的分布列为:
,故.
2.(2024·内蒙古呼伦贝尔·一模)当AIGC(生成式人工智能)领域的一系列创新性技术有了革命性突破,全球各大科技企业积极拥抱AIGC,我国有包括A在内的5家企业加码布局AIGC生成算法赛道,有包括B、C在内的5家企业加码布局AIGC的自然语言处理赛道,某传媒公司准备发布(2023年中国AIGC发展研究报告),先期准备从上面的10家企业中随机选取4家进行采访.
(1)若在布局不同的赛道中各选取2家企业,求选取的4家企业中,企业A,B,C至少有2家的概率.
(2)记选取的4家科技企业中布局AIGC的是生成算法赛道的企业个数为X,求X的分布列与期望.
【答案】(1);(2)分布列见解析,2.
【解析】(1)因为从上面的10家科技企业布局的两条赛道中各随机选取2家共有种不同的选法,
选取的4家科技企业中,企业至少有2家共有种不同的选法,
所以选取的4家科技企业中,企业至少有2家的概率为.
(2)可以取,
,
,
所以的分布列为
所以.
3.(2024·山东聊城·二模)随着互联网的普及、大数据的驱动,线上线下相结合的新零售时代已全面开启,新零售背景下,即时配送行业稳定快速增长.某即时配送公司为更好地了解客户需求,优化自身服务,提高客户满意度,在其两个分公司的客户中各随机抽取10位客户进行了满意度评分调查(满分100分),评分结果如下:
分公司A:66,80,72,79,80,78,87,86,91,91.
分公司B:62,77,82,70,73,86,85,94,92,89.
(1)求抽取的这20位客户评分的第一四分位数;
(2)规定评分在75分以下的为不满意,从上述不满意的客户中随机抽取3人继续沟通不满意的原因及改进建议,设被抽到的3人中分公司的客户人数为,求的分布列和数学期望.
【答案】(1);(2),分布列见解析
【解析】(1)将抽取的这20位客户的评分从小到大排列为:
62,66,70,72,73,77,78,79,80,80,82,85,86,86,87,89,91,91,92,94.
因为,所以抽取的这20位客户评分的第一四分位数为.
(2)由已知得分公司中75分以下的有66分,72分;
分公司中75分以下的有62分,70分,73分,
所以上述不满意的客户共5人,其中分公司中2人,分公司中3人.
所以的所有可能取值为1,2,3.
,
所以的分布列为
数学期望.
4.(2024·新疆·二模)水果按照果径大小可分为四类:标准果、优质果、精品果、礼品果.某采购商从采购的一批水果中随机抽取100个,利用水果的等级分类标准得到的数据如下:
(1)若将频率视为概率,从这100个水果中有放回地随机抽取4个,求恰好有2个水果是礼品果的概率;
(2)用分层抽样的方法从这100个水果中抽取20个,再从抽取的20个水果中随机地抽取2个,用表示抽取的是精品果的数量,求的分布列及数学期望.
【答案】(1);(2)分布列见解析,0.8
【解析】(1)设“从100个水果中随机抽取一个,抽到礼品果”为事件,则,
现有放回地随机抽取4个,设抽到礼品果的个数为,则,
故恰好抽到2个礼品果的概率为;
(2)用分层抽样的方法从100个水果中抽取20个,则其中精品果8个,非精品果12个,
现从中抽取2个,则精品果的数量服从超几何分布,所有可能的取值为,
则,
所以的分布列为:
故的数学期望.
【题型5 正态分布及其应用】
1.(2024·甘肃武威·模拟预测)已知随机变量满足,若,则( )
A.B.C.D.
【答案】B
【解析】由,得,则,
由,得,
因为,
所以随机变量对应的正态密度曲线的形状相同,其对称轴分别为直线,
从而.故选:B
2.(2024·河北石家庄·二模)某市教育局为了解高三学生的学习情况,组织了一次摸底考试,共有50000名考生参加这次考试,数学成绩近似服从正态分布,其正态密度函数为且,则该市这次考试数学成绩超过110分的考生人数约为( )
A.2000B.3000C.4000D.5000
【答案】D
【解析】由题易知均值,
由正态曲线的对称性可知 ,
则该市这次考试数学成绩超过110分的考生人数约为.故选:D.
3.(2024·河南信阳·一模)对A,B两地国企员工上班迟到情况进行统计,可知两地国企员工的上班迟到时间均符合正态分布,其中A地员工的上班迟到时间为X(单位:min),,对应的曲线为,B地员工的上班迟到时间为Y(单位:min),,对应的曲线为,则下列图象正确的是( )
A.B.
C.D.
【答案】B
【解析】由,故曲线的对称轴在曲线的左侧,排除C、D;
由,故曲线比曲线瘦高,曲线比曲线矮胖,排除A.故选:B.
4.(2024·辽宁抚顺·三模)某市共有教师1000名,为了解老师们的寒假研修情况,评选研修先进个人,现随机抽取了10名教师利用“学习APP”学习的时长(单位:小时):35,43,90,83,50,45,82,75,62,35,时长不低于80小时的教师评为“研修先进个人”.
(1)现从该样本中随机抽取3名教师的学习时长,求这3名教师中恰有2名教师是研修先进个人的概率.
(2)若该市所有教师的学习时长近似地服从正态分布,其中为抽取的10名教师学习时长的样本平均数,利用所得正态分布模型解决以下问题:
①试估计学习时长不低于50小时的教师的人数(结果四舍五人到整数);
②若从该市随机抽取的名教师中恰有名教师的学习时长在内,则为何值时,的值最大?
附:若随机变量服从正态分布,则,,.
【答案】(1);(2)①841;②14
【解析】(1)设事件“抽取的3名教师中恰有2名教师是研修先进个人”为.
由题知样本中学习时长不低于80小时的人数为3,时长低于80小时的人数为7,
则,
所以这3名教师中恰有2名教师是研修先进个人的概率为.
(2)①由样本数据知,.
因为,
所以,
所以,学习时长不低于50小时的教师人数为841.
②每名教师的学习时长在内的概率为,
由题意可知,则,
设,
则.
令,得,所以当时,,
令,得,所以当时,,
所以当时,最大,即使最大的的值为14.
考点四:统计与成对数据的统计分析
知识点1 随机抽样
1、简单随机抽样
(1)定义:一般地,设一个总体含有个个体,从中逐个不放回地抽取个个体作为样本(),如果每次抽取时总体内的各个个体被抽到的机会都相等,就把这种抽样方法叫做简单随机抽样.这样抽取的样本,叫做简单随机样本.
(2)简单随机抽样的特征(只有四个特点都满足的抽样才是简单随机抽样)
①有限性:简单随机抽样要求被抽取的样本的总体个数是有限的,便于通过样本对总体进行分析.
②逐一性:简单随机抽样是从总体中逐个地进行抽取,便于实践中操作.
③不放回性:简单随机抽样是一种不放回抽样,便于进行有关的分析和计算.
④等可能性:简单单随机抽样中各个个体被抽到的机会都相等,从而保证了抽样方法的公平.
2、分层抽样
(1)定义:一般地,在抽样时,将总体分成互不交叉的层,然后按照一定的比例,从各层独立地抽取一定数量的个体,将各层取出的个体合在一起作为样本,这种抽样方法叫做分层抽样.
分层抽样适用于已知总体是由差异明显的几部分组成的.
(2)分层抽样问题类型及解题思路
①求某层应抽个体数量:按该层所占总体的比例计算.
②已知某层个体数量,求总体容量或反之求解:根据分层抽样就是按比例抽样,列比例式进行计算.
③分层抽样的计算应根据抽样比构造方程求解,其中“抽样比=eq \f(样本容量,总体容量)=eq \f(各层样本数量,各层个体数量)”
知识点2 用样本估计总体
1、频率分布直方图
(1)频率、频数、样本容量的计算方法
①eq \f(频率,组距)×组距=频率.
②eq \f(频数,样本容量)=频率,eq \f(频数,频率)=样本容量,样本容量×频率=频数.
③频率分布直方图中各个小方形的面积总和等于.
(2)频率分布直方图中数字特征的计算
= 1 \* GB3 ①最高的小长方形底边中点的横坐标即是众数.
= 2 \* GB3 ②中位数左边和右边的小长方形的面积和是相等的.设中位数为,利用左(右)侧矩形面积之和等于,即可求出.
= 3 \* GB3 ③平均数是频率分布直方图的“重心”,等于频率分布直方图中每个小长方形的面积乘以小长方形底边中点的横坐标之和,即有,其中为每个小长方形底边的中点,为每个小长方形的面积.
2、百分位数
(1)定义:一组数据的第百分位数是这样一个值,它使得这组数据中至少有的数据小于或等于这个值,且至少有的数据大于或等于这个值.
(2)计算一组个数据的的第百分位数的步骤
①按从小到大排列原始数据.
②计算.
③若不是整数而大于的比邻整数,则第百分位数为第项数据;若是整数,则第百分位数为第项与第项数据的平均数.
(3)四分位数:我们之前学过的中位数,相当于是第百分位数.在实际应用中,除了中位数外,常用的分位数还有第百分位数,第百分位数.这三个分位数把一组由小到大排列后的数据分成四等份,因此称为四分位数.
3、样本的数字特征
(1)众数、中位数、平均数
①众数:一组数据中出现次数最多的数叫众数,众数反应一组数据的多数水平.
②中位数:将一组数据按大小顺序依次排列,把处在最中间位置的一个数据(或最中间两个数据的平均数)叫做这组数据的中位数,中位数反应一组数据的中间水平.
③平均数:个样本数据的平均数为,反应一组数据的平均水平,公式变形:.
(2)标准差和方差
①标准差:标准差是样本数据到平均数的一种平均距离,一般用表示.假设样本数据是,表示这组数据的平均数,则标准差.
②方差:方差就是标准差的平方,即.显然,在刻画样本数据的分散程度上,方差与标准差是一样的.在解决实际问题时,多采用标准差.
= 3 \* GB3 ③平均数、方差的性质:如果数据的平均数为,方差为,那么
一组新数据的平均数为,方差是.
一新数据的平均数为,方差是.
一组新数据的平均数为,方差是.
知识点3 成对数据的统计分析
1、回归分析与回归方程
(1)回归分析的定义:对具有相关关系的两个变量进行统计分析的一种常用方法.
(2)最小二乘法:使得样本数据的点到回归直线的距离的平方和最小的方法叫做最小二乘法.
(3)回归方程:对于一组具有线性相关关系的数据(x1,y1),(x2,y2),…,(xn,yn),其回归方程的求法为
其中,,,(,)称为样本点的中心.
(3)相关系数
若相应于变量的取值,变量的观测值为,
则变量与的相关系数,
通常用来衡量与之间的线性关系的强弱,的范围为.
= 1 \* GB3 ①当时,表示两个变量正相关;当时,表示两个变量负相关.
= 2 \* GB3 ②越接近,表示两个变量的线性相关性越强;越接近,表示两个变量间几乎不存在线性相关关系.当时,所有数据点都在一条直线上.
= 3 \* GB3 ③通常当时,认为两个变量具有很强的线性相关关系.
2、独立性检验
(1)分类变量:变量的不同“值”表示个体所属的不同类别,像这类变量称为分类变量.
(2)列联表:
①定义:列出的两个分类变量的频数表称为列联表.
②2×2列联表:假设有两个分类变量X和Y,它们的可能取值分别为{x1,x2}和{y1,y2},其样本频数列联表(称为2×2列联表)为2×2列联表
(3)独立性检验:计算随机变量利用的取值推断分类变量X和Y是否独立的方法称为χ2独立性检验.
【题型1 简单随机抽样与分层抽样】
1.(23-24高三下·四川巴中·月考)某学校师生共有3600人,现用分层抽样方法抽取一个容量为240的样本,已知样本中教师人数为30人,则该校学生人数为
【答案】
【解析】从教师中抽取的人数为30,则抽取学生的人数为,
该校学生人数为,
2.(2024·陕西西安·一模)某高校对中文系新生进行体测,利用随机数表对650名学生进行抽样,先将650名学生进行编号,001,002,…,649,650.从中抽取50个样本,下图提供随机数表的第4行到第6行,若从表中第5行第6列开始向右读取数据,则得到的第6个样本编号是( )
32 21 18 34 29 78 64 54 07 32 52 42 06 44 38 12 23 43 56 77 35 78 90 56 42
84 42 12 53 31 34 57 86 07 36 25 30 07 32 86 23 45 78 89 07 23 68 96 08 04
32 56 78 08 43 67 89 53 55 77 34 89 94 83 75 22 53 55 78 32 45 77 89 23 45
A.623B.328C.072D.457
【答案】A
【解析】从第5行第6列开始向右读取数据,第一个数为253,第二个数是313,
第三个数是457,下一个数是860,不符合要求,
下一个数是736,不符合要求,下一个是253,重复,
第四个是007,第五个是328,第六个数是623,,故A正确.故选:A.
3.(2024·海南·模拟预测)某机构统计了1000名演员的学历情况,制作出如图所示的饼状图,其中本科学历的人数为630.现按比例用分层随机抽样的方法从中抽取200人,则抽取的硕士学历的人数为( )
A.11B.13C.22D.26
【答案】D
【解析】由题意硕士学历的人数与总人数1000之比为,
现按比例用分层随机抽样的方法从中抽取200人,
则抽取的硕士学历的人数为.故选:D.
4.(2024·广东梅州·一模)某单位有职工450人,其中男职工150人,现为了解职工健康情况,该单位采取分层随机抽样的方法抽取了一个容量为90的样本,得出体重情况:男性平均体重为63千克;女性平均体重为54千克.则下列说法不正确的是( )
A.抽查的样本中女职工人数为60 B.该单位男职工的体重普遍比女职工较重
C.估计该单位职工平均体重为58.5 D.每一位男或女职工被抽中的可能性均为
【答案】C
【解析】A选项,抽查的样本中女职工人数为,A选项正确.
B选项,男性平均体重为63千克;女性平均体重为54千克,
所以该单位男职工的体重普遍比女职工较重,B选项正确.
C选项,估计该单位职工平均体重为,C选项错误.
D选项,每一位男或女职工被抽中的可能性均为,D选项正确.故选:C
【题型2 样本的数字特征及应用】
1.(2023·全国·高考真题)(多选)有一组样本数据,其中是最小值,是最大值,则( )
A.的平均数等于的平均数
B.的中位数等于的中位数
C.的标准差不小于的标准差
D.的极差不大于的极差
【答案】BD
【解析】对于选项A:设的平均数为,的平均数为,
则,
因为没有确定的大小关系,所以无法判断的大小,
例如:,可得;
例如,可得;
例如,可得;故A错误;
对于选项B:不妨设,
可知的中位数等于的中位数均为,故B正确;
对于选项C:因为是最小值,是最大值,
则的波动性不大于的波动性,
即的标准差不大于的标准差,
例如:,则平均数,
标准差,
,则平均数,
标准差,
显然,即;故C错误;
对于选项D:不妨设,
则,当且仅当时,等号成立,故D正确;故选:BD.
2.(2024·湖南·二模)某10人的射击小组,在一次射击训练中射击成绩数据如下表,则这组数据的中位数为( )
A.2B.8C.8.2D.8.5
【答案】D
【解析】将射击成绩由小到大排列:,
第个数分别为,因而中位数为.故选:D.
3.(2024·陕西西安·模拟预测)一组数据为,下列说法正确的个数是( )
①这些数据的众数是6
②这些数据的中位数是
③这些数据的平均数是7
④这些数据的标准差是
A.1B.2C.3D.4
【答案】A
【解析】依题意,原数据组由小到大排列为:,
所以这组数据的众数是6或8,故①错误;
中位数是6,故②错误;
平均数为.故③错误;
方差为,
标准差为.故④正确.故选:A.
4.(2024·陕西汉中·二模)一组样本数据的平均数为,方差为,标准差为s,下列说法正确的是( )
A.这组数据的中位数为
B.的平均数为
C.的方差为
D.的标准差为
【答案】D
【解析】依题意,,,
对于A,数据不一定是按大小顺序排列而成的,A错误;
对于B,,B错误;
对于C,,
,C错误;
对于D,,,
所以的标准差为,D正确.故选:D
5.(2024·福建厦门·一模)已知甲、乙两组数据分别为:和,若乙组数据的平均数比甲组数据的平均数大3,则( )
A.甲组数据的第70百分位数为23
B.甲、乙两组数据的极差不相同
C.乙组数据的中位数为24.5
D.甲、乙两组数据的方差相同
【答案】D
【解析】由题设得,,解得,
甲组数据中,故第70百分位数为24,A错;
甲组数据的极差为,乙组数据的极差为,
所以甲、乙两组数据的极差相同,故B错;
乙组数据从小到大为,故其中位数为,C错;
甲的平均数为,
乙的平均数为,
所以甲的方差为,
乙的方差为,
故两组数据的方差相同,D对.故选:D
【题型3 频率分布直方图】
1.(2023·全国·高考真题)某研究小组经过研究发现某种疾病的患病者与未患病者的某项医学指标有明显差异,经过大量调查,得到如下的患病者和未患病者该指标的频率分布直方图:
利用该指标制定一个检测标准,需要确定临界值c,将该指标大于c的人判定为阳性,小于或等于c的人判定为阴性.此检测标准的漏诊率是将患病者判定为阴性的概率,记为;误诊率是将未患病者判定为阳性的概率,记为.假设数据在组内均匀分布,以事件发生的频率作为相应事件发生的概率.
(1)当漏诊率%时,求临界值c和误诊率;
(2)设函数,当时,求的解析式,并求在区间的最小值.
【答案】(1),;(2),最小值为.
【解析】(1)依题可知,左边图形第一个小矩形的面积为,所以,
所以,解得:,
.
(2)当时,
;
当时,
,
故,
所以在区间的最小值为.
2.(2024·山东·二模)某校高三共有200人参加体育测试,根据规则,82分以上的考生成绩等级为,则估计获得的考生人数约为( )
A.100B.75C.50D.25
【答案】C
【解析】由频率分布直方图可得82分以上的考生的频率约为,
所以获得的考生人数约为人,故选:C.
3.(2024·天津河东·一模)根据《中华人民共和国道路交通安全法》规定:血液酒精浓度在(含80)以上时,属醉酒驾车,处十五日以下拘留和三个月以上六个月以下暂扣驾驶证,并处500元以上2000元以下罚款,某地统计了近五年来查处的酒后驾车和醉酒驾车共200人,如图,这是对这200人酒后驾车血液中酒精含量进行检测所得结果的频率分布直方图,下列说法正确的是( )
A.在酒后驾车的驾驶人中醉酒驾车比例不高因此危害不大
B.在频率分布直方图中每个柱的高度代表区间内人数的频率
C.根据频率分布直方图可知200人中醉酒驾车的约有30人
D.这200人酒后驾车血液中酒精含量的平均值约为
【答案】C
【解析】对于A,不管酒驾的比例高不高,其危害都大,故A错误;
对于B,在频率分布直方图中,每个柱的高度代表区间内的频率/组距这一数值,故B错误;
对于C,血液酒精浓度在(含80)以上时,属醉酒驾车,
所以这200人中醉酒驾车的约有,故C正确;
对于D,这200人酒后驾车血液中酒精含量的平均值约为
,
故D错误.故选:C.
4.(2024·四川成都·三模)为了更好地培养国家需要的人才,某校拟开展一项名为“书香致远,阅读润心”的读书活动,为了更好地服务全校学生,需要对全校学生的周平均阅读时间进行调查,现从该校学生中随机抽取200名学生,将他们的周平均阅读时间(单位:小时)数据分成5组:,根据分组数据制成了如图所示的频率分布直方图.
(1)求的值,并估计全校学生周平均阅读时间的平均数;
(2)用分层抽样的方法从周平均阅读时间不小于8小时的学生中抽出6人,再随机选出2人作为该活动的形象大使,求这人都来自这组的概率.
【答案】(1),平均数为;(2)
【解析】(1)依题意可得,解得.
又,
即估计全校学生周平均阅读时间的平均数为小时.
(2)由频率分布直方图可知和两组的频数的比为
所以利用分层抽样的方法抽取人,
这两组被抽取的人数分别为,,
记中的人为,,,,中的人为,,
从这人中随机选出人,则样本空间
共15个样本点;
设事件:选出的人都来自,
则共个样本点,
所以.
【题型4 百分位数的计算】
1.(2024·辽宁·二模)已知一组数据为50,40,39,45,32,34,42,37,则这组数据第40百分位数为( )
A.39B.40C.45D.32
【答案】A
【解析】将这组数据从小到大排列为:32,34,37,39,40,42,45,50,共8个,
因为,所以这组数据第40百分位数为第4个数据,即为39,故选:A
2.(2024·全国·模拟预测)下图为某地区2013~2023年移动电话普及率(单位:)发展情况统计:该地区这11年移动电话普及率的第60百分位数为( )
A.114.4B.112.9C.112.55D.119.2
【答案】B
【解析】这11年移动电话普及率从小到大排列为:
90.8,92.5,94.5,95.6,102.0,112.2,112.9,114.4,116.3,119.2,122.5.
因为,由此可知第百分位数是第个数,即.故选:B.
3.(2024·江苏盐城·模拟预测)2024年某校举行一场射箭比赛,甲乙丙丁戊各射中的环数分别为:9环,6环,7环,8环,10环.则在五个人的成绩的上四分位数是( )
A.8环B.9环C.7环D.6环
【答案】B
【解析】将5人的比赛成绩由小到大排列依次为:6,7,8,9,10,
,5人成绩的上四分位数为第四个数:9.故选:B.
4.(2024·江苏南通·二模)某同学在一次数学测试中的成绩是班级第三名(假设测试成绩两两不同),成绩处于第90百分位数,则该班级的人数可能为( )
A.15B.25C.30D.35
【答案】B
【解析】设班级人数为x人,由题意,,解得,
又,结合选项可得,该班级的人数可能为25.故选:B
【题型5 回归分析】
1.(2024·湖南·二模)对两个变量和进行回归分析,得到一组样本数据,下列统计量的数值能够刻画其经验回归方程的拟合效果的是( )
A.平均数B.相关系数C.决定系数D.方差
【答案】C
【解析】平均数与方差是用来反馈数据集中趋势与波动程度大小的统计量;
变量y和x之间的相关系数的绝对值越大,则变量y和x之间线性相关关系越强;
用决定系数来刻画回归效果,越大说明拟合效果越好.故选:C
2.(2024·河北沧州·一模)(多选)下表是某地从2019年至2023年能源消费总量近似值(单位:千万吨标准煤)的数据表:
以为解释变量,为响应变量,若以为回归方程,则决定系数0.9298,若以为回归方程,则,则下面结论中正确的有( )
A.变量和变量的样本相关系数为正数
B.比的拟合效果好
C.由回归方程可准确预测2024年的能源消费总量
D.
【答案】ABD
【解析】对于A选项:随着变量的增加,变量也在增加,
故变量和变量成正相关,即样本相关系数为正数,正确;
对于B选项:因为,故比的拟合效果好,正确;
对于C选项:回归方程可预测2024年的能源消费总量,不可准确预测,错误;
对于D选项:由回归方程必过样本中心点,可知,正确.故选:ABD.
3.(2024·浙江台州·二模)台州是全国三大电动车生产基地之一,拥有完整的产业链和突出的设计优势.某电动车公司为了抢占更多的市场份额,计划加大广告投入、该公司近5年的年广告费(单位:百万元)和年销售量(单位:百万辆)关系如图所示:令,数据经过初步处理得:
现有①和②两种方案作为年销售量y关于年广告费x的回归分析模型,其中a,b,m,n均为常数.
(1)请从相关系数的角度,分析哪一个模型拟合程度更好?
(2)根据(1)的分析选取拟合程度更好的回归分析模型及表中数据,求出y关于x的回归方程,并预测年广告费为6(百万元)时,产品的年销售量是多少?
(3)该公司生产的电动车毛利润为每辆200元(不含广告费、研发经费).该公司在加大广告投入的同时也加大研发经费的投入,年研发经费为年广告费的199倍.电动车的年净利润受年广告费和年研发经费影响外还受随机变量影响,设随机变量服从正态分布,且满足.在(2)的条件下,求该公司年净利润的最大值大于1000(百万元)的概率.(年净利润=毛利润×年销售量-年广告费-年研发经费-随机变量).
附:①相关系数,
回归直线中公式分别为,;
②参考数据:,,,.
【答案】(1)模型②的拟合程度更好;(2),当年广告费为6(百万元)时,产品的销售量大概是13(百万辆);(3)0.3
【解析】(1)设模型①和②的相关系数分别为,.
由题意可得:,
.
所以,由相关系数的相关性质可得,模型②的拟合程度更好.
(2)因为,
又由,,得,
所以,即回归方程为.
当时,,
因此当年广告费为6(百万元)时,产品的销售量大概是13(百万辆).
(3)净利润为,,
令,所以.
可得在上为增函数,在上为减函数.
所以,
由题意得:,即,,
即该公司年净利润大于1000(百万元)的概率为0.3.
4.(2024·辽宁·模拟预测)土壤食物网对有机质的分解有两条途径,即真菌途径和细菌途径.在不同的土壤生态系统中,由于提供能源的有机物其分解的难易程度不同,这两条途径所起的作用也不同.以细菌分解途径为主导的土壤,有机质降解快,氮矿化率高,有利于养分供应,以真菌途径为主的土壤,氮和能量转化比较缓慢,有利于有机质存财和氮的固持.某生物实验小组从一种土壤数据中随机抽查并统计了8组数据,如下表所示:
其散点图如下,散点大致分布在指数型函数的图象附近.
(1)求关于的经验回归方程(系数精确到0.01);
(2)在做土壤相关的生态环境研究时,细菌与真菌的比值能够反映土壤的碳氮循环.以样本的频率估计总体分布的概率,若该实验小组随机抽查8组数据,再从中任选4组,记真菌(单位:百万个)与细菌(单位:百万个)的数值之比位于区间内的组数为,求的分布列与数学期望.
附:经验回归方程的斜率和截距的最小二乘估计公式分别为,
【答案】(1);(2)分布列见解析,2
【解析】(1)由于,故,
令,
则,
,
则,
,
故,则关于的经验回归方程为;
(2)由已知图表可知
从第1组到第8组的真菌(单位:百万个)与细菌(单位:百万个)的数值之比依次为:
,,
故样本中比值位于内的组数有4组,则X的可能取值为:,
则,
,
故X的分布列为:
则.
【题型6 独立性检验】
1.(2024·黑龙江哈尔滨·二模)针对2025年第九届亚冬会在哈尔滨举办,校团委对“是否喜欢冰雪运动与学生性别的关系”进行了一次调查,其中被调查的男、女生人数相同,男生中喜欢冰雪运动的人数占男生人数的,女生中喜欢冰雪运动的人数占女生人数的,若依据的独立性检验,认为是否喜欢冰雪运动与学生性别有关,则被调查的学生中男生的人数不可能是( )
附:.
A.48B.54C.60D.66
【答案】A
【解析】设男生人数为,因为被调查的男、女生人数相同,
所以女生人数也为,根据题意列出列联表:
则,
因为依据的独立性检验,认为是否喜欢冰雪运动与学生性别有关,
所以,即,解得,又,
所以B、C、D正确,A错误.故选:A
2.(2024·山东枣庄·一模)某儿童医院用甲、乙两种疗法治疗小儿消化不良.采用有放回简单随机抽样的方法对治疗情况进行检查,得到两种疗法治疗数据的列联表:
经计算得到,根据小概率值的独立性检验(已知独立性检验中),则可以认为( )
A.两种疗法的效果存在差异
B.两种疗法的效果存在差异,这种判断犯错误的概率不超过0.005
C.两种疗法的效果没有差异
D.两种疗法的效果没有差异,这种判断犯错误的概率不超过0.005
【答案】C
【解析】零假设为:疗法与疗效独立,即两种疗法效果没有差异.
根据列联表中的数据,,
根据小概率值的独立性检验,没有充分证据推断不成立,
因此可以认为成立,即认为两种疗法效果没有差异.故选:C.
3.(2024·河南南阳·一模)通常人们认为语文作文成绩与课外阅读习惯(阅读习惯分为良好和不够良好两类)有很大关联,为了研究这个看法是否可信,某课外研究小组从学校一次期中测试语文作文成绩优秀的学生中随机调查了200人,同时在语文作文成绩不够优秀的学生中也随机调查了200人,得到如下数据:
(1)在这400名学生中按照课外阅读习惯良好与否进行分层随机抽样,抽取20名学生了解学生的行为习惯形成的原因,再从这20名学生中任选3人进行面对面访谈,求这3名学生中至少有1人课外阅读习惯良好的概率;
(2)根据小概率值的独立性检验,能否认为语文作文成绩与课外阅读习惯有关联?
附:.
【答案】(1);(2)根据小概率值的独立性检验,认为语文成绩与课外阅读习惯有关联
【解析】(1)由题意知,抽取的20人中课外阅读良好的人有人,
课外阅读不够良好的人有人,
则从20人中抽取3人,3人课外阅读习惯都不够良好的概率为,
所以从20人中抽取3人,3名学生中至少有1人课外阅读习惯良好的概率为.
(2)零假设:语文作文成绩与课外阅读习惯无关联,
,
根据小概率值的独立性检验,我们推断不成立,
故根据小概率值的独立性检验,认为语文成绩与课外阅读习惯有关联.
4.(2024·全国·模拟预测)某果农为了解施农家肥与化肥对苹果的大小是否有影响,现将自己所种植的苹果地合理分成两块,并对地连续施用三年农家肥,对地连续施用三年化肥.在第三年苹果采摘后,分别从两地的苹果中各抽取200个进行测量,其中地的大果(以上)为50个,中果为110个,小果(以下)为40个;地的大果为40个,中果为110个,小果为50个.
(1)根据以上数据,补全以下列联表,试根据小概率值的独立性检验,分析施肥的不同对苹果树结小果数是否有影响.
(2)现有苹果客商收购苹果,大果价格8元,中果6.5元,小果3元.客商对该果农的苹果质量进行评估:大果约个,中果约个,小果约个.假设两地的果树数之比为,且每棵果树结果数相等.该客商为节约时间,对该果农的苹果统一定价为6.5元.视频率为概率,用样本估计总体,请你为该果农出主意是否接受客商所给的价格,并给出解释.
参考公式及参考数据:,其中.
【答案】(1)列联表见解析,没有影响;(2)可以接受,答案见解析
【解析】(1)补全列联表如下.
零假设为:施肥的不同对苹果树结小果没有影响.根据列联表中的数据,
计算得.
根据小概率值的独立性检验,认为施肥的不同对苹果树结小果数没有影响.
(2)设该果农的所有苹果中,是大果的为事件,中果的为事件,小果的为事件,
则,
,,
所以果农的苹果平均定价为.
虽然客商给出的统一定价小于果农的苹果平均定价,但差距很小,
在综合考虑区分果子大小时的人力、物力、时间成本以及对果子本身损耗的情况下,
该果农可以接受客商所给的价格6.5元.
1、利用分类加法计数原理时注意根据题目特点选择一个恰当的分类标准,分类时注意完成这件事的任何一种方法必须属于某一类.
2、利用分步乘法计数原理时,注意将这件事划分成几个步骤来完成,各步骤之间有一定的连续性,只有当各步骤都完成了,这件事才能完成.
对于数字排列问题,0是特殊的数字,在解题过程中往往会忽视0不在首位的特殊要求。
1、直接法:把符合条件的排列数直接列式计算;
2、优先法:优先安排特殊元素或特殊位置;
3、捆绑法:相隔问题把相邻元素看作一个整体与其他元素一起排列,同时注意捆绑元素的内部排列;
4、插空法:不相邻问题,先考虑不受限制的元素的排列,再将不相邻的元素插在前面元素排列的空当中;
5、定序问题除法处理:对于定序问题,可先不考虑顺序限制,排列后再除以定序元素的全排列
6、间接法:正难则反、等价转化的方法
1、在二项式定理(a-b)n的问题要注意b的系数为-1,展开求解释不要忽略;
2、二项式(a+b)n的展开式的通项公式Tk+1=Ceq \\al(k,n)an-kbk(k=0,1,2,…,n)表示的是二项展开式的第k+1项,而不是第k项.
1、求(a+b)n的展开式中的特定项一般要应用通项公式Tk+1=Ceq \\al(k,n)an-kbk(k=0,1,2,…,n).
2、求两个因式积的特定项,一般对某个因式用通项公式,再结合因式相乘,分类讨论求解.
3、求三项展开式的特定项,一般转化为二项式求解或用定义法.
(1)系数和问题常用“赋值法”求解
赋值法是指对二项式中的未知元素赋值,从而求得二项展开式的各项系数和的方法.求解有关系数和题的关键点如下:
①赋值,观察已知等式与所求式子的结构特征,确定所赋的值,常赋的值有:-1,0,1等.
②求参数,通过赋值,建立参数的相关方程,解方程,可得参数值.
③求值,根据题意,得出指定项的系数和.
(2)二项式系数和:(a+b)n的展开式中二项式系数的和为Ceq \\al(0,n)+Ceq \\al(1,n)+…+Ceq \\al(n,n)=2n.
要注意二项展开式中二项式系数与某一项系数的区别. (a+b)n的展开式中第r+1项的系数是,其值只与有关,与无个,系数是该项中的常数,在(a+b)n的展开式中,系数最大的项是中间项;但当a,b的系数不是1时,系数最大的项的位置就不一定在中间,需要利用通项公式,根据系数的增减性具体讨论而定.
1、二项式系数先增后减中间项最大
(1)如果二项式的幂指数是偶数,则中间一项的二项式系数最大;
(2)如果二项式的幂指数是奇数,则中间两项,的二项式系数,相等且最大.
2、系数的最大项:求展开式中最大的项,一般采用待定系数法.设展开式中各项系数分别为,设第项系数最大,应有,从而解出来.
用公式法求古典概型的概率就是用所求事件A所含的基本事件个数除以基本事件空间Ω所含的基本事件个数求解事件A发生的概率P(A).解题的关键如下:
①定型,即根据古典概型的特点——有限性与等可能性,确定所求概率模型为古典概型.
②求量,利用列举法、排列组合等方法求出基本事件空间Ω及事件A所含的基本事件数.
③求值,代入公式P(A)=eq \f(A包含的基本事件的个数,基本事件的总数)求值.
乙甲
1
2
3
4
5
6
1
2
3
4
5
6
1、条件概率的求解方法:
(1)利用定义,分别求P(A)和P(AB),得,这是求条件概率的通法.
(2)借助古典概型概率公式,先求事件A包含的基本事件数n(A),再求事件A与事件B的交事件中包含的基本事件数n(AB),得.
2、全概率公式在解题中体现了“化整为零、各个击破”的转化思想,可将较为复杂的概率计算分解为一些较为容易的情况分别进行考虑.
3、利用贝叶斯公式求概率的步骤
第一步:利用全概率公式计算,即;
第二步:计算,可利用求解;
第三步:代入求解.
“互斥事件”和“对立事件”都是就两个事件而言的,互斥事件是指事件A与事件B在一次实验中不会同时发生,而对立事件是指事件A与事件B在一次实验中有且只有一个发生,因此,对立事件一定是互斥事件,但互斥事件不一定是对立事件。
(1)定义法:判断互斥事件、对立事件一般用定义判断,不可能同时发生的两个事件为互斥事件;两个事件,若有且仅有一个发生,则这两事件为对立事件,对立事件一定是互斥事件.
(2)集合法:①由各个事件所含的结果组成的集合彼此的交集为空集,则事件互斥.
②事件A的对立事件所含的结果组成的集合,是全集中由事件A所含的结果组成的集合的补集.
(1)首先判断几个事件的发生是否相互独立.
(2)求相互独立事件同时发生的概率的方法主要有:
①利用相互独立事件的概率乘法公式直接求解.
②正面计算较繁或难以入手时,可从其对立事件入手计算.
X
0
1
P
1-p
p
…
…
…
…
0
1
…
…
分布列性质的两个作用
1、利用分布列中各事件概率之和为1的性质可求参数的值及检查分布列的正确性.
2、随机变量X所取的值分别对应的事件是两两互斥的,利用这一点可以求随机变量在某个范围内的概率.
1
2
求离散型随机变量分布列的步骤:
(1)确定离散型随机变量的可能取值;
(2)求每一个离散型随机变量的概率;
(3)列出分布列。
2
3
4
0
1
2
10
30
60
1
2
3
1、定型:“独立”“重复”是二项分布的基本特征,“每次试验事件发生的概率都相等”是二项分布的本质特征.判断随机变量是否服从二项分布,要看在一次试验中是否只有两种试验结果,且两种试验结果发生的概率分别为p,1-p,还要看是否为n次独立重复试验,随机变量是否为某事件在这n次独立重复试验中发生的次数.
2、定参,确定二项分布中的两个参数n和p,即试验发生的次数和试验中事件发生的概率.
3、列表,根据离散型随机变量的取值及其对应的概率,列出分布列.
4、求值,根据离散型随机变量的期望和方差公式,代入相应数据求值.
相关公式:已知X~B(n,p),则P(X=k)=Ceq \\al(k,n)pk(1-p)n-k(k=0,1,2,…,n),E(X)=np,D(X)=np(1-p).
0
1
2
3
超几何分布的求解步骤:
第一步:验证随机变量服从超几何分布,并确定参数的值;
第二步:根据超几何分布的概率计算公式计算出随机变量取每一个值时的概率;
第三步:用表格的形式列出分布列。
X
0
1
2
P
0
1
2
3
4
1
2
3
等级
标准果
优质果
精品果
礼品果
个数个
10
25
40
25
0
1
2
利用正态曲线的对称性研究相关概率问题,涉及的知识主要是正态曲线关于直线x=μ对称及曲线与x轴之间的面积为1,注意下面三个结论的活用:
(1)对任意的a,有P(X<μ-a)=P(X>μ+a).
(2)P(X<x0)=1-P(X≥x0).
(3)P(a<X<b)=P(X<b)-P(X≤a).
总计
总计
0.10
0.05
0.010
0.005
0.001
2.706
3.841
6.635
7.879
10.828
抽样方法的选择要根据总体的情况以及两种抽样方法的特点:
(1)看总体是否由差异明显的几个部分组成,若是则选用分层随机抽样,否则考虑简单随机抽样;
(2)看总体和样本量的大小。当样本容量较小时,采用抽签法;当总体容量较大、样本容量较小时,采用随机数表法。
1、众数体现数据的最大集中点,但无法客观地反映总体特征;
2、中位数是样本数据所有点的频率和的等分线,它不受少数几个极端值的影响;
3、平均数与样本的每一个数据有关,它可以反映出更多的关于样本数据总体的信息,但是平均数受数据中极端值的影响较大。
成绩(单位:环)
6
7
8
9
10
人数
1
2
2
4
1
1、由频率分布直方图进行相关计算需掌握的2个关系式
(1)eq \f(频率,组距)×组距=频率.
(2)eq \f(频数,样本容量)=频率,此关系式的变形为eq \f(频数,频率)=样本容量,样本容量×频率=频数.
2、利用频率分布直方图估计样本的数字特征的方法
(1)中位数:在频率分布直方图中,中位数左边和右边的直方图的面积相等,由此可以估计中位数的值.
(2)平均数:平均数的估计值等于每个小矩形的面积乘以矩形底边中点横坐标之和.
(3)众数:最高的矩形的中点的横坐标.
计算一组个数据的的第百分位数的步骤
①按从小到大排列原始数据.
②计算.
③若不是整数而大于的比邻整数,则第百分位数为第项数据;若是整数,则第百分位数为第项与第项数据的平均数.
1、样本点不一定在经验回归直线上,但点(eq \(x,\s\up6(-)),eq \(y,\s\up6(-)))一定在经验回归直线上.
2、求eq \(b,\s\up6(^))时,灵活选择公式,注意公式的推导和记忆.
3、利用样本相关系数判断相关性强弱,看|r|的大小,而不是r的大小.
4、通过经验回归方程求的都是估计值,而不是真实值.
1、求回归直线方程
①计算出eq \x\t(x),eq \x\t(y),eq \i\su(i=1,n,x)eq \\al(2,i),eq \i\su(i=1,n,x)iyi或eq \i\su(i=1,n, )(xi-eq \x\t(x))(yi-eq \x\t(y)),eq \i\su(i=1,n, )(xi-eq \x\t(x))2的值;
②利用公式计算回归系数eq \(a,\s\up6(^)),eq \(b,\s\up6(^));
③写出回归直线方程eq \(y,\s\up6(^))=eq \(b,\s\up6(^))x+eq \(a,\s\up6(^)).
2、回归模型的拟合效果:利用相关系数r判断,当|r|越趋近于1时,两变量的线性相关性越强.
年份
2019
2020
2021
2022
2023
年份代号
1
2
3
4
5
能源消费总量近似值(单位:千万吨标准煤)
44.2
44.6
46.2
47.8
50.8
44
4.8
10
40.3
1.612
19.5
8.06
编号
1
2
3
4
5
6
7
8
细菌百万个
70
80
90
100
110
120
130
140
真菌百万个
8.0
10.0
12.5
15.0
17.5
21.0
27.0
39.0
X
0
1
2
3
4
P
构造一个随机变量,其中为样本容量.如果的观测值,就认为“两个分类变量之间有关系”;否则就认为“两个分类变量之间没有关系”.我们称这样的为一个判断规则的临界值.
(1)根据样本数据制成2×2列联表.
(2)根据公式计算.
(3)比较与临界值的大小关系,作统计推断.
0.1
0.05
0.01
0.005
0.001
2.706
3.841
6.635
7.879
10.828
男生
女生
合计
喜欢冰雪运动
不喜欢冰雪运动
合计
疗法
疗效
合计
未治愈
治愈
甲
15
52
67
乙
6
63
69
合计
21
115
136
语文作文成绩
课外阅读习惯
合计
不够良好
良好
优秀
60
140
200
不够优秀
180
20
200
合计
240
160
400
0.1
0.05
0.01
0.005
0.001
2.706
3.841
6.635
7.879
10.828
苹果地
大小情况
合计
非小果
小果
地
地
合计
0.100
0.050
0.010
0.005
2.706
3.841
6.635
7.879
苹果地
大小情况
合计
非小果
小果
A地
160
40
200
B地
150
50
200
合计
310
90
400
相关试卷
这是一份专题07 直线与圆(2考点+15题型)-【查漏补缺】2024年高考数学复习冲刺过关(新高考通用),文件包含专题07直线与圆2考点+15题型原卷版docx、专题07直线与圆2考点+15题型解析版docx等2份试卷配套教学资源,其中试卷共53页, 欢迎下载使用。
这是一份专题06 空间向量与立体几何(3考点+18题型)-【查漏补缺】2024年高考数学复习冲刺过关,文件包含专题06空间向量与立体几何3考点+18题型原卷版docx、专题06空间向量与立体几何3考点+18题型解析版docx等2份试卷配套教学资源,其中试卷共112页, 欢迎下载使用。
这是一份专题05 平面向量(4考点+16题型)-【查漏补缺】2024年高考数学复习冲刺过关(新高考通用),文件包含专题05平面向量4考点+16题型原卷版docx、专题05平面向量4考点+16题型解析版docx等2份试卷配套教学资源,其中试卷共66页, 欢迎下载使用。