专题10概率(理)知识点与大题16道专练(基础题)(原卷版)-备战2022年高考数学大题分类提升专题学案
展开
这是一份专题10概率(理)知识点与大题16道专练(基础题)(原卷版)-备战2022年高考数学大题分类提升专题学案,共17页。
专题10概率(理)知识点与大题16道专练(基础题)(原卷版)
知识点一:常见的概率类型与概率计算公式;
类型一:古典概型;
1、 古典概型的基本特点:
(1) 基本事件数有限多个;
(2) 每个基本事件之间互斥且等可能;
2、 概率计算公式:
A事件发生的概率;
类型二:几何概型;
1、 几何概型的基本特点:
(1) 基本事件数有无限多个;
(2) 每个基本事件之间互斥且等可能;
2、 概率计算公式:
A事件发生的概率;
注意:
(1) 究竟是长度比还是面积比还是体积比,关键是看表达该概率问题需要几个变量,如果需要一个变量,则应该是长度比或者角度比;若需要两个变量则应该是面积比;当然如果是必须要三个变量则必为体积比;
(2) 如果是用一个变量,到底是角度问题还是长度问题,关键是看谁是变化的主体,哪一个是等可能的;
例如:等腰中,角C=,则:
(1) 若点M是线段AB上一点,求使得的概率;
(2) 若射线CA绕着点C向射线CB旋转,且射线CA与线段AB始终相交且交点是M,求使得的概率;
解析:第一问中明确M为AB上动点,即点M是在AB上均匀分布,所以这一问应该是长度之比,所求概率:;
而第二问中真正变化的主体是射线的转动,所以角度的变化是均匀的,所以这一问应该是角度之比的问题,所以所求的概率:;
知识点二:常见的概率计算性质;
类型一:事件间的关系与运算;
A+B(和事件):表示A、B两个事件至少有一个发生;
(积事件):表示A、B两个事件同时发生;
(对立事件):表示事件A的对立事件;
类型二:复杂事件的概率计算公式;
1、 和事件的概率:
(1)特别的,若A与B为互斥事件,则:
(2)对立事件的概率公式:
2、 积事件的概率:
(1)若事件相互独立,则:
(2)n次独立重复的贝努利实验中,某事件A在每一次实验中发生的概率都为p,则在n次试验中事件A发生k次的概率:
类型三:条件概率;
1、 条件概率的定义:我们把在事件A发生的条件下事件B发生的概率记为:;
且
2、 三个常见公式:
(1) 乘法公式:
(2) 全概率公式:设是一组互斥的事件且,则对于任何一个事件B都有:
(3) 贝叶斯公式:设是一组互斥的事件且
则对于任何一个事件B都有:
知识点三:求解一般概率问题的步骤;
第一步:确定事件的性质:等可能事件、互斥事件、相互独立事件、n次独立重复实验等;
第二步:确定事件的运算:和事件、积事件、条件概率等;
第三步:运用相应公式,算出结果;
知识点三:常见的统计学数字特征量及其计算;
特征量一:平均数(数学期望)
计算公式一:;
计算公式二:;
计算公式三:(若随机变量是连续型随机变量,且函数是它的密度函数)
特征量二:中位数
将所有的数从大到小排或者从小到大排,若共有奇数个数,则正中间的那个数叫做这一列数的中位数;若共有偶数个数,那么正中间那两个数的平均数叫做这一列数的中位数。
特征量三:众数
将所有数中出现次数最多且次数超过1次的数叫做这一列数的众数。一列数的众数可以有多个,也可以没有。
特征量四:方差
方差反映一组数或者一个统计变量的稳定程度,方差越小数值越稳定,方差越大则数值波动越大。
计算公式一:;
计算公式二:;
计算公式三:;
注:期望和方差的性质:
性质1:;
性质2:;
性质6:;
性质7:;
;
性质9:若是相互独立的随机变量,则:
;
知识点四:简单的统计学知识;
问题一:统计学中的简单的抽样方法;
方法一:简单随机抽样;
1、 基本原理:根据研究目的选定总体,首先对总体中所有的观察单位编号,遵循随机原则,采用不放回抽取方法,从总体中随机抽取一定数量观察单位组成样本。
2、 具体做法:①随机数字法 ; ② 抽签法;
3、 优缺点分析:
优点:基本原理比较简单;
当总体容量不大时比较方便;
抽样误差的计算较方便;
缺点:对所有观察单位编号,当数量大时,有难度;
方法二:系统抽样;
1、 基本原理:先将总体的观察单位按某顺序号等分成n个部分再从第一部分随机抽第k号观察单位,依次用相等间隔,机械地从每一部分各抽取一个观察单位组成样本;
2、 优缺点分析:
优点:抽样方法简便,特别是容量比较大的时候;
易得到一个按比例分配的样本,抽样误差较小;
缺点:仍需对每个观察单位编号;
当观察单位按顺序有周期趋势或单调性趋势时,产生明显偏性;
方法三:分层抽样;
1、 基本原理:先将总体按某种特征分成若干层,再从每一层内随机抽取一定数量的观察单位,合起来组成样本。
2、 具体做法:
第一步:计算每一层个体数与总体容量的比值;
第二步:用样本容量分别乘以每一层的比值,得出每层应抽取的个体数;
第三步:用简单随机抽样的方法产生样本;
3、 优缺点分析:
优点:在一定程度上控制了抽样误差,尤其是最优分配法;
缺点:总体必须要能分成差别比较大的几层时才能用,局限性比较大;
总结:以上三种抽样方法的共同特征是每个个体被抽中的可能性相同;
知识点五:常用的几个统计学图表;
图表一:频率分布直方图与频率分布折线图;
1、 说明几个基本概念:
(1) 频数:符合某一条件的个体个数;
(2) 频率:频率=;(在必要情况下,可以近视的看作概率;所有组的频率之和是1;)
2、 认识频率分布直方图:
(1) 横标是分组的情况;
(2) 纵标不是频率,而是频率/组距;小方框的面积才是频率;所有的面积和为1;
3、 画频率分布直方图:
第一步:求极差;
第二步:分组,确定组距;
第三步:列频率分布表;
第四步:作图;
4、 画频率分布折线图:
将频率分布直方图中每个方框的顶边的中点用直线连起来形成的折线图;
5、 利用频率分布直方图估计样本的统计学数字特征量:
(1) 中位数:取图中方框面积和达到时的横坐标;
(2) 众数:取最高的那个方框的中点横坐标;
(3) 平均数:;其中表示第k组的中点横坐标,表示第k组的频率;
(4) 方差:;
图表二:茎叶图;
定义:若数据为整数,一般用中间的数表示个位数以上的部分,两边的数表示个位数字;若数据是小数,一般用中间的数表示整数部分,两边的数表示小数部分形成的图表;
知识点六:变量间的相互关系与统计案例;
1、相关关系的分类:
从散点图上看,点散布在从左下角到右上角的区域内,对于两个变量的这种相关关系,我们将它称为正相关;点散布在从左上角到右下角的区域内,两个变量的这种相关关系称为负相关。
2、线性相关:
从散点图上看,如果这些点从整体上看大致分布在一条直线附近,则称这两个变量之间具有线性相关关系,这条直线叫回归直线。
3.最小二乘法求回归方程:
(1)最小二乘法:使得样本数据的点到回归直线的距离的平方和最小的方法叫最小二乘法.
(2)回归方程:两个具有线性相关关系的变量的一组数据:
(x1,y1),(x2,y2),…,(xn,yn),其回归方程为=x+,
其中,b是回归方程的斜率,a是在y轴上的截距.
4.样本相关系数:
r= ,用它来衡量两个变量间的线性相关关系.
(1)当r>0时,表明两个变量正相关;
(2)当r<0时,表明两个变量负相关;
(3)r的绝对值越接近1,表明两个变量的线性相关性越强;r的绝对值越接近于0,表明两个变量之间几乎不存在线性相关关系.通常当|r|>0.75时,认为两个变量有很强的线性相关关系.
6.独立性检验:
(1)用变量的不同“值”表示个体所属的不同类别,这种变量称为分类变量.例如:是否吸烟,宗教信仰,国籍等.
(2)列出的两个分类变量的频数表,称为列联表.
(3)一般地,假设有两个分类变量X和Y,它们的值域分别为{x1,x2}和{y1,y2},其样本频数列联表(称为2×2列联表)为:
y1
y2
总计
x1
a
b
a+b
x2
c
d
c+d
总计
a+c
b+d
a+b+c+d
(其中n=a+b+c+d为样本容量),可利用独立性检验判断表来判断“x与y的关系”.这种利用随机变量K2来确定在多大程度上可以认为“两个分类变量有关系”的方法称为两个分类变量的独立性检验.
附表:
P(K2≥k)
0.050
0.010
0.001
k
3.841
6.635
10.828
注意:
(1)越大相关性越强,反之越弱;
(2)附表中P(K2≥k)是两个统计学变量无关的概率;
知识点七:常见的概率分布及期望、方差;
类型一:离散型随机变量的概率分布;
1、 两点分布(贝努利分布或0、1分布):
(1) 特点:随机变量x只能取两个值0、1;分布列如下:
0
1
(2) 期望:;
方差:;
2、 二项分布:
(1) 特点:在n次独立重复的贝努利实验中,每次实验中A事件发生的概率都是p;每次试验只有两个结果A或;随机变量表示n次试验中A事件发生的次数;
即:;则称随机变量服从二项分布;记为:
;
(2) 期望:;(有两种不同的证明方法,这里就省略了。)
方差:;
3、 几何分布:
(1) 特点:在独立重复的贝努利实验中,每次实验中A事件发生的概率都是p,不发生的概率为();随机变量表示A事件首次出现时试验的次数;则称随机变量服从几何分布,记为:;
(2) 期望:;(,期望公式可以利用等比数列求和和极限的思想证明。)
方差:;
4、 超几何分布:
(1) 特点:一般的共有N个个体,A类个体有M个,从中任取n个,随机变量表示取到的A类个体的个数,则称服从超几何分布,记为:;
;
(2) 期望:;
方差:;
类型二:连续型随机变量的概率分布;(高中阶段我们只研究正态分布)
正态分布:
1、 密度函数的概念:在频率分布折线图中,当样本容量取得足够大,组距取得足够小的时候频率分布折线图会变成一条光滑的曲线,我们就把这样的曲线叫做连续性随机变量的密度曲线;把他的解析式叫做密度函数;
显然,如果连续型随机变量的密度函数是,则:
;;
;;
2、正态分布的定义:如果连续型随机变量的密度函数是:;则称随机变量服从正态分布,记为:;
3、正态分布曲线的特点:
(1)整条曲线都在轴的上方,即对恒成立;
(2)是他的对称轴,当时,函数单调递增;当时,函数单调递减;在时取得最大值;
(3)正态分布曲线的两个主要参数的几何学意义:
参数决定对称轴的位置,也决定整条曲线的位置,所以也称为位置参数;参数 决定数据的离散程度,也就决定了曲线的高矮胖瘦;具体规律是:越大,数据越离散,曲线越矮越胖;越小,数据越集中,曲线越高越瘦;于是我们习惯于把参数称为形状参数;
4、 正态分布的期望与方差:若
期望:; 方差:;
5、 正态分布的原则:
(1);
(2);
(3);
6、标准正态分布:若,则称随机变量服从标准正态分布;
7、正态分布与标准正态分布之间的转化关系:
若,则;
1.某种产品的广告费支出与销售额(单位:百万元)之间如下对应数据:
2
4
5
6
8
30
40
60
50
70
(1)求回归方程;
(2)试预测广告费支出为10百万时的销售额为多大.(,)
2.为缓解堵车现象,解决堵车问题,银川市交警队调查了甲、乙两个路口的车流量,在2019年6月随机选取了14天,统计每天上午7:30-9:00早高峰时段各自的车流量(单位:百辆)得到如图所示的茎叶图,根据茎叶图回答以下问题.
(1)甲、乙两个路口的车流量的中位数分别是多少?
(2)试计算甲、乙两个路口的车流量在之间的频率.
3.2019年10月1日我国隆重纪念了建国70周年,期间进行了一系列大型庆祝活动,极大地激发了全国人民的爱国热情.某校高三学生也投入到了这场爱国活动中,他(她)们利用周日休息时间到社区做义务宣讲员,学校为了调查高三男生和女生周日的活动时间情况,随机抽取了高三男生和女生各40人,对他(她)们的周日活动时间进行了统计,分别得到了高三男生的活动时间(单位:小时)的频数分布表和女生的活动时间(单位:小时)的频率分布直方图.(活动时间均在内)
活动时间
频数
8
10
7
9
4
2
(1)根据调查,试判断该校高三年级学生周日活动时间较长的是男生还是女生?并说明理由;
(2)在被抽取的80名高三学生中,从周日活动时间在内的学生中抽取2人,求恰巧抽到1男1女的概率.
4.某高中三年级有A、B两个班,各有50名同学,这两个班参加能力测试,成绩统计结果如表:
A、B班成绩的频数分布表
分组
[50,60)
[60,70)
[70,80)
[80,90)
[90,100]
A班频数
4
8
23
9
6
B班频数
7
12
13
10
8
(1)试估计A、B两个班的平均分;
(2)统计学中常用M值作为衡量总体水平的一种指标,已知M与分数t的关系式为:M.
分别求这两个班学生成绩的M总值,并据此对这两个班的总体水平作简单评价.
5.某高校共有学生15000人,其中男生10500人,女生4500人,为调查该校学生每周平均体育运动时间的情况,采用分层抽样的方法,收集300名学生每周平均体育运动时间的样本数据(单位:小时).
(1)应收集多少位女生的样本数据?
(2)根据这300个样本数据,得到学生每周平均体育运动时间的频率分布直方图(如图所示),其中样本数据的分组区间为:,,,,,,估计该校学生每周平均体育运动时间超过4小时的概率;
(3)在样本数据中,有60位女生的每周平均体育运动时间超过4小时,请完成每周平均体育运动时间与性别列联表,并判断是否有的把握认为“该校学生的每周平均体育运动时间与性别有关”.
男生
女生
总计
每周平均体育运动时间不超过4小时
每周平均体育运动时间超过4小时
总计
附:,其中.
0.10
0.05
0.010
0.005
2.706
3.841
6.635
7.879
6.2019年9月24日国家统计局在庆祝中华人民共和国成立70周年活动新闻中心举办新闻发布会指出,1952年~2018年,我国GDP查679.1亿元跃升至90.03万亿元,实际增长174倍;人均GDP从119元提高到6.46万元,实际增长70倍.全国各族人民,砥砺奋进,顽强拼搏,实现了经济社会的跨越式发展.如图是全国2010年至2018年GDP总量(万亿元)的折线图.
注:年份代码1~9分别对应年份2010~2018.
(1)由折线图看出,可用线性回归模型拟合与年份代码的关系,请用相关系数加以说明;
(2)建立关于的回归方程(系数精确到0.01),预测2019年全国GDP的总量.
附注:参考数据:,,,.
参考公式:相关系数;
回归方程中斜率和截距的最小二乘法估计公式分别为,
7.国家每年都会对中小学生进行体质健康监测,一分钟跳绳是监测的项目之一.今年某小学对本校六年级300名学生的一分钟跳绳情况做了统计,发现一分钟跳绳个数最低为10,最高为189.现将跳绳个数分成,,,,,6组,并绘制出如下的频率分布直方图.
(1)若一分钟跳绳个数达到160为优秀,求该校六年级学生一分钟跳绳为优秀的人数;
(2)上级部门要对该校体质监测情况进行复查,发现每组男、女学生人数比例有很大差别,组男、女人数之比为,组男、女人数之比为,组男、女人数之比为,组男、女人数之比为,组男、女人数之比为,组男、女人数之比为.试估计此校六年级男生一分钟跳绳个数的平均数(同一组中的数据用该组区间的中点值作代表,结果保留整数).
8.钱学森、华罗庚、李四光、袁隆平、钟南山分别是我国著名的物理学家、数学家、古生物学家、农学家、呼吸病学专家,他们在各自不同的领域为我国作出了卓越贡献.为调查中学生对这些著名科学家的了解程度,某调查小组随机抽取了某市的100名中学生,请他们列举这些科学家的成就,把能列举这些科学家成就不少于4项的称为“比较了解”,少于4项的称为“不太了解”.调查结果如下表:
0项
1项
2项
3项
4项
5项
5项以上
男生(人)
1
6
6
7
20
17
3
女生(人)
2
5
5
8
10
8
2
(1)完成如下列联表,并判断是否有的把握认为“中学生对这些科学家的了解程度与性别有关”;
比较了解
不太了解
合计
男生
女生
合计
(2)在抽取的100名中学生中,按照性别采用分层抽样的方法抽取一个10人的样本,从这个样本中随机抽取4人,记为这4人中女生的人数,求的分布列和数学期望.
附:
0.100
0.050
0.010
0.001
2.706
3.841
6.635
10.828
,.
9.如表提供了某厂节能降耗技术改造后生产甲产品过程中记录的产量(吨)与相应的生产能耗(吨)标准煤的几组对照数据:
3
4
5
6
2.5
3
4
4.5
(1)请根据表中提供的数据,用最小二乘法求出关于的线性回归方程;
(2)已知该厂技术改造前100吨甲产品能耗为90吨标准煤,试根据(1)求出的线性回归方程,预测生产100吨甲产品的生产能耗比技术改造前降低多少吨标准煤?
(参考:用最小二乘法求线性回归方程系数公式, )
10.某人投弹击中目标的概率为.
(1)求投弹一次,击中次数的均值和方差;
(2)求重复投弹次,击中次数的均值和方差.
11.某班有男生28名、女生20名,从该班选出学生代表参加校学代会.
(1)若学校分配给该班1名代表,则有多少种不同的选法?
(2)若学校分配给该班2名代表,且男、女生代表各1名,则有多少种不同的选法?
12.有20件产品,其中5件是次品,其余都是合格品,现不放回的从中依次抽2件.求:
(1)第一次抽到次品的概率;
(2)在第一次抽到次品的条件下,第二次抽到次品的概率.
13.某运动员射击一次所得环数的分布列如下:
8
9
10
0.4
0.4
0.2
现进行两次射击,且两次射击互不影响,以该运动员两次射击中最高环数作为他的成绩,记为.
(1)求该运动员两次命中的环数相同的概率;
(2)求的分布列和数学期望.
14.在一次高三年级统一考试中,数学试卷有一道满分10分的选做题,学生可以从,两道题目中任选一题作答.某校有900名高三学生参加了本次考试,为了了解该校学生解答该选做题的得分情况,计划从900名考生的选做题成绩中随机抽取一个容量为10的样本,为此将900名考生选做题的成绩按照随机顺序依次编号为001—900.
(1)若采用随机数表法抽样,并按照以下随机数表,以加粗的数字5为起点,从左向右依次读取数据,每次读取三位随机数,一行读数用完之后接下一行左端.写出样本编号的中位数;
05 26 93 70 60 22 35 85 15 13 92 03 51 59 77 59 56 78 06 83 52 91 05 70 74
07 97 10 88 23 09 98 42 99 64 61 71 62 99 15 06 51 29 16 93 58 05 77 09 51
51 26 87 85 85 54 87 66 47 54 73 32 08 11 12 44 95 92 63 16 29 56 24 29 48
26 99 61 65 53 58 37 78 80 70 42 10 50 67 42 32 17 55 85 74 94 44 67 16 94
14 65 52 68 75 87 59 36 22 41 26 78 63 06 55 13 08 27 01 50 15 29 39 39 43
(2)若采用系统抽样法抽样,且样本中最小编号为08,求样本中所有编号之和:
(3)若采用分层轴样,按照学生选择题目或题目,将成绩分为两层,且样本中题目的成绩有8个,平均数为7,方差为4:样本中题目的成绩有2个,平均数为8,方差为1.用样本估计900名考生选做题得分的平均数与方差.
15.共享单车的投放,方便了市民短途出行,被誉为中国“新四大发明”之一.某市为研究单车用户与年龄的相关程度,随机调查了100位成人市民,统计数据如下:
不小于40岁
小于40岁
合计
单车用户
12
y
m
非单车用户
x
32
70
合计
n
50
100
(1)求出列联表中字母x、y、m、n的值;
(2)①从此样本中,对单车用户按年龄采取分层抽样的方法抽出5人进行深入调研,其中不小于40岁的人应抽多少人?
②从独立性检验角度分析,能否有以上的把握认为该市成人市民是否为单车用户与年龄是否小于40岁有关.
下面临界值表供参考:
P()
0.15
0.10
0.05
0.25
0.010
0.005
0.001
k
2.072
2.706
3.841
5.024
6.635
7.879
10.828
16.为降低雾霾等恶劣气候对居民的影响,某公司研发了一种新型防雾霾产品.每一台新产品在进入市场前都必须进行两种不同的检测,只有两种检测都合格才能进行销售,否则不能销售.已知该新型防雾霾产品第一种检测不合格的概率为,第二种检测不合格的概率为,两种检测是否合格相互独立.
(1)求每台新型防雾霾产品不能销售的概率;
(2)如果产品可以销售,则每台产品可获利40元;如果产品不能销售,则每台产品亏损80元(即获利元).现有该新型防雾霾产品3台,随机变量表示这3台产品的获利,求的分布列及数学期望.
相关学案
这是一份专题19概率(理)知识点与大题16道专练(基础题)(解析版)-备战2022年高考数学大题分类提升专题学案,共20页。学案主要包含了椭圆,双曲线,抛物线,直线与圆锥曲线的位置关系,弦长问题等内容,欢迎下载使用。
这是一份专题10概率(理)知识点与大题16道专练(基础题)(解析版)-备战2022年高考数学大题分类提升专题学案,共26页。
这是一份专题11概率(理)知识点与大题16道专练(中档题)(原卷版)-备战2022年高考数学大题分类提升专题学案,共17页。