专题9概率(文)知识点与大题16道专练(培优题)(原卷版)-备战2022年高考数学大题分类提升专题学案
展开
这是一份专题9概率(文)知识点与大题16道专练(培优题)(原卷版)-备战2022年高考数学大题分类提升专题学案,共17页。
专题9概率(文)知识点与大题16道专练(培优题)(原卷版)
知识点一:常见的概率类型与概率计算公式;
类型一:古典概型;
1、 古典概型的基本特点:
(1) 基本事件数有限多个;
(2) 每个基本事件之间互斥且等可能;
2、 概率计算公式:
A事件发生的概率;
类型二:几何概型;
1、 几何概型的基本特点:
(1) 基本事件数有无限多个;
(2) 每个基本事件之间互斥且等可能;
2、 概率计算公式:
A事件发生的概率;
注意:
(1) 究竟是长度比还是面积比还是体积比,关键是看表达该概率问题需要几个变量,如果需要一个变量,则应该是长度比或者角度比;若需要两个变量则应该是面积比;当然如果是必须要三个变量则必为体积比;
(2) 如果是用一个变量,到底是角度问题还是长度问题,关键是看谁是变化的主体,哪一个是等可能的;
例如:等腰中,角C=,则:
(1) 若点M是线段AB上一点,求使得的概率;
(2) 若射线CA绕着点C向射线CB旋转,且射线CA与线段AB始终相交且交点是M,求使得的概率;
解析:第一问中明确M为AB上动点,即点M是在AB上均匀分布,所以这一问应该是长度之比,所求概率:;
而第二问中真正变化的主体是射线的转动,所以角度的变化是均匀的,所以这一问应该是角度之比的问题,所以所求的概率:;
知识点二:常见的概率计算性质;
类型一:事件间的关系与运算;
A+B(和事件):表示A、B两个事件至少有一个发生;
(积事件):表示A、B两个事件同时发生;
(对立事件):表示事件A的对立事件;
类型二:复杂事件的概率计算公式;
1、 和事件的概率:
(1)特别的,若A与B为互斥事件,则:
(2)对立事件的概率公式:
知识点三:求解一般概率问题的步骤;
第一步:确定事件的性质:等可能事件、互斥事件、相互独立事件、n次独立重复实验等;
第二步:确定事件的运算:和事件、积事件、条件概率等;
第三步:运用相应公式,算出结果;
知识点三:常见的统计学数字特征量及其计算;
特征量一:平均数(数学期望)
计算公式一:;
计算公式二:;
特征量二:中位数
将所有的数从大到小排或者从小到大排,若共有奇数个数,则正中间的那个数叫做这一列数的中位数;若共有偶数个数,那么正中间那两个数的平均数叫做这一列数的中位数。
特征量三:众数
将所有数中出现次数最多且次数超过1次的数叫做这一列数的众数。一列数的众数可以有多个,也可以没有。
特征量四:方差
方差反映一组数或者一个统计变量的稳定程度,方差越小数值越稳定,方差越大则数值波动越大。
计算公式一:;
计算公式二:;
计算公式三:;
;
知识点四:简单的统计学知识;
问题一:统计学中的简单的抽样方法;
方法一:简单随机抽样;
1、 基本原理:根据研究目的选定总体,首先对总体中所有的观察单位编号,遵循随机原则,采用不放回抽取方法,从总体中随机抽取一定数量观察单位组成样本。
2、 具体做法:①随机数字法 ; ② 抽签法;
3、 优缺点分析:
优点:基本原理比较简单;
当总体容量不大时比较方便;
抽样误差的计算较方便;
缺点:对所有观察单位编号,当数量大时,有难度;
方法二:系统抽样;
1、 基本原理:先将总体的观察单位按某顺序号等分成n个部分再从第一部分随机抽第k号观察单位,依次用相等间隔,机械地从每一部分各抽取一个观察单位组成样本;
2、 优缺点分析:
优点:抽样方法简便,特别是容量比较大的时候;
易得到一个按比例分配的样本,抽样误差较小;
缺点:仍需对每个观察单位编号;
当观察单位按顺序有周期趋势或单调性趋势时,产生明显偏性;
方法三:分层抽样;
1、 基本原理:先将总体按某种特征分成若干层,再从每一层内随机抽取一定数量的观察单位,合起来组成样本。
2、 具体做法:
第一步:计算每一层个体数与总体容量的比值;
第二步:用样本容量分别乘以每一层的比值,得出每层应抽取的个体数;
第三步:用简单随机抽样的方法产生样本;
3、 优缺点分析:
优点:在一定程度上控制了抽样误差,尤其是最优分配法;
缺点:总体必须要能分成差别比较大的几层时才能用,局限性比较大;
总结:以上三种抽样方法的共同特征是每个个体被抽中的可能性相同;
知识点五:常用的几个统计学图表;
图表一:频率分布直方图与频率分布折线图;
1、 说明几个基本概念:
(1) 频数:符合某一条件的个体个数;
(2) 频率:频率=;(在必要情况下,可以近视的看作概率;所有组的频率之和是1;)
2、 认识频率分布直方图:
(1) 横标是分组的情况;
(2) 纵标不是频率,而是频率/组距;小方框的面积才是频率;所有的面积和为1;
3、 画频率分布直方图:
第一步:求极差;
第二步:分组,确定组距;
第三步:列频率分布表;
第四步:作图;
4、 画频率分布折线图:
将频率分布直方图中每个方框的顶边的中点用直线连起来形成的折线图;
5、 利用频率分布直方图估计样本的统计学数字特征量:
(1) 中位数:取图中方框面积和达到时的横坐标;
(2) 众数:取最高的那个方框的中点横坐标;
(3) 平均数:;其中表示第k组的中点横坐标,表示第k组的频率;
(4) 方差:;
图表二:茎叶图;
定义:若数据为整数,一般用中间的数表示个位数以上的部分,两边的数表示个位数字;若数据是小数,一般用中间的数表示整数部分,两边的数表示小数部分形成的图表;
知识点六:变量间的相互关系与统计案例;
1、相关关系的分类:
从散点图上看,点散布在从左下角到右上角的区域内,对于两个变量的这种相关关系,我们将它称为正相关;点散布在从左上角到右下角的区域内,两个变量的这种相关关系称为负相关。
2、线性相关:
从散点图上看,如果这些点从整体上看大致分布在一条直线附近,则称这两个变量之间具有线性相关关系,这条直线叫回归直线。
3.最小二乘法求回归方程:
(1)最小二乘法:使得样本数据的点到回归直线的距离的平方和最小的方法叫最小二乘法.
(2)回归方程:两个具有线性相关关系的变量的一组数据:
(x1,y1),(x2,y2),…,(xn,yn),其回归方程为=x+,
其中,b是回归方程的斜率,a是在y轴上的截距.
4.样本相关系数:
r= ,用它来衡量两个变量间的线性相关关系.
(1)当r>0时,表明两个变量正相关;
(2)当r<0时,表明两个变量负相关;
(3)r的绝对值越接近1,表明两个变量的线性相关性越强;r的绝对值越接近于0,表明两个变量之间几乎不存在线性相关关系.通常当|r|>0.75时,认为两个变量有很强的线性相关关系.
6.独立性检验:
(1)用变量的不同“值”表示个体所属的不同类别,这种变量称为分类变量.例如:是否吸烟,宗教信仰,国籍等.
(2)列出的两个分类变量的频数表,称为列联表.
(3)一般地,假设有两个分类变量X和Y,它们的值域分别为{x1,x2}和{y1,y2},其样本频数列联表(称为2×2列联表)为:
y1
y2
总计
x1
a
b
a+b
x2
c
d
c+d
总计
a+c
b+d
a+b+c+d
(其中n=a+b+c+d为样本容量),可利用独立性检验判断表来判断“x与y的关系”.这种利用随机变量K2来确定在多大程度上可以认为“两个分类变量有关系”的方法称为两个分类变量的独立性检验.
附表:
P(K2≥k)
0.050
0.010
0.001
k
3.841
6.635
10.828
注意:
(1)越大相关性越强,反之越弱;
(2)附表中P(K2≥k)是两个统计学变量无关的概率;
1.某高中社会实践小组设计了一个研究性学习项目,研究学习成绩(以单科为准)与手机使用(电子产品)的相关性,他们从全校随机抽样调查了名学生,其中有四成学生经常使用手机.名同学的物理成绩(百分制)的茎叶图如图所示.小组约定物理成绩低于分为一般,分以上为良好.
(1)根据以上资料完成以下列联表,并判断有多大的把握认为“物理成绩一般与经常使用手机有关系”.
物理成绩一般
物理成绩良好
合计
不使用手机
经常使用手机
合计
(2)现将个成绩分为,,,,共组,补全频率分布直方图,并依据频率分布直方图计算这名学生的物理平均成绩的估计值.
(3)从这名学生成绩高于分的人中随机选取人,求至少有一人不使用手机的概率.
附表及公式:,.
2.黄石新华书店为了了解销售单价(单位:元)在内的图书销售情况,从年已经销售的图书中随机抽取本,用分层抽样的方法获得的所有样本数据按照、、、、、分成组,制成如图所示的频率分布直方图,已知样本中销售单价在内的图书数是销售单价在内的图书数的倍.
(1)求出与;
(2)根据频率分布直方图佔计这本图书销售单价的平均数、中位数(同一组中的数据用该组区间的中点值作代表);
(3)根据频率分布直方图从销售单价价格低于元的书中任取本,求这本书价格至少有本低于元的概率.
3.月日是联合国确定的“世界防治荒漠化和干旱日”,为增强全社会对防治荒漠化的认识与关注,聚焦联合国可持续发展目标——实现全球土地退化零增长.自年以来,我国荒漠化和沙化状况呈现整体遏制、持续缩减、功能增强、成效明显的良好态势.治理沙漠离不开优质的树苗,现从苗埔中随机地抽测了株树苗的高度(单位:),得到以下频率分布直方图.
(1)求直方图中的值及众数、中位数;
(2)估计苗埔中树苗的平均高度;
(3)在样本中从及以上的树苗中按分层抽样抽出株,再从株中抽出两株树苗,其中含有及以上树苗的概率.
4.某企业投资两个新型项目,投资新型项目的投资额(单位:十万元)与纯利润(单位:万元)的关系式为,投资新型项目的投资额(单位:十万元)与纯利润(单位:万元)的散点图如图所示.
(1)求关于的线性回归方程;
(2)根据(1)中的回归方程,若,两个项目都投资60万元,试预测哪个项目的收益更好.
附:回归直线的斜率和截距的最小二乘估计分别为,.
5.袋中有9个大小相同颜色不全相同的小球,分别为黑球、黄球、绿球,从中任意取一球,得到黑球或黄球的概率是,得到黄球或绿球的概率是,试求:
(1)从中任取一球,得到黑球、黄球、绿球的概率各是多少?
(2)从中任取两个球,得到的两个球颜色不相同的概率是多少?
6.“工资条里显红利,个税新政人民心”,随着年新年钟声的敲响,我国自年以来,力度最大的一次个人所得税(简称个税)改革至年实施以来发挥巨大作用.个税新政主要内容包括:
(1)个税起征点为元;
(2)每月应纳税所得额(含税)收入个税起征点专项附加扣除;
(3)专项附加扣除包括住房、子女教育和赡养老人等.新旧个税政策下每月应纳税所得额(含税)计算方法及其对应的税率表如表:
旧个税税率表(税起征点元)
新个税税率表(个税起征点元)
缴税级数
每月应纳税所得额(含税)收入个税起征点
税率
每月应纳税所得额(含税)收入个税起征点专项附加扣除
税率
不超过元部分
不超过元部分
超过元至元部分
超过元至元部分
超过元至元的部分
超过元至元的部分
超过元至元的部分
超过元至元的部分
超过元至元部分
超过元至元部分
随机抽取某市名同一收入层级的从业者的相关资料,经统计分析,预估他们年的人均月收入元.统计资料还表明,他们均符合住房专项扣除;同时,他们每人至多只有一个符合子女教育扣除的孩子,并且他们之中既不符合子女教育扣除又不符合赡养老人扣除、只符合子女教育扣除但不符合赡养老人扣除、只符合赡养老人扣除但不符合子女教育扣除、即符合子女教育扣除又符合赡养老人扣除的人数之比是;此外,他们均不符合其他专项附加扣除.新个税政策下该市的专项附加扣除标准为:住房元/月,子女教育每孩元/月,赡养老人元/月等.假设该市该收入层级的从业者都独自享受专项附加扣除,将预估的该市该收入层级的从业者的人均月收入视为其个人月收入.根据样本估计总体的思想,解决如下问题:
(1)求该市该收入层级的从业者年月缴个税的所有可能及其概率.
(2)根据新旧个税方案,估计从年月开始,经过多少个月,该市该收入层级的从业者各月少缴交的个税之和就超过年的月收入?
7.为了解学生寒假期间学习情况,学校对某班男、女学生学习时间进行调查,学习时间按整小时统计,调查结果绘制成折线图如下:
(1)已知该校有400名学生,试估计全校学生中,每天学习不足4小时的人数;
(2)若从学习时间不少于4小时的学生中选取4人,设选取的男生人数为X,求随机变量X的分布列及均值E(X);
(3)试比较男生学习时间的方差与女生学习时间的方差的大小.(只需写出结论)
8.某疫苗研发机构将其生产的某款疫苗在征集的志愿者中进行人体试验,现随机选取100名试验者检验结果并评分(满分为100分),其中评分不低于80分视为强力有效,否则视为效力一般.得到如图所示的频率分布直方图.
(1)求的值,并估计所有试验者的平均得分(同一组中的数据用该组区间的中点值作代表);
(2)将选取的100名试验者的性别与疫苗是否强力有效进行统计,请将下列2×2列联表补充完整,并能否判断在犯错误的概率不超过0.05的前提下认为疫苗的强效力与性别有关?
强力有效
效力一般
合计
男性
50
女性
10
合计
100
参考数据:
0.15
0.10
0.05
0.025
0.010
0.005
0.001
2.072
2.706
3.841
5.024
6.635
7.879
10.828
,其中.
9.近年来,共享单车进驻城市,绿色出行引领时尚.某公司计划对未开通共享单车的县城进行车辆投放,为了确定车辆投放量,对过去在其他县城的投放量情况以及年使用人次进行了统计,得到了投放量(单位:千辆)与年使用人次(单位:千次)的数据如下表所示,根据数据绘制投放量与年使用人次的散点图如图所示.
(1)观察散点图,可知两个变量不具有线性相关关系,拟用对数函数模型或指数函数模型对两个变量的关系进行拟合,请问哪个模型更适宜作为投放量与年使用人次的回归方程类型(给出判断即可,不必说明理由),并求出关于的回归方程;
(2)已知每辆单车的购入成本为元,年调度费以及维修等的使用成本为每人次元,按用户每使用一次,收费元计算,若投入辆单车,则几年后可实现盈利?
参考数据:
其中,.
参考公式:对于一组数据,,…,,其回归直线的斜率和截距的最小二乘估计公式分别为,.
10.为研究男、女生的身高差异,现随机从高三某班选出男生、女生各10人,并测量他们的身高,测量结果如下(单位:厘米):
男:173 178 174 185 170 169 167 164 161 170
女:165 166 156 170 163 162 158 153 169 172
(1)根据测量结果完成身高的茎叶图(单位:厘米),并分别求出男、女生身高的平均值;
(2)请根据测量结果得到20名学生身高的中位数h(单位:厘米),将男、女生身高不低于h和低于h的人数填入下表中,并判断是否有的把握认为男、女生身高有差异?
人数
男生
女生
身高
身高
参照公式:
0.10
0.05
0.025
0.010
0.005
0.001
2.706
3.841
5.024
6.635
7.879
10.828
(3)若男生身高低于165厘米为偏矮,不低于165厘米且低于175厘米为正常,不低于175厘米为偏高.采用分层抽样的方法从以上男生中抽取5人作为样本.若从样本中任取2人,试求恰有1人身高属于正常的概率.
走进高考
11.(2020年全国统一高考数学试卷(文科)新课标Ⅰ)
某厂接受了一项加工业务,加工出来的产品(单位:件)按标准分为A,B,C,D四个等级.加工业务约定:对于A级品、B级品、C级品,厂家每件分别收取加工费90元,50元,20元;对于D级品,厂家每件要赔偿原料损失费50元.该厂有甲、乙两个分厂可承接加工业务.甲分厂加工成本费为25元/件,乙分厂加工成本费为20元/件.厂家为决定由哪个分厂承接加工业务,在两个分厂各试加工了100件这种产品,并统计了这些产品的等级,整理如下:
甲分厂产品等级的频数分布表
等级
A
B
C
D
频数
40
20
20
20
乙分厂产品等级的频数分布表
等级
A
B
C
D
频数
28
17
34
21
(1)分别估计甲、乙两分厂加工出来的一件产品为A级品的概率;
(2)分别求甲、乙两分厂加工出来的100件产品的平均利润,以平均利润为依据,厂家应选哪个分厂承接加工业务?
12.(2020年全国统一高考数学试卷(文科)新课标Ⅱ)
某沙漠地区经过治理,生态系统得到很大改善,野生动物数量有所增加.为调查该地区某种野生动物的数量,将其分成面积相近的200个地块,从这些地块中用简单随机抽样的方法抽取20个作为样区,调查得到样本数据(xi,yi)(i=1,2,…,20),其中xi和yi分别表示第i个样区的植物覆盖面积(单位:公顷)和这种野生动物的数量,并计算得,,,,.
(1)求该地区这种野生动物数量的估计值(这种野生动物数量的估计值等于样区这种野生动物数量的平均数乘以地块数);
(2)求样本(xi,yi)(i=1,2,…,20)的相关系数(精确到0.01);
(3)根据现有统计资料,各地块间植物覆盖面积差异很大.为提高样本的代表性以获得该地区这种野生动物数量更准确的估计,请给出一种你认为更合理的抽样方法,并说明理由.
附:相关系数r=,≈1.414.
13.(2020年全国统一高考数学试卷(理科)新课标Ⅲ)
某学生兴趣小组随机调查了某市100天中每天的空气质量等级和当天到某公园锻炼的人次,整理数据得到下表(单位:天):
锻炼人次
空气质量等级
[0,200]
(200,400]
(400,600]
1(优)
2
16
25
2(良)
5
10
12
3(轻度污染)
6
7
8
4(中度污染)
7
2
0
(1)分别估计该市一天的空气质量等级为1,2,3,4的概率;
(2)求一天中到该公园锻炼的平均人次的估计值(同一组中的数据用该组区间的中点值为代表);
(3)若某天的空气质量等级为1或2,则称这天“空气质量好”;若某天的空气质量等级为3或4,则称这天“空气质量不好”.根据所给数据,完成下面的2×2列联表,并根据列联表,判断是否有95%的把握认为一天中到该公园锻炼的人次与该市当天的空气质量有关?
人次≤400
人次>400
空气质量好
空气质量不好
附:,
P(K2≥k)
0.050
0.010
0.001
k
3.841
6.635
10.828
14.(2019年全国统一高考数学试卷(文科)新课标Ⅰ)
某商场为提高服务质量,随机调查了50名男顾客和50名女顾客,每位顾客对该商场的服务给出满意或不满意的评价,得到下面列联表:
满意
不满意
男顾客
40
10
女顾客
30
20
(1)分别估计男、女顾客对该商场服务满意的概率;
(2)能否有95%的把握认为男、女顾客对该商场服务的评价有差异?
附:.
P(K2≥k)
0.050
0.010
0.001
k
3.841
6.635
10.828
15.(2019年全国统一高考数学试卷(文科)新课标Ⅱ)
某行业主管部门为了解本行业中小企业的生产情况,随机调查了100个企业,得到这些企业第一季度相对于前一年第一季度产值增长率y的频数分布表.
的分组
企业数
2
24
53
14
7
(1)分别估计这类企业中产值增长率不低于40%的企业比例、产值负增长的企业比例;
(2)求这类企业产值增长率的平均数与标准差的估计值(同一组中的数据用该组区间的中点值为代表).(精确到0.01)
附:.
16.(2019年全国统一高考数学试卷(文科)新课标Ⅲ)为了解甲、乙两种离子在小鼠体内的残留程度,进行如下试验:将200只小鼠随机分成两组,每组100只,其中组小鼠给服甲离子溶液,组小鼠给服乙离子溶液.每只小鼠给服的溶液体积相同、摩尔浓度相同.经过一段时间后用某种科学方法测算出残留在小鼠体内离子的百分比.根据试验数据分别得到如下直方图:
记为事件:“乙离子残留在体内的百分比不低于”,根据直方图得到的估计值为.
(1)求乙离子残留百分比直方图中的值;
(2)分别估计甲、乙离子残留百分比的平均值(同一组中的数据用该组区间的中点值为代表).
相关学案
这是一份专题11概率(理)知识点与大题16道专练(中档题)(原卷版)-备战2022年高考数学大题分类提升专题学案,共17页。
这是一份专题8概率(文)知识点与大题16道专练(中档题)(原卷版)-备战2022年高考数学大题分类提升专题学案,共14页。
这是一份专题7概率(文)知识点与大题16道专练(基础题)(原卷版)-备战2022年高考数学大题分类提升专题学案,共15页。