专题7概率(文)知识点与大题16道专练(基础题)(原卷版)-备战2022年高考数学大题分类提升专题学案
展开
这是一份专题7概率(文)知识点与大题16道专练(基础题)(原卷版)-备战2022年高考数学大题分类提升专题学案,共15页。
专题7概率(文)知识点与大题16道专练(基础题)(原卷版)
知识点一:常见的概率类型与概率计算公式;
类型一:古典概型;
1、 古典概型的基本特点:
(1) 基本事件数有限多个;
(2) 每个基本事件之间互斥且等可能;
2、 概率计算公式:
A事件发生的概率;
类型二:几何概型;
1、 几何概型的基本特点:
(1) 基本事件数有无限多个;
(2) 每个基本事件之间互斥且等可能;
2、 概率计算公式:
A事件发生的概率;
注意:
(1) 究竟是长度比还是面积比还是体积比,关键是看表达该概率问题需要几个变量,如果需要一个变量,则应该是长度比或者角度比;若需要两个变量则应该是面积比;当然如果是必须要三个变量则必为体积比;
(2) 如果是用一个变量,到底是角度问题还是长度问题,关键是看谁是变化的主体,哪一个是等可能的;
例如:等腰中,角C=,则:
(1) 若点M是线段AB上一点,求使得的概率;
(2) 若射线CA绕着点C向射线CB旋转,且射线CA与线段AB始终相交且交点是M,求使得的概率;
解析:第一问中明确M为AB上动点,即点M是在AB上均匀分布,所以这一问应该是长度之比,所求概率:;
而第二问中真正变化的主体是射线的转动,所以角度的变化是均匀的,所以这一问应该是角度之比的问题,所以所求的概率:;
知识点二:常见的概率计算性质;
类型一:事件间的关系与运算;
A+B(和事件):表示A、B两个事件至少有一个发生;
(积事件):表示A、B两个事件同时发生;
(对立事件):表示事件A的对立事件;
类型二:复杂事件的概率计算公式;
1、 和事件的概率:
(1)特别的,若A与B为互斥事件,则:
(2)对立事件的概率公式:
知识点三:求解一般概率问题的步骤;
第一步:确定事件的性质:等可能事件、互斥事件、相互独立事件、n次独立重复实验等;
第二步:确定事件的运算:和事件、积事件、条件概率等;
第三步:运用相应公式,算出结果;
知识点三:常见的统计学数字特征量及其计算;
特征量一:平均数(数学期望)
计算公式一:;
计算公式二:;
特征量二:中位数
将所有的数从大到小排或者从小到大排,若共有奇数个数,则正中间的那个数叫做这一列数的中位数;若共有偶数个数,那么正中间那两个数的平均数叫做这一列数的中位数。
特征量三:众数
将所有数中出现次数最多且次数超过1次的数叫做这一列数的众数。一列数的众数可以有多个,也可以没有。
特征量四:方差
方差反映一组数或者一个统计变量的稳定程度,方差越小数值越稳定,方差越大则数值波动越大。
计算公式一:;
计算公式二:;
计算公式三:;
;
知识点四:简单的统计学知识;
问题一:统计学中的简单的抽样方法;
方法一:简单随机抽样;
1、 基本原理:根据研究目的选定总体,首先对总体中所有的观察单位编号,遵循随机原则,采用不放回抽取方法,从总体中随机抽取一定数量观察单位组成样本。
2、 具体做法:①随机数字法 ; ② 抽签法;
3、 优缺点分析:
优点:基本原理比较简单;
当总体容量不大时比较方便;
抽样误差的计算较方便;
缺点:对所有观察单位编号,当数量大时,有难度;
方法二:系统抽样;
1、 基本原理:先将总体的观察单位按某顺序号等分成n个部分再从第一部分随机抽第k号观察单位,依次用相等间隔,机械地从每一部分各抽取一个观察单位组成样本;
2、 优缺点分析:
优点:抽样方法简便,特别是容量比较大的时候;
易得到一个按比例分配的样本,抽样误差较小;
缺点:仍需对每个观察单位编号;
当观察单位按顺序有周期趋势或单调性趋势时,产生明显偏性;
方法三:分层抽样;
1、 基本原理:先将总体按某种特征分成若干层,再从每一层内随机抽取一定数量的观察单位,合起来组成样本。
2、 具体做法:
第一步:计算每一层个体数与总体容量的比值;
第二步:用样本容量分别乘以每一层的比值,得出每层应抽取的个体数;
第三步:用简单随机抽样的方法产生样本;
3、 优缺点分析:
优点:在一定程度上控制了抽样误差,尤其是最优分配法;
缺点:总体必须要能分成差别比较大的几层时才能用,局限性比较大;
总结:以上三种抽样方法的共同特征是每个个体被抽中的可能性相同;
知识点五:常用的几个统计学图表;
图表一:频率分布直方图与频率分布折线图;
1、 说明几个基本概念:
(1) 频数:符合某一条件的个体个数;
(2) 频率:频率=;(在必要情况下,可以近视的看作概率;所有组的频率之和是1;)
2、 认识频率分布直方图:
(1) 横标是分组的情况;
(2) 纵标不是频率,而是频率/组距;小方框的面积才是频率;所有的面积和为1;
3、 画频率分布直方图:
第一步:求极差;
第二步:分组,确定组距;
第三步:列频率分布表;
第四步:作图;
4、 画频率分布折线图:
将频率分布直方图中每个方框的顶边的中点用直线连起来形成的折线图;
5、 利用频率分布直方图估计样本的统计学数字特征量:
(1) 中位数:取图中方框面积和达到时的横坐标;
(2) 众数:取最高的那个方框的中点横坐标;
(3) 平均数:;其中表示第k组的中点横坐标,表示第k组的频率;
(4) 方差:;
图表二:茎叶图;
定义:若数据为整数,一般用中间的数表示个位数以上的部分,两边的数表示个位数字;若数据是小数,一般用中间的数表示整数部分,两边的数表示小数部分形成的图表;
知识点六:变量间的相互关系与统计案例;
1、相关关系的分类:
从散点图上看,点散布在从左下角到右上角的区域内,对于两个变量的这种相关关系,我们将它称为正相关;点散布在从左上角到右下角的区域内,两个变量的这种相关关系称为负相关。
2、线性相关:
从散点图上看,如果这些点从整体上看大致分布在一条直线附近,则称这两个变量之间具有线性相关关系,这条直线叫回归直线。
3.最小二乘法求回归方程:
(1)最小二乘法:使得样本数据的点到回归直线的距离的平方和最小的方法叫最小二乘法.
(2)回归方程:两个具有线性相关关系的变量的一组数据:
(x1,y1),(x2,y2),…,(xn,yn),其回归方程为=x+,
其中,b是回归方程的斜率,a是在y轴上的截距.
4.样本相关系数:
r= ,用它来衡量两个变量间的线性相关关系.
(1)当r>0时,表明两个变量正相关;
(2)当r<0时,表明两个变量负相关;
(3)r的绝对值越接近1,表明两个变量的线性相关性越强;r的绝对值越接近于0,表明两个变量之间几乎不存在线性相关关系.通常当|r|>0.75时,认为两个变量有很强的线性相关关系.
6.独立性检验:
(1)用变量的不同“值”表示个体所属的不同类别,这种变量称为分类变量.例如:是否吸烟,宗教信仰,国籍等.
(2)列出的两个分类变量的频数表,称为列联表.
(3)一般地,假设有两个分类变量X和Y,它们的值域分别为{x1,x2}和{y1,y2},其样本频数列联表(称为2×2列联表)为:
y1
y2
总计
x1
a
b
a+b
x2
c
d
c+d
总计
a+c
b+d
a+b+c+d
(其中n=a+b+c+d为样本容量),可利用独立性检验判断表来判断“x与y的关系”.这种利用随机变量K2来确定在多大程度上可以认为“两个分类变量有关系”的方法称为两个分类变量的独立性检验.
附表:
P(K2≥k)
0.050
0.010
0.001
k
3.841
6.635
10.828
注意:
(1)越大相关性越强,反之越弱;
(2)附表中P(K2≥k)是两个统计学变量无关的概率;
1.2020年4月底,随着新冠疫情防控进入常态化,为了促进消费复苏增长,上饶市开展“五一消费黄金周”系列活动,并发放亿元电子消费券.活动过后,我们随机抽取了50人,对是否使用过电子消费券进行调查,结果如下表:
年龄(单位:岁)
抽取人数
2
10
13
12
10
3
使用过消费券的人数
1
9
13
8
6
1
若以“年龄40岁为分界点”,由以上统计数据完成下面列联表,并判断是否有99%的把握认为使用电子消费券与按照40岁为分界点的人的年龄有关.
年龄低于40岁的人数
年龄不低于40岁的人数
合计
使用过消费券的人数
没有使用消费券的人数
合计
参考数据:
,其中.
2.入夏以来,天气炎热,合肥地区用电负荷连创新高,某用户随机统计了家里某4天用电量(千瓦·时)与当天气温(℃)情况,数据如下表:
气温(℃)
30
32
34
36
用电量(千瓦∙时)
20
26
30
36
(1)请根据提供的数据,计算,,用最小二乘法求出y关于x的线性回归方程;
(2)请估计当时的y值.
参考公式:,.
3.某单位对其名员工的饮食习惯进行了一次调查,并用如图所示的茎叶图表示他们的饮食指数(说明:图中饮食指数低于的人,喜食蔬菜;饮食指数高于的人,喜食肉类).
(1)根据所给数据完成下面的列联表;
喜食蔬菜
喜食肉类
总计
35岁以上
35岁以下
总计
(2)能否有的把握认为该单位员工的饮食习惯与年龄有关?
独立性检验的临界值表:
0.15
0.10
0.05
0.025
0.010
0.005
0.001
2.072
2.706
3.841
5.024
6.635
7.879
10.828
参考公式:,.
4.期末考试结束,高二(1)班班主任张老师从班里的40名学生中,随机抽取10名同学的语文和数学成绩进行抽样分析,研究学生偏科现象.将10名学生编号为1,2,310,再将他们的两科成绩(单位:分)绘成折线图如下:
(1)从这10名学生中随机抽取一名学生,求抽取的这名学生两科成绩相差大于10分的概率;
(2)从两科成绩均超过70分的学生中随机抽取2人进行访谈,求这2人中恰有一个是语文成绩高于数学成绩的概率;
(3)设该班语文和数学两科成绩的平均值分别为,方差分别为,根据折线图,试推断和,和的大小关系(直接写出结论,不需证明).
5.某校1 200名高三年级学生参加了一次数学测验(满分为100分),为了分析这次数学测验的成绩,从这1 200人的数学成绩中随机抽取200人的成绩绘制成如下的统计表,请根据表中提供的信息解决下列问题:
成绩分组
频数
频率
平均分
[0,20)
3
0.015
16
[20,40)
a
b
32.1
[40,60)
25
0.125
55
[60,80)
c
0.5
74
[80,100]
62
0.31
88
(1)求a,b,c的值;
(2)如果从这1 200名学生中随机抽取一人,试估计这名学生该次数学测验及格的概率 (注:60分及60分以上为及格);
(3)试估计这次数学测验的年级平均分.
6.甲、乙两个学习小组各有7名同学,在某次数学测试中,测试成绩的茎叶图如图所示.
(1)求甲组同学成绩的中位数和乙组同学成绩的众数;
(2)从这次测试成绩在90分以上的学生中,随机抽取1名学生,求抽到的这名学生来自甲组的概率.
7.如今,中国的“双十一”已经从一个节日变成了全民狂欢的“电商购物日”.某宝电商分析了近8年“双十一”期间的宣传费用(单位:万元)和利润(单位:十万元)之间的关系,得到下列数据:
2
3
4
5
6
8
9
11
1
2
3
3
4
5
6
8
请回答:(1)由表中数据,求线性回归方程,并预测当时,对应的利润为多少(,,精确到0.1);
附参考公式:回归方程中中和最小二乘估计分别为,,参考数据:,.
(2)为了更好地完成任务,某宝电商决定让宣传部门的3名成员各自制定两个方案,从中任选2个方案进行宣传,求这2个方案出自同一个人的概率.
8.在全球抗击新冠肺炎疫情期间,我国医疗物资生产企业加班加点生产口罩、防护服、消毒水等防疫物品,保障抗疫一线医疗物资供应,在国际社会上赢得一片赞誉.我国某口罩生产企业在加大生产的同时,狠抓质量管理,不定时抽查口罩质量,该企业质检人员从所生产的口罩中随机抽取了100个,将其质量指标值分成以下六组:,,,…,,得到如下频率分布直方图.
(1)求出直方图中的值;
(2)利用样本估计总体的思想,估计该企业所生产的口罩的质量指标值的平均数和中位数(同一组中的数据用该组区间中点值作代表,中位数精确到0.01).
9.为了监控一条生产线上的某种零件的生产过程,检验员每隔30min从该生产线上随机抽取一个零件,并测量其尽寸(单位,cm),下面是检脸员在一天内依次抽取的18个零件的尺寸:
抽取次序
1
2
3
4
5
6
7
8
9
零件尺寸
9.27
9.26
9.84
9.87
9.78
9.65
9.55
9.43
9.39
抽取次序
10
11
12
13
14
15
16
17
18
零件尺寸
9.36
9.42
9.77
9.83
9.93
9.34
9.82
9.95
9.33
零件尺寸在内为一级;在内为二级;在丙为超标
(1)求这18个数据中不超标数据的中位数;
(2)在以上零件为一级的数据中,随机抽取2个数据,求其中恰有一个零件尺寸小于9.3的概率;
(3)以这18个零件尺寸来估计该生产线的情况,若该生产线每日生产3600个零件,那么约有多少个零件超标.
10.甲、乙两家商场对同一种商品开展促销活动,对购买该商品的顾客两家商场的奖励方案如下:
甲商场:顾客转动如图所示圆盘,当指针指向阴影部分(图中两个阴影部分均为扇形,且每个扇形圆心角均为,边界忽略不计)即为中奖·
乙商场:从装有2个白球、2个蓝球和2个红球的盒子中一次性摸出1球(这些球除颜色外完全相同),它是红球的概率是,若从盒子中一次性摸出2球,且摸到的是2个相同颜色的球,即为中奖.
(Ⅰ)求实数的值;
(Ⅱ)试问:购买该商品的顾客在哪家商场中奖的可能性大?请说明理由.
11.在7块并排,形状大小相同的试验田上进行施肥量对水稻产量影响的实验,得到如下表所示的一组数据:
施肥量()
15
20
25
30
35
40
45
水稻产量()
330
345
365
405
445
450
455
(1)求对的回归直线方程;
(2)如果施肥量为38,其他情况不变,请预测水稻的产量.
..
12.某帮扶单位为帮助定点扶贫村真正脱贫,坚持扶贫同扶智相结合,帮助贫困村种植蜜柚,并利用互联网电商渠道进行销售.为了更好地销售,现从该村的蜜柚树上随机摘下了100个蜜柚进行测重,其质量分布在区间内(单位:克),统计质量的数据作出其频率分布直方图如图所示,以各组数据的中间数值代表这组数据的平均水平,以频率代表概率.
(1)估计这批蜜柚每只的平均重量;
(2)已知该贫困村的蜜柚树上大约还有10000个蜜柚待出售,对于这10000个蜜柚某电商提出两种收购方案:A.所有蜜柚均以40元/千克收购;B.低于2000克的蜜柚以60元/个收购,高于或等于2000克但不超过2500克的以90元/个收购,其余的以100元/个收购,请你通过计算为该村选择收益最好的方案.
13.随机抽取某中学甲、乙两班各10名同学,测量他们的身高(单位:cm),获得身高数据的茎叶图如图所示.
(1)试比较甲、乙两班分别抽取的这10名同学身高的中位数大小;
(2)现从乙班这10名同学中随机抽取两名身高不低于173cm的同学,求身高176cm的同学被抽到的概率.
14.为了解人们对“延迟退休年龄政策”的态度,某部门从年龄在岁到岁的人群中随机调查了人,并得到如图所示的频率分布直方图,在这人中不支持“延迟退休年龄政策”的人数与年龄的统计结果如表所示:
年龄
不支持“延迟退休年龄政策”的人数
15
5
15
23
17
(1)由频率分布直方图,估计这人年龄的平均数;(写出必要的表达式)
(2)根据以上统计数据补全下面的列联表,据此表,能否在犯错误的概率不超过的前提下,认为以岁为分界点的不同人群对“延迟退休年龄政策”的态度存在差异?
岁以下
岁以上
总计
不支持
支持
总计
附:临界值表、公式
0.15
0.10
0.050
0.025
0.010
0.005
0.001
2.072
2.706
3.841
5.024
6.635
7.879
10.828
15.某公交公司为了方便市民出行、科学规划车辆投放,在一个人员密集流动地段增设一个起点站,为研究车辆发车间隔时间(分钟)与乘客等候人数(人)之间的关系,经过调查得到如下数据:
间隔时间(分钟)
等候人数(人)
调查小组先从这组数据中选取组数据求线性回归方程,再用剩下的组数据进行检验.检验方法如下:先用求得的线性回归方程计算间隔时间对应的等候人数,再求与实际等候人数的差,若差值的绝对值不超过,则称所求线性回归方程是“恰当回归方程”.
(1)从这组数据中随机选取组数据后,求剩下的组数据的间隔时间之差大于的概率;
(2)若选取的是后面组数据,求关于的线性回归方程,并判断此方程是否是“恰当回归方程”;
(3)在(2)的条件下,为了使等候的乘客不超过人,则间隔时间最多可以设置为多少分钟?(精确到整数)
参考公式:,.
16.某网购平台为了解某市居民在该平台的消费情况,从该市使用其平台且每周平均消费额超过100元的人员中随机抽取了100名,并绘制如图所示频率分布直方图,已知中间三组的人数可构成等差数列.
(1)求的值;
(2)分析人员对100名调查对象的性别进行统计发现,消费金额不低于300元的男性有20人,低于300元的男性有25人,根据统计数据完成下列列联表,并判断是否有的把握认为消费金额与性别有关?
(3)分析人员对抽取对象每周的消费金额与年龄进一步分析,发现他们线性相关,得到回归方程.已知100名使用者的平均年龄为38岁,试判断一名年龄为25岁的年轻人每周的平均消费金额为多少.(同一组数据用该区间的中点值代替)
列联表
男性
女性
合计
消费金额
消费金额
合计
临界值表:
0.050
0.010
0.001
3.841
6.635
10.828
,其中
相关学案
这是一份专题11概率(理)知识点与大题16道专练(中档题)(原卷版)-备战2022年高考数学大题分类提升专题学案,共17页。
这是一份专题8概率(文)知识点与大题16道专练(中档题)(原卷版)-备战2022年高考数学大题分类提升专题学案,共14页。
这是一份专题7概率(文)知识点与大题16道专练(基础题)(解析版)-备战2022年高考数学大题分类提升专题学案,共26页。