高中数学高考 2021届高考二轮精品专题十 统计概率(文) 教师版(1)
展开
这是一份高中数学高考 2021届高考二轮精品专题十 统计概率(文) 教师版(1),共23页。试卷主要包含了以实际背景的图表分析,事件,概率,古典概型,几何概型等内容,欢迎下载使用。
专题 10
××
统计概率
命题趋势
1.抽样方法的考查,主要根据抽样方法求值.
2.以实际背景的图表分析.
3.平均数、众数、中位数、方差等特征数的意义以及对样本数据特征分析.
4.频率分布直方图的考查,分析频率分布直方图计算平均数、中位数、众数等 ,通常还与抽样方法、概率、线性回归方程结合起来考.
5.应用列举法、树状图法求解古典概型概率,或分析一些规则对称图形考查几何概型.
6.相关关系概念的考查,分析两个变量间的线性相关关系,并通过线性回归方程进行预估.
考点清单
1.简单随机抽样
定义:一般地,设一个总体含有N个个体,从中逐个不放回的抽取n个个体作为样本(n≤N),如果每次抽取时总体内的各个个体被抽到的机会相等,就把这种抽样方法叫做简单随机抽样.
最常用的简单随机抽样方法有两种——抽签法和随机数法.
适用范围:总体含个体数较少.
2.系统抽样
一般地,假设要从容量为N的总体中抽取容量为n的样本,我们可以按下列步骤进行系统抽样:
(1)先将总体的N个个体编号.有时可直接利用个体自身所带的号码,如学号、准考证号、门牌号等;
(2)确定分段间隔k,对编号进行分段.当(n是样本容量)是整数时,取;
(3)在第1段用简单随机抽样确定第一个个体编号l(l≤k);
(4)按照一定的规则抽取样本.通常是将l加上间隔k得到第2个个体编号(l+k),再加k得到第3个个体编号(l+2k),依次进行下去,直到获取整个样本.
注意:如果遇到不是整数的情况,可以先从总体中随机地剔除几个个体,使得总体中剩余的个体数能被样本容量整除.
适用范围:总体含个体数较多.
3.分层抽样
定义:一般地,在抽样时,将总体分成互不交叉的层,然后按照一定的比例,从各层独立地抽取一定数量的个体,将各层取出的个体合在一起作为样本,这种抽样方法叫分层抽样.
适用范围:总体由差异明显的几部分构成.
4.频率分布直方图
极差:一组数据中最大值与最小值的差;
频数:即个数;
频率:频数与样本容量的比值,频率分布直方图中各小长方形的面积表示相应各组的频率;
众数:出现次数最多的数,可以有多个.若无具体样本数据,则频率分布直方图中最高矩形的中点值可视为众数估计值;
中位数:按大小顺序排列的一组数据中居于中间位置的数,若中间位置有两个数,则取它们的平均数,中位数只有一个.若无具体样本数据,则频率分布直方图中将所有矩形面积平分的直线对应的横坐标可视为中位数的估计值;
平均数:所有样本数值之和除以样本个数的值.若无具体样本数据,则频率分布直方图中将每个矩形对应的区间中点值与该矩形面积相乘,然后全部相加得到的数值可视为该样本的平均值的估计值;
标准差:考察样本数据的分散程度的大小,一般用s表示.标准差越大,则数据离散程度越大;标准差越小,则数据离散程度越小.
.
方差:标准差的平方,用s2表示,也是刻画样本数据的分散程度,与标准差一致.
.
5.最小二乘法
回归直线y=bx+a,其中.
6.相关系数
,
当r为正时,表明变量x与y正相关;当r为负时,表明变量x与y负相关.
r∈[-1,1],r的绝对值越大,说明相关性越强;r的绝对值越小,说明相关性越弱.
7.事件
一般用大写字母A,B,C,...表示.
必然事件:一般地,我们把在条件S下,一定会发生的事件,叫做相对于条件S的必然事件.
不可能事件:在条件S下,一定不会发生的事件,叫做相对于条件S的不可能事件.
确定事件:必然事件与不可能事件统称为相对于条件S的确定事件.
随机事件:在条件S下可能发生也可能不发生的事件,叫做相对于条件S的随机事件.
互斥事件:在一次试验中不可能同时发生的两个事件.
对立事件:在一次试验中有且仅有一个会发生的两个事件.
8.概率
概率是一个确定的数,与每次的试验无关,用来度量事件发生的可能性大小.
9.古典概型
(1)实验中所有可能出现的基本事件只有有限个;
(2)每个基本事件出现的可能性相等;
(3).
10.几何概型
每个事件发生的概率只与构成该事件区域的长度(面积或体积)成比例.
.
11.回归分析
(1)样本点的中心(x,y)一定满足回归方程;
(2)点(xi,yi)的残差ei=yi-yi;
(3),R2越大,则模型的拟合效果越好;R2越小,则模型的拟合效果越差.
12.独立性检验
K2的观测值.
精题集训
(70分钟)
经典训练题
一、选择题.
1.为了丰富教职工业余文化生活,某校计划在假期组织全体老师外出旅游,并给出了两个方案(方案一和方案二),每位老师均选择且只选择一种方案,其中有50%的男老师选择方案一,有75%的女老师选择方案二,且选择方案一的老师中女老师占40%,那么该校全体老师中女老师的比例为( )
A. B. C. D.
【答案】B
【解析】设该校男老师的人数为x,女老师的人数为y,则可得如下表格:
方案一
方案二
男老师
0.5x
0.5x
女老师
0.25y
0.75y
由题意,可得,所以,故选B.
【点评】本题考查统计的基本思想,属于基础题.
2.某调查机构对全国互联网行业进行调查统计,得到整个互联网行业从业者年龄分布饼状图,90后从事互联网行业岗位分布条形图,则下列结论错误的是( )
注:90后指1990年及以后出生,80后指年之间出生,80前指1979年及以前出生.
A.互联网行业从业人员中从事技术和运营岗位的人数占总人数的三成以上
B.互联网行业中从事技术岗位的人数超过总人数的20%
C.互联网行业中从事运营岗位的人数90后一定比80前多
D.互联网行业中从事技术岗位的人数90后一定比80后多
【答案】D
【解析】对于选项A,因为互联网行业从业人员中,“90后”占比为,
其中从事技术和运营岗位的人数占的比分别为39.6%和17%,
则“90后”从事技术和运营岗位的人数占总人数的56%×39.6%+17%≈31.7%.
“80前”和“80后”中必然也有从事技术和运营岗位的人,则总的占比一定超过三成,
故选项A正确;
对于选项B,因为互联网行业从业人员中,“90后”占比为,
其中从事技术岗位的人数占的比为39.6%,
则“90后”从事技术岗位的人数占总人数的56%×39.6%≈22.2%.
“80前”和“80后”中必然也有从事技术岗位的人,则总的占比一定超过20%,故选项B正确;
对于选项C,“90后”从事运营岗位的人数占总人数的比为56%×17%≈9.5%,
大于“80前”的总人数所占比3%,故选项C正确;
选项D,“90后”从事技术岗位的人数占总人数的56%×39.6%≈22.2%,
“80后”的总人数所占比为41%,条件中未给出从事技术岗位的占比,故不能判断,所以选项D错误,
故选D.
【点评】本题考查利用扇形统计图和条形统计图解决实际问题,解本题的关键就是利用条形统计图中“90后”事互联网行业岗位的占比乘以“90后”所占总人数的占比,再对各选项逐一分析即可.
3.甲乙两台机床同时生产一种零件,10天中,两台机床每天出的次品数分别是:
甲
0
1
0
2
2
0
3
1
2
4
乙
2
2
1
1
1
2
1
1
0
1
x1,x2分别表示甲乙两组数据的平均数,S1,分别表示甲乙两组数据的方差,则下列选项正确的是( )
A.x1=x2,S1>S2 B.x1>x2,S1>S2
C.,S1>S2 D.x1>x2,S1x2;
,,∴S1>S2,
故选B.
【点评】本题考查平均数和方差的定义和计算,是基础题,解题时要注意平均数和方差的合理运用.
4.2020年的“金九银十”变成“铜九铁十”,全国各地房价“跳水”严重,但某地二手房交易却“逆市”而行.下图是该地某小区2019年11月至2020年11月间,当月在售二手房均价(单位:万元/平方米)的散点图.(图中月份代码1∼13分别对应2019年11月∼2020年11月)
根据散点图选择y=a+bx和y=c+dlnx两个模型进行拟合,经过数据处理得到的两个回归方程分别为y=0.9369+0.0285x和y=0.9554+0.0306lnx,并得到以下一些统计量的值:
y=0.9369+0.0285x
y=0.9554+0.0306lnx
R2
0.923
0.973
注:x是样本数据中x的平均数,y是样本数据中y的平均数,则下列说法不一定成立的是( )
A.当月在售二手房均价y与月份代码x呈正相关关系
B.根据y=0.9369+0.0285x可以预测2021年2月在售二手房均价约为1.0509万元/平方米
C.曲线y=0.9369+0.0285x与y=0.9554+0.0306lnx的图形经过点x,y
D.y=0.9554+0.0306lnx回归曲线的拟合效果好于y=0.9369+0.0285x的拟合效果
【答案】C
【解析】对于A,散点从左下到右上分布,所以当月在售二手房均价y与月份代码x呈正相关关系,
故A正确;
对于B,令x=16,由y=0.9369+0.028516=1.0509,
所以可以预测2021年2月在售二手房均价约为1.0509万元/平方米,故B正确;
对于C,非线性回归曲线不一定经过x,y,故C错误;
对于D,R2越大,拟合效果越好,故D正确,
故选C.
【点评】本题考查命题的真假的判断与应用,回归直线方程,相关关系的判断,是中档题.
5.某校学生的男女人数之比为2:3,按照男女比例通过分层随机抽样的方法抽到一个样本,样本中男生每天运动时间的平均值为100分钟、女生为80分钟.结合此数据,估计该校全体学生每天运动时间的平均值
为( )
A.98分钟 B.90分钟 C.88分钟 D.85分钟
【答案】C
【解析】设样本中男生人数为2a,女生人数为3a,则样本容量为5a,
又男生每天运动时间的平均值为100分钟、女生为80分钟,
所以该校全体学生每天运动时间的平均值为,故选C.
【点评】本题考查了分层抽样的应用,考查了总体平均数的估计,属于基础题.
6.已知一组数据x1,x2,x3的平均数是5,方差是4则由,,2x3+1,11这4个数据组成的新的一组数据的方差是( )
A.16 B.14 C.12 D.8
【答案】C
【解析】由已知得x1+x2+x3=15,x1-52+x2-52+x3-52=12,
则新数据的平均数为,
所以方差为
,
故选C.
【点评】本题考查了平均数与方差的变换特点,若在原来数据前乘以同一个数,平均数也乘以同一个数,
而方差要乘以这个数的平方,在数据上同加同减一个数.
7.总体由编号01,02,…,29,30的30个个体组成.利用下面的随机数表选取5个个体,选取方法是从如下随机数表的第1行的第6列和第7列数字开始由左到右依次选取两个数字,则选出来的第5个个体的编号为( )
第1行78 16 62 32 08 02 62 42 62 52 53 69 97 28 01 98
第2行32 04 92 34 49 35 82 00 36 23 48 69 69 38 74 81
A.27 B.26 C.25 D.24
【答案】C
【解析】由随机数表法可知,样本的前5个个体的编号分别为23、20、26、24、25,
因此,选出的第5个个体的编号为25,故选C.
【点评】本题主要考了随机数表的使用,属于基础题.
8.已知△ABC的三个顶点坐标为A3,0、B0,4、C0,0,D点的坐标为2,0,向△ABC内部投一点P,那么点P落在△ABD内的概率为( )
A. B. C. D.
【答案】A
【解析】由题意可知,,,
因此,点P落在△ABD内的概率为,故选A.
【点评】本题考查了几何概型的求解,而几何概率的求解的关键是求得事件所占区域与整个区域的几何度量,本题是一道与面积有关的试题,属于基础题.
9.若同时掷两个骰子,则向上的点数之和为6的概率是( )
A. B. C. D.
【答案】D
【解析】根据题意,可知共有36个基本事件,
其中向上的点数之和为6的事件含有(1,5)(5,1)(2,4)(4,2)(3,3)共5个基本事件,
所以概率,故选D.
【点评】本题考查概率的求法,是基础题,解题时要认真审题,注意列举法的合理使用.
二、解答题.
10.某地区2014年至2020年农村居民家庭人均纯收入y(单位:万元)的数据如下表:
年份
2014
2015
2016
2017
2018
2019
2020
年份代号t
1
2
3
4
5
6
7
人均纯收入y
2.9
3.3
3.6
4.4
4.8
5.2
5.9
(1)求y关于t的线性回方程;
(2)利用(1)中的回归方程,分析2014年至2020年该地区农村居民家庭人均纯收入的变化情况,并预测该地区2021年农村居民家庭人均纯收入.
附:回归直线的斜率和截距的最小二乘法估计公式分别为:,a=y-bt.
【答案】(1);(2)预测该地区2021年农村居民家庭人均纯收入为6.3万元.
【解析】(1)由所给数据计算得,
.
ti-t2=9+4+1+0+1+4+9=28,
.
,a=y-b=4.3-0.5×4=2.3,
所求回归方程为.
(2)由(1)知,b=0.5>0,
故2014年至2020年该地区农村居民家庭人均纯收入逐年增加,平均每年增加0.5万元.
将2021年的年份代号t=8代入(1)中的回归方程得y=0.5×8+2.3=6.3.
故预测该地区2021年农村居民家庭人均纯收入为6.3万元.
【点评】利用最小二乘法求回归直线方程时,一般先根据题中条件,计算两变量的均值,再根据最小二乘法对应的公式,求出b和a,即可得解.
11.2020年1月24日,中国疾控中心成功分离中国首株新型冠状病毒毒种.6月19日,中国首个新冠mRNA疫苗获批启动临床试验,截至2020年10月20日,中国共计接种了约6万名受试者,为了研究年龄与疫苗的不良反应的统计关系,现从受试者中采取分层抽样抽取100名,其中大龄受试者有30人,舒张压偏高或偏低的有10人,年轻受试者有70人,舒张压正常的有60人.
(1)根据已知条件完成下面的2×2列联表,并据此资料你是否能够以99%的把握认为受试者的年龄与舒张压偏高或偏低有关?
大龄受试者
年轻受试者
合计
舒张压偏高或偏低
舒张压正常
合计
(2)在上述100人中,从舒张压偏高或偏低的所有受试者中采用分层抽样抽取6人,从抽出的6人中任取3人,设取出的大龄受试者人数为X,求X的分布列和数学期望.
运算公式:,
对照表:
P (K2≥k)
0.100
0.050
0.010
0.001
k
2.706
3.841
6.635
10.828
【答案】(1)没有99%的把握认为受试者的年龄与舒张压偏高或偏低有关;(2)分布列见解析,.
【解析】(1)2×2列联表如下:
大龄受试者
年轻受试者
合计
舒张压偏高或偏低
10
10
20
舒张压正常
20
60
80
合计
30
70
100
,
所以,没有99%的把握认为受试者的年龄与舒张压偏高或偏低有关.
(2)由题意得,采用分层抽样抽取的6人中,大龄受试者有3人,年轻受试者有3人,
所以大龄受试者人数为X的可能取值为0,1,2,3,
所以,,
,,
所以X的分布列为:
X
0
1
2
3
P
所以.
【点评】本题第二问解题的关键在于根据题意得抽取的6人中,大龄受试者有3人,年轻受试者有3人,
进而根据超几何分布求概率分布列与数学期望,考查运算求解能力,是中档题.
12.广西某高三理科班N名学生的物理测评成绩(满分120分)的频率分布直方图如图,已知分数在的学生有27人.
(1)求总人数N和分数在分的人数n;
(2)求出该频率分布直方图的众数,中位数,平均数;
(3)为了分析某个学生的学习状态,对其下一阶段的学生提供指导性建议,对他前7次考试的数学成绩x(满分150分),物理成绩y进行分析,如表是该生7次考试的成绩.
数学
88
83
117
92
108
100
112
物理
94
91
108
96
104
101
106
已知该生的物理成绩y与数学成绩x是线性相关的,若该生的数学成绩达到130分,请你估计他的物理成绩大约是多少?其回归方程y=bx+a,,a=y-bx.
其中,
12×6+17×9+17×8+8×4+8×4+12×6=497,
122+172+172+82+122=994.
【答案】(1)60,9;(2)众数:,中位数:100,平均数:;(3)可估计他的物理成绩为115分.
【解析】(1)根据频率分布直方图的意义,分数在的学生有27人,
的频率为0.05+0.04×5=0.45,可得总人数.
直方图面积之和为1,可得的频率为,即人数为人.
的人数为,所以人数为9人.
(2)众数,
由0.01×5+0.04×5+0.05×5=0.5,所以中位数为100;
平均数69.25+0.1×112.5=80.50(分).
(3)由表中数据:,,
其中;,
∵a=y-bx=100-0.5×100=50,
∴物理成绩y与数学成绩x是线性其回归方程为y=0.5x+50.
当时,可得y=115,即可估计他的物理成绩为115分.
【点评】本题考查了频率分布直方图与列举法求古典概型的概率问题,也考查了线性回归方程的应用问题,
是综合题.
高频易错题
一、选择题.
1.已知变量x,y之间的线性回归方程为y=-0.7x+10.3,且变量x,y之间的一组相关数据如表所示,则下列说法错误的是( )
x
6
8
10
12
y
6
m
3
2
A.变量x,y之间呈负相关关系 B.m=4
C.可以预测,当x=20时,y=-3.7 D.该回归直线必过点9,4
【答案】B
【解析】A.由回归方程y=-0.7x+10.3,知b=-0.7
相关试卷
这是一份高考数学二轮专题——统计概率专题(学生及教师版),文件包含统计概率专题教师版pdf、统计概率专题学生版pdf等2份试卷配套教学资源,其中试卷共370页, 欢迎下载使用。
这是一份高中数学高考专题31 概率和统计【文】(解析版),共40页。试卷主要包含了故选C等内容,欢迎下载使用。
这是一份高中数学高考 2021届高考二轮精品专题十 统计概率(文) 学生版(1),共27页。试卷主要包含了以实际背景的图表分析,事件,概率,古典概型,几何概型等内容,欢迎下载使用。