所属成套资源:2022-2023学年高一数学下学期期末知识点精讲+训练学案+期末模拟卷(苏教版2019必修第二册)
- 专题10 空间角、距离的计算——2022-2023学年高一数学下学期期末知识点精讲+训练学案+期末模拟卷(苏教版2019必修第二册) 学案 1 次下载
- 专题11 空间图形的表面积与体积——2022-2023学年高一数学下学期期末知识点精讲+训练学案+期末模拟卷(苏教版2019必修第二册) 学案 2 次下载
- 专题12 球的外接、内切及立体几何最值问题——2022-2023学年高一数学下学期期末知识点精讲+训练学案+期末模拟卷(苏教版2019必修第二册) 学案 1 次下载
- 专题14 概率——2022-2023学年高一数学下学期期末知识点精讲+训练学案+期末模拟卷(苏教版2019必修第二册) 学案 1 次下载
- 期末模拟试卷01——2022-2023学年高一数学下学期期末知识点精讲+训练学案+期末模拟卷(苏教版2019必修第二册) 学案 2 次下载
专题13 统计——2022-2023学年高一数学下学期期末知识点精讲+训练学案+期末模拟卷(苏教版2019必修第二册)
展开
这是一份专题13 统计——2022-2023学年高一数学下学期期末知识点精讲+训练学案+期末模拟卷(苏教版2019必修第二册),文件包含专题13统计解析版docx、专题13统计原卷版docx等2份学案配套教学资源,其中学案共43页, 欢迎下载使用。
专题13 统计
(一)抽样
1.简单随机抽样
(1)定义:一般地,设一个总体含有N个个体,从中逐个不放回地抽取n个个体作为样本(n≤N),如果每次抽取时总体内的各个个体被抽到的机会都相等,就把这种抽样方法叫做简单随机抽样.这样抽取的样本,叫做简单随机样本.
(2)常用方法:抽签法和随机数法.
(3)随机数法步骤:
①将总体中的个体编号.
②在随机数表中任选一个数作为开始.
③规定一个方向作为从选定的数读取数字的方向.
④开始读取数字,若不在编号中,则跳过,若在编号中则取出,依次取下去,直到取满为止(相同的号只计一次).
⑤根据选定的号码抽取样本.
2.分层抽样
(1)在抽样时,将总体分成互不交叉的层,然后按照一定的比例,从各层独立地抽取一定数量的个体,将各层取出的个体合在一起作为样本,这种抽样方法是一种分层抽样.
(2)分层抽样的应用范围
当总体是由差异明显的几个部分组成时,往往选用分层抽样.
(二)统计图表
1.频率分布直方图
(1)纵轴表示,即小长方形的高=;
(2)小长方形的面积=组距×=频率;
(3)各个小方形的面积总和等于1.
2.频率分布表的画法
第一步:求极差,决定组数和组距,组距=;
第二步:分组,通常对组内数值所在区间取左闭右开区间,最后一组取闭区间;
第三步:登记频数,计算频率,列出频率分布表.
3.频率分布直方图中的常见结论
(1)众数的估计值为最高矩形的中点对应的横坐标.
(2)平均数的估计值等于频率分布直方图中每个小矩形的面积乘以小矩形底边中点的横坐标之和.
(3)中位数的估计值的左边和右边的小矩形的面积和是相等的.
4.茎叶图
茎叶图是统计中用来表示数据的一种图,茎是指中间的一列数,叶就是从茎的旁边生长出来的数.
①“叶”位置只有一个数字,而“茎”位置的数字位数一般不需要统一;
②茎叶图上重复出现的数据要重复记录,不能遗漏.
5.条形图:建立直角坐标系,用横轴(横轴上的数字)表示样本数据类型,用纵轴上的单位长度表示一定的数量,根据每个样本(或某个范围内的样本)的数量多少画出长短不同的等宽矩形,然后把这些矩形按照一定的顺序排列起来,这样一种表达和分析数据的统计图称为条形图.
6.折线图:建立直角坐标系,用横轴上的数字表示样本值,用纵轴上的单位长度表示一定的数量,根据样本值和数量的多少描出相应各点,然后把各点用线段顺次连接,得到一条折线,用这种折线表示出样本数据的情况,这样的一种表示和分析数据的统计图称为折线图.
7.扇形图:用一个圆表示总体,圆中各扇形分别代表总体中的不同部分,每个扇形的大小反映所表示的那部分占总体的百分比的大小,这样的一种表示和分析数据的统计图称为扇形图.
(三)用样本估计总体
1.众数:一组数据出现次数最多的数叫众数,众数反应一组数据的多数水平;
2.中位数:一组数据中间的数,(起到分水岭的作用)中位数反应一组数据的中间水平;
平均数:反应一组数据的平均水平;
3.方差:方差是和中心偏离的程度,用来衡量一批数据的波动大小(即这批数据偏离平均数的大小)并把它叫做这组数据的方差.在样本容量相同的情况下,方差越大,说明数据的波动越大,越不稳定.方差的简化计算公式:s2=[(x+x+…+x)-n 2]或写成s2=(x+x+…+x)-2,即方差等于原数据平方的平均数减去平均数的平方.
4.标准差是方差的算术平方根,意义在于反映一个数据集的离散程度.
5.百分位:一般地,一组数据的第p百分位是这样一个值,它使得这组数据中至少有p%的数据小于或等于这个值,且至少有(100-p%)的数据大于或等于这个值.
题型一 抽样
【典例1】(2022春·江苏盐城·高一统考期末)工厂生产A,B,C,3种不同型号的产品,产量之比为3:2:7.现用分层抽样的方法抽取一个容量为n的样本,若样本中B种型号的产品有12件,则样本容量n=( )
A.72 B.48 C.24 D.60
【典例2】(2022春·江苏宿迁·高一统考期末)某工厂生产A,B,C三种不同型号的产品,某月生产A,B,C这三种型号的产品的数量之比为,现用分层抽样的方法抽取一个容量为60的样本,已知B种型号的产品被抽取30件,则a的值为( )
A.1 B.2 C.3 D.4
【典例3】(2022春·江苏苏州·高一校联考期末)某单位有青年职工160人,中年职工人数是老年职工人数的2倍,老、中、青职工共有430人,为了解职工身体状况,现采用分层抽样方法进行调查,在抽取的样本中有青年职工32人,则该样本中的老年职工人数为( )
A.16 B.18 C.27 D.36
【典例4】(2022春·江苏南京·高一江苏省江浦高级中学校联考期末)总体编号为01,02,…,29,30的30个个体组成.利用下面的随机数表选取5个个体,选取方法是从随机数表第1行的第3列和第4列数字开始由左到右依次选取两个数字,则选出来的第5个个体的编号为( )
7816 1572 0802 6315 0216 4319 9714 0198
3204 9234 4936 8200 3623 4869 6938 7181
A.02 B.15 C.16 D.19
【总结提升】
1.不论哪种抽样方法,总体中的每一个个体入样的概率都是相同的.
2. 分层抽样的前提和遵循的两条原则
(1)前提:分层抽样使用的前提是总体可以分层,层与层之间有明显区别,而层内个体间差异较小,每层中所抽取的个体数可按各层个体数在总体的个体数中所占比例抽取.
(2)遵循的两条原则:
①将相似的个体归入一类,即为一层,分层要求每层的各个个体互不交叉,即遵循不重复、不遗漏的原则;
②分层抽样为保证每个个体等可能入样,需遵循在各层中进行简单随机抽样,每层样本数量与每层个体数量的比等于抽样比.
3.命题方向:
(1)抽样的概念
(2)抽样方案的设计.
题型二 扇形图、折线图的应用
【典例5】(2023·江苏·高三统考学业考试)党的二十大报告指出:“全面提高人才自主培养质量,着力造就拔尖创新人才,聚天下英才而用之.”某区域教育部门为提高学生的创新能力,组织了200名学生参与研究性学习,每人仅参加1个课题组,参加各课题组的人数占比的扇形统计图如图所示,则参加数学类的人数比参加理化类的人数多( )
A.16 B.30 C.32 D.62
【典例6】(2017·全国高考真题(理))某城市为了解游客人数的变化规律,提高旅游服务质量,收集并整理了2014年1月至2016年12月期间月接待游客量(单位:万人)的数据,绘制了如图所示的折线图.根据该折线图,下列结论错误的是( )
A.月接待游客量逐月增加
B.年接待游客量逐年增加
C.各年的月接待游客量高峰期大致在7,8月
D.各年1月至6月的月接待游客量相对于7月至12月,波动性更小,变化比较平稳
【典例7】(2018·全国高考真题(文))某地区经过一年的新农村建设,农村的经济收入增加了一倍.实现翻番.为更好地了解该地区农村的经济收入变化情况,统计了该地区新农村建设前后农村的经济收入构成比例.得到如下饼图:
则下面结论中不正确的是
A.新农村建设后,种植收入减少
B.新农村建设后,其他收入增加了一倍以上
C.新农村建设后,养殖收入增加了一倍
D.新农村建设后,养殖收入与第三产业收入的总和超过了经济收入的一半
【典例8】(2021秋·江苏无锡·高一无锡市市北高级中学校考开学考试)在西安市开展的“双城联创”活动中,某校倡议七年级学生利用双休日在各自社区参加义务劳动,为了解同学们劳动情况,学校随机抽查了部分学生的劳动时间,并用得到的数据绘制成不完整的统计图表,如图所示:
劳动时间(时)
频数(人数)
频率
12
1
30
2
18
合计
1
(1)统计表中的___________,___________.补全条形统计图:
(2)求所有被调查同学的平均劳动时间.
【总结提升】
扇形统计图直观地反映了各个类别在总体中所占的比例,折线统计图则可以看出变化趋势.频数直方图既能够反映分布状况,又可以表示变化趋势.
题型三 频率分布直方图
【典例9】(2022春·江苏连云港·高一统考期末)某校高一年级1000名学生在一次考试中的成绩的频率分布直方图如图所示,现用分层抽样的方法从成绩40~70分的同学中共抽取80名同学,则抽取成绩50~60分的人数是( )
A.20 B.30 C.40 D.50
【典例10】(2023春·江苏南京·高二校考开学考试)某学校组织学生参加数学测试,某班成绩的频率分布直方图如图,数据的分组依次为,,,.若不低于80分的人数是35人,且同一组中的数据用该组区间的中点值代表,则下列说法中正确的是( )
A.该班的学生人数是50 B.成绩在的学生人数是12
C.估计该班成绩的平均分为85 D.成绩的众数一定落在区间内
【典例11】(2022春·江苏苏州·高一江苏省木渎高级中学)某公司针对新购买的50000个手机配件的重量随机抽出1000台进行检测,如图是根据抽样检测后的重量(单位:克)数据绘制的频率分布直方图,其中配件重量的范围是,样本数据分组为.用样本估计总体,则下列说法错误的是( )
A.这批配件重量的平均数是(精确到0.01)
B.这批配件重量的中位数是在之间
C.
D.这批配件重量在范围的有15000个
【典例12】(2021·全国·高考真题(文))为了解某地农村经济情况,对该地农户家庭年收入进行抽样调查,将农户家庭年收入的调查数据整理得到如下频率分布直方图:
根据此频率分布直方图,下面结论中不正确的是( )
A.该地农户家庭年收入低于4.5万元的农户比率估计为6%
B.该地农户家庭年收入不低于10.5万元的农户比率估计为10%
C.估计该地农户家庭年收入的平均值不超过6.5万元
D.估计该地有一半以上的农户,其家庭年收入介于4.5万元至8.5万元之间
【总结提升】
1.两个主要考查角度:
(1)利用频率分布直方图求频率、频数.
(2)利用频率分布直方图估计总体
2.熟记结论:(1)在频率分布直方图中,各小长方形的面积表示相应各组的频率,所有小长方形的面积的和等于1;
(2) ×组距=频率;
(3)频数/样本容量=频率,此关系式的变形为频数/频率=样本容量,样本容量×频率=频数
3.易错防范:频率分布直方图的纵坐标是频率组距,而不是频率
题型四 用样本估计总体
【典例13】(2022春·江苏无锡·高一统考期末)某高校12名毕业生的起始月薪如下表所示:
毕业生
1
2
3
4
5
6
7
8
9
10
11
12
起始月薪
2850
2950
3050
2880
2755
2710
2890
3130
2940
3325
2920
2880
则第85百分位数是( )
A.3325 B.3130 C.3050 D.2950
【典例14】(2022·江苏·高一开学考试)关于用统计方法获取数据,分析数据,下列结论错误的是( )
A.某食品加工企业为了解生产的产品是否合格,合理的调查方式为抽样调查
B.为了解高一学生的视力情况,现有高一男生480人,女生420人,按性别进行分层抽样,样本量按比例分配,若从女生中抽取的样本量为63,则样本容量为135
C.若甲、乙两组数据的标准差满足则可以估计乙比甲更稳定
D.若数据的平均数为,则数据的平均数为
【典例15】(2022春·江苏徐州·高一统考期末)已知数据,,…,的平均数为3,方差为1,那么数据,,…,的平均数和方差分别为( )
A.3,1 B.9,3 C.10,9 D.10,10
【典例16】【多选题】(2022春·江苏无锡·高一辅仁高中校考期末)一组数据6,7,8,a,12的平均数为8,则此组数据的( )
A.众数为7 B.极差为6
C.中位数为8 D.方差为
【典例17】【多选题】(2023届福建省福州市高三质量检测数学试题)已知互不相同的9个样本数据,若去掉其中最大和最小的数据,则剩下的7个数据与原9个数据相比,下列数字特征中不变的是( )
A.中位数 B.平均数
C.方差 D.第40百分位数
【典例18】(2022春·江苏南通·高一金沙中学校考期末)设样本数据的平均数为,方差为,若数据的平均数比方差大4,则的最大值是_________.
【总结提升】
1.众数、中位数、平均数都是刻画数据特征的,但任何一个样本数据改变都会引起平均数的改变,而众数、中位数不具有这个性质.所以平均数可以反映出更多的关于样本数据全体的信息,它是样本数据的重心.
2.在样本中出现极端值的情况下,众数、中位数更能反映样本数据的平均水平.
3.平均数反映了数据取值的平均水平;
4.方差(标准差)越大,说明数据的离散性越大;方差(标准差)越小,说明数据的离散性越小,数据越集中、稳定.
5.用样本的数字特征估计总体的数字特征时,如果抽样的方法比较合理,那么样本可以反映总体的信息,但从样本得到的信息会有偏差,这些偏差是由样本的随机性引起的.虽然样本的数字特征并不是总体真正的数字特征,而是总体的一个估计,但这种估计是合理的,特别是当样本容量很大时,样本的数字特征稳定于总体的数字特征.
题型五 总体数字特征的实际应用
【典例19】(2023春·广东江门·高一鹤山市第一中学校考阶段练习)某果园试种了A,B两个品种的桃树各10棵,并在桃树成熟挂果后统计了这20棵桃树的产量如下表,记A,B两个品种各10棵产量的平均数分别为和,方差分别为和.
A(单位kg)
60
50
40
60
70
80
80
80
90
90
B(单位kg)
40
60
60
80
80
50
80
80
70
100
(1)分别求这两个品种产量的极差和中位数;
(2)求,,,;
(3)果园要大面积种植这两种桃树中的一种,依据以上计算结果分析选种哪个品种更合适,并说明理由.
【典例20】(2022春·江苏苏州·高一校考期末)为了调查疫情期间物理网课学习情况,某校组织了高一年级学生进行了物理测试.根据测试成绩(总分100分),将所得数据按照,,,,,分成6组,其频率分布直方图如图所示.
(1)求图中a的值;
(2)试估计本次物理测试成绩的平均分;(同一组中的数据用该组区间的中点值作代表)
(3)该校准备对本次物理测试成绩优异(将成绩从高到低排列,排在前13%的为优异)的学生进行嘉奖,则受嘉奖的学生分数不低于多少?
【规律方法】
1.明确样本数字特征所反映样本的特征,一般地,平均数反映的是样本个体的平均水平,众数和中位数则反映样本中个体的“重心”,而标准差则反映了样本的波动程度、离散程度,即均衡性、稳定性、差异性等.因此,我们可以根据问题的需要选择用样本的不同数字特征来分析问题.
2.主要命题角度有三个:
(1)样本的数字特征与频率分布直方图交汇
(2)样本的数字特征与茎叶图交汇
(3)样本的数字特征与优化决策问题交汇:利用样本的数字特征解决优化决策问题的依据
①标准差、方差描述了一组数据围绕平均数波动的大小.标准差、方差越大,数据的离散程度越大,越不稳定;标准差、方差越小,数据的离散程度越小,越稳定.
②用样本估计总体就是利用样本的数字特征来描述总体的数字特征.
一、单选题
1.(2023·江苏·高三统考学业考试)已知五个数的平均数为4,则( )
A.3 B.4 C.5 D.6
2.(2023·江苏南通·统考模拟预测)为宣传我国第三艘航空母舰“中国人民解放军海军福建舰”正式服役,增强学生的国防意识,某校组织1000名学生参加了“逐梦深蓝,山河荣耀”国防知识竞赛,从中随机抽取20名学生的考试成绩(单位:分),成绩的频率分布直方图如图所示,则下列说法正确的是( )
A.频率分布直方图中的值为0.004
B.估计这20名学生考试成绩的第60百分位数为75
C.估计这20名学生数学考试成绩的众数为80
D.估计总体中成绩落在内的学生人数为150
3.(2022·高一课时练习)小王于2015年底贷款购置了一套房子,根据家庭收入情况,小王选择了10年期每月还款数额相同的还货方式,且截止2019年底,他没有再购买第二套房子.下图是2016年和2019年家庭收入用于各项支出的比例分配图,根据以上信息,判断下列结论中正确的是( )
A.小王一家2019年用于饮食支出费用与2016年相同
B.小王一家2019年用于其他方面的支出费用是2016年的3倍
C.小王一家2019年的家庭收入比2016年增加了一倍
D.小王一家2019年的房贷支出比2016年减少了
二、多选题
4.(2022·江苏·高一开学考试)某校组织全体学生参加了主题为“奋斗百年路,启航新征程”的知识竞赛,随机抽取了200名学生进行成绩统计,发现抽取的学生的成绩都在50分至100分之间,进行适当分组后(每组的取值区间均为左闭右开),画出频率分布直方图(如图),下列说法正确的是( )
A.在被抽取的学生中,成绩在区间内的学生有80人
B.图中x的值为0.020
C.估计全校学生成绩的中位数为87
D.估计全校学生成绩的分位数为95
5.(2022春·江苏南通·高一统考期末)对于一组数据2,3,3,4,6,6,8,8,则( )
A.极差为8 B.平均数为5
C.方差为 D.40百分位数是4
6.(2023·江苏南通·二模)已知甲种杂交水稻近五年的产量(单位:t/hm2)数据为:9.8,10.0,10.0,10.0,10.2,乙种杂交水稻近五年的产量(单位:t/hm2)数据为:9.6,9.7,10.0,10.2,10.5,则( )
A.甲种的样本极差小于乙种的样本极差
B.甲种的样本平均数等于乙种的样本平均数
C.甲种的样本方差大于乙种的样本方差
D.甲种的样本60百分位数小于乙种的样本60百分位数
三、填空题
7.(贵州省毕节市2023届高三诊断性考试(三)数学(文)试题)某学校为了解教师身体健康情况,从高考学科和非高考学科教师中采用分层抽样的方法抽取部分教师体检.已知该学校高考学科和非高考学科教师的比例是5:1,且被抽到参加体检的教师中,高考学科教师比非高考学科教师多64人,则参加体检的人数是___________.
8.(2022春·江苏宿迁·高一统考期末)某校从高一新生中随机抽取了一个容量为20的身高样本,数据从小到大排序如下(单位:):152,155,158,164,164,165,165,165,166,167,168,168,169,170,170,170,171,x,176,178,若样本数据的85百分位数是173,则x的值为______.
9.(2022春·江苏南通·高一统考期末)若数据3x1-2,3x2-2,…,3x10-2的方差为18,则数据x1,x2,…,x10的方差为__________.
10.(2022春·江苏苏州·高一校联考期末)一组数据按从小到大的顺序排列为1,4,4,x,7,8(其中),若该组数据的中位数是众数的倍,则该组数据的第60百分位数是__________.
11.(2021秋·江苏南京·高二南京市第二十九中学校考期末)某科研课题组通过一款手机软件,调查了某市1000名跑步爱好者平均每周的跑步量(简称“周跑量”),得到如下的频数分布表:
周跑量
,
,
,
,
,
,
,
,
,
人数
100
120
130
180
220
150
60
30
10
周跑量
小于20公里
20公里到40公里
不小于40公里
类别
休闲跑者
核心跑者
精英跑者
装备价格(单位:元)
2500
4000
4500
根据跑步爱好者的周跑量,将跑步爱好者分成以上三段,不同类别的跑者购买的装备价格不一样.根据以上数据,估计该市每位跑步爱好者购买装备,平均需要花费__元.
12.(2022春·江苏盐城·高一统考期末)若的标准差为,则的标准差是___________.
13.(2022春·江苏扬州·高一统考期末)已知样本数据的平均数和方差分别为77和123,样本数据的平均数和方差分别为m和n,全部70个数据的平均数和方差分别为74和138,则_____________,_____________.
四、解答题
14.(2022春·江苏盐城·高一统考期末)为了有效抗击疫情,保卫师生健康,某校鼓励学生在食堂就餐,为了更好地服务学生,提升食堂的服务水平,学校采用了问卷调查的形式调研了学生对食堂服务的满意程度,满分是100分,将问卷回收并整理评分数据后,把得分分成了5组:[50,60),[60,70),[70,80),[80,90),[90,100],并绘制成如图所示的频率直方图.
(1)计算a的值和样本的平均分;
(2)为了更全面地了解师生对食堂服务水平的评价,求该样本的50百分位数(精确到0.01).
15.(2022春·江苏无锡·高一辅仁高中校考期末)我国是世界上严重缺水的国家之一,为提倡节约用水,我市为了制定合理的节水方案,对家庭用水情况进行了调查,通过抽样,获得了2021年 100个家庭的月均用水量(单位:t),将数据按照[0,2),[2,4),[4,6),[6,8),[8,10]分成5组,制成了如图所示的频率分布直方图.
(1)求全市家庭月均用水量不低于 6t的频率;
(2)假设同组中的每个数据都用该组区间的中点值代替,求全市家庭月均用水量平均数的估计值;
(3)求全市家庭月均用水量的75%分位数的估计值(精确到0.01).
16.(2022·高一单元测试)已知A,B两家公司的员工月均工资(单位:万元)情况分别如图1,图2所示:
(1)以每组数据的区间中点值为代表,根据图1估计A公司员工月均工资的平均数、中位数,你认为用哪个数据更能反映该公司普通员工的工资水平?请说明理由.
(2)小明拟到A,B两家公司中的一家应聘,以公司普通员工的工资水平作为决策依据,他应该选哪个公司?
相关学案
这是一份期末模拟试卷01——2022-2023学年高一数学下学期期末知识点精讲+训练学案+期末模拟卷(苏教版2019必修第二册),文件包含期末模拟试卷01解析版docx、期末模拟试卷01原卷版docx等2份学案配套教学资源,其中学案共24页, 欢迎下载使用。
这是一份专题14 概率——2022-2023学年高一数学下学期期末知识点精讲+训练学案+期末模拟卷(苏教版2019必修第二册),文件包含专题14概率解析版docx、专题14概率原卷版docx等2份学案配套教学资源,其中学案共35页, 欢迎下载使用。
这是一份专题11 空间图形的表面积与体积——2022-2023学年高一数学下学期期末知识点精讲+训练学案+期末模拟卷(苏教版2019必修第二册),文件包含专题11空间图形的表面积与体积解析版docx、专题11空间图形的表面积与体积原卷版docx等2份学案配套教学资源,其中学案共42页, 欢迎下载使用。