- 06第六章 平面向量和复数——2023年高中数学学业水平考试专项精讲+测试(人教A版2019,新教材地区) 试卷 7 次下载
- 07第七章 立体几何初步——2023年高中数学学业水平考试专项精讲+测试(人教A版2019,新教材地区) 试卷 6 次下载
- 09第九章 概率——2023年高中数学学业水平考试专项精讲+测试(人教A版2019,新教材地区) 试卷 6 次下载
- 普通高中学业水平合格性考试数学综合训练卷01(全国通用)——2023年高中数学学业水平考试专项精讲+测试(人教A版2019,新教材地区) 试卷 9 次下载
- 普通高中学业水平合格性考试数学综合训练卷02(全国通用)——2023年高中数学学业水平考试专项精讲+测试(人教A版2019,新教材地区) 试卷 9 次下载
08第八章 统计——2023年高中数学学业水平考试专项精讲+测试(人教A版2019,新教材地区)
展开第八章 统计
8.1随机抽样
8.2用样本估计总体
8.3统计实战
8.1随机抽样
知识回顾
1、简单随机抽样
(1)简单随机抽样
分为放回简单随机抽样和不放回简单随机抽样.除非特殊声明,本章简单随机抽样指不放回简单随机抽样.
(2)简单随机样本
通过简单随机抽样获得的样本称为简单随机样本.
(3)简单随机抽样的常用方法
实现简单随机抽样的方法很多,抽签法和随机数法是比较常用的两种方法.
2、总体平均数与样本平均数
定义
总体均值(总体平均数)
一般地,总体中有个个体,它们的变量值分别为,,,,则称为总体均值,又称总体平均数.
如果总体的个变量值中,不同的值共有()个,不妨记为,,,,其中出现的频率()则总体均值还可以写成加权平均数的形式
样本均值(样本平均数)
如果从总体中抽取一个容量为的样本,它们的变量值分别为,,,则称为样本均值,又称样本平均数.
说明:(1)在简单随机抽样中,我们常用样本均值去估计总体平均数;
(2)总体平均数是一个确定的数,样本平均数具有随机性(应为样本具有随机性);
(3)一般情况下,样本量越大,估计越准确.
3、分层随机抽样
(1)分层随机抽样的概念
一般地,按一个或多个变量把总体划分成若干个子总体,每个个体属于且仅属于一个子总体,在每个子总体中独立地进行简单随机抽样,再把所有子总体中抽取的样本合在一起作为总样本,这样的抽样方法称为分层随机抽样,每一个子总体称为层.
(2)分层随机抽样的平均数计算
在分层随机抽样中,以层数是2为例,如果第1层和第2层包含的个体数分别为和,抽取的样本量分别为和,第1层和第2层的样本平均数分别为,,样本平均数位,则.我们可以采用样本平均数估计总体平均数
4、统计图表
(1)常见的统计图表有条形图、扇形图、折线图、频数分布直方图、频率分布直方图等.
(2)频率分布表、频率分布直方图的制作步骤及意义
(3)绘制频率分布直方图的步骤及频率分布直方图的性质
①求极差,即一组数据中的最大值与最小值的差.
②决定组距与组数.组距与组数的确定没有固定的标准,一般数据的个数越多,所分组数越多.当样本容量不超过100时,常分成5~12组.为方便起见,一般取等长组距,并且组距应力求“取整”.
③将数据分组.
④列频率分布表.计算各小组的频率,第组的频率是.
⑤画频率分布直方图.其中横轴表示分组,纵轴表示.实际上就是频率分布直方图中各小长方形的高度,它反映了各组样本观测数据的疏密程度.
高频考点
1.(2022·贵州·高二学业考试)某班有男生25人,女生15人,现用分层抽样的方法从该班抽取8人参加志愿者活动,则应抽取的女生人数为( )
A.2 B.3 C.4 D.6
2.(2022·广西·高二学业考试)某班有55人,要抽出3人,班长给全班同学编号:01,02,03,…,55.用随机数表法确定人选,依次得到4个随机数为03,25,98,47,其中,不能作为编号的随机数是( )
A.03 B.25 C.98 D.47
3.(2022·浙江·杭州市余杭高级中学高二学业考试)我国古代数学名著《九章算术》有一抽样问题:“今有北乡若干人,西乡七千四百八十八人,南乡六千九百一十二人,凡三乡,发役三百人,而北乡需遣一百人,问北乡人数几何?”其意思为:“今有某地北面若干人,西面有人,南面有人,这三面要征调人,而北面共征调人(用分层抽样的方法),则北面共有( )人.”
A. B. C. D.
4.(2022·全国·高一学业考试)总体有编号为01,02,…,19,20的20个个体组成,利用下面的随机数表选取3个个体,选取方法是从随机数表第1行的第5列和第6列数字开始由左到右依次选取两个数字,则选出来的第3个个体的编号为( )
7816
6572
0802
6314
0702
4369
9728
0198
3204
9234
4935
8200
3623
4869
6938
7481
A.08 B.02 C.63 D.14
5.(2022·宁夏·青铜峡市宁朔中学高二学业考试)采用分层抽样的方法抽取一个容量为40的样本,高一年级被抽取10人,高三年级被抽取5人,高二年级共有250人,则这个学校共有高中学生( )
A.人 B.人 C.人 D.人
6.(2022·福建·上杭一中高二学业考试)从2019年末开始,新型冠状病毒在全球肆虐.为了研制新型冠状病毒疫苗,某大型药企需要从150名志愿者中抽取15名志愿者进行临床试验,现采用分层抽样的方法进行抽取,若这150名志愿者中老年人的人数为50人,则老年人中被抽到进行临床试验的人数是( )
A.15 B.10 C.5 D.1
7.(2022·天津南开·高二学业考试)某校选修乒乓球课程的学生中,高一年级有30名,高二年级有40名.现用分层抽样的方法在这70名学生中抽取一个样本,已知在高一年级的学生中抽取了6名,则在高二年级的学生中应抽取的人数为
A.6 B.8 C.10 D.12
8.(2022·天津河东·高二学业考试)某校足球俱乐部有男运动员60人,女运动员40人,为了了解运动员的身体素质,用分层抽样的方法从全体运动员中抽取一个容量为30的样本,则应抽取的男运动员人数为______________.
9.(2022·湖南·怀化市辰溪博雅实验学校高二学业考试)一支游泳队有男运动员人,女运动员人,按性别分层,用分层随机抽样从全体运动员抽取一个容量为的样本,那么抽取的女运动员人数为___________.
10.(2022·江西省万载中学高一期中)某企业共有3200名职工,其中,中年、青年、老年职工的比例为5:3:2,从所有职工中抽取一个样本容量为400的样本.
(1)应采用哪种抽样方法更合理?
(2)中年、青年、老年职工应分别抽取多少人?
11.(2022·全国·高一课时练习)已知总体容量为200,根据以下随机数表,抽取一个样本容量为5的样本.
55 19 68 97 65 03 73 52 16 56 00 58 55
90 27 33 42 29 38 87 22 13 88 83 34 53
81 29 13 29 35 01 20 71 34 62 33 74 82
14 53 73 19 09 03 56 54 29 56 93 51 86
32 68 92 33 98 74 66 99 40 14 71 94 58
45 94 19 33 81 14 44 99 81 07 35 91 70
29 13 80 03 54 07 27 96 94 78 32 66 50
95 52 74 33 13 80 55 62 54 37 71 67 95
13 20 02 44 95 94 64 85 04 05 72 01 32
90 76 14 53 89 74 60 41 93 66 13 83 27
92 79 64 64 72 28 54 96 53 84 48 14 52
98 94 56 07 93 39 30
12.(2022·全国·高一课时练习)某校高一、高二、高三年级共有学生1800名,为了了解同学们对“智慧课堂”的意见,计划采用分层抽样的方法从这1800名学生中抽取一个容量为36的样本.若从高一、高二、高三年级抽取的人数恰好是从小到大排列的连续偶数,求该校高三年级的学生人数.
13.(2022·陕西渭南·高一期末)我们国家正处于老龄化社会中,老有所依也是政府的民生工程.某市共有户籍人口400万,老年人(年龄60岁及以上)约有66万,为了了解老年人的健康状况,政府从老年人中随机抽取600人并委托医疗机构免费为他们进行健康评估,健康状况共分为不能自理、不健康尚能自理、基本健康、健康四个等级,并以80岁为界限分成两个群体进行统计,样本分布情况如图:
(1)若采用分层抽样的方法从样本中不能自理的老年人中抽取16人进一步了解他们的生活状况,则两个群体中各应抽取多少人?
(2)估算该市80岁及以上的老年人占全市户籍人口的百分比.
8.2用样本估计总体
知识回顾
1、总体百分位数的估计
(1)第百分位数的定义
一般地,一组数据的第p百分位数是这样一个值,它使得这组数据中至少有的数据小于或等于这个值,且至少有的数据大于或等于这个值.
(2)计算一组个数据的第百分位数的步骤:
第1步,按从小到大排列原始数据.
第2步,计算.
第3步,若不是整数,而大于的比邻整数为,则第百分位数为第项数据;若是整数,则第百分位数为第项与第项数据的平均数.
2、样本的数字特征
(1)众数
一组数据中出现次数最多的数据(即频率分布最大值所对应的样本数据)称为这组数据的众数.
(2)中位数
一组数据按从小到大(或从大到小)的顺序排成一列,处于最中间的一个数据(当数据个数是奇数时)或最中间两个数据的平均数(当数据个数是偶数时)称为这组数据的中位数.
(3)平均数
一组数据的和与这组数据的个数的商称为这组数据的平均数.数据,,,的平均数为
(4)标准差与方差
如果有个数据,,,那么平均数,标准差为:,方差:
3、在频率分布直方图中,众数,中位数,平均数的估计值
(1)最高的小矩形底边中点的横坐标即是众数;
(2)中位数左边和右边的所有小矩形的面积和是相等的;
(3)平均数是频率分布直方图的“重心”,等于频率分布直方图中每个小矩形的面积乘小矩形底边中点的横坐标之和.
高频考点
1.(2022·重庆·高一学业考试)为做好“新冠肺炎”疫情防控工作,我市各学校坚持落实“双测温两报告”制度,以下是某宿舍6名同学某日上午的体温记录:36.3,36.1,36.4,36.7,36.5,36.6(单位:),则该组数据的第80百分位数为( )
A.36.7 B.36.6 C.36.5 D.36.4
2.(2022·浙江·诸暨市教育研究中心高二学业考试)已知甲、乙两组按从小到大顺序排列的数据:甲组:14,30,37,,41,52,53,55,58,80;乙组:17,22,32,,45,47,51,59.若甲组数据的第30百分位数和乙组数据的中位数相等,则等于( )
A.7 B.8 C.9 D.10
3.(2022·浙江·诸暨市教育研究中心高二学业考试)已知数据,,,,的方差为,则数据,,,,的标准差为( )
A. B. C. D.
4.(2022·贵州·高二学业考试)某校高一年级一次数学考试成绩(单位:分)的频率分布直方图如图所示,估计该次考试成绩的众数为( )
A.65 B.75 C.85 D.95
5.(2022·贵州·高二学业考试)如图所示茎叶图表示的数据中,中位数是( )
A.30 B.32 C.35 D.39
6.(2022·天津河东·高二学业考试)某校8位学生的本次月考成绩恰好都比上一次的月考成绩高出50分,则以该8位学生这两次的月考成绩各自组成样本,则这两个样本不变的数字特征是( )
A.方差 B.中位数 C.众数 D.平均数
7.(2022·湖南娄底·高二学业考试)某校为了了解学生对“中国梦”伟大构想的认知程度,举办了一次“一带一路”知识竞赛,满分100分,以下数据为参加竞赛决赛的15名同学的成绩(单位:分):68,60,62,76,78,69,70,71,84,74,46,88,73,80,81.则这15人成绩的第80百分位数是( )
A.80 B.80.5 C.81 D.81.5
8.(2022·浙江·诸暨市教育研究中心高二学业考试)为了解电视对生活的影响,一个社会调查机构就平均每天看电视的时间调查了某地10000位居民,并根据所得数据画出样本的频率分布直方图(如图),为了分析该地居民平均每天看电视的时间与年龄、学历、职业等方面的关系,要从这10000位居民中再用分层抽样抽出100位居民做进一步调查,则在(小时)时间段内应抽出的人数是( )
A.25 B.30 C.50 D.75
9.(2022·浙江·诸暨市教育研究中心高二学业考试)如图是某学校的教研处根据调查结果绘制的本校学生每天放学后的自学时间情况的频率分布直方图:根据频率分布直方图,求出自学时间的中位数和众数的估计值(精确到)分别是( )
A., B.,
C., D.,
10.(多选)(2022·全国·高二学业考试)为了研究演员上春晚次数与其粉丝数量(单位:百万人)的关系,某网站对其中一位演员上春晚次数与其相应的粉丝数量进行了统计,得到如下数据:
上春晚次数x
2
3
5
6
粉丝数量y
5
7
9
11
由表中数据,得经验回归直线l:,则下列结论错误的是( )
附:.A. B.
C.直线l过点 D.直线l过点
11.(多选)(2022·浙江·诸暨市教育研究中心高二学业考试)为庆祝中国共产党成立100周年,某校开展“唱红色歌曲,诵红色经典”歌咏比赛活动,甲、乙两位选手经历了7场初赛后进入决赛,他们的7场初赛成绩如下
甲选手:78 84 85 85 86 88 92
乙选手:72 84 86 87 89 93 94
则以下结论正确的是( )
A.甲成绩的极差比乙成绩的极差小
B.甲成绩的众数比乙成绩的中位数小
C.甲成绩的方差比乙成绩的方差小
D.甲成绩的平均数比乙成绩的平均数大
12.(2022·浙江·诸暨市教育研究中心高二学业考试)2020年春季,受疫情的影响,学校推迟了开学时间上级部门倡导“停课不停学”,鼓励学生在家学习,复课后,某校为了解学生在家学习的周均时长(单位:小时),随机调查了部分学生,根据他们学习的周均时长,得到如图所示的频率分布直方图.则该校学生学习的周均时长的众数的估计值为___________.
13.(2022·北京·高三学业考试)某校举行演讲比赛,五位评委对甲、乙两位选手的评分如下:
甲 8.1 7.9 8.0 7.9 8.1
乙 7.9 8.0 8.1 8.5 7.5
记五位评委对甲、乙两位选手评分数据的方差分别为,则:______(填“>”,“=”或“<”).
14.(2022·浙江·太湖高级中学高二学业考试)目前,新冠病毒引起的疫情仍在全球肆虐,在党中央的正确领导下,全国人民团结一心,使我国疫情得到了有效的控制,各地各学校逐渐开始有序复学.某校为了解疫情期间学生线上学习效果,进行一次摸底考试,从中选取60名同学的成绩(百分制,均为正数)分成[40,50),[50,60),[60,70),[70,80),[80,90),[90,100)六组后,得到部分频率分布直方图(如图),观察图形,回答下列问题:
(1)求分数在内的频率,并补全这个频率分布直方图;
(2)根据频率分布直方图,估计本次考试成绩的均值;
(3)根据评奖规则排名靠前10%的同学可以获奖,请你估计获奖的同学至少需要多少分?
15.(2022·宁夏·青铜峡市宁朔中学高二学业考试)从甲、乙两名学生中选拔一人参加射箭比赛,为此需要对他们的射箭水平进行测试.现要求这两名学生在相同条件下各射箭5次,命中的环数如下:
甲
8
9
7
9
7
乙
10
9
8
6
7
(1)计算甲、乙两人射箭命中环数的平均数和标准差;
(2)比较两个人的成绩,然后决定选择哪名学生参加射箭比赛.
16.(2022·全国·高一学业考试)某市司法部门为了宣传《中华人民共和国宪法》举办法律知识问答活动,从该市岁的人群中随机抽取一个容量为的样本,并将样本按年龄分成五组:、、、、,再将其按从左到右的顺序分别编号为第组,第组,,第组,绘制了样本的频率分布直方图.对回答问题的情况进行统计后,结果如下表所示.
组号
分组
回答正确的人数
回答正确的人数占本组的比例
第组
第组
第组
第组
第组
(1)分别求出、的值;
(2)从第、、组回答正确的人中用分层抽样的方法抽取人,则第、、组各应抽取多少人?
(3)根据频率分布直方图估算出样本数据的中位数.
8.3统计实战
一、单选题
1.甲、乙两位同学的5次数学学业水平模拟考试成绩的方差分别为10.2和14.3,则以下解释比较合理的是( )
A.甲比乙的成绩稳定 B.乙比甲的成绩稳定
C.甲、乙的成绩稳定性无差异 D.甲比乙的成绩的标准差大
2.某班有45名学生,其中男生25人,女生20人.现用分层抽样的方法,从该班学生中抽取9人参加禁毒知识测试,则应抽取的男生人数为( )
A.3 B.4 C.5 D.6
3.某中学对全校学生进行了一次环保知识测试,测试成绩的频率分布直方图如图所示,则直方图中b的值为( )
A.0.08 B.0.05 C.0.03 D.0.02
4.某田径队有运动员100人,其中男运动员60人,女运动员40人.为了解田径队运动员的睡眠情况,采用分层抽样的方法获得一个容量为20的样本,那么应抽取男运动员的人数为( )
A.10 B.12 C.14 D.16
5.如图所示茎叶图表示的数据中,中位数是( )
A.65 B.77
C.81 D.89
6.某学校有160名教职工,其中教师120名,行政人员16名,后勤服务人员24名,今从中抽取一个容量为20的样本,采用( )较为合适.
A.简单随机抽样 B.系统抽样
C.分层抽样 D.其他抽样
7.张先生去某城市参加学术会议,拟选择在会议中心附近的、两酒店中的一个人住.张先生在网上查看了最近入住两个酒店的客人对两酒店的综合评分如下表,
72
86
87
89
92
94
73
74
86
88
94
95
记、两酒店的综合评分数据的均值为,,方差为,,则下述判断较合理的是( )A.因为,,应选择酒店
B.因为,,应选择酒店
C.因为,,应选择酒店
D.因为,,应选择酒店
8.现对某类文物进行某种物性指标检测,从1000件中随机抽取了200件,测得了它的物性指标值,得到如下频率分布直方图,据此估计这1000件文物中物性指标值不小于95的件数为( )
A.34 B.67 C.340 D.670
9.设一组样本数据x1,x2,…,xn的方差为0.01,则数据10x1,10x2,…,10xn的方差为( )
A.0.01 B.0.1 C.1 D.10
二、多选题
10.有一组样本数据,,…,,由这组数据得到新样本数据,,…,,其中(为非零常数,则( )
A.两组样本数据的样本平均数相同
B.两组样本数据的样本中位数相同
C.两组样本数据的样本标准差相同
D.两组样本数据的样本极差相同
三、填空题
11.采用分层抽样的方法抽取一个容量为40的样本,高一年级被抽取10人,高二年级被抽取15人,高三年级共有300人,则这个学校共有高中学生_________人.
12.甲、乙两人在10天中每天加工零件的个数用茎叶图表示如图,中间一列的数字表示零件个数的十位数,两边的数字表示零件个数的个位数,则这10天中甲加工零件的中位数为a和乙加工零件的平均数为b,则a+b=________.
四、解答题
13.某工厂对200个电子元件的使用寿命进行检查,按照使用寿命(单位:h),可以把这批电子元件分成第一组,第二组,第三组,第四组,第五组,第六组.由于工作中不慎将部分数据丢失,现有以下部分图表:
使用
寿命
频数
30
20
频率
0.2
0.4
(1)求图2中A的值;
(2)补全图2频率分布直方图,并求图2中阴影部分的面积;
(3)为了某次展销会,用分层抽样的方法在寿命位于内的产品中抽取5个作为样本,那么在内应抽取多少个?
14.某校从参加某次知识竞赛的同学中,选取60名同学将其成绩(百分制,均为整数)分成,,,,,六组后,得到部分频率分布直方图(如图),观察图形中的信息,回答下列问题:
(1)求分数内的频率,并补全这个频率分布直方图;
(2)从频率分布直方图中,估计本次考试成绩的中位数;
15.2021年开始,广西将推行全新的高考制度,采用“”模式,其中语文、数学、外语三科为必考科目,另外考生还需要依据想考取的高校及专业要求,结合自己的兴趣爱好等因素,在物理、历史中自选一门(2选1),在政治、地理、化学、生物4门科目中自选两门参加考试(4选2).由于受疫情影响多地推迟开学,开展线上教学.为了了解高一学生的选科意向,某学校对学生所选科目进行线上检测,下面是100名学生的物理、化学、生物三科总分成绩,以组距20分成7组:,画出频率分布直方图如图所示.
(1)求频率分布直方图中a的值;
(2)根据频率分布直方图求物理、化学、生物三科总分成绩的中位数;
(3)估计这100名学生的物理、化学、生物三科总分成绩的平均数.(同一组中的数据用该组区间的中点值作代表)
16.心绞痛是冠状动脉供血不足,心肌急剧地暂时缺血与缺氧所引起的以发作性胸痛或胸部不适为主要表现的临床综合征.在某地随机调查10位心绞痛患者第一次出现症状的年龄,得到如图所示的样本数据频率分布直方图.
(1)求直方图中a的值;
(2)估计这组数据的平均数;(同一组中的数据以该组区间的中点值为代表)
(3)估计这组数据的第55百分位数.
五、双空题
18.某校足球俱乐部有男运动员60人,女运动员40人,为了了解运动员的身体素质,用分层抽样的方法从全体运动员中抽取一个容量为30的样本,则应抽取的(1)男运动员人数为_______;(2)女运动员人数为_______.
普通高中学业水平合格性考试数学综合训练卷02(全国通用)——2023年高中数学学业水平考试专项精讲+测试(人教A版2019,新教材地区): 这是一份普通高中学业水平合格性考试数学综合训练卷02(全国通用)——2023年高中数学学业水平考试专项精讲+测试(人教A版2019,新教材地区),文件包含普通高中学业水平合格性考试数学综合训练卷02解析版docx、普通高中学业水平合格性考试数学综合训练卷02原卷版docx等2份试卷配套教学资源,其中试卷共16页, 欢迎下载使用。
普通高中学业水平合格性考试数学综合训练卷01(全国通用)——2023年高中数学学业水平考试专项精讲+测试(人教A版2019,新教材地区): 这是一份普通高中学业水平合格性考试数学综合训练卷01(全国通用)——2023年高中数学学业水平考试专项精讲+测试(人教A版2019,新教材地区),文件包含普通高中学业水平合格性考试数学综合训练卷01解析版docx、普通高中学业水平合格性考试数学综合训练卷01原卷版docx等2份试卷配套教学资源,其中试卷共17页, 欢迎下载使用。
09第九章 概率——2023年高中数学学业水平考试专项精讲+测试(人教A版2019,新教材地区): 这是一份09第九章 概率——2023年高中数学学业水平考试专项精讲+测试(人教A版2019,新教材地区),文件包含09第九章概率解析版docx、09第九章概率原卷版docx等2份试卷配套教学资源,其中试卷共27页, 欢迎下载使用。