所属成套资源:【同步课堂】2025-2026学年高中数学必修二复习讲义与复习课件(人教A版2019)
高中人教A版 (2019)用样本估计总体精品学案
展开
这是一份高中人教A版 (2019)用样本估计总体精品学案,文件包含92用样本估计总体2025-2026高中数学必修二高一下同步复习讲义原卷版docx、92用样本估计总体2025-2026高中数学必修二高一下同步复习讲义解析版docx等2份学案配套教学资源,其中学案共70页, 欢迎下载使用。
▉考点01 总体取值规律的估计
1.频率分布直方图
(1)频率分布表与频率分布直方图的意义
为了探索一组数据的取值规律,一般先要用表格对数据进行整理,或者用图将数据直观表示出来.在初中,我们曾用频数分布表和频数分布图来整理和表示这种数值型数据,由此能使我们清楚地知道数据分布在各个小组的个数.
有时,我们更关心各个小组的数据在样本容量中所占比例的大小,所以选择频率分布表和频率分布直方图来整理和表示数据.
(2)频率分布表与频率分布直方图的制作步骤
与画频数分布直方图类似,我们可以按以下步骤制作频率分布表、画频率分布直方图.
第一步,求极差
极差为一组数据中最大值与最小值的差.
第二步,决定组距与组数
第三步,将数据分组
通常对组内数据取左闭右开区间,最后一组数据取闭区间.
第四步,列频率分布表
计算各小组的频率,作出频率分布表.
第五步,画频率分布直方图
画图时,以横轴表示分组,纵轴(小长方形的高度)表示.
2.其他几类常用统计图——条形图、折线图、扇形图
▉考点02 总体百分位数、集中趋势与离散程度的估计
1.总体百分位数的估计
(1)概念
一般地,一组数据的第p百分位数是这样一个值,它使得这组数据中至少有p%的数据小于或等于这个值,且至少有(100-p)%的数据大于或等于这个值.
(2)求解步骤
可以通过下面的步骤计算一组n个数据的第p百分位数:
第1步,按从小到大排列原始数据.
第2步,计算i=n×p%.
第3步,若i不是整数,而大于i的比邻整数为j,则第p百分位数为第j项数据;若i是整数,则第p百分位数为第i项与第(i+1)项数据的平均数.
2.总体集中趋势的估计
在初中的学习中我们已经了解到,平均数、中位数和众数等都是刻画“中心位置”的量,它们从不同角度刻画了一组数据的集中趋势.具体概念回顾如下:
3.总体离散程度的估计
(1)方差和标准差
假设一组数据是,,,,用表示这组数据的平均数,则我们称为这组数据的方差.有时为了计算方差的方便,我们还把方差写成的形式.
我们对方差开平方,取它的算数平方根,称为这组数据的标准差.
(2)总体(样本)方差和总体标准差
①一般式:如果总体中所有个体的变量值分别为,总体平均数为,则总体方差
.
②加权式:如果总体的N个变量值中,不同的值共有k(k≤N)个,不妨记为,其中出
现的频数为,则总体方差为.
总体标准差:S=.
(3)标准差与方差的统计意义
①标准差刻画了数据的离散程度或波动幅度,标准差越大,数据的离散程度越大;标准差越小,数据的离散程度越小.
②在刻画数据的分散程度上,方差与标准差是一样的,但在解决实际问题时,一般多采用标准差.
③标准差(方差)的取值范围为[0,+∞).若样本数据都相等,表明数据没有波动幅度,数据没有离散性,则
标准差为0.反之,标准差为0的样本,其中的数据都相等.
4.频率分布直方图中的统计参数
(1)频率分布直方图中的“众数”
根据众数的意义可知,在频率分布直方图中最高矩形中的某个(些)点的横坐标为这组数据的众数.一般用中点近似代替.
(2)频率分布直方图中的“中位数”
根据中位数的意义,在样本中,有50%的个体小于或等于中位数,也有50%的个体大于或等于中位数.
因此,在频率分布直方图中,中位数左边和右边的直方图的面积应该相等,由此可估计中位数的值.
(3)频率分布直方图中的“平均数”
平均数是频率分布直方图的“重心”.因为平均数可以表示为数据与它的频率的乘积之和,所以在频率分布直方图中,样本平均数可以用每个小矩形底边中点的横坐标与小矩形的面积的乘积之和近似代替.
▉一.根据统计数据确定极差组距和组数(共3小题)
1.一个容量为80的样本中数据的最大值是140,最小值是51,组距是10,则应将样本数据分为( )
A.10组B.9组C.8组D.7组
【答案】B
【解答】解:∵数据中的最大值是140,最小值是51,
故该组数据的极差为140﹣51=89
又∵组距为10,
89÷10=8.9
故可将该组数据分成9组,
故选:B.
2.为了解某年级女生的身高情况,从中抽出20名进行测量,结果如下:(单位:cm)
149 159 142 160 156 163 145 150 148 151
156 144 148 149 153 143 168 168 152 155
在列样本频率分布表的过程中,如果设组距为4cm,那么组数为( )
A.4B.5C.6D.7
【答案】D
【解答】解:最大值与最小值的差:168﹣142=26;
组距是4时,264=6.5,则分成7组;
故选:D.
3.频率分布直方图中,小长方形的面积等于( )
A.相应各组的频数B.相应各组的频率
C.组数D.组距
【答案】B
【解答】解:小长方形的长为组距,高为 频率组距,所以小长方形的面积为:组距×频率组距=频率,
∴频率分布直方图中,小长方形的面积等于相应各组的频率.
故选:B.
▉二.列频率分布表及补全频率分布表(共4小题)
4.为了解某地区高三毕业生报考飞行员的400名学生的身高(单位:cm)情况,将得到的数据整理后,列出频率分布表如下:
(1)求a的值,并求出这一地区高三毕业生报考飞行员的学生身高的平均数(同一组中的数据用该组区间的中点作代表);
(2)如果从身高落在[172,184)的学生中抽取60名学生检测视力,按分层抽样的方法抽取,则身高超过180cm的学生应被抽取多少名?
【答案】(1)176.82;
(2)10.
【解答】解:(1)∵a+2a+3a+0.135+0.055=1,
∴a=0.135,
∴前三组的频率分别是0.135、0.27、0.405,
故这一地区高三毕业生报考飞行员的学生身高的平均数x=170×0.135+174×0.27+178×0.405+182×0.135+186×0.055=176.82(cm).
(2)身高落在[172,184)的学生的频率是0.27+0.405+0.135=0.81,所以频数是0.81×400=324.
其中身高超过180cm的学生有0.135×400=54名,
从中抽取60名学生,则身高超过180cm的学生应被抽取54324×60=10名.
5.在一次数学测验后,数学老师将某班全体学生(50人)的数学成绩进行初步统计后交给其班主任(如表).
请你帮助这位班主任完成下面的统计分析工作:
(1)列出频率分布表;
(2)画出频率分布直方图及频率分布折线图;
(3)从频率分布直方图估计出该班同学成绩的众数、中位数和平均数.
【答案】见试题解答内容
【解答】解:(1)计算对应的频率,列出频率分布表,如下;…(2分)
(2)根据频率分布表,画出频率分布直方图及频率分布折线图,如下;…(6分)
(3)根据频率分布直方图知,最高的一组数据[80,90),
所以众数为:80+902=85;
又0.04+0.12+0.20=0.36<0.5,
0.36+0.4=0.76>0.5,
所以中位数在[80,90)内,设为x,
则0.36+(x﹣80)×0.040=0.5,
解得x=83.5,
即中位数为83.5;
平均数为55×0.04+65×0.12+75×0.20+85×0.40+95×0.24=81.8.…(12分)
6.对某电子元件进行寿命追踪调查,情况如下.
(1)列出频率分布表;
(2)画出频率分布直方图及频率分布折线图;
(3)估计元件寿命在100~400h以内的在总体中占的比例;
(4)从频率分布直方图可以看出电子元件寿命的众数,平均数和中位数是多少?
【答案】见试题解答内容
【解答】解:(1)样本容量为200,可得样本频率分布表:
(2)频率分布直方图如下:
(3)估计电子元件寿命在100﹣﹣400 h以内的在总体中占的比例为1﹣(0.20+0.15)=0.65.
(4)从频率分布直方图可以看出电子元件寿命的众数,平均数和中位数分别是:
估计该电子元件寿命的众数为 300+4002=350;
平均数 =150×20+250×30+350×80+450×40+550×30200=365.
中位数 =300+100×0.5−(0.1+0.15)0.4=362.5.
7.某校高三年级共有学生1200名,为了解学生某次月考的情况,抽取了部分学生的成绩(得分均为整数,满分为100分)进行统计,绘制出如下尚未完成的频率分布表:
(1)补充完整题中的频率分布表;
(2)若成绩在[80,100]为优秀,估计该校高三年级学生在这次月考中,成绩优秀的学生约为多少人.
【答案】见试题解答内容
【解答】解:(1)由题意可得,抽取的学生人数为4÷0.04=100,
成绩在[50,60)的学生人数为100×0.12=12,
成绩在[60,70)的频率为38÷100=0.38,
成绩在[70,80)的学生人数为100×0.31=31,
成绩在[80,90)的频率为1﹣0.04﹣0.12﹣0.38﹣0.31﹣0.01=0.14,
学生人数为100×0.14=14,
成绩在[90,100]的学生人数为100×0.01=1,
故频率分布表为:
(2)由(1)可得,成绩在[80,100]的频率为0.14+0.01=0.15,
故成绩优秀的学生人数约为1200×0.1=180.
▉三.频率分布表的应用(共2小题)
8.学校从参加高一年级期中考试的学生中抽出50名学生,并统计了他们的数学成绩(成绩均为整数且满分为100分),数学成绩分组及各组频数如下:[40,50),2;[50,60),3;[60,70),14;[70,80),15;[80,90),12;[90,100],4.
(1)在给出的样本频率分布表中,求A,B,C,D的值;
(2)估计成绩在80分以上(含80分)学生的比例;
(3)为了帮助成绩差的学生提高数学成绩,学校决定成立“二帮一”小组,即从成绩在[90,100]的学生中选两位同学,共同帮助成绩在[40,50)中的某一位同学.已知甲同学的成绩为42分,乙同学的成绩为95分,求甲、乙两同学恰好被安排在同一小组的概率.
样本频率分布表:
【答案】见试题解答内容
【解答】解:(1)由题意知:A=12; B=0.24; C=50; D=1;
(2)估计成绩在80分以上(含80分)的数据包括[80,90)和[90,100]两组数据,
两组数据的频率之和为0.24+0.08=0.32,
∴成绩在80分以上(含80分)学生的比例为32%;
(3)成绩在[90,100]的学生有4人,成绩在[40,50)的学生有2人,
实行“二帮一”小组,共有 C42×C21=12 种情形,
其中甲、乙两同学恰好被安排在同一小组的有 C31=3 种情形,
∴甲、乙两同学恰好被安排在同一小组的概率为 312=14.
9.为迎接建党90周年,某班开展了一次“党史知识竞赛”,竞赛分初赛和决赛两个阶段进行,在初赛后,把成绩(满分为100分,分数均匀整数)进行统计,制成如表的频率分布表:
(Ⅰ)求a,b,c,d的值;
(Ⅱ)若得分在[90,100]之间的有机会进入决赛,已知其中男女比例为2:3,如果一等奖只有两名,求获得一等奖的全部为女生的概率.
【答案】见试题解答内容
【解答】(Ⅰ)根据样本容量、频率和频数之间的关系得到
a=50×0.1=5,b=2550=0.5,c=5,d=0.1
(Ⅱ)由题意知本题是一个古典概型,
∵把得分在[90,100]之间的五名学生分别计为“男甲,男乙,女甲,女乙,女丙”,则事
件“一等奖只有两名”包含的所有事件为(男甲,男乙),(男甲,女甲),(男甲,女乙),
(男甲,女丙),(男乙,女甲),(男乙,女乙),(男乙,女丙),(女甲,女乙),
(女甲,女丙),(女乙,女丙),共10个基本事件,
事件“获得一等奖的全部为女生”包含的所有事件为(女甲,女乙),(女甲,女丙),
(女乙,女丙),共3个基本事件,
∴获得一等奖的全部为女生的概率P=310
▉四.画频率分布直方图(共4小题)
(多选)10.某市为最大限度的吸引“高精尖缺”人才,向全球“招贤纳士”,推进了人才引入落户政策.随着人口增多,对住房要求也随之而来,而选择购买商品房时,住户对商品房的户型结构越来越重视,因此某商品房调查机构随机抽取n名市民,针对其居住的户型结构和满意度进行了调查,如图1调查的所有市民中四居室共200户,所占比例为13,二居室住户占16.如图2是用分层抽样的方法从所有调查的市民的满意中,抽取10%的调查结果绘制成的统计图,则下列说法错误的是( )
A.样本容量为60
B.样本中三居室住户共抽取了25户
C.根据样本可估计对四居室满意的住户有70户
D.样本中对三居室满意的有15户
【答案】BC
【解答】解:如图1调查的所有市民中四居室共200户,所占比例为13,二居室住户占16,
所以20013=600,二居室有600×16=100户,三居室为300户,
由频率分布直方图和扇形统计图得:
在A中,样本容量为n=600×10%=60,故A正确;
在B中,样本中三居室住户共抽取了300×10%=30户,故B错误;
在C中,根据样本可估计对四居室满意的住户有200×40%=80户,故C错误;
在D中,样本中对三居室满意的有300×10%×50%=15户,故D正确.
故选:BC.
11.某校高二年级的600名学生参加一次科普知识竞赛,然后随机抽取50名学生的成绩进行统计分析.
(1)完成频率分布表;
(2)根据上述数据画出频率分布直方图;
(3)估计这次竞赛成绩在80分以上的学生人数是多少?
(4)估计这次竞赛中成绩的众数,中位数,平均数分别是多少?
【答案】见试题解答内容
【解答】解:(1)根据频率=频数样本容量,完成下列频率分布表;
(2)根据上述数据画出频率分布直方图如下;
(3)∵成绩在80分以上的频率为0.3+0.1=0.4,
∴估计高二年级600名学生中成绩在80分以上的有:
600×0.4=240(人),
(4)估计平均成绩为:0.1×55+0.2×65+0.3×75+0.3×85+0.1×95=76.5,
众数落在第三组和第四组,即众数为75,85,
中位数,前三组的频率为0.1+0.2+0.3=0.6,故中位数落在第三组,为70+10×0.20.3≈77
12.某班50名同学参加数学测验,成绩的分组及各组的频数如下:
[40,50),2;[50,60),3;[60,70),10;[70,80),15;[80,90),12;[90,100),8.
(1)列出样本的频率分布表;
(2)画出频率分布直方图.
【答案】见试题解答内容
【解答】解:(1)频率分布表如下:
(2)频率分布直方图如图所示:
13.某花木公司为了调查某种树苗的生长情况,抽取了一个容量为100的样本,测得树苗的高度(cm)数据的分组及相应频数如下:
[107,109)3株;[109,111)9株;[111,113)13株;[113,115)16株;[115,117)26株;
[117,119)20株;[119,121)7株;[121,123)4株;[123,125)2株.
(1)列出频率分布表.
(2)画出频率分布直方图.
(3)据上述图表,估计数据落在[109,121)范围内的可能性是百分之几?
(4)求出数据的中位数.
【答案】见试题解答内容
【解答】解:(1)画出频率分布表,图形如下:
(2)画出频率分布直方图:
(3)由上述图表可知数据落在[109,121)范围内的频率为:
0.94﹣0.03=0.91,
即数据落[109,121)范围内的可能性是91%.
(4)∵[107,109)3株;[109,111)9株;[111,113)13株;[113,115)16株;[115,117)26株;
[117,119)20株;[119,121)7株;[121,123)4株;[123,125)2株.
∴中位数=115+1172=116.
▉五.补全频率分布直方图(共5小题)
14.某地区教研机构对该地区模拟考试成绩进行分析,随机抽取了200分到450分之间的1000名学生的成绩,并根据这些学生的成绩画出样本的频率分布直方图,如图所示,则成绩在[350,450]内的学生人数为( )
A.300B.400C.600D.1200
【答案】B
【解答】解:由频率分布直方图可得,(0.002+0.004+a+a+0.002)×50=1,
解得a=0.006,
所以成绩在[350,450]内的学生人数为1000×(0.006+0.002)×50=400.
故选:B.
15.为了解某小区居民的体育锻炼时间,随机在该小区选取了100名住户,将他们上周体育锻炼的时间(单位:时)按照[0,2)、[2,4)、[4,6)、[6,8)、[8,10]分成5组,制成如图所示的频率分布直方图.
(1)求图中a的值并估计样本数据的第75百分位数;
(2)按分层随机抽样的方法从上周体育锻炼时间在[2,4)、[4,6)的住户中选取5人,再从这5人中任意选取2人,求这2人上周体育锻炼时间都不低于4小时的概率.
【答案】见试题解答内容
【解答】解:(1)由频率分布直方图可知,(0.05+0.075+0.1+0.15+a)×2=1,
解得a=0.125,
设样本数据的第75百分位数为x,
因为样本数据在[0,6)的频率为2×(0.05+0.1+0.15)=0.6<0.75,
样本数据在[0,8)的频率为2×(0.05+0.1+0.15+0.125)=0.85>0.75,
则x∈(6,8),所以0.6+0.125×(x﹣6)=0.75,
解得x=7.2,
故估计样本数据的第75百分位数为7.2;
(2)上周体育锻炼时间在[2,4)的频数为0.1×2×100=20,
上周体育锻炼时间在[4,6)的频数为0.15×2×100=30,
按分层随机抽样的方法选取5人,
则上周体育锻炼时间在[2,4)的住户被抽取2050×5=2人,记为a、b,
体育锻炼时间在[4,6)的住户被抽取3050×5=3人,记为A、B、C,
所以从这5人中随机抽取2人的情况有ab、aA、aB、aC、bA、bB、bC、AB、AC、BC,共10种,
其中,事件“所抽取的2人上周体育锻炼时间都不低于4小时”包含的情况有AB、AC、BC,共3种,
则所求的概率P=310.
16.对某高校学生参加“走进敬老院送温暖”的活动次数进行统计,随机抽取N名学生,得到这N名学生参加此活动的次数,根据此数据作出如下频率分布表和频率分布直方图.
(1)求出表中N,p及图中a的值;
(2)若该校有学生3000人,试估计该校学生参加此活动的次数在区间[15,20)内的人数;
(3)估计该校学生参加此活动次数的众数、中位数及平均数.(同一组中的数据用该组区间的中点值为代表,所有结果保留一位小数)
【答案】(1)N=50,p=0.04,a=0.008;(2)1440;(3)众数是17.5,中位数为18.1,平均数是18.3.
【解答】解:(1)由分组[10,15)对应的频数是10,频率是0.20,知10N=0.20,所以N=50,
所以10+24+14+m=50,解得m=2,
所以p=mN=250=0.04,a=mN×5=250×5=0.008;
(2)估计该校学生参加此活动的次数在区间[15,20)内的人数为2450×3000=1440;
(3)估计该校学生参加此活动次数的众数是15+202=17.5;
因为n=2450=0.48,
参加活动次数在[10,15)之间的频率为0.2<0.5,
参加活动次数在[10,20)之间的频率为0.2+0.48=0.68>0.5,
所以估计该校学生参加此活动次数的中位数x位于[15,29)之间,
∴0.2+(x﹣15)×0.485=0.5,解得:x=18.1,
所以该校学生参加此活动次数的中位数为18.1;
由12.5×0.20+17.5×0.48+22.5×0.28+27.5×0.04=18.3,
所以估计该校学生参加此活动次数的平均数是18.3.
17.数字人民币在数字经济时代中体现的价值、交易媒介和支付手段职能,为各地数字经济建设提供了安全、便捷的支付方式,同时也为金融监管、金融产品设计提供更多选择性和可能性.苏州作为全国首批数字人民币试点城市之一,提出了2023年交易金额达2万亿元的目标.现从使用数字人民币的市民中随机选出200人,并将他们按年龄(单位:岁)进行分组:第1组[15,25),第2组[25,35),第3组[35,45),第4组[45,55),第5组[55,65],得到如图所示的频率分布直方图.
(1)求直方图中a的值并估算样本平均年龄(同组中的数据用该组区间的中点值作代表)及第78百分位数;
(Ⅱ)在这200位市民中用分层随机抽样的方法从年龄在[25,35)和[45,55)内抽取6位市民做问卷调查,现从这6位中随机抽取两名幸运市民,求两名幸运市民年龄都在[25,35)内的概率.
【答案】(Ⅰ)0.035;38.5;47;
(Ⅱ)25.
【解答】解:(Ⅰ)因为10(0.010+0.030+a+0.015+0.010)=1,
解得a=0.035,
可得样本平均年龄x=20×0.1+30×0.3+40×0.35+50×0.15+60×0.1=38.5,
易知前三组的频率之和为10(0.010+0.030+0.035)=0.75<0.78,
前四组的频率之和为10(0.010+0.030+0.035+0.015)=0.9>0.78,
所以第78百分位数在区间[45,55)上,
不妨设第78百分位数为x,
此时0.75+x−4510×0.15=0.78,
解得x=47;
(Ⅱ)易知年龄在[25,35)内的市民人数为200×0.3=60,
年龄在[45,55)内的市民人数为200×0.15=30,
若在这200位市民中用分层随机抽样的方法从年龄在[25,35)和[45,55)内抽取6位市民做问卷调查,
可得年龄在[25,35)内的市民人数为6×6060+30=4人,设为a,b,c,d,
年龄在[45,55)内的市民人数为6×3060+30=2人,设为x,y,
可得从这6名市民中抽取两名的样本事件有(ab),(ac),(ad),(ax),(ay),(bc),(bd),(bx),(by),(cd),(cx),(cy),(dx),(dy),(xy)这15种情况,
其中年龄都在[25,35)内的样本事件有(ab),(ac),(ad),(bc),(bd),(cd)这6种情况,
则两名幸运市民年龄都在[25,35)内的概率P=615=25.
18.受突如其来的新冠疫情的影响,全国各地学校都推迟2020年的春季开学,某学校“停课不停学“,利用云课平台提供免费线上课程,该学校为了解学生对线上课程的满意程度,随机抽取了100名学生对该线上课程评分、其频率分布直方图如图.
(1)求图中a的值;
(2)求评分的中位数;
(3)以频率当作概率,若采用分层抽样的方法,从样本评分在[60,70)和[90,100]内的学生中共抽取5人进行测试来检验他们的网课学习效果,再从中选取2人进行跟踪分析,求这2人中至少一人评分在[60,70)内的概率.
【答案】(1)a=0.040.
(2)81.25.
(3)710.
【解答】解:(1)由频率分布直方图的性质得:
(0.005+0.010+0.015+a+0.030)×10=1,
∴a=0.040.
(2)由频率分布直方图得:
[50,80)的频率为(0.005+0.010+0.03)×10=0.45,
[80,90)的频率为0.04×10=0.4,
∴中位数为:80+0.5−0.450.4×10=81.25.
(3)由题知评分在[60,70),[90,100]内的频率分别为0.1和0.15,
则抽取的5人中,评分在[60,70)内的为2人,评分在[90,100]的有3人,
记评分在[90,100]内的3位学生为a,b,c,
评分在[60,70)内的2位学生为D,E,
则从5人中任选2人的所有可能结果为:
(a,b),(a,c),(a,D),(a,E),(b,c),(b,D),(b,E),(c,D),(c,E),(D,E),共10种,
其中,评分在[90,100]内的可能结果为(a,b),(a,c),(b,c),共3种,
∴这2人中至少一人评分在[60,70)的频率为P=1−310=710.
▉六.频率分布直方图的应用(共5小题)
19.某地教育局为了解“双减”政策的落实情况,在辖区内初一年级在校学生中抽取了100名学生,调查了他们课下做作业的时间,得到如图所示的频率分布直方图,则下列结论不正确的是( )
A.该地初一年级学生做作业的时间超过3小时的概率估计为35%
B.估计该地初一年级有一半以上的学生做作业的时间超过2小时
C.估计该地初一年级学生做作业的时间的众数为2.25小时
D.估计该地初一年级有一半以上的学生做作业的时间在2小时至3小时之间
【答案】D
【解答】解:对于A,超过3小时的概率估计为:(0.3+0.2+0.1+0.1)×0.5=35%,故A正确;
对于B,超过2小时的概率估计为:(0.5+0.4+0.3+0.2+0.1+0.1)×0.5=0.8>0.5,故B正确;
对于C,由图知众数约为 2+2.52=2.25 (小时),故C正确;
对于D,时间在2小时至3小时之间的概率估计为:(0.5+0.4)×0.5=0.45,
所以没有一半以上的学生做作业的时间在2小时至3小时之间,故D错误.
故选:D.
20.为了加深师生对党史的了解,激发广大师生知史爱党、知史爱国的热情,某校举办了“学党史、育文化”暨“喜迎党的二十大”党史知识竞赛,并将1000名师生的竞赛成绩(满分100分,成绩取整数)整理成如图所示的频率分布直方图,则下列说法不正确的是( )
A.a的值为0.005
B.估计这组数据的众数为75
C.估计成绩低于60分的有250人
D.估计这组数据的第85百分位数为85
【答案】D
【解答】解:根据频率分布直方图可知:10(2a+3a+3a+6a+5a+a)=1,即a=0.005,故A正确;
由图易得在区间[70,80)的人最多,故可估计这组数据的众数为75,故B正确;
10×0.005×(2+3)×1000=250,故成绩低于6(0分)的有250人,即C正确;
由图中前四组面积之和为:(2+3+3+6)×0.005×10=0.7,
图中前五组面积之和为:(2+3+3+6+5)×0.005×10=0.95,
故这组数据的第85百分位数在第五组数据中,
设这组数据的第85百分位数为m,
则有0.7+5×0.005(m﹣80)=0.85,
故m=86,即估计这组数据的第85百分位数为86,故D错误.
故选:D.
21.下列频率分布直方图中,平均数大于中位数的是( )
A.
B.
C.
D.
【答案】D
【解答】解:对A,B,由图形的对称性,易得平均数等于中位数,所以A,B选项错误;
对C,因为频率分布直方图向左拖尾,所以平均数小于中位数,所以C错误;
对于选项D,因为频率分布直方图向右拖尾,所以平均数大于中位数,所以D正确.
故选:D.
22.某城市户居民的月平均用电量(单位:度),以[160,180),[180,200),[200,220),[220,240),[240,260),[260,280),[280,300]分组的频率分布直方图如图,则下列说法错误的是( )
A.直方图中x=0.0075
B.图中所有矩形面积之和为1
C.月平均用电量的中位数为225
D.在月平均用电量为[220,240),[240,260),[260,280),[280,300]的四组用户中,用分层抽样的方法抽取11户居民,月平均用电量在[220,240)的用户中应抽取5户
【答案】C
【解答】解:对于A,B,在直方图中,各组数据频率之和为所有矩形面积之和为1,故B正确;
则(0.002+0.0025+0.005+x+0.0095+0.011+0.0125)×20=1,
得x=0.0075,故A正确;
对于C,前3个矩形面积之和为(0.002+0.0095+0.011)×20=0.45<0.5.
前4个矩形面积之和为(0.002+0.0095+0.011+0.0125)×20=0.7>0.5.
则中位数在[220,240)内,
设为y,则(y﹣220)×0.0125=0.5﹣0.45,得y=224,即中位数为224,故C错误;
对于D,因为月平均用电量为[220,240)的居民对应的频率为:0.0125×20=0.25.
月平均用电量为[220,240),[240,260),[260,280),[280,300)的四组居民对应频率之和为:1﹣0.45=0.55.
则应抽取居民的户数为11×,故D正确.
故选:C.
23.为了解人们对环保知识的认知情况,某调查机构对A地区随机选取n个居民进行了环保知识问卷调查,并根据问卷成绩(不低于60分记为及格)绘制成如图所示的频率分布直方图(分为[40,50),[50,60),[60,70),[70,80),[80,90),[90,100]六组),若问卷成绩最后三组频数之和为360,则下列结论正确的是 ②③④ .
①n=480
②问卷成绩在[70,80)内的频率为0.3
③a=0.030
④以样本估计总体,若对A地区5000人进行问卷调查,则约有1250人不及格
【答案】②③④.
【解答】解:对于③,由频率分布直方图知:(0.010+0.015+0.015+a+0.025+0.005)×10=1,
解得a=0.030,故③正确;
对于①,n×(0.030+0.025+0.005)×10=360,解得n=600,故①错误;
对于②,问卷成绩在[70,80)内的频率为10a=0.3,故②正确;
对于④,对A地区5000人进行问卷调查,则不及格人数约有:5000×(0.010+0.015)×10=1250人,故④正确.
故答案为:②③④.
▉七.频率分布折线图、密度曲线(共5小题)
24.由于国庆期间有七天长假,很多电影都选择在此期间上映.某机构统计了2019年与2020年国庆期间的单日票房,得到的数据如图所示.
下列结论错误的是( )
A.2019年国庆期间和2020年国庆期间,均是10月1日票房最高,随后逐日递减
B.2020年国庆期间7天的单日票房数据的中位数比2019年的小
C.2020年国庆期间7天的单日票房数据的极差比2019年的大
D.2020年国庆期间7天的单日票房数据的方差比2019年的小
【答案】D
【解答】解:由图表可得2019年与2020年国庆期间,均是10月1日票房最高,随后逐日递减,故A正确;
2020年国庆期间7天的单日票房数据的中位数为5.45,极差为4.22,
2019年国庆期间7天的单日票房数据的中位数为6.17,极差为3.95,故B,C正确;
由图可得2020年国庆期间7天的单日票房数据波动更大,
所以2020年国庆期间7天的单日票房数据的方差比2019年的大,故D错误.
故选:D.
25.如图是2017年第一季度五省GDP情况图,则下列陈述中不正确的是( )
A.2017年第一季度GDP总量和增速由高到低排位均居同一位的省只有1个
B.与去年同期相比,2017年第一季度五个省的GDP总量均实现了增长
C.去年同期河南省的GDP总量不超过4000亿元
D.2017年第一季度GDP增速由高到低排位第5的是浙江省
【答案】A
【解答】解:由2017年第一季度五省GDP情况图,知:
在A中,2017年第一季度GDP总量和增速由高到低排位均居同一位的省有江苏和河南,共2个,故A错误;
在B中,与去年同期相比,2017年第一季度五个省的GDP总量均实现了增长,故B正确;
在C中,去年同期河南省的GDP总量不超过4000亿元,故C正确;
在D中,2017年第一季度GDP增速由高到低排位第5的是浙江省,故D正确.
故选:A.
(多选)26.甲、乙两名篮球运动员连续5场比赛的得分如图所示,则( )
A.甲得分的极差大于乙得分的极差
B.甲得分的平均数大于乙得分的平均数
C.甲得分的中位数大于乙得分的中位数
D.甲得分的方差大于乙得分的方差
【答案】BC
【解答】解:首先整理甲、乙得分数据并排序,
甲:15,16,18,21,30,乙:4,10,16,22,38,
A.极差:甲极差:30﹣15=15,乙极差:38﹣4=34,甲极差小于乙,A错误;
B.平均数:甲平均数:15+16+18+21+305=20,
乙平均数:4+10+16+22+385=18,甲平均数大于乙,B正确;
C.中位数:甲排序后中位数为18,乙排序后中位数为16.甲中位数大于乙,C正确;
D.方差:甲方差:(15−20)2+(16−20)2+(18−20)2+(21−20)2+(30−20)25=29.2,
乙方差:(4−18)2+(10−18)2+(16−18)2+(22−18)2+(38−18)25=136,
甲方差小于乙,D错误.
故选:BC.
(多选)27.为了贯彻“双减”政策,实现德、智、体、美、劳全面发展的育人目标,某校制订了一套五育并举的量化评价标准,如图是该校甲、乙两个班在评比时的得分(各项满分10分,得分越高,成绩越好)折线图,则下列说法正确的是 ( )
A.甲班五项评比得分的极差为1.7
B.甲班五项评比得分的平均数小于乙班五项评比得分的平均数
C.甲班五项评比得分的中位数大于乙班五项评比得分的中位数
D.甲班五项评比得分的方差小于乙班五项评比得分的方差
【答案】AC
【解答】解:对于A,甲班五项得分的极差为9.8﹣8.1=1.7,选项A正确,
对于B,计算甲班五项得分的平均数为x甲=15×(9.8+9.6+9+9.5+8.1)=9.2,
乙班五项得分的平均数为x乙=15×(9.8+9+9.5+9.2+8.5)=9.2,
所以甲班五项得分的平均数等于乙班五项得分的平均数,选项B错误,
对于C,甲班五项得分的中位数是9.5,乙班五项得分的中位数是9.2,
所以甲班五项得分的中位数大于乙班五项得分的中位数,选项C正确,
对于D,计算甲班五项得分的方差为s甲2=15×[0.62+0.42+(﹣0.2)2+0.32+(﹣1.1)2]=0.372,
乙班五项得分的方差为s乙2=15×[0.62+(﹣0.2)2+0.32+02+(﹣0.7)2]=0.196,
所以甲班五项得分的方差大于乙班五项得分的方差,选项D错误.
故选:AC.
(多选)28.在管理学研究中,有一种衡量个体领导力的模型,称为“五力模型”,即一个人的领导力由五种能力﹣﹣影响力、控制力、决断力、前瞻力和感召力构成.如图是某企业对两位领导人领导力的测评图,其中每项能力分为三个等级,“一般”记为4分、“较强”记为5分、“很强”记为6分,把分值称为能力指标,则下列判断正确的是( )
A.甲、乙的五项能力指标的均值相同
B.甲、乙的五项能力指标的方差相同
C.如果从控制力、决断力、前瞻力考虑,乙的领导力高于甲的领导力
D.如果从影响力、控制力、感召力考虑,甲的领导力高于乙的领导力
【答案】AB
【解答】解:甲的五项能力指标为6,5,4,5,4,平均值为6+5+4+5+45=4.8,
乙的五项能力指标为6,4,5,4,5,平均值为6+4+5+4+55=4.8,故选项A正确;
由于均值相同,各项指标数也相同(只是顺序不同),所以方差也相同,故选项B正确;
从控制力、决断力、前瞻力考虑,甲的均值为143,乙的均值为133,所以甲的领导力高于乙的领导力,故选项C不正确;
从影响力、控制力、感召力考虑,甲、乙的指标均值相同,方差也相同,所以甲、乙水平相当,故选项D不正确.
故选:AB.
▉八.平均数(共4小题)
29.已知互不相等的一组数x1,x2,x3,x4,x5,x6,x7,x8的平均数为x8,方差为s12,若x1,x2,x3,x4,x5,x6,x7的方差为s22,则( )
A.s12>s22
B.s12=s22
C.s12<s22
D.s12与s22的大小关系不确定
【答案】C
【解答】解:已知互不相等的一组数x1,x2,x3,x4,x5,x6,x7,x8的平均数为x8,方差为s12,
若x1,x2,x3,x4,x5,x6,x7的方差为s22,
即x1+x2+x3+x4+x5+x6+x7+x88=x8,
所以x1+x2+x3+x4+x5+x6+x7=7x8,则x1+x2+x3+x4+x5+x6+x77=x8,
所以数据x1,x2,x3,x4,x5,x6,x7的平均数是x8,
又s12=(x1−x8)2+(x2−x8)2+(x3−x8)2+(x4−x8)2+(x5−x8)2+(x6−x8)2+(x7−x8)2+(x8−x8)28=
(x1−x8)2+(x2−x8)2+(x3−x8)2+(x4−x8)2+(x5−x8)2+(x6−x8)2+(x7−x8)28,s22=(x1−x8)2+(x2−x8)2+(x3−x8)2+(x4−x8)2+(x5−x8)2+(x6−x8)2+(x7−x8)27,
s12与s22的分子相同,比较分母,可知s12<s22.
故选:C.
30.下列说法正确的是( )
A.数据1,8,3,5,6的第60百分位数是5
B.若一组样本数据4,6,7,8,9,a的平均数为7,则a=7
C.用分层随机抽样时,个体数最多的层里的个体被抽到的概率最大
D.若x1,x2,⋯,x10的标准差为4,则﹣2x1+3,﹣2x2+3,﹣2x3+3,…,﹣2x10+3的标准差是8
【答案】D
【解答】解:对于A,数据1,8,3,5,6从小到大为1,3,5,6,8,
5×0.6=3,
∴数据1,8,3,5,6的第60百分位数是 12(5+6)=5.5,故A错误;
对于B,一组样本数据4,6,7,8,9,a的平均数为7,
∴16(4+6+7+8+9+a)=7,
解得a=8,故B错误;
对于C,用分层随机抽样时,个体数最多的层里的个体被抽到的概率与其它层里的个体被抽到的概率相等,故C错误;
对于D,若x1,x2,⋯,x10的标准差为4,
则﹣2x1+3,﹣2x2+3,﹣2x3+3,…,﹣2x10+3的标准差是 (−2)2×42=8,故D正确.
故选:D.
31.若数据x1,x2,⋯,x10的平均数为3,方差为4,则下列说法错误的是( )
A.数据4x1+1,4x2+1,⋯,4x10+1的平均数为13
B.数据3x1,3x2,⋯,3x10的方差为12
C.i=110 xi=30
D.i=110 xi2=130
【答案】B
【解答】解:依题意,110i=110 xi=3,110i=110(xi−3)2=4,
对于A,110i=110(4xi+1)=4×3+1=13,故A正确;
对于B,依题意,110i=1103xi=110(3i=110 xi)=3×3=9,
所以数据3x1,3x2,⋯,3x10的方差为110i=110(3xi−9)2=110i=1109(xi−3)2=9×4=36,故B错误;
对于C,i=110 xi=30,故C正确;
对于D,由110i=110(xi−3)2=110i=110(xi2−6xi+9)=110(i=110 xi2−6i=110 xi+90)=110(i=110 xi2−90)=4,
解得i=110 xi2=130,故D正确.
故选:B.
32.一组单调递增数据x1,x2,…,xn的平均数、极差、中位数、方差依次为x,Δx,m,s12,构造一组新的数据y1,y2,…,yn,其中yi=3xi﹣1(i=1,2,⋯,n),新数据的平均数、极差、中位数、方差依次为y,Δy,n,s22,则下列结论中不正确的是( )
A.若x=y,则x=0B.Δy=3Δx
C.若m+n=3,则n=2D.若s1+s2=4,则s1=1
【答案】A
【解答】解:根据题意,依次分析选项:
对于A:因为yi=3xi﹣1(i=1,2,⋯,n),所以y=3x−1,若x=y,即x=3x−1,解可得x=12,故A错误;
对于B:因为数据x1,x2,…,xn单调递增,所以数据y1,y2,…,yn也单调递增,
所以极差Δx=xn﹣x1,Δy=yn﹣y1=3xn﹣1﹣(3x1﹣1)=3(xn﹣x1)=3Δx,故B正确;
对于C:由A知n=3m﹣1,因为m+n=3,所以n=2,故C正确;
对于D:因为yi=3xi﹣1(i=1,2,⋯,n),所以s22=9s12,即s2=3s1,
因为s1+s2=4,所以s1=1,故D正确.
故选:A.
▉九.中位数(共5小题)
33.某中学举办迎国庆歌咏比赛,邀请了七位评委,对一个选手打分后,得到一组互不相等的数据x1,x2,x3,x4,x5,x6,x7,去掉其中最高分与最低分得到的数据与原始数据一定相同的是( )
A.平均分B.极差C.标准差D.中位数
【答案】D
【解答】解:对于选项A:由题意若7个数据为1,2,3,5,6,7,8,可得原平均分为1+2+3+5+6+7+87=327,
去掉最高和最低分后平均分为2+3+5+6+75=235,
∵327≠235,∴平均分不一定相同,故选项A错误;
对于选项B:由题意若7个数据为1,2,3,5,6,7,8,可得原极差为8﹣1=7,
去掉最高和最低分后为2,3,5,6,7,极差为7﹣2=5,
∵7≠5,∴极差不一定相同,故选项B错误;
对于选项C:由题意若7个数据为1,2,3,4,5,6,7,可得原数据平均数为x1=1+2+3+4+5+6+77=4,
标准差为s1=(1−4)2+(2−4)2+(3−4)2+(4−4)2+(5−4)2+(6−4)2+(7−4)27=4=2,
去掉最高和最低分后平均数为x2=2+3+4+5+65=4,
标准差为s2=(2−4)2+(3−4)2+(4−4)2+(5−4)2+(6−4)25=2,
∴标准差不一定相同,故选项C错误;
对于选项D:由题意可设x1<x2<x3<x4<x5<x6<x7,可得原始数据的中位数为x4,
去掉最高和最低分后可得x2,x3,x4,x5,x6的中位数也为x4,
∴去掉其中最高分与最低分得到的数据与原始数据一定相同的是中位数,故选项D正确.
故选:D.
34.已知一组样本数据为“2,2,3,5,6,7,8”,该样本数据的中位数是( )
A.6B.5C.3D.2
【答案】B
【解答】解:由中位数定义可知,从小到大,选择第4个数为作为中位数,即5.
故选:B.
35.已知两组数据x1,x2,x3和y1,y2,y3,的中位数、方差均相同,则两组数据合并为一组数据后( )
A.中位数一定不变,方差可能变大
B.中位数一定不变,方差可能变小
C.中位数可能改变,方差可能变大
D.中位数可能改变,方差可能变小
【答案】A
【解答】解:不妨设x1≤x2≤x3,y1≤y2≤y3,
由两组数据x1,x2,x3和y1,y2,y3,的中位数、方差均相同,
得x2=y2,两组数据合并为一组数据后,则中位数为x2+y22=x2=y2,
故中位数不变,则C、D错误;
这两组数据的平均数分别为x,y,方差均为s12,
x=13i=13 xi,y=13i=13 yi,
s12=13i=13 (xi2−3x2)=13i=13 (yi2−3y2),可得i=13 xi=3x,i=13 yi=3y,
i=13 xi2=3(s12+x2),i=13 yi2=3(s12+y2),
则两组数据合并为一组数据后的平均数z=16(3x+3y)=x+y2,
方程s2=16[i=13 (xi−z)2+(yi−z)2]=16(i=13 xi2+i=13 yi2−6z2)
16[3(s12+x2)+3(s12+y2)−6z2]=s12+x2+y22−z2
=s12+x2+y22−(x+y2)2=s12+(x−y)24≥s12,
当且仅当x=y时等号成立,即方差可能变大,不会变小,故A正确,B错误.
故选:A.
36.200辆汽车通过某一段公路时的时速的频率分布直方图如图所示,则时速的中位数的估计值分别为 62.5 .
【答案】62.5.
【解答】解:根据题意以及频率直方图,
前三个矩形的面积为(0.01+0.03+0.04)×10=0.8>0.5,
前两个矩形的面积为(0.01+0.03)×10=0.4<0.5,
所以中位数在区间(60,70),设中位数为x,
由题得0.4+(x﹣60)×0.04=0.5,解之得x=62.5.
∴中位数的估计值为62.5.
故答案为:62.5.
37.在一次人才招聘会上,有一家公司的招聘员告诉你,“我们公司的收入水平很高”“去年,在50名员工中,最高年收入达到了200万,员工年收入的平均数是10万”,而你的预期是获得9万元年薪.下列判断中,正确的判断的个数是 3 个.
(1)年薪为9万元的员工在这家公司算高收入者;
(2)如果招聘员继续告诉你,“员工年收入的变化范围是从3万到200万”,那么这个信息能使你作出自己是否受聘的决定;
(3)如果招聘员继续给你提供了如下信息,员工收入的第一四分位数为4.5万,第三四分位数为9.5万,则这条信息能使你作出自己是否受聘的决定;
(4)根据(3)中招聘员提供的信息,估计平均数比中位数高.
【答案】3.
【解答】解:对于(1),因为平均收入和最高收入相差太大,说明高收入的员工占极少数,
现在已经知道至少有一个人的年收入为200万元,那么其他员工的年收入之和为10×50﹣200=300万元,
所以每人平均收入约6.12万元,
如果再有几个收入特别高的,那么公司其它的员工的收入将会更低,
所以能认为年薪为9万元的员工在这家公司算高收入者,故(1)正确;
对于(2),不能作出是否受聘的决定,要看中位数是多少,故(2)不正确;
对于(3),可以确定有75%的员工年收入在4.5万元以上,其中25%的员工年收入在9.5万元以上,故(3)正确;
对于(4),收入的中位数大约是7万元,因为受年收入200万元这个极端值的影响,所以平均数比中位数高很多,故(4)正确,
所以正确的判断的个数是3个.
故答案为:3.
▉十.众数(共5小题)
38.某校举行“勇士杯”学生篮球比赛,统计高一年级部分班级的得分数据如下:
则下列说法正确的是( )
A.得分的众数为34
B.得分的中位数为28
C.得分的75%分位数为33
D.得分的极差为6
【答案】C
【解答】解:根据表格中数据可知,出现次数最多的是28,所以得分的众数为28,即A错误;
将8个数据从小到大排列为26,28,28,28,30,32,34,34,
所以中位数为 28+302=29,可知B错误;
易知75%×8=6为整数,
所以第75%分位数为第6个和第7个数的平均值 32+342=33,即C正确;
得分的极差为34﹣26=8,即D错误.
故选:C.
39.某校运动会,一位射击运动员10次射击射中的环数依次为:7,7,10,9,7,6,9,10,7,8.则下列说法错误的是( )
A.这组数据的平均数为8
B.这组数据的众数为7
C.这组数据的极差为4
D.这组数据的第80百分位数为9
【答案】D
【解答】解:根据题意,依次分析选项:
对于A,该组数据的平均数x=110(7+7+10+9+7+6+9+10+7+8)=8,A正确;
对于B,数据的众数为7,B正确;
对于C,数据的极差为10﹣6=4,C正确;
对于D,数据从小到大排列为6,7,7,7,7,8,9,9,10,10,则这组数据的第80百分位数为12(9+10)=9.5,D错误.
故选:D.
40.已知一组数据按从小到大的顺序排列为﹣1,0,4,x,6,15,且这组数据的中位数是5,那么这组数据的众数是( )
A.5B.6C.4D.5.5
【答案】B
【解答】解:∵数据﹣1,0,4,x,6,15的中位数是5,
∴4+x2=5,
∴x=6,
∴这组数据中只有6出现两次,
∴众数是6;
故选:B.
(多选)41.从参加环保知识竞赛的学生中抽出60名学生,将其成绩(均为整数)整理后画出的频率直方图如图所示,则( )
A.估计[79.5,89.5)这一组的频数是15
B.估计这组数据的众数是74.5
C.估计该次环保知识竞赛的平均成绩是72.5
D.估计这组数据的中位数是72.8
【答案】ABD
【解答】解:对于A,频率=(89.5﹣79.5)×0.025=0.25;频数=60×0.25=15,A正确;
对于B,[69.5,79.5)一组的频率最大,人数最多,则众数为69.5+79.52=74.5,B正确;
对于C,平均分为:44.5×0.1+54.5×0.15+64.5×0.15+74.5×0.3+84.5×0.25+94.5×0.05=70.5,C错误;
对于D,前3组的频率之和为0.4,前4组的频率之和为0.7,
所以中位数在区间[69.5,79.5)内,
设中位数为x,
∴(x﹣69.5)×0.03=0.1,
∴x≈72.8,
所以中位数为72.8,D正确.
故选:ABD.
42.一组数据:1,2,3,4,5,5,5,6,6,7,8,9,9,10的众数为a,上四分位数为b,则a+b= 13 .
【答案】13.
【解答】解:因为这组数据的众数为5,故a=5,
因为数据个数为14,且14×34=10.5,
所以这组数据的上四分位数是第11个数,故b=8.
所以a+b=13.
故答案为:13.
▉十一.标准差(共4小题)
43.已知在R软件的控制台中,输入“sample(1:20,4,replace=F)”,按回车键,得到的4个1~20范围内的不重复的整数随机数为12,6,10,4,则这4个整数的标准差为( )
A.210B.10C.40D.10
【答案】B
【解答】解:数据的平均数为12+6+10+44=8,
这4个数据的方差为14[(12−8)2+(6−8)2+(10−8)2+(4−8)2]=10,其标准差为10.
故选:B.
44.已知一组数据x1,x2,x3,…,x10的标准差为2,将这组数据x1,x2,x3,…,x10中的每个数先同时减去2,再同时乘以3,得到一组新数据,则这组新数据的标准差为( )
A.2B.4C.6D.32
【答案】C
【解答】解:因为数据x1,x2,x3,…,x10的标准差为2,所以方差为4,
由题意知,得到的新数据为3x1﹣6,3x2﹣6,3x3﹣6,…,3x10﹣6,
这组新数据的方差为4×32=36,标准差为6.
故选:C.
(多选)45.下列说法正确的是( )
A.一组样本数据的方差s2=120[(x1−3)2+(x2−3)2+⋯+(x20−3)2],则这组样本数据的总和为60
B.数据13,27,24,12,14,30,15,17,19,23的第70百分位数是23
C.若一个样本容量为8的样本的平均数是5,方差为2,现样本中又加人一个新数据5,此时样本的平均数不变,方差变大
D.若样本数据x1,x2,⋯,x10的方差为8,则数据2x1﹣1,2x2﹣1,⋯,2x10﹣1的标准差为42
【答案】AD
【解答】解:对于A,∵s2=120[(x1−3)2+(x2−3)2+⋯+(x20−3)2],
∴s2=120[x12−6x1+9+x22−6x2+9+⋯+x202−6x20+9]
=120[x12+x22+⋯+x202−6(x1+x2+⋯+x20)+9×20]
=120[x12+x22+⋯+x202]−6x+9,
又s2=120[(x1−x)2+(x2−x)2+⋯+(x20−x)2]
=120[x12−2x1⋅x+x2+x22−2x2⋅x+x2+⋯+x202−2x20⋅x+x2]
=120[x12+x22+⋯+x202]−2x2+x2=120[x12+x22+⋯+x202]−x2,
∴−x2=−6x+9,∴(x−3)2=0,∴该组数据的平均数是3,
这组样本数据的总和为3×20=60,
∴一组样本数据的方差s2=120[(x1−3)2+(x2−3)2+⋯+(x20−3)2],
则这组样本数据的总和为60故A正确;
对于B,数据13,27,24,12,14,30,15,17,19,23共10个数,
从小到大排列为12,13,14,15,17,19,23,24,27,30,由于10×0.7=7,
故选择第7和第8个数的平均数作为第70百分位数,即23+242=23.5,
∴数据13,27,24,12,14,30,15,17,19,23的第70百分位数是23.5,故B错误;
对于C,某8个数的平均数为5,方差为2,现又加入一个新数据5,
设此时这9个数的平均数为x,方差为S2,
则x=8×5+59=5,S2=8×2+(5−5)29=169<2,
∴样本中又加人一个新数据5,此时样本的平均数不变,方差变小,故C错误;
对于D,样本数据x1,x2,…,x10的方差为8,
∴数据2x1﹣1,2x2﹣1,…,2x10﹣1的标准差为22×8=42,故D正确.
故选:AD.
46.若样本数据x1,x2,…,x10的标准差为10,则数据3x1﹣1,3x2﹣1,…,3x10﹣1的方差为 900 .
【答案】900.
【解答】解:设x1,x2,…,x10的平均数为x,标准差为s,
则s=110[(x1−x)2+(x2−x)2+⋯+(x10−x)2]=10,
设3x1﹣1,3x2﹣1,…,3x10﹣1的平均数为x′,标准差为s',
则有x′=(3x1−1)+(3x2−1)+⋯+(3x10−1)10
=3(x1+x2+⋯x10)−1010=3×x1+x2+⋯x1010−1=3x−1,
所以s′=110{[(3x1−1)−(3x−1)]2+[(3x2−1)−(3x−1)]2+⋯+[(3x10−1)−(3x−1)]2}
=110[(3x1−3x)2+(3x2−3x)2+⋯+(3x10−3x)2]
=910[(x1−x)2+(x2−x)2+⋯+(x10−x)2]
=3110[(x1−x)2+(x2−x)2+⋯+(x10−x)2]
=3s=30,
所以s'2=900.
故答案为:900.
▉十二.方差(共4小题)
47.已知样本容量为5的样本平均数为3,方差为185,将数据9加入原样本得到样本容量为6的新样本,若新样本的平均数为x,方差为s2,则( )
A.x=4,s2=6B.x=4,s2=8C.x=6,s2=4D.x=8,s2=4
【答案】B
【解答】解:设原样本为x1,x2,x3,x4,x5,则i=15 xi=5×3=15,
所以15i=15 (xi−3)2=185,可得i=15 xi2=63.
所以x=5×3+96=4,
所以s2=16[i=15 (xi−4)2+(9−4)2]
=16(i=15 xi2−8×5×3+16×5+25)
=16(63−120+80+25)=486=8.
故选:B.
48.已知x1,x2,…,xn的方差为3,则2x1+1,2x2+1,…,2xn+1的方差为( )
A.6B.7C.12D.18
【答案】C
【解答】解:由已知方差为3,
得2x1+1,2x2+1,…,2xn+1的方差为22×3=12.
故选:C.
49.经过简单随机抽样获得的样本数据为x1,x2,…,xn,且数据x1,x2,…,xn的平均数为x,方差为s2,则下列说法正确的是( )
A.若s2=0,则所有的数据xi(i=1,2,…,n)都为0
B.若x=3,则yi=2xi+1(i=1,2,…,n)的平均数为6
C.若s2=3,则yi=2xi+1(i=1,2,…,n)的方差为12
D.若该组数据的25%分位数为90,则可以估计总体中至少有75%的数据不大于90
【答案】C
【解答】解:方差s2=0时,说明所有的数据x1,x2,…,xn都相等,但不一定为0,故A错误;
数据x1,x2,…,xn的平均数x=3,数据yi=2xi+1(i=1,2,…,n)的平均数为2×3+1=7,故B错误;
数据x1,x2,…,xn的方差为s2=3,数据yi=2xi+1(i=1,2,…,n)的方差为22×3=12,故C正确;
数据x1,x2,…,xn的25%分位数为90,则可以估计总体中有至少有75%的数据大于或等于90,故D错误.
故选:C.
50.已知一组数据4,2a,3﹣a,5,6的平均数为4,则a的值是 2 ,这一组数据的方差是 145 .
【答案】2;145.
【解答】解:由题意得,4+2a+3−a+5+65=4,可得a=2,
则这组数据为4,4,1,5,6,
∴s2=15×[2×(4﹣4)2+(1﹣4)2+(5﹣4)2+(6﹣4)2]=145.
故答案为:2;145.
▉十三.极差(共4小题)
51.已知一组样本数据8,11,9,7,a,5的极差为6,则a的取值范围是( )
A.[5,11]B.{5,11}C.{5}D.[6,17]
【答案】A
【解答】解:因为数据的极差为6,而11﹣5=6,
所以所以5≤a≤11,
即a的取值范围是[5,11].
故选:A.
(多选)52.气象台预报嘉兴市5月份气候适宜,温度波动幅度较小,比较适合户外运动,其中2024年5月9日至5月15日7天内的当日最高温度(单位℃)分别为:24,28,23,25,26,26,29,则以下说法正确的是( )
A.该组数据的极差为6
B.该组数据的众数为26
C.该组数据的中位数为25.5
D.该组数据的第70百分位数为26
【答案】ABD
【解答】解:将这组数据按照从小到大的顺排列得23,24,25,26,26,28,29,
则该组数据的极差为29﹣23=6,故A正确;
该组数据的众数为26,故B正确;
该组数据的中位数为26,故C错误;
因为70%×7=4.9,所以该组数据的第70百分位数为第5个数据,即26,故D正确.
故选:ABD.
53.为了解夏季高温天气的变化情况,某气象部门记录了某地区连续10天的日平均气温(单位:℃),其数据分别为30,32,29,34,31,36,33,38,35,37,则该地区这10天日平均气温的极差是 9 ℃.
【答案】9.
【解答】解:某气象部门记录了某地区连续10天的日平均气温(单位:℃),
其数据分别为30,32,29,34,31,36,33,38,35,37,
∴该地区这10天日平均气温的极差是38﹣29=9℃.
故答案为:9.
54.某校为了普及“一带一路“知识,举行了一次知识竞赛,满分10分,有10名同学代表班级参加比赛,已知学生得分均为整数,比赛结束后统计这10名同学得分情况如折线图所示,则这10名同学成绩的极差为 7 ,80%分位数是 8.5 .
【答案】7;8.5
【解答】解:由题意知,
数据3,6,6,6,6,6,7,8,9,10的极差是10﹣3=7;
所以数据3,6,6,6,6,6,7,8,9,10的80%分位数是8+92=8.5.
故答案为:7,8.5.
▉十四.百分位数(共6小题)
55.制造业采购经理指数(PMI)是衡量制造业经济运行状况的重要指标.现将2024年10月至2025年10月的制造业PMI指数从小到大排列为49.0,49.0,49.1,49.3,49.4,49.5,49.7,49.8,50.1,50.1,50.2,50.3,50.5,则这组数据的第90百分位数为( )
A.50.2B.50.3C.50.4D.50.5
【答案】B
【解答】解:由题意可知,数据从小到大排列为49.0,49.0,49.1,49.3,49.4,49.5,49.7,49.8,50.1,50.1,50.2,50.3,50.5,
因为13×90%=11.7,
所以该组数据的第90百分位数是第12个数据50.3.
故选:B.
56.树人中学举行主题为“弘扬传统文化,传承中华美德”的演讲比赛,现随机抽选10名参赛选手,获得他们出场顺序的数据,将这组数据从小到大排序为3,5,6,8,m,14,15,16,17,18,若该组数据的中位数是极差的45,则该组数据的第40百分位数是( )
A.9B.10C.11D.12
【答案】A
【解答】解:根据题意可得m+142=45×(18−3),解得m=10,
又10×0.4=4,
∴该组数据的第40百分位数是8+m2=8+102=9.
故选:A.
57.某中学共有3000名学生,该校从全校学生中随机抽取200名,统计他们2024年阅读的书籍数量,由此来估计该校学生当年阅读书籍数量的情况,下列关于估计中正确的是( )
A.阅读量的众数估值为8
B.阅读量的中位数估值为6.5
C.阅读量的平均数估值为6.76
D.第70百分位数为8.86
【答案】D
【解答】解:对于A,众数估值为4+82=6,故A错误;
对于B,设中位数为x,则x在[4,8]内,所以0.06×4+0.1×(x﹣4)=0.5,解得x=6.6,故B错误;
对于C,平均数x=0.24×2+0.4×6+0.28×10+0.06×14+0.02×18=6.88,故C错误;
对于D,第70百分位数y在[8,12]内,所以0.06×4+0.1×4+0.07×(x﹣8)=0.7,解得y=627≈8.86,故D正确.
故选:D.
58.已知跳水比赛中运动员五轮的成绩互不相等,记为xi(i=1,2,3,4,5),平均数为x,随机删去其任一轮的成绩,得到一组新数据,记为yi(i=1,2,3,4),平均数为y,对新数据和原数据,下面说法正确的是( )
A.两组数据的极差不可能相等
B.两组数据的中位数不可能相等
C.若x=y,则两组数据的方差不可能相等
D.若x=y,两组数据的第60百分位数可能相等
【答案】C
【解答】解:跳水比赛中运动员五轮的成绩互不相等,记为xi(i=1,2,3,4,5),平均数为x,
随机删去其任一轮的成绩,得到一组新数据,记为yi(i=1,2,3,4),平均数为y,
对于A,若随机删去任一轮的成绩,恰好不是最高成绩和最低成绩,
此时新数据的极差等于原数据的极差,故A错误;
对于B,不妨设x1<x2<x3<x4<x5,
当12(x2+x4)=x3时,若随机删去的成绩是x3,
此时新数据的中位数等于原数据的中位数,故B错误;
对于C,若x=y,即删去的数据恰为平均数,
根据方差的计算公式,分子不变,分母变小,此时方差会变大,故C正确;
对于D,在按从小到大的顺序排列的5个数据中5×60%=3,
此时原数据的60%分位数为第三个数和第四个数的平均数,即x3+x42,
删去一个数据后的4个数据,按从小到大的顺序排列,可得4×60%=2.4,
此时新数据的60%分位数为第三个数,即x3或x4,
若x3<x4,则x3<x3+x42<x4,
∴新数据的60%分位数不等于原数据的60%分位数,故D错误.
故选:C.
59.2025年春节档上映的动画电影《哪吒之魔童闹海》引发全民观影热潮.某数据平台实时统计了该片上映前10天的全国单日票房(单位:亿元),并生成如图所示的折线图.假设横轴为上映时间(日期),纵轴为单日票房(亿),则下列说法正确的是( )
A.前十日之后,随着上映时间的增加,单日票房一定会呈现下降趋势
B.上映前十天的票房极差为4.76(亿)
C.上映前十天的票房中位数为6.34(亿)
D.上映前十天的票房第70百分位数为7.30(亿)
【答案】C
【解答】解:前十日之后,随着上映时间的增加,单日票房不一定会呈现下降趋势,故A错误;
上映前10天的数据从小到大排序:4.76,4.87,5.44,5.88,6.15,6.53,7.3,8.14,8.44,8.69,共10个,
极差为8.69﹣4.76=3.93,故B错误;
中位数为6.15+6.532=6.34,故C正确;
上映前十天的票房第70百分位数为7.3+8.142=7.72,故D错误.
故选:C.
60.为备战运动会,射击队的甲、乙两位射击运动员开展了队内对抗赛.在对抗赛中两人各射靶10次,每次命中的成绩(环数)如下:
(1)求甲运动员的样本数据第85百分位数;
(2)分别计算这两位运动员射击成绩的平均数和方差;
(3)射击队教练希望利用此次射击成绩为依据,挑选一名运动员参加运动会,请你帮助教练分析两个运动员的成绩,作出判断并说明理由.
注:一组数据x1,x2,⋯,xn的平均数为x,它的方差为s2=1n[(x1−x)2+(x2−x)2+⋯+(xn−x)2]
【答案】(1)10;
(2)x甲=7,x乙=7,S甲2=4.6,S乙2=1.2;
(3)挑选乙参加比赛,理由见解析.
【解答】解:(1)根据题意,把甲的数据按从小到大排列如下:4,4,5,6,7,7,8,9,10,10,
因为85%×10=8.5,
则第9个数据是第85百分位数,故第85百分位数为10.
(2)根据题意,x甲=110(4+4+5+6+7+7+8+9+10+10)=7,
x乙=110(5+6+6+7+7+7+7+8+8+9)=7,
S甲2=110[(7−7)2×2+(8−7)2+(6−7)2+(10−7)2×2+(5−7)2+(4−7)2×2+(9−7)2]=4.6,
S乙2=110[(5−7)2+(6−7)2×2+(7−7)2×4+(8−7)2×2+(9−7)2]=1.2,
(3)由(2)知,s甲2>s乙2,x甲=x乙,
即两名运动员射击成绩的平均数相同,且s甲2>s乙2,则乙的成绩比甲稳定;应该选乙参加比赛.条形图
折线图
扇形图
特
点
一般地,条形图中,一条轴上显示的是所关注的数据类型,另一条轴上对应的是数量、个数或者比例,条形图中每一长方形都是等宽的.
用一个单位长度表示一定的数量,用折线的起伏表示数量的增减变化.
用整个圆表示总体,扇形图中,每一个扇形的圆心角以及弧长,都与这一部分表示的数据大小成正比.
作用及选用情景
能清楚地表示每个项目的具体数量,便于相互比较大小.
能清楚地看出数量增减变化的情况及各部分数量的多少.常用来表示随时间变化的数据,当然,也可以用在其他合适的情形中.
可以形象地表示出各部分数据在全部数据中所占的比例情况.
图例
名称
概念
平
均
数
如果有n个数x1,x2,…,xn,那么就是这组数据的平均数,用表示,即.
中
位
数
将一组数据按从小到大或从大到小的顺序排列,处在最中间的一个数据(当数据个数是奇数时)或最中间两个数据的平均数(当数据个数是偶数时)称为这组数据的中位数.
众
数
一组数据中出现次数最多的数据(即频数最大值所对应的样本数据)称为这组数据的众数.
组号
分组
频率
1
[168,172)
a
2
[172,176)
2a
3
[176,180)
3a
4
[180,184)
0.135
5
[184,188]
0.055
合计
1
分数
50~60
60~70
70~80
80~90
90~100
人数
2
6
10
20
12
分组
频数
频率
[50,60)
2
0.04
[60,70)
6
0.12
[70,80)
10
0.20
[80,90)
20
0.40
[90,100]
12
0.24
合 计
50
1.00
寿命(h)
100~200
200~300
300~400
400~500
500~600
个 数
20
30
80
40
30
范围
100~200
200~300
300~400
400~500
500~600
频率
0.1
0.15
0.4
0.2
0.15
分组
频数
频率
[40,50)
4
0.04
[50,60)
0.12
[60,70)
38
[70,80)
0.31
[80,90)
[90,100]
0.01
分组
频数
频率
[40,50)
4
0.04
[50,60)
12
0.12
[60,70)
38
0.38
[70,80)
31
0.31
[80,90)
14
0.14
[90,100)
l
0.01
分组
频数
频率
[40,50)
2
0.04
[50,60)
3
0.06
[60,70)
14
0.28
[70,80)
15
0.30
[80,90)
A
B
[90,100]
4
0.08
合计
C
D
序号
分组(分数段)
频数(人数)
频率
1
[0,60)
a
0.1
2
[60,75)
15
0.3
3
[75,90)
20
b
4
[90,100]
c
d
合计
50
1
分组
频数
频率
[50,60)
5
0.1
[60,70)
10
0.2
[70,80)
15
0.3
[80,90)
15
0.3
[90,100)
5
0.1
合计
50
1
分组
频数
频率
[50,60)
5
0.1
[60,70)
10
0.2
[70,80)
15
0.3
[80,90)
15
0.3
[90,100)
5
0.1
合计
50
1
成绩分组
频数
频率
[40,50)
2
0.04
[50,60)
3
0.06
[60,70)
10
0.2
[70,80)
15
0.3
[80,90)
12
0.24
[90,100)
8
0.16
分组
频数
频率
累积频率
[107,109)
3
0.03
0.03
[109,111)
9
0.09
0.12
[111,113)
13
0.13
0.25
[113,115)
16
0.16
0.41
[115,117)
26
0.26
0.67
[117,119)
20
0.20
0.87
[119,121)
7
0.07
0.94
[121,123)
4
0.04
0.98
[123,125]
2
0.02
1.00
合计
100
1.00
分组
频数
频率
[10,15)
10
0.20
[15,20)
24
n
[20,25)
14
0.28
[25,30]
m
p
合计
N
1
班级
1
2
3
4
5
6
7
8
得分
28
34
34
30
26
28
28
32
甲
4
7
6
5
4
9
10
7
8
10
乙
7
5
8
6
7
9
7
6
7
8
相关学案
这是一份高中人教A版 (2019)用样本估计总体精品学案,文件包含92用样本估计总体2025-2026高中数学必修二高一下同步复习讲义原卷版docx、92用样本估计总体2025-2026高中数学必修二高一下同步复习讲义解析版docx等2份学案配套教学资源,其中学案共70页, 欢迎下载使用。
这是一份高中数学人教A版 (2019)必修 第二册随机抽样优秀导学案及答案,文件包含91随机抽样2025-2026高中数学必修二高一下同步复习讲义原卷版docx、91随机抽样2025-2026高中数学必修二高一下同步复习讲义解析版docx等2份学案配套教学资源,其中学案共46页, 欢迎下载使用。
这是一份高中数学人教A版 (2019)必修 第二册第九章 统计9.2 用样本估计总体导学案及答案,共22页。
相关学案 更多
- 1.电子资料成功下载后不支持退换,如发现资料有内容错误问题请联系客服,如若属实,我们会补偿您的损失
- 2.压缩包下载后请先用软件解压,再使用对应软件打开;软件版本较低时请及时更新
- 3.资料下载成功后可在60天以内免费重复下载
免费领取教师福利