







还剩52页未读,
继续阅读
所属成套资源:高中数学人教A版(2019)必修第二册优秀课件多份
成套系列资料,整套一键下载
人教A版2019必修第二册复习课第4课时统计优秀课件
展开
这是一份人教A版2019必修第二册复习课第4课时统计优秀课件,共60页。
第4课时 统计知识梳理·构建体系专题归纳·核心突破 知识梳理·构建体系知识网络要点梳理1.总体、个体、变量、样本、样本量的含义是什么?请完成下表:2.简单随机抽样的方法有哪些?具体操作过程是什么?请完成下表:5.第p百分位数的定义及计算步骤是什么?(1)定义:一般地,一组数据的第p百分位数是这样一个值,它使得这组数据中至少有 p% 的数据小于或等于这个值,且至少有(100-p)%的数据大于或等于这个值.(2)计算第p百分位数的步骤:第1步,按从小到大排列原始数据.第2步,计算i= n×p% .第3步,若i不是整数,而大于i的比邻整数为j,则第p百分位数为第j项数据;若i是整数,则第p百分位数为第i项与第(i+1)项数据的平均数.(3)四分位数:常用的分位数有第25百分位数,第50百分位数,第75百分位数.这三个分位数把一组由小到大排列后的数据分成四等份,因此称为四分位数.其中第25百分位数也称为第一四分位数或下四分位数等,第75百分位数也称为第三四分位数或上四分位数等.6.刻画总体集中趋势的常用统计量有哪些?它们各自的特征是什么?请完成下表:7.刻画总体离散程度的参数有哪些?它们各自的特征是什么?请完成下表:【思考辨析】 判断下列说法是否正确,正确的在后面的括号内画“√”,错误的画“×”.(1)检测一批种子的发芽率,可以用全面调查.( × )(2)用简单随机抽样抽取样本时,一般都得先对所有个体编号.( √ )(3)在简单随机抽样中,我们常用样本平均数去估计总体平均数.( √ )(4)分层随机抽样都是分两层.( × )(5)在比例分配的分层随机抽样中,我们可以用样本平均数估计总体平均数.( √ )(6)通过频率分布表和频率分布直方图,可以知道数据落在各个小组的比例大小.( √ )(7)频率分布直方图中分组越多,越容易看出总体数据的分布特点.( × )(8)若一组数据有60个数,则第60百分位数是36个数.( × )(9)对一个单峰的频率分布直方图,如果直方图在右边“拖尾”,那么平均数大于中位数.( √ )(10)方差刻画数据的集中趋势,平均数刻画数据的离散程度.( × )专题归纳·核心突破专题一 随机抽样【例1】 某单位有2 000名职工,在管理、技术开发、营销、生产各部门中,职工年龄分布如下表所示.(1)若要抽取40人调查身体状况,则应怎样抽样?(2)若要召开一个25人的讨论单位发展和薪金调整方面的座谈会,则应怎样抽选出席人?(3)若要抽取20人进行关于北京2022年冬奥会的调查问卷,则应怎样抽样?分析:(1)身体状况与年龄有关,考虑分层随机抽样;(2)座谈会与各部门有关,考虑分层随机抽样;(3)冬奥会是大众体育盛会,调查一个单位人员对其情况的了解,可用简单随机抽样.(3)用随机数法:对该单位全部2 000名职工随机编号,号码是1,2,3,…,2 000.利用随机数工具产生20个1~2 000范围内的不同的整数随机数,把产生的随机数作为抽中的编号,与编号对应的20名职工就是要抽取的样本.专题二 总体取值规律与百分位数的估计【例2】 某中学高一女生共有450人,为了解高一女生的身高情况,随机抽取部分高一女生测量身高(单位:cm),所得数据整理后列出频率分布表如右.(1)求出表中字母m,n,M,N所对应的数值;(2)画出频率分布直方图;(3)估计该校高一女生身高在149.5~165.5 cm范围内有多少人?(4)估计该校高一女生身高的第80百分位数.分析:(1)利用频率分布表的特征求出m,n,M,N;(2)根据画频率分布直方图的步骤画出频率分布直方图;(3)利用样本所占的比例估计总体的分布;(4)利用样本的百分位数估计总体的百分位数.数据落在165.5~169.5范围内的频数m=50-(8+6+14+10+8)=4,频率为n=0.08,总频率N=1.00.(2)频率分布直方图如下:【变式训练2】 某校高三年级有500名学生,为了了解数学学科的学习情况,现从中随机抽取若干名学生在一次测试中的数学成绩(满分为150分),制成如右频率分布表:(1)表格中①②③④处的数值分别为 、 、 、 ; (2)在图中画出样本数据的频率分布直方图;(3)根据题中信息估计总体数学成绩的60%分位数.(2)频率分布直方图如图所示. 专题三 总体集中趋势与离散程度的估计【例3】 甲、乙两名运动员在相同的条件下各射靶10次,每次射靶成绩(单位:环)如图所示.分析:由上图可知甲、乙射靶10次命中的环数,根据中位数、平均数、方差的定义及计算公式可分别求得甲、乙两人的中位数、平均数及方差,通过比较它们的大小,可以分析出甲、乙两人成绩的偏离程度、集中趋势、成绩的好坏及有无潜力等问题.甲的射靶环数按从小到大的顺序排列为5,6,6,7,7,7,7,8,8,9,所以中位数为7.于是填充后的表格如下表所示.【变式训练3】 从高三年级抽出50名学生参加数学竞赛,由成绩得到频率分布直方图如图所示. 由于一些数据丢失,试利用频率分布直方图估计:(1)这50名学生成绩的众数与中位数;(2)这50名学生的平均成绩.(2)取每个小矩形底边中点的横坐标乘以小矩形的面积,求和为45×(0.004×10)+55×(0.006×10)+65×(0.02×10)+75×(0.03×10)+85×(0.024×10)+95×(0.016×10)=76.2.故估计这50名学生的平均成绩为76.2分.设中位数在第四个小矩形内的底边长为x,高为0.03,则0.03x=0.2得x≈6.7,故中位数约为70+6.7=76.7.(2)样本平均值应是频率分布直方图的“重心”,即所有数据的平均值,取每个小矩形底边的中点值乘以每个小矩形的面积,求和即可.因此平均成绩为45×(0.004×10)+55×(0.006×10)+65×(0.02×10)+75×(0.03×10)+85×(0.021×10)+95×(0.016×10)≈74.考点一 总体取值规律与百分位数的估计1.(2020·天津高考)从一批零件中抽取80个,测量其直径(单位:mm),将所得数据分为9组:[5.31,5.33),[5.33,5.35),…, [5.45,5.47),[5.47,5.49],并整理得到如下频率分布直方图,则在被抽取的零件中,直径落在区间[5.43,5.47)内的个数为( ) A.10 B.18C.20 D.36解析:∵在区间[5.43,5.47]的频率为(6.25+5.00)×0.02=0.225,∴0.225×80=18.故选B.答案:B2.(2019·全国Ⅲ高考)《西游记》《三国演义》《水浒传》和《红楼梦》是中国古典文学瑰宝,并称为中国古典小说四大名著.某中学为了解本校学生阅读四大名著的情况,随机调查了100位学生,其中阅读过《西游记》或《红楼梦》的学生共有90位,阅读过《红楼梦》的学生共有80位.阅读过《西游记》且阅读过《红楼梦》的学生共有60位,则该校阅读过《西游记》的学生人数与该校学生总数比值的估计值为( )A.0.5 B.0.6 C.0.7 D.0.8答案:C 3.(2018·全国Ⅰ高考)某地区经过一年的新农村建设,农村的经济收入增加了一倍,实现翻番.为更好地了解该地区农村的经济收入变化情况,统计了该地区新农村建设前后农村的经济收入构成比例,得到如下饼图:则下面结论中不正确的是( )A.新农村建设后,种植收入减少B.新农村建设后,其他收入增加了一倍以上C.新农村建设后,养殖收入增加了一倍D.新农村建设后,养殖收入与第三产业收入的总和超过了经济收入的一半解析:设建设前经济收入为1,则建设后经济收入为2,建设前种植收入为0.6,建设后种植收入为2×0.37=0.74,故A不正确;建设前的其他收入为0.04,养殖收入为0.3,建设后其他收入为0.1,养殖收入为0.6,故B,C正确;建设后养殖收入与第三产业收入的总和所占比例为58%,故D正确,故选A.答案:A考点二 总体集中趋势与离散程度的估计4.(2019·全国Ⅱ高考)演讲比赛共有9位评委分别给出某选手的原始评分,评定该选手的成绩时,从9个原始评分中去掉1个最高分、1个最低分,得到7个有效评分.7个有效评分与9个原始评分相比,不变的数字特征是( )A.中位数 B.平均数 C.方差 D.极差答案:A 5.(2020·全国Ⅲ高考)设一组样本数据x1,x2,…,xn的方差为0.01,则数据10x1,10x2,…,10xn的方差为( )A.0.01 B.0.1 C.1 D.10答案:C 解析:四个选项的数据都具有对称性,平均数均为2.5,其中B选项的数据中,极端值最多,数据波动程度最大,故选B.答案:B7.(2019·江苏高考)已知一组数据6,7,8,8,9,10,则该组数据的方差是 . 8.(2019·全国Ⅱ高考)我国高铁发展迅速,技术先进.经统计,在经停某站的高铁列车中,有10个车次的正点率为0.97,有20个车次的正点率为0.98,有10个车次的正点率为0.99,则经停该站高铁列车所有车次的平均正点率的估计值为 . 答案:0.98 9.(2020·全国Ⅲ高考节选)某学生兴趣小组随机调查了某市100天中每天的空气质量等级和当天到某公园锻炼的人次,整理数据(单位:天)得到下表:(1)分别估计该市一天的空气质量等级为1,2,3,4的概率;(2)求一天中到该公园锻炼的平均人次的估计值(同一组中的数据用该组区间的中点值为代表).10.(2020·全国Ⅰ高考)某厂承接了一项加工业务,加工出来的产品(单位:件)按标准分为A,B,C,D四个等级.加工业务约定:对于A级品、B级品、C级品,厂家每件分别收取加工费90元,50元,20元;对于D级品,厂家每件要赔偿原料损失费50元.该厂有甲、乙两个分厂可承接加工业务.甲分厂加工成本费为25元/件,乙分厂加工成本费为20元/件.厂家为决定由哪个分厂承接加工业务,在两个分厂各试加工了100件这种产品,并统计了这些产品的等级,整理如下:甲分厂产品等级的频数分布表乙分厂产品等级的频数分布表 (1)分别估计甲、乙两分厂加工出来的一件产品为A级品的概率;(2)分别求甲、乙两分厂加工出来的100件产品的平均利润,以平均利润为依据,厂家应选哪个分厂承接加工业务?(2)由数据知甲分厂加工出来的100件产品利润的频数分布表为比较甲、乙两分厂加工的产品的平均利润,应选甲分厂承接加工业务.所以,这类企业产值增长率的平均数与标准差的估计值分别为30%,17%.
第4课时 统计知识梳理·构建体系专题归纳·核心突破 知识梳理·构建体系知识网络要点梳理1.总体、个体、变量、样本、样本量的含义是什么?请完成下表:2.简单随机抽样的方法有哪些?具体操作过程是什么?请完成下表:5.第p百分位数的定义及计算步骤是什么?(1)定义:一般地,一组数据的第p百分位数是这样一个值,它使得这组数据中至少有 p% 的数据小于或等于这个值,且至少有(100-p)%的数据大于或等于这个值.(2)计算第p百分位数的步骤:第1步,按从小到大排列原始数据.第2步,计算i= n×p% .第3步,若i不是整数,而大于i的比邻整数为j,则第p百分位数为第j项数据;若i是整数,则第p百分位数为第i项与第(i+1)项数据的平均数.(3)四分位数:常用的分位数有第25百分位数,第50百分位数,第75百分位数.这三个分位数把一组由小到大排列后的数据分成四等份,因此称为四分位数.其中第25百分位数也称为第一四分位数或下四分位数等,第75百分位数也称为第三四分位数或上四分位数等.6.刻画总体集中趋势的常用统计量有哪些?它们各自的特征是什么?请完成下表:7.刻画总体离散程度的参数有哪些?它们各自的特征是什么?请完成下表:【思考辨析】 判断下列说法是否正确,正确的在后面的括号内画“√”,错误的画“×”.(1)检测一批种子的发芽率,可以用全面调查.( × )(2)用简单随机抽样抽取样本时,一般都得先对所有个体编号.( √ )(3)在简单随机抽样中,我们常用样本平均数去估计总体平均数.( √ )(4)分层随机抽样都是分两层.( × )(5)在比例分配的分层随机抽样中,我们可以用样本平均数估计总体平均数.( √ )(6)通过频率分布表和频率分布直方图,可以知道数据落在各个小组的比例大小.( √ )(7)频率分布直方图中分组越多,越容易看出总体数据的分布特点.( × )(8)若一组数据有60个数,则第60百分位数是36个数.( × )(9)对一个单峰的频率分布直方图,如果直方图在右边“拖尾”,那么平均数大于中位数.( √ )(10)方差刻画数据的集中趋势,平均数刻画数据的离散程度.( × )专题归纳·核心突破专题一 随机抽样【例1】 某单位有2 000名职工,在管理、技术开发、营销、生产各部门中,职工年龄分布如下表所示.(1)若要抽取40人调查身体状况,则应怎样抽样?(2)若要召开一个25人的讨论单位发展和薪金调整方面的座谈会,则应怎样抽选出席人?(3)若要抽取20人进行关于北京2022年冬奥会的调查问卷,则应怎样抽样?分析:(1)身体状况与年龄有关,考虑分层随机抽样;(2)座谈会与各部门有关,考虑分层随机抽样;(3)冬奥会是大众体育盛会,调查一个单位人员对其情况的了解,可用简单随机抽样.(3)用随机数法:对该单位全部2 000名职工随机编号,号码是1,2,3,…,2 000.利用随机数工具产生20个1~2 000范围内的不同的整数随机数,把产生的随机数作为抽中的编号,与编号对应的20名职工就是要抽取的样本.专题二 总体取值规律与百分位数的估计【例2】 某中学高一女生共有450人,为了解高一女生的身高情况,随机抽取部分高一女生测量身高(单位:cm),所得数据整理后列出频率分布表如右.(1)求出表中字母m,n,M,N所对应的数值;(2)画出频率分布直方图;(3)估计该校高一女生身高在149.5~165.5 cm范围内有多少人?(4)估计该校高一女生身高的第80百分位数.分析:(1)利用频率分布表的特征求出m,n,M,N;(2)根据画频率分布直方图的步骤画出频率分布直方图;(3)利用样本所占的比例估计总体的分布;(4)利用样本的百分位数估计总体的百分位数.数据落在165.5~169.5范围内的频数m=50-(8+6+14+10+8)=4,频率为n=0.08,总频率N=1.00.(2)频率分布直方图如下:【变式训练2】 某校高三年级有500名学生,为了了解数学学科的学习情况,现从中随机抽取若干名学生在一次测试中的数学成绩(满分为150分),制成如右频率分布表:(1)表格中①②③④处的数值分别为 、 、 、 ; (2)在图中画出样本数据的频率分布直方图;(3)根据题中信息估计总体数学成绩的60%分位数.(2)频率分布直方图如图所示. 专题三 总体集中趋势与离散程度的估计【例3】 甲、乙两名运动员在相同的条件下各射靶10次,每次射靶成绩(单位:环)如图所示.分析:由上图可知甲、乙射靶10次命中的环数,根据中位数、平均数、方差的定义及计算公式可分别求得甲、乙两人的中位数、平均数及方差,通过比较它们的大小,可以分析出甲、乙两人成绩的偏离程度、集中趋势、成绩的好坏及有无潜力等问题.甲的射靶环数按从小到大的顺序排列为5,6,6,7,7,7,7,8,8,9,所以中位数为7.于是填充后的表格如下表所示.【变式训练3】 从高三年级抽出50名学生参加数学竞赛,由成绩得到频率分布直方图如图所示. 由于一些数据丢失,试利用频率分布直方图估计:(1)这50名学生成绩的众数与中位数;(2)这50名学生的平均成绩.(2)取每个小矩形底边中点的横坐标乘以小矩形的面积,求和为45×(0.004×10)+55×(0.006×10)+65×(0.02×10)+75×(0.03×10)+85×(0.024×10)+95×(0.016×10)=76.2.故估计这50名学生的平均成绩为76.2分.设中位数在第四个小矩形内的底边长为x,高为0.03,则0.03x=0.2得x≈6.7,故中位数约为70+6.7=76.7.(2)样本平均值应是频率分布直方图的“重心”,即所有数据的平均值,取每个小矩形底边的中点值乘以每个小矩形的面积,求和即可.因此平均成绩为45×(0.004×10)+55×(0.006×10)+65×(0.02×10)+75×(0.03×10)+85×(0.021×10)+95×(0.016×10)≈74.考点一 总体取值规律与百分位数的估计1.(2020·天津高考)从一批零件中抽取80个,测量其直径(单位:mm),将所得数据分为9组:[5.31,5.33),[5.33,5.35),…, [5.45,5.47),[5.47,5.49],并整理得到如下频率分布直方图,则在被抽取的零件中,直径落在区间[5.43,5.47)内的个数为( ) A.10 B.18C.20 D.36解析:∵在区间[5.43,5.47]的频率为(6.25+5.00)×0.02=0.225,∴0.225×80=18.故选B.答案:B2.(2019·全国Ⅲ高考)《西游记》《三国演义》《水浒传》和《红楼梦》是中国古典文学瑰宝,并称为中国古典小说四大名著.某中学为了解本校学生阅读四大名著的情况,随机调查了100位学生,其中阅读过《西游记》或《红楼梦》的学生共有90位,阅读过《红楼梦》的学生共有80位.阅读过《西游记》且阅读过《红楼梦》的学生共有60位,则该校阅读过《西游记》的学生人数与该校学生总数比值的估计值为( )A.0.5 B.0.6 C.0.7 D.0.8答案:C 3.(2018·全国Ⅰ高考)某地区经过一年的新农村建设,农村的经济收入增加了一倍,实现翻番.为更好地了解该地区农村的经济收入变化情况,统计了该地区新农村建设前后农村的经济收入构成比例,得到如下饼图:则下面结论中不正确的是( )A.新农村建设后,种植收入减少B.新农村建设后,其他收入增加了一倍以上C.新农村建设后,养殖收入增加了一倍D.新农村建设后,养殖收入与第三产业收入的总和超过了经济收入的一半解析:设建设前经济收入为1,则建设后经济收入为2,建设前种植收入为0.6,建设后种植收入为2×0.37=0.74,故A不正确;建设前的其他收入为0.04,养殖收入为0.3,建设后其他收入为0.1,养殖收入为0.6,故B,C正确;建设后养殖收入与第三产业收入的总和所占比例为58%,故D正确,故选A.答案:A考点二 总体集中趋势与离散程度的估计4.(2019·全国Ⅱ高考)演讲比赛共有9位评委分别给出某选手的原始评分,评定该选手的成绩时,从9个原始评分中去掉1个最高分、1个最低分,得到7个有效评分.7个有效评分与9个原始评分相比,不变的数字特征是( )A.中位数 B.平均数 C.方差 D.极差答案:A 5.(2020·全国Ⅲ高考)设一组样本数据x1,x2,…,xn的方差为0.01,则数据10x1,10x2,…,10xn的方差为( )A.0.01 B.0.1 C.1 D.10答案:C 解析:四个选项的数据都具有对称性,平均数均为2.5,其中B选项的数据中,极端值最多,数据波动程度最大,故选B.答案:B7.(2019·江苏高考)已知一组数据6,7,8,8,9,10,则该组数据的方差是 . 8.(2019·全国Ⅱ高考)我国高铁发展迅速,技术先进.经统计,在经停某站的高铁列车中,有10个车次的正点率为0.97,有20个车次的正点率为0.98,有10个车次的正点率为0.99,则经停该站高铁列车所有车次的平均正点率的估计值为 . 答案:0.98 9.(2020·全国Ⅲ高考节选)某学生兴趣小组随机调查了某市100天中每天的空气质量等级和当天到某公园锻炼的人次,整理数据(单位:天)得到下表:(1)分别估计该市一天的空气质量等级为1,2,3,4的概率;(2)求一天中到该公园锻炼的平均人次的估计值(同一组中的数据用该组区间的中点值为代表).10.(2020·全国Ⅰ高考)某厂承接了一项加工业务,加工出来的产品(单位:件)按标准分为A,B,C,D四个等级.加工业务约定:对于A级品、B级品、C级品,厂家每件分别收取加工费90元,50元,20元;对于D级品,厂家每件要赔偿原料损失费50元.该厂有甲、乙两个分厂可承接加工业务.甲分厂加工成本费为25元/件,乙分厂加工成本费为20元/件.厂家为决定由哪个分厂承接加工业务,在两个分厂各试加工了100件这种产品,并统计了这些产品的等级,整理如下:甲分厂产品等级的频数分布表乙分厂产品等级的频数分布表 (1)分别估计甲、乙两分厂加工出来的一件产品为A级品的概率;(2)分别求甲、乙两分厂加工出来的100件产品的平均利润,以平均利润为依据,厂家应选哪个分厂承接加工业务?(2)由数据知甲分厂加工出来的100件产品利润的频数分布表为比较甲、乙两分厂加工的产品的平均利润,应选甲分厂承接加工业务.所以,这类企业产值增长率的平均数与标准差的估计值分别为30%,17%.
相关资料
更多