- 第二十一讲 函数导数及其几何意义学案 学案 3 次下载
- 第二十二讲 导数的应用学案 学案 4 次下载
- 第二十三讲 排列、组合学案 学案 2 次下载
- 第二十四讲 随机事件的概率学案 学案 2 次下载
- 第二十六讲 二项式定理学案 学案 3 次下载
第二十五讲 统计学案
展开1.抽样方法
(1)简单随机抽样(包括抽签法和随机数表法);
(2)系统抽样,也叫等距抽样;
(3)分层抽样(按比例抽样),常用于某个总体由差异明显的几部分组成的情形.
【注: 它们都是等概率抽样】
2. 简单随机抽样
(1)定义:一般地,设一个总体含有N个个体,从中逐个不放回地抽取n个个体作为样本(n≤N),如果每次抽取时总体内的各个个体被抽到的机会都相等,就把这种抽样方法叫做简单随机抽样.这样抽取的样本,叫做简单随机样本.
(2)常用方法:抽签法和随机数法.
3. 分层抽样
(1)在抽样时,将总体分成互不交叉的层,然后按照一定的比例,从各层独立地抽取一定数量的个体,将各层取出的个体合在一起作为样本,这种抽样方法是一种分层抽样.
(2)分层抽样的应用范围:
【当总体是由差异明显的几个部分组成时,往往选用分层抽样】
4. 系统抽样
(1)定义:当总体中的个体数较多时,可以将总体分成均衡的几部分,然后按照预先制定的规则,从每一部分抽取一个个体,得到所需的样本,这种抽样的方法叫做系统抽样.
(2)系统抽样的步骤
假设要从容量为N的总体中抽取容量为n的样本.
①先将总体的N个个体编号;
②确定分段间隔k,对编号进行分段.当eq \f(N,n)(n是样本容量)是整数时,取k=eq \f(N,n);
5. 茎叶图:通常用来记录两位数的数据,“茎”记录十位数,“叶”记录个位数,叶上的数字可以重复.
6. 众数、中位数和平均数:
(1)众数:一组数据中出现次数最多的数据叫做这组数据的众数.
(2)中位数:将一组数据按大小依次排列,处于最中间位置的一个数据(或最中间两个数据的平均数)叫做这组数据的中位数.
(3)平均数:一组数据的算术平均数即为这组数据的平均数,n个数据x1,x2,…,xn的平均数
7. 总体特征数的估计:
(1)样本方差;
(2)样本标准差=;
8. 在频率分布直方图中:
(1)频率、频数、样本容量的计算方法
① eq \f(频率,组距)×组距=频率.
② eq \f(频数,样本容量)=频率,eq \f(频数,频率)=样本容量,样本容量×频率=频数.
(2)频率分布直方图中数字特征的计算
①最高的小长方形底边中点的横坐标即是众数.
②中位数左边和右边的小长方形的面积和是相等的.
= 3 \* GB3 ③平均数是频率分布直方图的“重心”,等于频率分布直方图中每个小长方形的面积乘以小长方形底边中点的横坐标之和.
9. 回归方程:
方程:eq \(b,\s\up6(^))=eq \f(\i\su(i=1,n, )xi-\x\t(x)yi-\x\t(y),\i\su(i=1,n, )xi-\x\t(x)2),eq \(a,\s\up6(^))=eq \x\t(y)-eq \(b,\s\up6(^)) eq \x\t(x).
相关系数:r=eq \f(\i\su(i=1,n, )xi-\x\t(x)yi-\x\t(y),\r(\i\su(i=1,n, )xi-\x\t(x)2\i\su(i=1,n, )yi-\x\t(y)2)).
(1) 散点图: 散点图中如果所有的样本点都落在某一函数的曲线附近,变量之间就有相关关系.如果所有的样本点都落在某一直线附近,变量之间就有线性相关关系.若点散布在从左下角到右上角的区域,则正相关.
(2)利用相关系数判定,当|r|越趋近于1相关性越强.
当残差平方和越小,若r>0,则正相关;r<0时,则负相关.
(3)线性回归直线方程中:eq \(b,\s\up6(^))>0时,正相关;eq \(b,\s\up6(^))<0时,负相关.
(4)回归直线方程中系数的两种求法
①公式法:利用公式,求出回归系数eq \(b,\s\up6(^)),eq \(a,\s\up6(^)).
②待定系数法:利用回归直线过样本点中心(eq \x\t(x),eq \x\t(y))求系数.
(5)回归分析的两种策略
①利用回归方程进行预测:把回归直线方程看作一次函数,求函数值.
②利用回归直线判断正、负相关:决定正相关还是负相关的是回归系数eq \(b,\s\up6(^)).
(6)对于非线性化的回归分析问题,通常先画出已知数据的散点图,选择跟散点拟合得最好的函数模型,再进行变量代换,求出代换后的回归直线方程,即得所要求的非线性的回归方程.
10. 独立性检验
(1)2×2列联表
设X,Y为两个变量,它们的取值分别为{x1,x2}和{y1,y2},其样本频数列联表(2×2列联表)如下:
(2)独立性检验的注意事项及求解步骤
①根据样本数据制成2×2列联表;
②根据公式K2=eq \f(nad-bc2,a+ba+cb+dc+d)计算K2的观测值k;
= 3 \* GB3 ③比较观测值k与临界值的大小关系,作统计推断.
题型1 抽样方法的应用问题
1.某学校有男、女学生各500名.为了解男女学生在学习兴趣与业余爱好方面是否存在显著差异,拟从全体学生中抽取100名学生进行调查,则宜采用的抽样方法是
A. 抽签法 B. 随机数法 C. 系统抽样法 D. 分层抽样法
2. 对某商店一个月内每天的顾客人数进行了统计,得到如右茎叶图,则该样本的中位数、众数、极差分别是
A. 46,45,56 B. 46,45,53
C. 47,45,56 D. 45,47,53
3. 某工厂甲、乙、丙三个车间生产了同一种产品,数量分别为120件,80件,60件.为了解它们的产品质量是否存在显著差异,用分层抽样方法抽取了一个容量为n的样本进行调查,其中从丙车间的产品中抽取了3件,则n=
A. 9 B. 10 C. 12 D. 13
4.某校初三年级有400名学生,随机抽查了40名学生测试1分钟仰卧起坐的成绩(单位:次),将数据整理后绘制成如图所示的频率分布直方图.用样本估计总体,下列结论正确的是
A.该校初三学生1分钟仰卧起坐的次数的中位数为25
B.该校初三学生1分钟仰卧起坐的次数的众数为24
C.该校初三学生1分钟仰卧起坐的次数超过30的人数约有80
D.该校初三学生1分钟仰卧起坐的次数少于20的人数约为8
5. (2017山东)如图所示的茎叶图记录了甲、乙两组各5名工人某日的产量数据(单位:件).若这两组数据的中位数相等,且平均值也相等,则x和y的值分别为
A. 3,5 B. 5,5
C. 3,7 D. 5,7
6. 一支田径运动队有男运动员56人,女运动员42人.现用分层抽样的方法抽取若干人,若抽取的男运动员有8人,则抽取的女运动员有______人.
7. 某学员在一次射击测试中射靶10次,命中环数如下:
7,8,7,9,5,4,9,10,7,4
(1)平均命中环数为;
(2)命中环数的标准差为.
题型2 用样本估计总体
容量为20的样本数据,分组后的频数如下表:
则样本数据落在区间[10,40)的频率为
0.35B. 0.45C.0.55D.0.65
2.下图是某公司10个销售店某月销售某产品数量(单位:台)的茎叶图,则数据落在区间[22,30)内的概率为
A. 0.2 B. 0.4
C. 0.5 D. 0.6
3. 甲、乙两名篮球运动员5场比赛得分的原始记录如茎叶图所示,若甲、乙两人的平均得分分别为x甲,x乙,则下列结论正确的是
A. x甲
C. x甲>x乙;乙比甲得分稳定
D. x甲
根据该折线图,下列结论错误的是
A. 月接待游客逐月增加
B. 年接待游客量逐年增加
C. 各年的月接待游客量高峰期大致在7,8月
D. 各年1月至6月的月接待游客量相对于7月至12月,波动性更小,变化比较平稳
5.某班的全体学生参加英语测试,成绩的频率分布直方图如图,数据的分组依次为若低于60分的人数是15,则该班的学生人数是
A.45 B.50 C.55 D.60
题型3 回归方程的求解与应用
(2019惠州调研)某商场为了了解毛衣的月销售量y(件)与月平均气温x(℃)之间的关系,随机统计了某4个月的月销售量与当月平均气温,其数据如下表:
由表中数据算出线性回归方程eq \(y,\s\up6(^))=eq \(b,\s\up6(^))x+eq \(a,\s\up6(^))中的eq \(b,\s\up6(^))=-2,气象部门预测下个月的平均气温约为6 ℃,据此估计该商场下个月毛衣销售量约为
A.46件 B.40件 C.38件 D.58件
(2019湘东)已知具有相关关系的两个变量x,y的几组数据如下表所示:
(1)请根据上表数据在网格纸中绘制散点图;
(2)请根据上表数据,用最小二乘法求出y关于x的线性回归方程eq \(y,\s\up6(^))=eq \(b,\s\up6(^))x+eq \(a,\s\up6(^)),并估计当x=20时y的值.
参考公式:eq \(b,\s\up6(^))=eq \f(\i\su(i=1,n,x)iyi-n\x\t(x) \x\t(y),\i\su(i=1,n,x)\\al(2,i)-n\x\t(x)2),eq \(a,\s\up6(^))=eq \x\t(y)-eq \(b,\s\up6(^))eq \x\t(x).
(2019江西联考)某品牌2019款汽车即将上市,为了对这款汽车进行合理定价,某公司在某市五家4S店分别进行了两天试销售,得到如下数据:
(1)分别以五家4S店的平均单价与平均销量为散点,求出单价与销量的回归直线方程eq \(y,\s\up6(^))=eq \(b,\s\up6(^))x+eq \(a,\s\up6(^));
(2)在大量投入市场后,销量与单价仍服从(1)中的关系,且该款汽车的成本为12万元/辆,为使该款汽车获得最大利润,则该款汽车的单价约为多少万元(保留一位小数)?
附:eq \(b,\s\up6(^))=eq \f(\i\su(i=1,n, )xi-\x\t(x)yi-\x\t(y),\i\su(i=1,n, )xi-\x\t(x)2),eq \(a,\s\up6(^))=eq \x\t(y)-eq \(b,\s\up6(^)) eq \x\t(x).
(2019汕头一模)二手车经销商小王对其所经营的A型号二手汽车的使用年数x与销售价格y(单位:万元/辆)进行整理,得到如下数据:
下面是z关于x的折线图:
(1)由折线图可以看出,可以用线性回归模型拟合z与x的关系,请用相关系数加以说明;
(2)求y关于x的回归方程,并预测某辆A型号二手车当使用年数为9年时售价约为多少;(eq \(b,\s\up6(^)),eq \(a,\s\up6(^))小数点后保留两位有效数字)
(3)基于成本的考虑,该型号二手车的售价不得低于7 118元,请根据(2)求出的回归方程预测在收购该型号二手车时车辆的使用年数不得超过多少年.
参考公式:eq \(b,\s\up6(^))=eq \f(\i\su(i=1,n, )xi-\x\t(x)yi-\x\t(y),\i\su(i=1,n, )xi-\x\t(x)2)=eq \f(\i\su(i=1,n,x)iyi-n \x\t(x) \x\t(y),\i\su(i=1,n,x)\\al(2,i)-n \x\t(x)2),eq \(a,\s\up6(^))=eq \x\t(y)-eq \(b,\s\up6(^)) eq \x\t(x),r=eq \f(\i\su(i=1,n, )xi-\x\t(x)yi-\x\t(y),\r(\i\su(i=1,n, )xi-\x\t(x)2\i\su(i=1,n, )yi-\x\t(y)2)).
参考数据:
eq \i\su(i=1,6,x)iyi=187.4,eq \i\su(i=1,6,x)izi=47.64,eq \i\su(i=1,6,x)eq \\al(2,i)=139,eq \r(\i\su(i=1,6, )xi-\x\t(x)2)=4.18, eq \r(\i\su(i=1,6, )yi-\x\t(y)2)=13.96,eq \r(\i\su(i=1,6, )zi-\x\t(z)2)=1.53,ln1.46≈0.38,ln0.711 8≈-0.34.
题型4 独立性检验的应用
(2018·全国卷Ⅲ节选)某工厂为提高生产效率,开展技术创新活动,提出了完成某项生产任务的两种新的生产方式.为比较两种生产方式的效率,选取40名工人,将他们随机分成两组,每组20人.第一组工人用第一种生产方式,第二组工人用第二种生产方式.根据工人完成生产任务的工作时间(单位:min)绘制了如下茎叶图:
(1)求40名工人完成生产任务所需时间的中位数m,并将完成生产任务所需时间超过m和不超过m的工人数填入下面的列联表:
(2)根据(1)中的列联表,能否有99%的把握认为两种生产方式的效率有差异?
附:K2=eq \f(nad-bc2,a+bc+da+cb+d),
(2017全国Ⅱ)海水养殖场进行某水产品的新、旧网箱养殖方法的产量对比,收获时各随机抽取了100个网箱,测量各箱水产品的产量(单位:kg),其频率分布直方图如下:
旧养殖法 新养殖法
(1)记A表示事件“旧养殖法的箱产量低于50 kg”,估计A的概率;
(2)填写下面列联表,并根据列联表判断是否有99%的把握认为箱产量与养殖方法有关;
(3)根据箱产量的频率分布直方图,对这两种养殖方法的优劣进行比较.
附:
K2=eq \f(nad-bc2,a+bc+da+cb+d).
(2019江门模拟)为探索课堂教学改革,江门某中学数学老师用“传统教学”和“导学案”两种教学方式分别在甲、乙两个平行班进行教学实验.为了解教学效果,期末考试后,分别从两个班级各随机抽取20名学生的成绩进行统计,得到如下茎叶图.记成绩不低于70分者为“成绩优良”.
(1)请大致判断哪种教学方式的教学效果更佳,并说明理由;
(2)构造一个教学方式与成绩优良的2×2列联表,并判断能否在犯错误的概率不超过0.05的前提下认为“成绩优良与教学方式有关”.
附:K2=eq \f(nad-bc2,a+bc+da+cb+d),其中n=a+b+c+d.
独立性检验临界值表:
题型5 频率分布直方图
观察下列各图形,其中两个变量x,y具有相关关系的图是
A.①② B.①④
C.③④ D.②③
2. 某仪器厂从新生产的一批零件中随机抽取40个进行检测,如图是根据抽样检测得到的零件的质量(单位:克)绘制的频率分布直方图,样本数据按照[80,82),[82,84),[84,86),[86,88),[88,90),[90,92),[92,94),[94,96]分成8组,将其按从左到右的顺序分别记为第一组,第二组,……,第八组.则样本数据的中位数在第________组.
3. 我国是世界上严重缺水的国家,某市为了制定合理的节水方案,对居民用水情况进行了调查,通过抽样,获得了某年100位居民每人的月均用水量(单位:吨),将数据按照[0,0.5),[0.5,1),…,[4,4.5]分成9组,制成了如图所示的频率分布直方图.
(1)求直方图中a的值;
(2)设该市有30万居民,估计全市居民中月均用水量不低于3吨的人数,说明理由.
(2017北京)某大学艺术专业400名学生参加某次测评,根据男女学生人数比例,使用分层抽样的方法从中随机抽取了100名学生,记录他们的分数,将数据分成7组:[20,30),[30,40),…,[80,90],并整理得到如下频率分布直方图:
(1)从总体的400名学生中随机抽取一人,估计其分数小于70的概率;
(2)已知样本中分数小于40的学生有5人,试估计总体中分数在区间[40,50)内的人数;
(3)已知样本中有一半男生的分数不小于70,且样本中分数不小于70的男女生人数相等.试估计总体中男生和女生人数的比例.
5. (2016四川)我国是世界上严重缺水的国家,某市为了制定合理的节水方案,对居民用水情况进行了调查,通过抽样,获得了某年100位居民每人的月均用水量(单位:吨),将数据按照[0,0.5),[0.5,1),…,[4,4.5]分成9组,制成了如图所示的频率分布直方图.
(1)求直方图中a的值;
(2)设该市有30万居民,估计全市居民中月均用水量不低于3吨的人数,说明理由;
(3)估计居民月均用水量的中位数.
1. (全国Ⅰ)某学校为了解1 000名新生的身体素质,将这些学生编号为1,2,…,1 000,从这些新生中用系统抽样方法等距抽取100名学生进行体质测验.若46号学生被抽到,则下面4名学生中被抽到的是
A. 8号学生B. 200号学生C. 616号学生D. 815号学生
2. (2019全国Ⅱ)演讲比赛共有9位评委分别给出某选手的原始评分,评定该选手的成绩时,从9个原始评分中去掉1个最高分、1个最低分,得到7个有效评分.7个有效评分与9个原始评分相比,不变的数字特征是
A. 中位数B. 平均数C. 方差 D. 极差
3. 《西游记》《三国演义》《水浒传》和《红楼梦》是中国古典文学瑰宝,并称为中国古典小说四大名著.某中学为了解本校学生阅读四大名著的情况,随机调查了100位学生,其中阅读过《西游记》或《红楼梦》的学生共有90位,阅读过《红楼梦》的学生共有80位,阅读过《西游记》且阅读过《红楼梦》的学生共有60位,则该校阅读过《西游记》的学生人数与该校学生总数比值的估计值为
A. 0.5 B. 0.6 C. 0.7D. 0.8
4. (2018全国Ⅰ)某地区经过一年的新农村建设,农村的经济收入增加了一倍.实现翻番.为更好地了解该地区农村的经济收入变化情况,统计了该地区新农村建设前后农村的经济收入构成比例.得到如下饼图:
则下面结论中不正确的是
A. 新农村建设后,种植收入减少
B. 新农村建设后,其他收入增加了一倍以上
C. 新农村建设后,养殖收入增加了一倍
D. 新农村建设后,养殖收入与第三产业收入的总和超过了经济收入的一半
5.(2017全国Ⅰ)为评估一种农作物的种植效果,选了块地作试验田.这块地的亩产量(单位:kg)分别为,,…,,下面给出的指标中可以用来评估这种农作物亩产量稳定程度的是
A.,,…,的平均数 B.,,…,的标准差
C.,,…,的最大值 D.,,…,的中位数
6. 设某大学的女生体重y(单位:kg)与身高x(单位:cm)具有线性相关关系,根据一组样本数据(xi,yi)(i=1,2,…,n),用最小二乘法建立的回归方程为=0.85x-85.71,则下列结论中不正确的是
A. y与x具有正的线性相关关系
B. 回归直线过样本点的中心(x,y)
C. 若该大学某女生身高增加1cm,则其体重约增加0.85kg
D. 若该大学某女生身高为170cm,则可断定其体重必为58.79kg
7. (2019·山西五校联考)某校为了解学生的学习情况,采用分层抽样的方法从高一1 000人、高二1 200人、高三n人中抽取81人进行问卷调查,若高二被抽取的人数为30,则n=
A.860 B.720
C.1 020 D.1 040
8. 总体由编号为01,02,…,19,20的20个个体组成.利用下面的随机数表选取5个个体,选取方法从随机数表第1行的第5列和第6列数字开始由左到右一次选取两个数字,则选出来的第5个个体的编号为
A.08B.07C.02D.01
9. 对一批产品的长度(单位:mm)进行抽样检测,下图为检测结果的频率分布直方图.根据标准,产品长度在区间[20,25)上的为一等品,在区间[15,20)和区间[25,30)上的为二等品,在区间[10,15)和[30,35]上的为三等品.用频率估计概率,现从该批产品中随机抽取一件,则其为二等品的概率为
A. 0.09B. 0.20
C. 0.25D. 0.45
10. 从一批苹果中,随机抽取50个,其重量(单位:克)的频数分布表如下:
(1)根据频数分布表计算苹果的重量在的频率;
(2)用分层抽样的方法从重量在和的苹果中共抽取4个,其中苹果重量在的有几个?
(3)在(2)中抽出的4个苹果中,任取2个,求重量在和中各有1个的概率.
11. (2018·全国卷Ⅰ)某家庭记录了未使用节水龙头50天的日用水量数据(单位:m3)和使用了节水龙头50天的日用水量数据,得到频数分布表如下:
未使用节水龙头50天的日用水量频数分布表
使用了节水龙头50天的日用水量频数分布表
(1)作出使用了节水龙头50天的日用水量数据的频率分布直方图;
(2)估计该家庭使用节水龙头后,日用水量小于0.35 m3的概率;
(3)估计该家庭使用节水龙头后,一年能节省多少水?(一年按365天计算,同一组中的数据以这组数据所在区间中点的值作代表)
12. (2018全国Ⅲ)某工厂为提高生产效率,开展技术创新活动,提出了完成某项生产任务的两种新的生产方式.为比较两种生产方式的效率,选取40名工人,将他们随机分成两组,每组20人.第一组工人用第一种生产方式,第二组工人用第二种生产方式.根据工人完成生产任务的工作时间(单位:min)绘制了如下茎叶图:
(1)根据茎叶图判断哪种生产方式的效率更高?并说明理由;
(2)求40名工人完成生产任务所需时间的中位数m,并将完成生产任务所需时间超过m和不超过m的工人数填入下面的列联表;
(3)根据(2)中的列联表,能否有99%的把握认为两种生产方式的效率有差异?
附:K2=eq \f(nad-bc2,a+bc+da+cb+d),
13. (2018全国Ⅱ)下图是某地区2000年至2016年环境基础设施投资额y(单位:亿元)的折线图.
为了预测该地区2018年的环境基础设施投资额,建立了y与时间变量t的两个线性回归模型.根据2000年至2016年的数据(时间变量t的值依次为1,2,…,17)建立模型①:eq \(y,\s\up6(^))=-30.4+13.5t;根据2010年至2016年的数据(时间变量t的值依次为1,2,…,7)建立模型②:eq \(y,\s\up6(^))=99+17.5t.
(1)分别利用这两个模型,求该地区2018年的环境基础设施投资额的预测值;
(2)你认为用哪个模型得到的预测值更可靠?并说明理由.
y1
y2
总计
x1
a
b
a+b
x2
c
d
c+d
总计
a+c
b+d
a+b+c+d
分组
[10,20)
[20,30)
[30,40)
[40,50)
[50,60)
[60,70)
频数
2
3
4
5
4
2
月平均气温x/℃
17
13
8
2
月销售量y/件
24
33
40
55
x
2
4
6
8
10
y
3
6
7
10
12
使用年数x
2
3
4
5
6
7
售价y
20
12
8
6.4
4.4
3
z=lny
3.00
2.48
2.08
1.86
1.48
1.10
超过m
不超过m
第一种生产方式
第二种生产方式
箱产量<50 kg
箱产量≥50 kg
旧养殖法
新养殖法
P(K2≥k)
0.050
0.010
0.001
k
3.841
6.635
10.828
P(K2≥k0)
0.10
0.05
0.025
0.010
k0
2.706
3.841
5.024
6.635
7816 6572 0802 6314 0702 4369 9728 0198
3204 9234 4935 8200 3623 4869 6938 7481
分组(重量)
频数(个)
5
10
20
15
日用水量
[0,0.1)
[0.1,0.2)
[0.2,0.3)
[0.3,0.4)
[0.4,0.5)
[0.5,0.6)
[0.6,0.7)
频数
1
3
2
4
9
26
5
日用水量
[0,0.1)
[0.1,0.2)
[0.2,0.3)
[0.3,0.4)
[0.4,0.5)
[0.5,0.6)
频数
1
5
13
10
16
5
超过m
不超过m
第一种生产方式
第二种生产方式
P(K2≥k)
0.050
0.010
0.001
k
3.841
6.635
10.828
2023届高考数学二轮复习专题四第1讲统计与统计案例学案: 这是一份2023届高考数学二轮复习专题四第1讲统计与统计案例学案,共16页。学案主要包含了易错提醒,素养提升等内容,欢迎下载使用。
2023届高考数学二轮复习专题五概率与统计第3讲统计、成对数据的统计分析学案: 这是一份2023届高考数学二轮复习专题五概率与统计第3讲统计、成对数据的统计分析学案,共22页。
2023届高考一轮复习讲义(理科)第十一章 统计与统计案例 第3讲 变量间的相关关系、统计案例学案: 这是一份2023届高考一轮复习讲义(理科)第十一章 统计与统计案例 第3讲 变量间的相关关系、统计案例学案,共23页。学案主要包含了知识梳理,习题改编等内容,欢迎下载使用。