所属成套资源:高考数学专项解题方法归纳探究(全国通用)
高考数学专项解题方法归纳探究(全国通用)模板17 统计与概率(解析板)
展开
这是一份高考数学专项解题方法归纳探究(全国通用)模板17 统计与概率(解析板),共22页。试卷主要包含了根据样本求总体,用频率分布直方图估计总体,求古典概型的概率等内容,欢迎下载使用。
统计与概率
学校:___________姓名:___________班级:___________考号:___________
模板攻略
模板一、根据样本求总体
1.模板解决思路
(1)对于条形图来说,条形图是用条形的长度表示各类别频数的多少.其宽度(表示类别)是固定的,但若条形图(或其他图表)中每组数据不是一个具体的数,而是一个范围.则取其中间值
(2)利用频率分布直方图求数字特征,有
①众数是最高的矩形的底边的中点
②中位数左右两侧直方图的面积相等.
③平均数等于每个小矩形的面积乘以小矩形底边中点的横坐标之和.
2.模板解决步骤
①第一步将条形统计图(或其他图表)转化为样本数据,如果条形统计图(或其他图表)中每组数据不是一个具体的数,而是一个范围,则取其中间值.
②第二步 算出样本总数n.
③第三步代人公式计算数字特征.
知识要点
知识点一 众数、中位数、平均数
1.众数:一组数据中出现次数最多的数.
2.中位数:把一组数据按从小到大(或从大到小)的顺序排列,处在中间位置的数(或中间两个数的平均数)叫做这组数据的中位数.
3.平均数:如果n个数x1,x2,…,xn,那么=(x1+x2+…+xn)叫做这n个数的平均数.
特别提示:
1.平均数、中位数和众数等都是刻画“中心位置”的量,它们从不同角度刻画了一组数据的集中趋势.
2.一般地,对数值型数据(如用水量、身高、收入、产量等)集中趋势的描述,可以用平均数、中位数;而对分类型数据(如校服规格、性别、产品质量等级等)集中趋势的描述,可以用众数.
知识点二 标准差
标准差是样本数据到平均数的一种平均距离,一般用是S表示
特别提示:
方差描述了数据相对平均数的离散程度.在平均数相同的情况下,
方差越大,离散程度越大,数据波动性越大,稳定性越差;方差越小,数据越集中、越稳定.
知识点三 方差
从数学角度考虑,有时用标准差的平方S2——方差来代替标准差,作为测量样本数据分散程度的工具
例题演练
例题1
某校两个班级100名学生在一次考试中的成绩的频率分布直方图如图所示,其中成绩分组区如下表:
组号
第一组
第二组
第三组
第四组
第五组
分组
(1)求频率表分布直方图中a的值;
(2)根据频率表分布直方图,估计这100名学生这次考试成绩的平均分;
(3)现用分层抽样的方法从第三、四、五组中随机抽取6名学生,将该样本看成一个总体,从中随机抽取2名,求其中恰有1人的分数不低于90分的概率.
【答案】(1)a=0.005;(2)74.5;(3)
【详解】
(1)由题意得10a+0.01×10+0.02×10+0.03×10+0.035×10=1,所以a=0.005.
(2)由直方图分数在[50,60]的频率为0.05,[60,70]的频率为0.35,[70,80]的频率为0.30,[80,90]的频率为0.20,[90,100]的频率为0.10,所以这100名学生期中考试数学成绩的平均分的估计值为:55×0.05+65×0.35+75×0.30+85×0.20+95×0.10=74.5
(3)由直方图,得:
第3组人数为0.3×100=30,
第4组人数为0.2×100=20人,
第5组人数为0.1×100=10人.
所以利用分层抽样在60名学生中抽取6名学生,
每组分别为:
第3组:人,
第4组:人,
第5组:=1人.
所以第3、4、5组分别抽取3人、2人、1人.
设第3组的3位同学为A1,A2,A3,第4组的2位同学为B1,B2,第5组的1位同学为C1,则从六位同学中抽两位同学有15种可能如下:
(A1,A2),(A1,A3),(A2,A3),(B1,B2),(A1,B1),(A1,B2),(A2,B1),(A2,B2),(A3,B1),(A3,B2),(A1,C1),(A2,C1),(A3,C1),(B1,C1),(B2,C1),其中恰有1人的分数不低于90(分)的情形有:(A1,C1),(A2,C1),(A3,C1),(B1,C1),(B2,C1),共5种.
所以恰有1人的分数不低于90分的概率为.
例题2
为了进一步推动全市学习型党组织、学习型社会建设,某市组织开展“学习强国”知识测试,每人测试文化、经济两个项目,每个项目满分均为60分.从全体测试人员中随机抽取了100人,分别统计他们文化、经济两个项目的测试成绩,得到文化项目测试成绩的频数分布表和经济项目测试成绩的频率分布直方图如下:
经济项目测试成绩频率分布直方图
分数区间
频数
2
3
5
15
40
35
文化项目测试成绩频数分布表
将测试人员的成绩划分为三个等级如下:分数在区间内为一般,分数在区间内为良好,分数在区间内为优秀.
(1)在抽取的100人中,经济项目等级为优秀的测试人员中女生有14人,经济项目等级为一般或良好的测试人员中女生有34人.填写下面列联表,并根据列联表判断是否有以上的把握认为“经济项目等级为优秀”与性别有关?
优秀
一般或良好
合计
男生数
女生数
合计
(2)用这100人的样本估计总体.
(i)求该市文化项目测试成绩中位数的估计值.
(ii)对该市文化项目、经济项目的学习成绩进行评价.
附:
0.150
0.050
0.010
2.072
3.841
6.635
.
【答案】(1)见解析;(2)(i)46.25 (ii)见解析
【详解】
(1)由频率分布直方图,得经济项目等级为优秀人数为.其中女生数为14人,男生数为26人.经济项目等级为一般或良好的60名测试人员中,女生数为34人,男生数为26人.作出列联表:
优秀
一般或良好
合计
男生数
26
26
52
女生数
14
34
48
合计
40
60
100
.
由于,故有以上的把握认为“经济项目等级为优秀”与性别有关.
(2)(i)由频数分布表知,文化项目测试成绩低于40分的频率为,测试成绩低于50分的频率为.
故该市文化项目测试成绩中位数的估计值为.
(ii)①由直方图知,经济项目测试成绩低于40分的频率为,测试成绩低于50分的频率为,故该市文化项目测试成绩中位数的估计值为.
因为,所以该市文化项目学习成绩的更好.
②文化项目测试成绩良好率估计值为0.9,经济项目测试成绩良好率估计值为0.8,,所以该市文化项目学习成绩的更好.
③文化项目测试成绩平均数的估计值为
.
经济项目测试成绩平均数的估计值为
.
因为,所以该市文化项目学习成绩的更好.
④文化项目测试成绩优秀率估计值为0.35,经济项目测试成绩优秀率估计值为0.4,,所以该市对经济项目学习研究的更深入.
⑤该市文化项目测试成绩众数的估计值为45(分).
经济项目测试成绩众数的估计值为55(分).
因为,所以该市对经济项目学习研究的更深入.
模板攻略
模板二、用频率分布直方图估计总体
1.模板解决思路
在频率分布直方图中,各小矩形面积之和为1,频率=组距x 的面积.各小矩形的面积表示相应各组的频率。频率分布直方图以面积的形式反映了数据落在各小组内的频率大小.掌握好画频率分布直方图的步骤是解与频率分布直方图相关题目的基础.
2.模板解决步骤
①第一步确定频率分 布直方图的组距,以及所求值在直方图上的范围.
②第二步利用频率=小矩形的面积求出所求值的频率.
③第三步由总数x频率,求出所求值.
知识要点
知识点、作频率分布直方图的步骤
1.求极差:极差为一组数据中最大值与最小值的差.
2.决定组距与组数
将数据分组时,一般取等长组距,并且组距应力求“取整”,组数应力求合适,以使数据的分布规律能较清楚地呈现出来.
3.将数据分组
4.列频率分布表
各小组的频率=.
5.画频率分布直方图
纵轴表示,实际上就是频率分布直方图中各小长方形的高度,小长方形的面积=组距×=频率.
特别提示:
(1)频率分布表在数量表示上比较确切,但不够直观、形象,分析数据分布的总体态势时不太方便.
(2)频率分布直方图能够很容易地表示大量数据,非常直观地表明分布的形状,使我们能够看到在分布表中看不清楚的数据模式,但是从直方图本身得不出原始的数据内容,也就是说,把数据表示成直方图后,原有的具体数据信息就被抹掉了
例题演练
例题1
2017年“双11”前夕,某市场机构随机对中国公民进行问卷调查,用于调研“双11”民众购物意愿和购物预计支出状况. 分类统计后,从有购物意愿的人中随机抽取100人作为样本,将他(她)们按照购物预计支出(单位:千元)分成8组: [0, 2),[2, 4),[4, 6),…,[14, 16],并绘制成如图所示的频率分布直方图,其中,样本中购物预计支出不低于1万元的人数为a.
(Ⅰ) (i)求a的值,并估算这100人购物预计支出的平均值;
(ii)以样本估计总体,在有购物意愿的人群中,若至少有65%的人购物预计支出不低于x千元,求x的最大值.
(Ⅱ) 如果参与本次问卷调查的总人数为t,问卷调查得到下列信息:
①参与问卷调查的男女人数之比为2:3;
②男士无购物意愿和有购物意愿的人数之比是1:3,女士无购物意愿和有购物意愿的人数之比为1:4;
③能以90%的把握认为“双11购物意愿与性别有关”,但不能以95%的把握认为“双11购物意愿与性别有关”.
根据以上数据信息,求t所有可能取值组成的集合M.
附: ,其中.
独立检验临界值表:
0.100
0.050
0.025
0.010
2.706
3.841
5.024
6.635
【答案】(1) (i) a=22,平均值为7.8(千元)(ii)6.5 (2)M={800,850,900,950,1000,1050}
【解析】
试题解析:解:(Ⅰ) (i)因为(0.02+0.04+0.09+0.10+0.14+b+0.03+0.02)×2=l,
解得b=0.06,所以a=(b+0.03+0.02)×2×l00=22
由频率分布直方图可知,购物预计支出平均值为:
0.02×2×1+0.04×2×3+0.09×2×5+0.10×2×7
+0.14×2×9+0.06×2×11+0.03×2×13+0.02×2×15=7.8
所以这100人购物预计支出的平均值为7.8(千元).
(ii)由频率分布直方图可知,
前3个小矩形的面枳为:(0.02+0.04+0.09)×2=0.30,
后4个小矩形的面积为:(0.14+0.06+0.03+0.02)×2=0.50,
设x的最大值为y,所以y∈[6, 8),所以0.3+(y-6)×0.10=l-0.65,
所以y=6.5,所以x的最大值是6.5
(Ⅱ)设无购物意愿的男士人数为m,无购物意愿的女士人数为n,
由已知可以得到如下2×2列联表:
男士
女士
总计
无购物意愿
m
n
m+n
有购物意愿
3m
4n
3m+4n
总计
4m
5n
4m+5n
其中,t=4m+5n=10m
公式,可得:
因为在犯错误槪率不超过0.10的前提下,可以认为“双11”购物意愿与性别有关,但却不能以95%的把握认为“双11购物意愿与性别有关”.
所以,所以,
因为,所以m=80,85,90,95,100,105,
所以M={800,850,900,950,1000,1050}
例题2
“累积净化量()”是空气净化器质量的一个重要衡量指标,它是指空气净化器从开始使用到净化效率为时对颗粒物的累积净化量,以克表示.根据《空气净化器》国家标准,对空气净化器的累计净化量()有如下等级划分:
累积净化量(克)
12以上
等级
为了了解一批空气净化器(共2000台)的质量,随机抽取台机器作为样本进行估计,已知这台机器的累积净化量都分布在区间中.按照均匀分组,其中累积净化量在的所有数据有:和,并绘制了如下频率分布直方图:
(1)求的值及频率分布直方图中的值;
(2)以样本估计总体,试估计这批空气净化器(共2000台)中等级为的空气净化器有多少台?
(3)从累积净化量在的样本中随机抽取2台,求恰好有1台等级为的概率.
【答案】(1)(2)这批空气净化器等级为的空气净化器共有560台. (3)
【解析】
(Ⅰ)因为之间的数据一共有6个,
再由频率分布直方图可知:落在之间的频率为.
因此,.
∴.
(Ⅱ)由频率分布直方图可知:落在之间共:台,
又因为在之间共4台,
∴落在之间共28台,
故,这批空气净化器等级为的空气净化器共有560台.
(Ⅲ)设“恰好有1台等级为”为事件
依题意,落在之间共有6台.记为:,属于国标级有4台,我们记为:,
则从中随机抽取2个,所有可能的结果有15种,它们是: ,
而事件的结果有8种,它们是: .
因此事件的概率为.
模板攻略
模板三、用频率估计概率
1.模板解决思路
频率随着试验次数的变化而变化,而概率却是一个常数,它是频率的科学抽象,当试验次数越来越多时,频率向概率靠近,频率是概率的近似值
2.模板解决步骤
①第一步根据频数求出各部分频率.
②第二步将满足某条件的事件表示成各部分的组合形式.
③第三步算出满足某条件的频率.
④第四步用频率估计概率.
知识要点
知识点一、频率与概率的关系
(1)频率是概率的近似值,随着试验次数的增加,频率会越来越接近概率.
(2)频率本身是随机的,在试验前不能确定.
(3)概率是一个确定的常数,是客观存在的,在试验前已经确定,与试验次数无关.
知识点二、概率的基本性质
性质1;对任意的事件A,都有P(A)≥0.
性质2;必然事件的概率为1,不可能事件的概率为0,即P(Ω)=1,P(∅)=0.
性质3;如果事件A与事件B互斥,那么P(A∪B)=P(A)+P(B).
性质4;如果事件A与事件B互为对立事件,那么P(B)=1-P(A),P(A)=1-P(B).
性质5;如果A⊆B,那么P(A)≤P(B).
性质6;设A,B是一个随机试验中的两个事件,我们有P(A∪B)=P(A)+P(B)-P(A∩B).
例题演练
例题1
为落实十三五规划节能减排的国家政策,某职能部门对市场上两种设备的使用寿命进行调查统计,随机抽取A型和B型设备各100台,得到如下频率分布直方图:
(1)将使用寿命超过2500小时和不超过2500小时的台数填入下面的列联表:
超过2500小时
不超过2500小时
总计
A型
B型
总计
根据上面的列联表,能否有99%的把握认为使用寿命是否超过2500小时与型号有关?
(2)用分层抽样的方法从不超过2500小时A型和B型设备中抽取8台,再从这8台设备中随机抽取3台,其中A型设备为X台,求X的分布列和数学期望;
(3)已知用频率估计概率,现有一项工作需要10台同型号设备同时工作2500小时才能完成,工作期间设备损坏立即更换同型号设备(更换设备时间忽略不计),A型和B型设备每台的价格分别为1万元和0.6万元,A型和B型设备每台每小时耗电分别为2度和6度,电价为0.75元/度.只考虑设备的成本和电费,你认为应选择哪种型号的设备,请说明理由.
参考公式: K2=n(ad-bc)2(a+b)(c+d)(a+c)(b+d) , n=a+b+c+d .
参考数据:
P(K2≥k0)
0.050
0.010
0.001
k0
3.841
6.635
10.828
【答案】 (1)由频率分布直方图可知,A型超过2500小时的有 100×(0.0006+0.0005+0.0003)×500=70 台,则A型不超过2500小时的有30台,同理,B型超过2500小时的有 100×(0.0006+0.0003+0.0001)×500=50 台,则B型不超过2500小时的有50台.
列联表如下:
超过2500小时
不超过2500小时
总计
A型
70
30
100
B型
50
50
100
总计
120
80
200
因为 K2=200×(70×50-30×50)2100×100×120×80≈8.333>6.635 ,
所以有99%的把握认为使用寿命是否超过2500小时与型号有关.
(2)由(1)和分层抽样的定义可知A型设备有3台,B型设备有5台,
所以X的取值可能为0,1,2,3,
P(X=0)=C53C83=528 , P(X=1)=C31C52C83=1528 ,
P(X=2)=C32C51C83=1556 , P(X=3)=C33C83=156 ,
所以X的分布列为
X
0
1
2
3
P
528
1528
1556
156
所以 E(X)=0×528+1×1528+2×1556+3×156=98 .
(3)由频率分布直方图中的频率估计概率知:
A型设备每台更换的概率为0.3,所以10台A型设备估计要更换3台;
B型设备每台更换的概率为0.5,所以10台B型设备估计要更换5台,
选择A型设备的总费用 y1=(10+3)×1+10×2×0.75×2500×10-4=16.75 (万元),
选择B型设备的总费用 y2=(10+5)×0.6+10×6×0.75×2500×10-4=20.25 (万元),
所以选择A型设备.
【解析】 (1)根据直方图中数据可得列联表,计算观测值,根据临界值表可得;
(2)由分层抽样的定义可知A型设备有3台,B型设备有5台,可得X的取值可能为0,1, 2,3,分别求出概率,即可求得分布列及数学期望;
(3)计算A,B型设备的总费用比较可得.
例题2
某电视台举行文艺比赛,并通过网络对比赛进行直播.比赛现场有5名专家评委给每位参赛选手评分,场外观众可以通过网络给每位参赛选手评分.每位选手的最终得分由专家评分和观众评分确定.某选手参与比赛后,现场专家评分情况如表;场外有数万名观众参与评分,将评分按照[7,8),[8,9),[9,10]分组,绘成频率分布直方图如图:
专家
A
B
C
D
E
评分
9.6
9.5
9.6
8.9
9.7
(1)求a的值,并用频率估计概率,估计某场外观众评分不小于9的概率;
(2)从5名专家中随机选取3人,X表示评分不小于9分的人数;从场外观众中随机选取3人,用频率估计概率,Y表示评分不小于9分的人数;试求E(X)与E(Y)的值;
(3)考虑以下两种方案来确定该选手的最终得分:方案一:用所有专家与观众的评分的平均数 x 作为该选手的最终得分,方案二:分别计算专家评分的平均数 x1 和观众评分的平均数 x2 ,用 x1+x22 作为该选手最终得分.请直接写出 x 与 x1+x22 的大小关系.
【答案】 (1)解:由图知 a=1-0.2-0.5=0.3 ,某场外观众评分不小于9的概率是 12 .
(2)解:X的可能取值为2,3.P(X=2)= C42C11C53=35 ;P(X=3)= C43C53=25 .
所以X的分布列为
X
2
3
P
35
25
所以E(X)=2× 35+3×25=125 .
由题意可知, Y~B(3,12) ,所以E(Y)=np= 32 .
(3)解: x83 时, y=130+(n-83)×10=10n-700 ;
∴ 乙公司给超市的日利润 y (单位:元)与销售数量 n 的函数关系为: y={130,0≤n≤8310n-700,n>83 .
(Ⅱ)(1)记事件 A :“甲公司产品的销售数量不超过87件”,
则 P(A)=5+10+550=25 ;
(2)解:甲公司给超市的日利润为 X 元,
则 X 的所有可能取值为 171 , 174 , 177 , 180 , 183 ,
∴X=150×(171×5+174×10+177×5+180×20+183×10)=178.2 (元);
设乙公司给超市的日利润为 Y 元,
则 Y 的所有可能取值为 130 , 140 , 170 , 200 , 230 ,
则 ∴Y=150×(130×50+0×5+10×5+40×10+70×15+100×15)=190 (元);
∵X83 两种情况下得到关系式,进而得到结果;(Ⅱ)(1)利用频率的计算方式可求得对应的概率;(2)分别计算甲、乙两公司给到超市的日利润的平均数,选择平均数较大的产品进行销售.
相关试卷
这是一份高考数学专项解题方法归纳探究(全国通用)模板01 集合专项练习(解析版),共17页。试卷主要包含了单选题,多选题,填空题,解答题等内容,欢迎下载使用。
这是一份高考数学专项解题方法归纳探究(全国通用)模板01 集合(解析版),共9页。试卷主要包含了 求集合中元素的个数,集合的运算问题,求集合中参数的值等内容,欢迎下载使用。
这是一份高考数学专项解题方法归纳探究(全国通用)模板17 统计与概率(解析版),共16页。试卷主要包含了单选题,多选题,填空题,解答题等内容,欢迎下载使用。