2019届高三文科数学二轮复习配套教案:第一篇专题七第1讲 概率与统计
展开第1讲 概率与统计
(对应学生用书第46页)
1.(2018·全国Ⅱ卷,文5)从2名男同学和3名女同学中任选2人参加社区服务,则选中的2人都是女同学的概率为( D )
(A)0.6 (B)0.5 (C)0.4 (D)0.3
解析:设2名男同学为a,b,3名女同学为A,B,C,从中选出两人的情形有(a,b),(a,A),(a,B),(a,C),(b,A),(b,B),(b,C),(A,B),(A,C),(B,C),共10种,而都是女同学的情形有(A,B),(A,C),(B,C),共3种,故所求概率为=0.3.故选D.
2.(2018·全国Ⅲ卷,文5)若某群体中的成员只用现金支付的概率为0.45,既用现金支付也用非现金支付的概率为0.15,则不用现金支付的概率为( B )
(A)0.3 (B)0.4 (C)0.6 (D)0.7
解析:由题意可知不用现金支付的概率为1-0.45-0.15=0.4.故选B.
3.(2018·全国Ⅰ卷,文3)某地区经过一年的新农村建设,农村的经济收入增加了一倍实现翻番.为更好地了解该地区农村的经济收入变化情况,统计了该地区新农村建设前后农村的经济收入构成比例.得到如下饼图:
则下面结论中不正确的是( A )
(A)新农村建设后,种植收入减少
(B)新农村建设后,其他收入增加了一倍以上
(C)新农村建设后,养殖收入增加了一倍
(D)新农村建设后,养殖收入与第三产业收入的总和超过了经济收入的一半
解析:设新农村建设前,农村的经济收入为a,则新农村建设后,农村的经济收入为2a.新农村建设前后,各项收入的对比如下表:
| 新农村建设前 | 新农村建设后 | 新农村建设后变化情况 | 结论 |
种植收入 | 60%a | 37%×2a=74%a | 增加 | A错 |
续表
| 新农村建设前 | 新农村建设后 | 新农村建设后变化情况 | 结论 |
其他收入 | 4%a | 5%×2a=10%a | 增加一倍以上 | B对 |
养殖收入 | 30%a | 30%×2a=60%a | 增加了一倍 | C对 |
养殖收入 +第三产 业收入 | (30%+6%)a =36%a | (30%+28%)×2a =116%a | 超过经济收 入2a的一半 | D对 |
故选A.
4.(2017·全国Ⅰ卷,文4)
如图,正方形ABCD内的图形来自中国古代的太极图.正方形内切圆中的黑色部分和白色部分关于正方形的中心成中心对称.在正方形内随机取一点,则此点取自黑色部分的概率是( B )
(A) (B) (C) (D)
解析:不妨设正方形的边长为2,则正方形的面积为4,圆的半径为1,圆的面积为πr2=π.黑色部分的面积为圆面积的,即为,所以点取自黑色部分的概率是=.故选B.
5.(2017·全国Ⅲ卷,文18)某超市计划按月订购一种酸奶,每天进货量相同,进货成本每瓶4元,售价每瓶6元,未售出的酸奶降价处理,以每瓶2元的价格当天全部处理完.根据往年销售经验,每天需求量与当天最高气温(单位:℃)有关.如果最高气温不低于25 ℃,需求量为500瓶;如果最高气温位于区间[20,25),需求量为300瓶;如果最高气温低于20 ℃,需求量为200瓶.为了确定六月份的订购计划,统计了前三年六月份各天的最高气温数据,得下面的频数分布表:
最高 气温 | [10,15) | [15,20) | [20,25) | [25,30) | [30,35) | [35,40) |
天数 | 2 | 16 | 36 | 25 | 7 | 4 |
以最高气温位于各区间的频率估计最高气温位于该区间的概率.
(1)估计六月份这种酸奶一天的需求量不超过300瓶的概率;
(2)设六月份一天销售这种酸奶的利润为Y(单位:元),当六月份这种酸奶一天的进货量为450瓶时,写出Y的所有可能值,并估计Y大于零的概率.
解:(1)这种酸奶一天的需求量不超过300瓶,当且仅当最高气温低于25 ℃,由表格数据知最高气温低于25 ℃的频率为=0.6,所以估计这种酸奶一天的需求量不超过300瓶的概率为0.6.
(2)当这种酸奶一天的销售量为450瓶时,
若最高气温不低于25 ℃,则Y=6×450-4×450=900,
若最高气温位于区间[20,25),则Y=6×300+2(450-300)-4×450=300,
若最高气温低于20 ℃,则Y=6×200+2(450-200)-4×450=-100,
所以Y的所有可能值为900,300,-100.
Y大于零,当且仅当最高气温不低于20 ℃,由表格数据知,最高气温不低于20 ℃的频率为=0.8,
因此Y大于零的概率的估计值为0.8.
1.考查角度
古典概型、几何概率、统计图表、抽样方法、用样本估计概率及互斥事件、对立事件的概率.
2.题型及难易度
选择、填空、解答题,难度中低档.
(对应学生用书第47~48页)
抽样方法
【例1】 (1)(2018·长沙市名校实验班阶段性测试)一个总体由编号分别为01,02,…,29,30的30个个体组成,利用下面的随机数表选取6个个体,选取方法是从随机数表的第1行第4列开始,由左到右依次读取,则选出来的第6个个体的编号为 .
7816 6572 0802 6314 0702 4369 9728 0198
3204 9234 4935 8200 3623 4869 6938 7481
(2)(2018·广州市测试)
已知某区中小学学生人数如图所示.为了解该区学生参加某项社会实践活动的意向,拟采用分层抽样的方法来进行调查.若高中需抽取20名学生,则小学与初中共需抽取的学生人数为 .
解析:(1)从第1行第4列开始,满足要求的编号依次为20,26,24,19,23,03,所以选出来的第6个个体的编号为03.
(2)设小学与初中共需抽取的学生人数为x,依题意可得=,解得x=85.
答案:(1)03 (2)85
(1)简单随机抽样适用于总体个体数较少,具体方法有抽签法、随机数表法;
(2)系统抽样适用于总体的个体数较多,特点是等距抽样,即所抽到的数据是以抽样距为公差的等差数列.
(3)分层抽样适用于总体由差异明显的几部分组成,特点是按比例,即抽样比==.
热点训练1:(1)(2018·全国Ⅲ卷)某公司有大量客户,且不同年龄段客户对其服务的评价有较大差异.为了解客户的评价,该公司准备进行抽样调查,可供选择的抽样方法有简单随机抽样、分层抽样和系统抽样,则最合适的抽样方法是 .
(2)(2018·南昌市摸底调研)某校高三(2)班现有64名学生,随机编号为0,1,2,…,63,依编号顺序平均分成8组,组号依次为1,2,3,…,8.现用系统抽样方法抽取一个容量为8的样本,若在第1组中随机抽取的号码为5,则在第6组中抽取的号码为 .
解析:(1)因为客户数量大,且不同年龄段客户对其服务的评价有较大差异,所以最合适的抽样方法是分层抽样.
(2)依题意,分组间隔为=8,因为采用系统抽样方法,且在第1组中随机抽取的号码为5,所以在第6组中抽取的号码为5+5×8=45.
答案:(1)分层抽样 (2)45
古典概型、几何概型
考向1 古典概型
【例2】 (2018·郑州市二次质检)某市举行了一次初一学生调研考试,为了解本次考试学生的数学学科成绩情况,从中抽取部分学生的分数(满分为100分,得分取正整数,抽取学生的分数均在[50,100]内)作为样本(样本容量为n)进行统计,按照[50,60),[60,70),[70,80),[80,90),[90,100]的分组方法作出频率分布直方图,并作出了样本分数的茎叶图(茎叶图中仅列出了得分在[50,60),[80,90)内的数据),如图所示.
(1)求频率分布直方图中的x,y的值,并估计学生分数的中位数;
(2)在选取的样本中,从成绩在80分以上(含80分)的学生中随机抽取2名学生,求所抽取的2名学生中恰有一人的分数在[90,100]内的概率.
解:(1)由题意可知,样本容量n==50,
y==0.010,
x=0.100-0.004-0.010-0.016-0.030=0.040.
因为(0.016+0.030)×10=0.46<0.5,
所以学生分数的中位数在[70,80)内.
设中位数为a分,则0.46+0.04×(a-70)=0.5,得a=71,
所以估计学生分数的中位数为71分.
(2)由题意可知,分数在[80,90)内的学生有5人,记这5人分别为a1,a2,a3,a4,a5,分数在[90,100]内的学生有2人,记这2人分别为b1,b2,从这7名学生中随机抽取2名学生的所有情况有21种,分别为(a1,a2),(a1,a3),(a1,a4),(a1,a5),(a1,b1),(a1,b2),(a2,a3),(a2,a4),(a2,a5),(a2,b1),(a2,b2),(a3,a4),(a3,a5),(a3,b1),(a3,b2),(a4,a5),(a4,b1),(a4,b2),(a5,b1),(a5,b2),(b1,b2).其中2名学生中恰有一人的分数在[90,100]内的情况有10种,
故所抽取的2名学生中恰有一人的分数在[90,100]内的概率P=.
考向2 几何概型
【例3】 (2018·福州市质检)
如图,在菱形ABCD中,AB=2,∠ABC=60°,以该菱形的4个顶点为圆心的扇形的半径都为1.若在菱形内随机取一点,则该点取自阴影部分的概率是 .
解析:依题意,菱形中空白部分的面积总和等于一个半径为1的圆的面积,菱形ABCD的面积为2×2×sin 60°=2.所以该点落在阴影部分的概率P=1-=1-π.
答案:1-π
(1)求古典概型概率的一般步骤
①求出所有基本事件的个数n,常用的方法有列举法、列表法、画树状图法;
②求出事件A所包含的基本事件的个数m;
③代入公式P(A)=求解.
(2)求几何概型概率要寻找构成试验的全部结果所构成的区域和事件发生所构成的区域,有时需要设出变量,在坐标系中表示所需要的区域.
热点训练2:(1)(2018·广州市调研)
如图,四个相同的直角三角形与中间的小正方形拼成一个边长为2的大正方形,直角三角形中较小的锐角θ=.若向该大正方形区域内随机投掷一点,则该点落在中间小正方形区域内的概率是( )
(A) (B) (C) (D)
(2)(2018·石家庄市重点高中摸底)一个三位数,个位、十位、百位上的数字依次为x,y,z,当且仅当y>x,y>z时,称这样的数为“凸数”(如243),现从集合{1,2,3,4}中取出三个不相同的数组成一个三位数,则这个三位数是“凸数”的概率为( )
(A) (B) (C) (D)
解析:(1)在每个直角三角形中,斜边长为2,有一个内角为,所以每个直角三角形的面积S=,所以所求概率P==.故选A.
(2)从集合{1,2,3,4}中取出三个不相同的数组成一个三位数共有24个结果:123,124,132,134,142,143,213,214,231,234,241,243,312,314,321,324,341,342,412,413,421,423,431,432,其中是“凸数”的是132,142,143,231,241,243,341,342,共8个结果,所以这个三位数是“凸数”的概率为=.故选B.
用样本估计总体
【例4】 (2018·山东省、湖北省部分重点中学二次质检)某市教育局在数学竞赛结束后,为了评估学生的数学素养,特从所有参赛学生中随机抽取1 000名学生的成绩(单位:分,均为整数)作为样本进行估计,将成绩进行整理后分成五组,从左到右依次记为第一组,第二组,第三组,第四组,第五组,并绘制成如图所示的频率分布直方图.已知第一、三、四、五组的频率分别是0.30,0.15,0.10,0.05.
(1)求第二组的频率,并补全频率分布直方图;
(2)估计这1 000名学生成绩的平均数和方差;
(3)若成绩不低于65分的学生至少占总考生的75%就说明整体的数学素养优秀,否则不优秀,根据以上抽样情况,判断该市学生的数学素养情况.
解:(1)第二组的频率为1-(0.30+0.15+0.10+0.05)=0.40,
补全的频率分布直方图如图:
(2)样本的平均数=54.5×0.30+64.5×0.40+74.5×0.15+84.5×0.10+94.5×0.05=66.5,
样本的方差s2=(-12)2×0.30+(-2)2×0.40+82×0.15+182×0.10+282×0.05=126,
估计这1 000名学生成绩的平均数为66.5分,方差为126.
(3)成绩不低于65分的学生所占比例估计为1-0.3-0.4×=0.5=50%,
由于该估计值小于75%,故该市学生的数学素养不优秀.
用样本的数字特征估计总体的数字特征的方法
(1)用样本估计总体时,样本的平均数、标准差只是总体的平均数、标准差的近似值;
(2)若给出图形,如直方图,可分析样本数据的分布情况,大致判断平均数的范围,并利用数据的波动性大小反映方差(标准差)的大小.
(3)根据频率分布直方图求样本的平均数、方差(或标准差)、众数时,同一组数据中的数据用该组区间的中点值(组中值)代表.
热点训练3:(2017·全国Ⅲ卷)某城市为了解游客人数的变化规律,提高旅游服务质量,收集并整理了2014年1月至2016年12月期间月接待游客量(单位:万人)的数据,绘制了下面的折线图.
根据该折线图,下列结论错误的是( )
(A)月接待游客量逐月增加
(B)年接待游客量逐年增加
(C)各年的月接待游客量高峰期大致在7,8月
(D)各年1月至6月的月接待游客量相对于7月至12月,波动性更小,变化比较平稳
解析:由题图可知应选A.
热点训练4:(2018·长沙市名校实验班阶段测试)某农科所培育一种新型水稻品种,首批培育幼苗2 000株,株长均介于285 mm~335 mm,研究员从中随机抽取100株对株长进行统计分析,得到如下频率分布表.
株长/mm | 频数 | 频率 |
[285,295) | 2 | 0.02 |
[295,305) | 31 | a |
[305,315) | 35 | 0.35 |
[315,325) | b | 0.28 |
[325,335] | 4 | 0.04 |
合计 | 100 | 1 |
(1)根据频率分布表中的数据写出a,b的值;
(2)求样本的平均株长和样本方差s2(同一组数据用该区间的中点值代替,求s2时,用的整数部分计算);
(3)水稻幼苗在进入育种试验阶段后,研究员为了进一步优化品种,分别选取株长在[285,295)内的两株幼苗A,B的花粉与株长在[325,335]内的三株幼苗a,b,c的花粉进行随机杂交授粉,求A和a正好杂交授粉的概率.
解:(1)a=31÷100=0.31,
b=100×0.28=28.
(2)=290×0.02+300×0.31+310×0.35+320×0.28+330×0.04=310.1(mm),
s2=202×0.02+102×0.31+102×0.28+202×0.04=83.
(3)由题意知幼苗A,B的花粉与幼苗a,b,c的花粉进行杂交的所有可能情况为Aa,Ab,Ac,Ba,Bb,Bc,共6种,
所以A和a正好杂交授粉的概率为.
【例1】 (2018·郑州市质量预测)
我市某高中从高三年级甲、乙两个班中各选出7名学生参加2018年全国高中数学联赛(河南初赛),他们取得的成绩(满分100分)的茎叶图如图所示,其中甲班学生成绩的中位数是81,乙班学生成绩的平均数是86.若正实数a,b满足a,G,b成等差数列且x,G,y成等比数列,则+的最小值为( )
(A) (B)2 (C) (D)9
解析:由甲班学生成绩的中位数是81,可知81为甲班7名学生的成绩按从小到大的顺序排列的第4个数,故x=1.由乙班学生成绩的平均数为86,可得(-10)+(-6)+(-4)+(y-6)+5+7+10=0,解得y=4.由x,G,y成等比数列,可得G2=xy=4,由正实数a,b满足a,G,b成等差数列,可得G=2,a+b=2G=4,所以+=+×+=1+++4≥×(5+4)=(当且仅当b=2a时取等号).故+的最小值为.故选C.
【例2】 (2018·惠州市调研)某大学生在开学季准备销售一种文具盒进行试创业,在一个开学季内,每售出1盒该产品获得利润30元,未售出的产品,每盒亏损10元.根据历史资料,得到开学季市场需求量的频率分布直方图,如图所示.该同学为这个开学季购进了160盒该产品,以x(单位:盒,100≤x≤200)表示这个开学季内的市场需求量,y(单位:元)表示这个开学季内经销该产品的利润.
(1)根据直方图估计这个开学季内市场需求量x的众数和平均数;
(2)将y表示为x的函数;
(3)根据直方图估计利润y不少于4 000元的概率.
解:(1)由频率分布直方图得,这个开学季内市场需求量x的众数是150盒,
需求量在[100,120)内的频率为0.005 0×20=0.1,
需求量在[120,140)内的频率为0.010 0×20=0.2,
需求量在[140,160)内的频率为0.015 0×20=0.3,
需求量在[160,180)内的频率为0.012 5×20=0.25,
需求量在[180,200]内的频率为0.007 5×20=0.15,
则平均数=110×0.1+130×0.2+150×0.3+170×0.25+190×0.15=153(盒).
(2)因为每售出1盒该产品获得利润30元,未售出的产品,每盒亏损10元,
所以当100≤x<160时,y=30x-10×(160-x)=40x-1 600,
当160≤x≤200时,y=160×30=4 800,
所以y=
(3)因为利润y不少于4 000元,所以当100≤x<160时,由40x-1 600≥4 000,解得160>x≥140.
当160≤x≤200时,y=4 800>4 000恒成立,所以200≥x≥140时,利润y不少于4 000元.
所以由(1)知利润y不少于4 000元的概率P=1-0.1-0.2=0.7.
【例3】 (2018·广州市二次综合测试)A药店计划从甲、乙两家药厂选择一家购买100件某种中药材,为此A药店从这两家药厂提供的100件该种中药材中各随机抽取10件,以抽取的10件中药材的质量(单位:克)作为样本,样本数据的茎叶图如图所示.已知A药店根据中药材的质量的稳定性选择药厂.
(1)根据样本数据,A药店应选择哪家药厂购买中药材?(不必说明理由)
(2)若将抽取的样本分布近似看成总体分布,药店与所选药厂商定中药材的购买价格如下表:
每件中药材的质量n/克 | 购买价格/(元/件) |
n<15 | 50 |
15≤n≤20 | a |
n>20 | 100 |
(i)估计A药店所购买的100件中药材的总质量;
(ii)若A药店所购买的100件中药材的总费用不超过7 000元,求a的最大值.
解:(1)A药店应选择乙药厂购买中药材.
(2)(i)从乙药厂所抽取的10件中药材的质量的平均值为
=×(7+9+11+12+12+17+18+21+21+22)=15(克),
故A药店所购买的100件中药材的总质量的估计值为100×15=1 500(克).
(ii)由题知乙药厂所提供的每件中药材的质量n<15的概率为=0.5,15≤n≤20的概率为=0.2,n>20的概率为=0.3,则A药店所购买的100件中药材的总费用为100×(50×0.5+0.2a+100×0.3).
依题意得100×(50×0.5+0.2a+100×0.3)≤7 000,
解得a≤75,
所以a的最大值为75.
(对应学生用书第49页)
【典例】 (2018·全国Ⅰ卷,文19)(12分)某家庭记录了未使用节水龙头50天的日用水量数据(单位:m3)和使用了节水龙头50天的日用水量数据,得到频数分布表如下:
未使用节水龙头50天的日用水量频数分布表
日用 水量 | [0, 0.1) | [0.1, 0.2) | [0.2, 0.3) | [0.3, 0.4) | [0.4, 0.5) | [0.5, 0.6) | [0.6, 0.7) |
频数 | 1 | 3 | 2 | 4 | 9 | 26 | 5 |
使用了节水龙头50天的日用水量频数分布表
日用 水量 | [0, 0.1) | [0.1, 0.2) | [0.2, 0.3) | [0.3, 0.4) | [0.4, 0.5) | [0.5, 0.6) |
频数 | 1 | 5 | 13 | 10 | 16 | 5 |
(1)在图中作出使用了节水龙头50天的日用水量数据的频率分布直方图;
(2)估计该家庭使用节水龙头后,日用水量小于0.35 m3的概率;
(3)估计该家庭使用节水龙头后,一年能节省多少水?(一年按365天计算,同一组中的数据以这组数据所在区间中点的值作代表)
评分细则:
解:(1)如图所示.
…4分
(2)根据以上数据,该家庭使用节水龙头后50天日用水量小于0.35 m3的频率为
0.2×0.1+1×0.1+2.6×0.1+2×0.05=0.48,6分
因此该家庭使用节水龙头后,日用水量小于0.35 m3的概率的估计值为0.48.7分
(3)该家庭未使用节水龙头50天日用水量的平均数为
=×(0.05×1+0.15×3+0.25×2+0.35×4+0.45×9+0.55×26+0.65×5)=0.48.9分
该家庭使用了节水龙头后50天日用水量的平均数为
=×(0.05×1+0.15×5+0.25×13+0.35×10+0.45×16+0.55×5)=0.35.11分
估计使用节水龙头后,一年可节省水(0.48-0.35)×365=47.45(m3).12分
注:第(1)问得分说明:正确作出频率分布直方图,得4分;第(2)问得分说明:①计算出频率得2分,②由频率估计出概率,得1分,第(3)问得分说明:①计算出使用节水龙头前、后50天日用水量的平均数,各得2分,②计算出一年节省水量,得1分.
【答题启示】
(1)频率分布直方图的长方形的高度为的值,本题常把高度与频率混淆而失分.
(2)频率公式:频率==·组距(即频率分布直方图小矩形的面积).
(3)用样本频率估计概率.本题常只计算出频率,而忽视说明用频率值估计概率值,而失分.