|学案下载
终身会员
搜索
    上传资料 赚现金
    最新高考数学一轮复习-第十章-统计与统计案例【导学案】
    立即下载
    加入资料篮
    最新高考数学一轮复习-第十章-统计与统计案例【导学案】01
    最新高考数学一轮复习-第十章-统计与统计案例【导学案】02
    最新高考数学一轮复习-第十章-统计与统计案例【导学案】03
    还剩36页未读, 继续阅读
    下载需要10学贝 1学贝=0.1元
    使用下载券免费下载
    加入资料篮
    立即下载

    最新高考数学一轮复习-第十章-统计与统计案例【导学案】

    展开
    这是一份最新高考数学一轮复习-第十章-统计与统计案例【导学案】,共39页。

    课程标准
    1.理解随机抽样的必要性和重要性.会用简单随机抽样方法从总体中抽取样本;了解分层抽样和系统抽样方法.
    2.了解分布的意义和作用,能根据频率分布表画频率分布直方图、频率折线图、茎叶图,体会它们各自的特点.
    3.理解样本数据标准差的意义和作用,会计算数据标准差.
    4.能从样本数据中提取基本的数字特征(平均数、标准差),并作出合理的解释.
    5.会用样本的频率分布估计总体分布,会用样本的数字特征估计总体的数字特征,理解用样本估计总体的思想.
    6.会用随机抽样的基本方法和样本估计总体的思想解决一些简单的实际问题.
    [由教材回扣基础]
    1.简单随机抽样
    (1)抽取方式:逐个不放回地抽取.
    (2)特点:每个个体被抽到的概率相等.
    (3)常用方法:抽签法和随机数法.
    2.分层抽样
    (1)在抽样时,将总体分成互不交叉的层,然后按照一定的比例,从各层独立地抽取一定数量的个体,将各层取出的个体合在一起作为样本,这种抽样方法叫做分层抽样.
    (2)分层抽样的应用范围
    当总体是由差异明显的几个部分组成时,往往选用分层抽样.
    3.系统抽样的步骤
    假设要从容量为N的总体中抽取容量为n的样本.
    (1)编号码:先将总体的N个个体编号.
    (2)确定分段间隔k:对编号进行分段,当eq \f(N,n)(n是样本容量)是整数时,取k=eq \f(N,n).
    (3)定规则:在第1段用简单随机抽样确定第一个个体编号l(l≤k);按照一定的规则抽取样本.通常是将l加上间隔k得到第2个个体编号l+k,再加k得到第3个个体编号l+2k,依次进行下去,直到获取整个样本.
    4.作频率分布直方图的步骤
    (1)求极差(即一组数据中最大值与最小值的差);
    (2)决定组距与组数;
    (3)将数据分组;
    (4)列频率分布表;
    (5)画频率分布直方图.
    5.频率分布折线图和总体密度曲线
    (1)频率分布折线图:连接频率分布直方图中各小长方形上端的中点,就得到频率分布折线图.
    (2)总体密度曲线:随着样本容量的增加,作图时所分的组数增加,组距减小,相应的频率折线图会越来越接近于一条光滑曲线,统计中称这条光滑曲线为总体密度曲线.
    6.茎叶图的优点
    茎叶图的优点是不但可以记录所有信息,而且可以随时记录,这对数据的记录和表示都能带来方便.
    提醒:茎叶图中茎是指中间的一列数,叶是从茎的旁边生长出来的数.
    7.样本的数字特征
    澄清微点·熟记结论
    (1)平均数的性质
    ①若给定一组数据x1,x2,…,xn的平均数为eq \x\t(x),则ax1,ax2,…,axn的平均数为aeq \x\t(x);ax1+b,ax2+b,…,axn+b的平均数为aeq \x\t(x)+b.
    ②若M个数的平均数是X,N个数的平均数是Y,则这(M+N)个数的平均数是eq \f(MX+NY,M+N).
    ③若两组数据x1,x2,…,xn和y1,y2,…,yn的平均数分别是eq \x\t(x)和eq \x\t(y),则x1+y1,x2+y2,…,xn+yn的平均数是eq \x\t(x)+eq \x\t(y).
    (2)方差的性质
    若给定一组数据x1,x2,…,xn,其方差为s2,则ax1,ax2,…,axn的方差为a2s2;ax1+b,ax2+b,…,axn+b的方差为a2s2.特别地,当a=1时,有x1+b,x2+b,…,xn+b的方差为s2,这说明将一组数据中的每一个数据都加上一个相同的常数,方差是不变的,即不影响数据的波动性.
    [练小题巩固基础]
    一、准确理解概念(判断正误)
    (1)分层抽样中,每个个体被抽到的可能性与层数及分层有关.( )
    (2)平均数、众数与中位数从不同的角度描述了一组数据的集中趋势.( )
    (3)一组数据的方差越大,说明这组数据越集中.( )
    (4)频率分布直方图中,小矩形的面积越大,表示样本数据落在该区间的频率越大.( )
    答案:(1)× (2)√ (3)× (4)√
    =二、练牢教材小题
    1.(新北师大版必修①P180 T1改编)某城市收集并整理了该市2021年1月份至10月份每月最低气温与最高气温(单位:℃)的数据,绘制了如图所示的折线图,已知该市每月的最低气温与当月的最高气温两变量具有较好的线性关系,则根据该折线图,下列结论错误的是( )
    A.每月的最低气温与当月的最高气温两变量为正相关
    B.10月份的最高气温不低于5月份的最高气温
    C.月温差(最高气温减最低气温)的最大值出现在1月份
    D.最低气温低于0 ℃的月份有4个
    解析:选D 由题图可以看出,当最低气温较大时,最高气温也较大,故A正确;10月份的最高气温大于20 ℃,而5月份的最高气温不超过20 ℃,故B正确;从各月的温差看,1月份的温差最大,故C正确;而最低气温低于0 ℃的月份是1,2,4三个月份,故D错误.
    2.(人教A版必修③P64 T5改编)一支田径队有男运动员56人,女运动员42人,按性别用分层抽样的方式从全体运动员中抽出一个容量为28的样本,则男、女运动员应各抽______人,______人.
    答案:16 12
    3.(新人教A版必修②P197T1改编)如图是100位居民月均用水量的频率分布直方图,则月均用水量为[2,2.5)范围内的居民数为________.
    解析:由频率分布直方图可知,月均用水量为[2,2.5)范围内的居民所占频率为0.5×0.5=0.25,所以月均用水量为[2,2.5)范围内的居民数为100×0.25=25.
    答案:25
    4.(新苏教版必修②P254T10改编)已知数据x1,x2,…,x10的平均数为2,方差为3,那么数据2x1+3,2x2+3,…,2x10+3的平均数和方差分别为________.
    答案:7,12
    三、练清易错易混
    1.(忽视随机抽样的等可能性致误)某校要从高一、高二、高三共2 020名学生中选取50名学生组成志愿团,若先用简单随机抽样的方法从2 020名学生中剔除20名学生,再从剩下的2 000名学生中按分层抽样的方法抽取50名学生,则下面对每名学生入选的概率描述正确的是________.(填序号)
    ①都相等且为eq \f(50,2 020);②都相等且为eq \f(1,40);③不完全相等.
    答案:①
    2.(混淆众数、中位数、平均数的概念)某校从参加高二年级学业水平测试的学生中抽出80名学生,其数学成绩(均为整数)的频率分布直方图如图所示,则这次测试数学成绩的众数为________,这次测试数学成绩的中位数为________(精确到0.1),这次测试数学成绩的平均数为________.
    答案:75 73.3 72
    3.(不理解均值、方差的意义)某校高二年级在一次数学选拔赛中,因为甲、乙两人的竞赛成绩相同,所以决定根据平时在相同条件下进行的六次测试确定出最佳人选,这六次测试的成绩数据如下:
    则eq \x\t(x)甲=________,eq \x\t(x)乙=________,s甲2=________,s乙2=________,进而根据以上数据可判断最佳人选为________.
    答案:133 133 eq \f(47,3) eq \f(38,3) 乙
    命题视角一 抽样方法的应用(自主练通)
    1.利用简单随机抽样,从n个个体中抽取一个容量为10的样本.若第二次抽取时,余下的每个个体被抽到的概率为eq \f(1,3),则在整个抽样过程中,每个个体被抽到的概率为( )
    A.eq \f(1,4) B.eq \f(1,3) C.eq \f(5,14) D..eq \f(10,27)
    解析:选C 根据题意,eq \f(9,n-1)=eq \f(1,3),解得n=28.故在整个抽样过程中每个个体被抽到的概率为eq \f(10,28)=eq \f(5,14).
    2.福利彩票“双色球”中红球的号码可以从01,02,03,…,32,33这33个两位号码中选取,小明利用如下所示的随机数表选取红色球的6个号码,选取方法是从第1行第9列的数字开始,从左到右依次读取数据,则第四个被选中的红色球的号码为( )
    A.12 B.33 C.06 D.16
    解析:选C 被选中的红色球的号码依次为17,12,33,06,32,22.所以第四个被选中的红色球的号码为06.
    3.现从编号为1,2,…,96的观众中,采用系统抽样的方法抽取八位幸运观众,其中有两个编号为21与93,则所抽取的8个编号的中位数为( )
    A.45 B.48 C.51 D.57
    解析:选C 由系统抽样的特点可知,其抽样方法是等间隔抽取,由于从96名观众中抽取8位幸运观众,因此间隔k=eq \f(96,8)=12,设在第一组抽取的编号为x,由于在第2组抽取的编号为21,在第8组抽取的编号为93,所以在第2组抽取的号码为x+12=21,因此x=9,则抽取的8个号码依次为9,21,33,45,57,69,81,93,这8个数的中位数为eq \f(45+57,2)=51.故选C.
    4.某公司生产A,B,C三种不同型号的轿车,其产量之比为2∶3∶4,为检验该公司的产品质量,用分层抽样的方法抽取一个容量为n的样本,若样本中A种型号的轿车比B种型号的轿车少8辆,则n=( )
    A.96 B.72 C.48 D.36
    解析:选B 由题意得eq \f(3,9)n-eq \f(2,9)n=8,所以n=72.故选B.
    5.山东某高中针对学生发展要求,开设了富有地方特色的“泥塑”与“剪纸”两个社团,已知报名参加这两个社团的学生共有800人,按照要求每人只能参加一个社团,各年级参加社团的人数情况如下表:
    其中x∶y∶z=5∶3∶2,且“泥塑”社团的人数占两个社团总人数的eq \f(3,5),为了了解学生对这两个社团活动的满意程度,从中抽取一个50人的样本进行调查,则从高二年级“剪纸”社团的学生中应抽取________人.
    解析:因为“泥塑”社团的人数占两个社团总人数的eq \f(3,5),所以“剪纸”社团的人数占两个社团总人数的eq \f(2,5),所以“剪纸”社团的人数为800×eq \f(2,5)=320.易知“剪纸”社团中高二年级人数所占比例为eq \f(y,x+y+z)=eq \f(3,5+3+2)=eq \f(3,10),所以“剪纸”社团中高二年级人数为320×eq \f(3,10)=96.由题意知,抽样比为eq \f(50,800)=eq \f(1,16),所以从高二年级“剪纸”社团中抽取的人数为96×eq \f(1,16)=6.
    答案:6
    [一“点”就过]
    1.应用随机数法的两个关键点
    (1)确定以表中的哪个数(哪行哪列)为起点,以哪个方向为读数的方向;
    (2)读数时注意结合编号特点进行读取.若编号为两位数字,则两位两位地读取;若编号为三位数字,则三位三位地读取,有超过总体号码或出现重复号码的数字舍去,这样继续下去,直到获取整个样本.
    2.解决分层抽样的常用公式
    先确定抽样比,然后把各层个体数乘以抽样比,即得各层要抽取的个体数.
    (1)抽样比=eq \f(样本容量,总体容量)=eq \f(各层样本容量,各层个体总量);
    (2)层1的容量∶层2的容量∶层3的容量=样本中层1的容量∶样本中层2的容量∶样本中层3的容量.
    命题视角二 样本的数字特征的计算
    [典例] (1)已知10名工人生产同一零件,生产的件数分别是16,18,15,11,16,18,18,
    17,15,13,设其平均数为a,中位数为b,众数为c,则有( )
    A.a>b>c B.a>c>b
    C.c>a>b D.c>b>a
    (2)已知某样本的容量为50,平均数为70,方差为75.现发现在收集这些数据时,其中的两个数据记录有误,一个错将80记录为60,另一个错将70记录为90.在对错误的数据进行更正后,重新求得样本的平均数为eq \x\t(x),方差为s2,则( )
    A.eq \x\t(x)=70,s2<75 B.eq \x\t(x)=70,s2>75
    C.eq \x\t(x)>70,s2<75 D..eq \x\t(x)<70,s2>75
    [解析] (1)把题中数据按从小到大排列为11,13,15,15,16,16,17,18,18,18,平均数为a=eq \f(1,10)(11+13+15+15+16+16+17+18+18+18)=eq \f(157,10)=15.7,中位数为16,众数为18,则b=16,c=18,所以c>b>a.
    (2)由题意,eq \x\t(x)=eq \f(70×50+80-60+70-90,50)=70,设收集的48个准确数据分别为x1,x2,…,x48,则75=eq \f(1,50)[(x1-70)2+(x2-70)2+…+(x48-70)2+(60-70)2+(90-70)2]=eq \f(1,50)[(x1-70)2+(x2-70)2+…+(x48-70)2+500],s2=eq \f(1,50)[(x1-70)2+(x2-70)2+…+(x48-70)2+(80-70)2+(70-70)2]=eq \f(1,50)[(x1-70)2+(x2-70)2+…+(x48-70)2+100]<75,所以s2<75.
    [答案] (1)D (2)A
    [方法技巧]
    (1)利用平均数、方差的性质可简化运算,要熟记.
    (2)方差描述一组数据围绕平均数波动的幅度.
    应用时注意其公式的简化形式:s2=eq \f(1,n)eq \i\su(i=1,n,x)i2-eq \x\t(x)2.
    [针对训练]
    1.某学习小组在一次数学测验中,得100分的有1人,95分的有1人,90分的有2人,85分的有4人,80分和75分的各1人,则该学习小组成绩的平均数、众数、中位数分别是( )
    A.85分、85分、85分 B.87分、85分、86分
    C.87分、85分、85分 D.87分、85分、90分
    解析:选C 由题意知,该学习小组共有10人,因此众数和中位数都是85,平均数为eq \f(1,10)(100+95+2×90+4×85+80+75)=87.
    2.已知样本9,10,11,x,y的平均数是10,标准差为eq \r(2),则xy=________.
    解析:由平均数得9+10+11+x+y=50,∴x+y=20.又由(9-10)2+(10-10)2+(11-10)2+(x-10)2+(y-10)2=(eq \r(2))2×5=10,得x2+y2-20(x+y)=-192,(x+y)2-2xy-20(x+y)=-192,∴xy=96.
    答案:96
    命题视角三 统计图表的应用
    [典例] (1)(2021·全国甲卷)为了解某地农村经济情况,对该地农户家庭年收入进行抽样调查,将农户家庭年收入的调查数据整理得到如下频率分布直方图:
    根据此频率分布直方图,下面结论中不正确的是( )
    A.该地农户家庭年收入低于4.5万元的农户比率估计为6%
    B.该地农户家庭年收入不低于10.5万元的农户比率估计为10%
    C.估计该地农户家庭年收入的平均值不超过6.5万元
    D.估计该地有一半以上的农户,其家庭年收入介于4.5万元至8.5万元之间
    (2)2021年新型冠状病毒肺炎疫情对消费饮食行业造成了很大影响,为了解A,B两家大型餐饮店受影响的程度,现统计了2021年2月到7月A,B两店每月营业额,得到如图所示的折线图,根据营业额折线图,下列说法不正确的是( )
    A.A店营业额的极差比B店营业额的极差小
    B.A店2月到7月营业额的中位数是31
    C.B店2月到7月每月增加的营业额越来越多
    D.B店2月到7月的营业额的平均值为29
    [解析] (1)由频率分布直方图可知,该地农户家庭年收入低于4.5万元的农户比率约为0.02+0.04=0.06,所以A正确;该地农户家庭年收入不低于10.5万元的农户比率约为0.02+0.02+0.02+0.04=0.10,所以B正确;由频率分布直方图可知,该地农户家庭年收入的平均值约为3×0.02+4×0.04+5×0.1+6×0.14+7×0.2+8×0.2+9×0.1+10×0.1+11×0.04+12×0.02+13×0.02+14×0.02=7.68>6.5,所以C不正确;该地农户家庭年收入介于4.5万元至8.5万元之间的比率约为0.1+0.14+0.2+0.2=0.64>0.5,所以D正确.故选C.
    (2)由折线图可知,A店营业额的极差为64-14=50(万元),B店营业额的极差为63-2=61(万元),故A正确;由A店2月到7月营业额由低到高依次为14,20,26,36,45,64,得A店2月到7月营业额的中位数是(26+36)÷2=31,故B正确;因为B店从4月到5月营业额的增加量为19,从5月到6月营业额的增加量为15,故C错误;B店2月到7月的营业额的平均值为eq \f(1,6)(2+8+16+35+50+63)=29,故D正确.
    [答案] (1)C (2)C
    [方法技巧]
    1.谨记频率分布直方图的相关公式
    (1)直方图中各小长方形的面积之和为1.
    (2)直方图中纵轴表示eq \f(频率,组距),故每组样本的频率为组距×eq \f(频率,组距),即矩形的面积.
    (3)直方图中每组样本的频数为频率×总数.
    2.频率分布直方图中数字特征的计算
    (1)最高的小长方形底边中点的横坐标即是众数.
    (2)中位数左边和右边的小长方形的面积和是相等的.
    (3)平均数是频率分布直方图的“重心”,等于频率分布直方图中每个小长方形的面积乘以小长方形底边中点的横坐标之和.
    [针对训练]
    1.(2021·广东湛江一模)中国数学奥林匹克由中国数学会主办,是全国中学生级别最高、规模最大、最具影响力的数学竞赛.某重点高中为参加中国数学奥林匹克做准备,对该校数学集训队进行一次选拔赛,所得分数的茎叶图如图所示,则该集训队考试成绩的众数与中位数分别为( )
    A.85,75 B.85,76
    C.74,76 D.75,77
    解析:选B 由茎叶图可知,85出现了3次,出现的次数最多,所以众数为85;中位数为eq \f(75+77,2)=76.
    2.某大学生暑假到工厂参加生产劳动,生产了100件产品,质检人员测量其长度(单位:厘米),将所得数据分成6组:[90,91),[91,92),[92,93),[93,94),[94,95),[95,96],得到如图所示的频率分布直方图,则对这100件产品,下列说法中不正确的是( )
    A.b=0.25
    B.长度落在区间[93,94)内的个数为35
    C.长度的众数一定落在区间[93,94)内
    D.长度的中位数一定落在区间[93,94)内
    解析:选C 对于A,由频率和为1,得(0.35+b+0.15+0.1×2+0.05)×1=1,解得b=0.25,所以A正确;对于B,长度落在区间[93,94)内的个数为100×0.35=35,所以B正确;对于C,频率分布直方图上不能判断长度的众数一定落在区间[93,94)内,所以C错误;对于D,[90,93)内有45个数,[94,96]内有20个数,所以长度的中位数一定落在区间[93,94)内,所以D正确.
    命题视角四 用样本估计总体
    [典例] (2021·全国乙卷)某厂研制了一种生产高精产品的设备,为检验新设备生产产品的某项指标有无提高,用一台旧设备和一台新设备各生产了10件产品,得到各件产品该项指标数据如下:
    旧设备和新设备生产产品的该项指标的样本平均数分别记为eq \a\vs4\al(\x\t(x))和eq \a\vs4\al(\x\t(y)),样本方差分别记为s12和s22.
    (1)求eq \a\vs4\al(\x\t(x)),eq \x\t(y),s12,s22.
    (2)判断新设备生产产品的该项指标的均值较旧设备是否有显著提高如果eq \x\t(y)-eq \x\t(x)≥2eq \r(\f(s12+s22,10)),那么认为新设备生产产品的该项指标的均值较旧设备有显著提高,否则不认为有显著提高.
    [解] (1)∵eq \x\t(x)=eq \f(1,10)×(9.8+10.3+10.0+10.2+9.9+9.8+10.0+10.1+10.2+9.7)=10,eq \x\t(y)=eq \f(1,10)×(10.1+10.4+10.1+10.0+10.1+10.3+10.6+10.5+10.4+10.5)=10.3,∴=eq \f(1,10)×(0.22+0.32+02+0.22+0.12+0.22+02+0.12+0.22+0.32)=0.036,s22=eq \f(1,10)×(0.22+0.12+0.22+0.32+0.22+02+0.32+0.22+0.12+0.22)=0.04.
    (2)∵eq \x\t(y)-eq \x\t(x)=10.3-10=0.3,2 =2eq \r(\f(0.036+0.04,10))=2eq \r(0.007 6),∴eq \x\t(y)-eq \x\t(x)=0.3=2×0.15=2×eq \r(0.152)=2×eq \r(0.022 5)>2×eq \r(0.007 6),满足eq \x\t(y)-eq \x\t(x)≥2,∴新设备生产产品的该项指标的均值较旧设备有显著提高.
    eq \a\vs4\al([方法技巧])
    利用样本的数字特征解决优化决策问题的依据
    (1)平均数反映了数据取值的平均水平;标准差、方差描述了一组数据围绕平均数波动的大小.标准差、方差越大,数据的离散程度越大,越不稳定;标准差、方差越小,数据的离散程度越小,越稳定.
    (2)用样本估计总体就是利用样本的数字特征来描述总体的数字特征.
    [针对训练]
    1.(2020·全国Ⅰ卷)某厂接受了一项加工业务,加工出来的产品(单位:件)按标准分为A,B,C,D四个等级.加工业务约定:对于A级品、B级品、C级品,厂家每件分别收取加工费90元,50元,20元;对于D级品,厂家每件要赔偿原料损失费50元.该厂有甲、乙两个分厂可承接加工业务.甲分厂加工成本费为25元/件,乙分厂加工成本费为20元/件.厂家为决定由哪个分厂承接加工业务,在两个分厂各试加工了100件这种产品,并统计了这些产品的等级,整理如下:
    甲分厂产品等级的频数分布表
    乙分厂产品等级的频数分布表
    (1)分别估计甲、乙两分厂加工出来的一件产品为A级品的概率;
    (2)分别求甲、乙两分厂加工出来的100件产品的平均利润,以平均利润为依据,厂家应选哪个分厂承接加工业务?
    解:(1)由试加工产品等级的频数分布表知,甲分厂加工出来的一件产品为A级品的概率的估计值为eq \f(40,100)=0.4;乙分厂加工出来的一件产品为A级品的概率的估计值为eq \f(28,100)=0.28.
    (2)由数据知甲分厂加工出来的100件产品利润的频数分布表为
    因此甲分厂加工出来的100件产品的平均利润为
    eq \f(1,100)(65×40+25×20-5×20-75×20)=15.
    由数据知乙分厂加工出来的100件产品利润的频数分布表为
    因此乙分厂加工出来的100件产品的平均利润为
    eq \f(1,100)(70×28+30×17+0×34-70×21)=10.
    比较甲、乙两分厂加工的产品的平均利润,应选甲分厂承接加工业务.
    2.某行业主管部门为了解本行业中小企业的生产情况,随机调查了100个企业,得到这些企业第一季度相对于前一年第一季度产值增长率y的频率分布表.
    (1)分别估计这类企业中产值增长率不低于40%的企业比例、产值负增长的企业比例;
    (2)求这类企业产值增长率的平均数与标准差的估计值(同一组中的数据用该组区间的中点值为代表).(精确到0.01)
    附:eq \r(74)≈8.602.
    解:(1)根据产值增长率频率分布表得,所调查的100个企业中产值增长率不低于40%的企业频率为eq \f(14+7,100)=0.21,产值负增长的企业频率为eq \f(2,100)=0.02,
    用样本频率分布估计总体分布,得这类企业中产值增长率不低于40%的企业比例为21%,产值负增长的企业比例为2%.
    (2)eq \x\t(y)=eq \f(1,100)×(-0.10×2+0.10×24+0.30×53+0.50×14+0.70×7)=0.30,
    s2=eq \f(1,100)×[(-0.40)2×2+(-0.20)2×24+02×53+0.202×14+0.402×7]=0.029 6,
    s=eq \r(0.029 6)=0.02×eq \r(74)≈0.17.
    所以这类企业产值增长率的平均数与标准差的估计值分别为0.30,0.17.
    数学建模·练抽象思维——统计中的创新应用问题
    1.(创新学科情境)一个样本a,3,5,7的平均数是b,且a,b分别是数列{2n-2}(n∈N*)的第2项和第4项,则这个样本的方差是( )
    A.3 B.4
    C.5 D. 6
    解析:选C 由题意,得a=22-2=1,b=24-2=4,∴s2=eq \f(1,4)[(1-4)2+(3-4)2+(5-4)2+(7-4)2]=5.
    2.(创新学科情境)某高校为从甲、乙两名学生中选出一名学生会主席,对甲、乙两名学生的领导力进行了考核.已知一个人的领导力由影响力、控制力、决断力、前瞻力和感召力这五项能力构成.通过考核,得到甲、乙两人的五项能力指标值的雷达图如图所示,则下列说法中正确的是( )
    A.从整体上看,乙的领导力高于甲的领导力
    B.甲、乙两人的五项能力指标值的方差不同
    C.如果仅从控制力、决断力和前瞻力三项能力考虑,乙的领导力低于甲的领导力
    D.如果仅从影响力、感召力、控制力三项能力考虑,甲的领导力高于乙的领导力
    解析:选C 由雷达图可得甲的五项能力指标值分别为6,5,4,5,4,乙的五项能力指标值分别为6,4,5,4,5,甲、乙两人的五项能力指标值的和相同,所以从整体上看,甲、乙两人的领导力相当,选项A错误;由对A的分析易知甲、乙两人五项能力指标值的方差相同,选项B错误;从控制力、决断力、前瞻力考虑,甲的能力指标值的均值为eq \f(14,3),乙的能力指标值的均值为eq \f(13,3),故甲的领导力高于乙的领导力,选项C正确;从影响力、感召力、控制力考虑,甲、乙的能力指标值的均值相同,故甲、乙两人的领导力相当,选项D错误.故选C.
    3.(走向生产生活)为了普及环保知识,增强环保意识,某大学随机抽取30名学生参加环保知识测试,得分(十分制)如图所示,假设得分的中位数为m,众数为n,平均数为eq \x\t(x),则m,n,eq \x\t(x)的大小关系为________.(用“<”连接)
    解析:由图可知,30名学生得分的中位数为第15个数和第16个数(分别为5,6)的平均数,即m=5.5;又5出现次数最多,故n=5;eq \x\t(x)=eq \f(1,30)(2×3+3×4+10×5+6×6+3×7+2×8+2×9+2×10)≈5.97.故n答案:n4.(决策性问题)2021年9月15日20时,中华人民共和国第十四届运动会在西安奥体中心体育场盛大开幕,会歌《追着未来出发》将百年梦想与健康中国高度融合,标志着我国竞技体育水平的提高以及对竞技体育的重视,也激励着广大体育爱好者为梦前行.少年有梦,不应止于心动,更要付诸行动,某篮球运动爱好者为了提高自己的投篮水平,制订了一个短期训练计划,为了了解训练效果,执行训练前,他统计了10场比赛的得分,计算出得分的中位数为15分,平均得分为15分,得分的方差为42.5分2.执行训练后也统计了10场比赛的得分,分别为:14,9,16,21,18,8,12,23,14,15(单位:分).
    (1)请计算该篮球运动员执行训练后统计的10场比赛得分的中位数、平均得分与方差.
    (2)如果仅从执行训练前后统计的各10场比赛得分数据分析,你认为训练计划对该运动员的投篮水平的提高是否有帮助?为什么?
    解:(1)训练后得分的中位数为eq \f(14+15,2)=14.5,平均得分为eq \f(1,10)(14+9+16+21+18+8+12+23+14+15)=15(分),方差为eq \f(1,10)[(14-15)2+(9-15)2+(16-15)2+(21-15)2+(18-15)2+(8-15)2+(12-15)2+(23-15)2+(14-15)2+(15-15)2]=20.6(分2).
    (2)尽管训练后中位数比训练前稍小,但平均得分一样,训练后方差20.6小于训练前方差42.5,说明训练后得分稳定性提高了,这是投篮水平提高的表现,故此训练计划对该运动员的投篮水平的提高有帮助.
    [课时跟踪检测]
    一、基础练——练手感熟练度
    1.(2022·云南一检)某学校为了了解高一年级、高二年级、高三年级这三个年级的学生对学校有关课外活动内容与时间安排的意见,拟从这三个年级中按人数比例抽取部分学生进行调查,则最合理的抽样方法是( )
    A.抽签法 B.随机数法
    C.分层抽样法 D.系统抽样法
    解析:选C 由于研究对象是三个年级学生的意见,故应按分层抽样法来抽取,故选C.
    2.某公司生产三种型号的轿车,产量分别为1 500 辆,6 000辆和2 000辆.为检验该公司的产品质量,公司质监部门要抽取57辆进行检验,则下列说法不正确的是( )
    A.应采用分层抽样抽取
    B.应采用抽签法抽取
    C.三种型号的轿车依次应抽取9辆,36辆,12辆
    D.这三种型号的轿车,每一辆被抽到的概率都是相等的
    解析:选B 因为是三种型号的轿车,个体差异明显,所以选择分层抽样,故A正确;因为个体数目多,用抽签法制签难,搅拌不均匀,抽出的样本不具有很好的代表性,故B不正确;抽样比为 eq \f(57,1 500+6 000+2 000)=eq \f(3,500),三种型号的轿车依次应抽取9辆,36辆,12辆,故C正确;分层抽样中,每一个个体被抽到的可能性相同,故D正确.
    3.如图所示的茎叶图记录了甲、乙两组各5名工人某日的产量数据(单位:件).若这两组数据的中位数相等,且平均值也相等,则x和y的值分别为( )
    A.3,5 B.5,5 C.3,7 D.5,7
    解析:选A 由两组数据的中位数相等可得65=60+y,解得y=5,又它们的平均值相等,所以eq \f(1,5)×[56+62+65+74+(70+x)]=eq \f(1,5)×(59+61+67+65+78),解得x=3.
    4.(2022·南京模拟)将6个数据1,2,3,4,5,a去掉最大的一个,剩下的5个数据的平均数为1.8,则a=________.
    解析:若a是最大的数,则eq \f(1+2+3+4+5,5)=3,不符合题意.故5是最大的数,则eq \f(1+2+3+4+a,5)=1.8,解得a=-1.
    答案:-1
    二、综合练——练思维敏锐度
    1.(2020·天津高考)从一批零件中抽取80个,测量其直径(单位:mm),将所得数据分为9组:[5.31,5.33),[5.33,5.35),…,[5.45,5.47),[5.47,5.49],并整理得到如下频率分布直方图,则在被抽取的零件中,直径落在区间[5.43,5.47]内的个数为( )
    A.10 B.18 C.20 D.36
    解析:选B 由题知[5.43,5.45)与[5.45,5.47]所对应的小矩形的高分别为6.25,5.00,所以[5.43,5.47]的频率为(6.25+5.00)×0.02=0.225,所以直径落在区间[5.43,5.47]内的个数为80×0.225=18,故选B.
    2.(2022·宝鸡一模)为落实《国家学生体质健康标准》达标测试工作,全面提升学生的体质健康水平,某校高二年级体育组教师在高二年级随机抽取部分男生,测试了立定跳远项目,依据测试数据绘制了如图所示的频率分布直方图.已知立定跳远200 cm以上成绩为及格,255 cm以上成绩为优秀,根据图中的数据估计该校高二年级男生立定跳远项目的及格率和优秀率分别是( )
    A.87%,3% B.80%,3%
    C.87%,6% D.80%,6%
    解析:选C 由频率分布直方图可得,优秀率为0.003×20×100%=6%.∵1-eq \b\lc\(\rc\)(\a\vs4\al\c1(0.003+0.014×\f(200-195,20)))×20=0.87,∴及格率为87%.故选C.
    3.(2022·成都一诊)甲、乙两台机床同时生产一种零件,10天中,两台机床每天出的次品数如表所示:
    eq \x\t(x)1,eq \x\t(x)2分别表示甲、乙两组数据的平均数,s1,s2分别表示甲、乙两组数据的方差,则下列选项正确的是( )
    A.eq \x\t(x)1=eq \x\t(x)2,s1>s2 B.eq \x\t(x)1>eq \x\t(x)2,s1>s2
    C.eq \x\t(x)1s2 D..eq \x\t(x)1>eq \x\t(x)2,s1解析:选B 由表格数据知,eq \x\t(x)1=eq \f(1,10)(0+1+0+2+2+0+3+1+2+4)=1.5,eq \x\t(x)2=eq \f(1,10)(2+2+1+1+1+2+1+1+0+1)=1.2,∴eq \x\t(x)1>eq \x\t(x)2.s1=eq \f(1,10)eq \i\su(i=1,10, )(x1i-eq \x\t(x1))2=1.65,s2=eq \f(1,10)eq \i\su(i=1,10, )(x2i-eq \x\t(x2) )2=0.36,∴s1>s2.
    4.等差数列x1,x2,x3,…,x9的公差为1,若以上述数据x1,x2,x3,…,x9为样本,则此样本的方差为( )
    A.eq \f(20,3) B.eq \f(10,3) C.60 D.30
    解析:选A 由等差数列的性质得样本的平均数为eq \f(1,9)(x1+x2+…+x9)=eq \f(1,9)(2x5+2x5+2x5+2x5+x5)=x5,所以该组数据的方差为eq \f(1,9)[(x1-x5)2+(x2-x5)2+…+(x9-x5)2]=eq \f(1,9)[2×(42+32+22+12)]=eq \f(20,3).
    5.为了考察某校各班参加课外书法小组的人数,从全校随机抽取5个班级,把每个班级参加该小组的人数作为样本数据.已知样本平均数为7,样本方差为4,且样本数据互不相同,则样本数据中的最大值为( )
    A.9 B.10 C.11 D.12
    解析:选B 不妨设样本数据为x1,x2,x3,x4,x5,且x16.某企业三个分厂生产同一种电子产品,三个分厂的产量分布如图所示.现在用分层抽样方法从三个分厂生产的产品中共抽取100件进行使用寿命的测试,则第一分厂应抽取的件数为________;测试结果为第一、二、三分厂取出的产品的平均使用寿命分别为1 020小时,980小时,1 030小时,估计这个企业生产的产品的平均使用寿命为________小时.
    解析:由分层抽样可知,第一分厂应抽取100×50%=50(件).由样本的平均数估计总体的平均数,可知这批电子产品的平均使用寿命约为1 020×50%+980×20%+1 030×30%=1 015(小时).
    答案:50 1 015
    7.造纸术、印刷术、指南针、火药被称为中国古代四大发明,此说法最早由英国汉学家艾约瑟提出并为后来许多中国的历史学家所继承,普遍认为这四种发明对中国古代的政治、经济、文化的发展产生了巨大的推动作用.某小学三年级共有学生500名,随机抽查100名学生并提问中国古代四大发明,能说出两种发明的有45人,能说出三种及其以上发明的有32人,据此估计该校三年级的500名学生中,对四大发明只能说出一种或一种也说不出的有________人.
    解析:在这100名学生中,只能说出一种或一种也说不出的有100-45-32=23(人),设500名学生中对四大发明只能说出一种或一种也说不出的有x人,则eq \f(100,23)=eq \f(500,x),解得x=115.
    答案:115
    8.甲、乙两名学生在5次英语测试中的成绩统计如下:
    甲:74,85,86,90,93;
    乙:76,83,85,87,97.
    现要从中选派一人参加英语口语竞赛,从统计学角度,你认为派哪位学生参加更合适?请说明理由.
    解:eq \x\t(x)甲=eq \f(74+85+86+90+93,5)=85.6;
    eq \x\t(x)乙=eq \f(76+83+85+87+97,5)=85.6.
    s甲2=eq \f(1,5)×[(74-85.6)2+(85-85.6)2+(86-85.6)2+(90-85.6)2+(93-85.6)2]=eq \f(1,5)×209.2=41.84;s乙2=eq \f(1,5)×[(76-85.6)2+(83-85.6)2+(85-85.6)2+(87-85.6)2+(97-85.6)2]=eq \f(1,5)×231.2=46.24.因为eq \x\t(x)甲=eq \x\t(x)乙,s甲29.某次人才招聘活动中,某公司计划招收600名新员工.由于报名者共2 000人,远超计划,故该公司采用笔试的方法进行选拔,并按照笔试成绩择优录取.现采用随机抽样的方法抽取200名报名者的笔试成绩,绘制频率分布直方图如图所示.
    已知在频率分布直方图中,左边四个小长方形的高度自左向右依次构成公比为2的等比数列.根据频率分布直方图解答以下问题:
    (1)求m;
    (2)估计此次笔试的平均成绩;
    (3)估计该公司此次招聘的录取分数线.
    解:(1)由题图知,笔试成绩在30到70的频率为1-(0.020+0.015+0.005)×10=0.6.因为左边四个小长方形的高度自左向右依次构成公比为2的等比数列,可分别设为a,2a,4a,8a,所以(a+2a+4a+8a)×10=0.6,解得a=0.004,所以m=0.004×8=0.032.
    (2)成绩在自左向右各段的频率分别为0.04,0.08,0.16,0.32,0.2,0.15,0.05,则笔试成绩的平均值eq \x\t(x)=0.04×35+0.08×45+0.16×55+0.32×65+0.2×75+0.15×85+0.05×95=67.1.
    (3)已知报名者共2 000人,计划招收600名新员工,则eq \f(600,2 000)=0.3.因为成绩在80到100分的频率为0.2,成绩在70到80分的频率为0.2,所以录取分数线在70到80分之间,为eq \f(0.2+0.2-0.3,0.2)×10+70=75(分).
    10.某公司为了解用户对其产品的满意度,从A,B两地区分别随机调查了40个用户,根据用户对产品的满意度评分,得到A地区用户满意度评分的频率分布直方图和B地区用户满意度评分的频数分布表.
    A地区用户满意度评分的频率分布直方图
    B地区用户满意度评分的频数分布表
    (1)请作出B地区用户满意度评分的频率分布直方图,并通过直方图比较两地区满意度评分的平均值及分散程度(不要求计算出具体值,给出结论即可).
    (2)根据用户满意度评分,将用户的满意度从低到高分为三个等级,估计哪个地区用户的满意度等级为不满意的概率大,请说明理由.
    解:(1)作出频率分布直方图如图所示.
    通过两地区用户满意度评分的频率分布直方图可以看出,B地区用户满意度评分的平均值高于A地区用户满意度评分的平均值;B地区用户满意度评分比较集中,而A地区用户满意度评分比较分散.
    (2)A地区用户的满意度等级为不满意的概率大.理由如下:记CA表示事件:“A地区用户的满意度等级为不满意”;CB表示事件:“B地区用户的满意度等级为不满意”.由直方图得P(CA)的估计值为(0.01+0.02+0.03)×10=0.6,P(CB)的估计值为(0.005+0.02)×10=0.25.所以A地区用户的满意度等级为不满意的概率大.
    第二节 变量间的相关性与统计案例
    课程标准
    1.会作两个有关联变量的数据的散点图,并利用散点图认识变量间的相关关系.
    2.了解最小二乘法的思想,能根据给出的线性回归方程系数公式建立线性回归方程(线性回归方程系数公式不要求记忆).
    3.了解回归分析的思想、方法及其简单应用.了解独立性检验的思想、方法及其初步应用.
    [由教材回扣基础]
    1.变量间的相关关系
    常见的两变量之间的关系有两类:一类是函数关系,另一类是相关关系;与函数关系不同,相关关系是一种非确定性关系.
    2.两个变量的线性相关
    (1)从散点图上看,如果这些点从整体上看大致分布在通过散点图中心的一条直线附近,称两个变量之间具有线性相关关系,这条直线叫回归直线.
    (2)从散点图上看,点分布在从左下角到右上角的区域内,两个变量的这种相关关系称为正相关,点分布在左上角到右下角的区域内,两个变量的相关关系为负相关.
    (3)回归方程为eq \(y,\s\up6(^))=eq \(b,\s\up6(^))x+eq \(a,\s\up6(^)),其中eq \(b,\s\up6(^))=eq \f(\(∑,\s\up6(n),\s\d4(i=1))xiyi-n\x\t(x) \x\t(y),\(∑,\s\up6(n),\s\d4(i=1))xi2-n\x\t(x)2),eq \(a,\s\up6(^))=eq \x\t(y)-eq \(b,\s\up6(^))eq \x\t(x).
    (4)相关系数
    当r>0时,表明两个变量正相关;
    当r<0时,表明两个变量负相关.
    r的绝对值越接近于1,表明两个变量的线性相关性越强.r的绝对值越接近于0,表明两个变量之间几乎不存在线性相关关系,通常|r|大于0.75时,认为两个变量有很强的线性相关性.
    3.独立性检验
    (1)2×2列联表:假设有两个分类变量X和Y,它们的取值分别为{x1,x2}和{y1,y2},其样本频数列联表(称2×2列联表)为:
    (2)K2统计量
    K2=eq \f(nad-bc2,a+bc+da+cb+d)(其中n=a+b+c+d为样本容量).
    [练小题巩固基础]
    一、准确理解概念(判断正误)
    (1)“名师出高徒”可以解释为教师的教学水平与学生的水平成正相关关系.( )
    (2)通过回归直线方程eq \(y,\s\up6(^))=beq \(x,\s\up6(^))+eq \(a,\s\up6(^))可以估计预报变量的取值和变化趋势.( )
    (3)只有两个变量有相关关系,所得到的回归模型才有预测价值.( )
    (4)事件X,Y关系越密切,则由观测数据计算得到的K2值越大.( )
    答案:(1)√ (2)√ (3)√ (4)√
    二、练牢教材小题
    1.(新湘教版选择性必修②P193T1改编)已知变量x,y之间具有线性相关关系,其散点图如图所示,回归直线l的方程为eq \(y,\s\up6(^))=eq \(b,\s\up6(^))x+eq \(a,\s\up6(^)),则下列说法正确的是( )
    A.eq \(a,\s\up6(^))>0,eq \(b,\s\up6(^))<0 B.eq \(a,\s\up6(^))>0,eq \(b,\s\up6(^))>0
    C.eq \(a,\s\up6(^))<0,eq \(b,\s\up6(^))<0 D..eq \(a,\s\up6(^))<0,eq \(b,\s\up6(^))>0
    答案:D
    2.(新人教A版选择性必修③P132例3改编)下面是2×2列联表:
    则表中a,b的值分别为________,________.
    答案:52 74
    3.(人教A版选修2-3 P97T1改编)为了判断高中三年级学生是否选修文科与性别的关系,现随机抽取50名学生,得到如下2×2列联表:
    已知P(K2≥3.841)≈0.05,P(K2≥5.024)≈0.025.
    根据表中数据,得到K2的观测值k=eq \f(50×13×20-10×72,23×27×20×30)≈4.844.则认为选修文科与性别有关系出错的可能性为________.
    答案:5%
    三、练清易错易混
    1.(独立性检验理解不当)某医疗机构通过抽样调查(样本容量n=1 000),利用2×2列联表和K2统计量研究患肺病是否与吸烟有关.计算得K2=4.453,经查阅临界值表知P(K2≥3.841)≈0.05,现给出四个结论,其中正确的是( )
    A.在100个吸烟的人中约有95个人患肺病
    B.若某人吸烟,那么他有95%的可能性患肺病
    C.有95%的把握认为“患肺病与吸烟有关”
    D.只有5%的把握认为“患肺病与吸烟有关”
    解析:选C 由已知数据可得,有1-0.05=95%的把握认为“患肺病与吸烟有关”.故选C.
    2.(忽视回归直线过样本点中心)已知变量x和y的统计数据如下表:
    根据上表可得回归直线方程为eq \(y,\s\up6(^))=eq \(b,\s\up6(^))x-0.25,据此可以预测当x=8时,eq \(y,\s\up6(^))=( )
    A.6.4 B.6.25
    C.6.55 D.6.45
    解析:选C 由题意知eq \x\t(x)=eq \f(3+4+5+6+7,5)=5,eq \x\t(y)=eq \f(2.5+3+4+4.5+6,5)=4,
    将点(5,4)代入eq \(y,\s\up6(^))=eq \(b,\s\up6(^))x-0.25,解得eq \(b,\s\up6(^))=0.85,则eq \(y,\s\up6(^))=0.85x-0.25,所以当x=8时,eq \(y,\s\up6(^))=0.85×8-0.25=6.55,故选C.
    命题视角一 相关关系的判断
    [典例] (1)对变量x,y有观测数据(xi,yi)(i=1,2,…,10),得散点图如图①,对变量u,v有观测数据(ui,vi)(i=1,2,…,10),得散点图如图②.由这两个散点图可以判断( )
    A.变量x与y正相关,u与v正相关
    B.变量x与y正相关,u与v负相关
    C.变量x与y负相关,u与v正相关
    D.变量x与y负相关,u与v负相关
    (2)某公司在2021年上半年的月收入x(单位:万元)与月支出y(单位:万元)的统计资料如表所示:
    根据统计资料,则( )
    A.月收入的中位数是15,x与y有正线性相关关系
    B.月收入的中位数是17,x与y有负线性相关关系
    C.月收入的中位数是16,x与y有正线性相关关系
    D.月收入的中位数是16,x与y有负线性相关关系
    [解析] (1)由散点图可得两组数据均线性相关,且图①的线性回归方程斜率为负,图②的线性回归方程斜率为正,则由散点图可判断变量x与y负相关,u与v正相关.
    (2)月收入的中位数是eq \f(15+17,2)=16,收入增加,支出增加,故x与y有正线性相关关系.
    [答案] (1)C (2)C
    [方法技巧]
    判断相关关系的2种方法
    (1)散点图法:如果所有的样本点都落在某一函数的曲线附近,变量之间就有相关关系.如果所有的样本点都落在某一直线附近,变量之间就有线性相关关系.
    (2)相关系数法:利用相关系数判定,当|r|越趋近于1时,相关性越强.
    [针对训练]
    1.四名同学根据各自的样本数据研究变量x,y之间的相关关系,并求得回归直线方程,分别得到以下四个结论:
    ①y与x负相关且eq \(y,\s\up6(^))=2.347x-6.423;
    ②y与x负相关且eq \(y,\s\up6(^))=-3.476x+5.648;
    ③y与x正相关且eq \(y,\s\up6(^))=5.437x+8.493;
    ④y与x正相关且eq \(y,\s\up6(^))=-4.326x-4.578.
    其中一定不正确的结论的序号是( )
    A.①② B.②③ C.③④ D.①④
    解析:选D 正相关指的是y随x的增大而增大,负相关指的是y随x的增大而减小,故不正确的为①④.
    2.在一组数据为(x1,y1),(x2,y2),…,(xn,yn)(n≥2,x1,x2,…,xn不全相等)的散点图中,若这组样本数据的相关系数为-1,则所有的样本点(xi,yi)(i=1,2,…,n)满足的方程可以是( )
    A.y=-eq \f(1,2)x+1 B.y=x-1
    C.y=x+1 D.y=-x2
    解析:选A ∵这组样本数据的相关系数为-1,∴这一组数据(x1,y1),(x2,y2),…,(xn,yn)线性相关,且是负相关,∴可排除B、C、D,故选A.
    命题视角二 回归分析
    考法(一) 线性回归方程
    [例1] 某手机厂商在销售200万台某型号手机时开展“手机碎屏险”活动.活动规则如下:用户购买该型号手机时可选购“手机碎屏险”,保费为x元.若在购机后一年内发生碎屏可免费更换一次屏幕.该手机厂商将在这200万台该型号手机全部销售完毕一年后,在购买碎屏险且购机后一年内未发生碎屏的用户中随机抽取1 000名,每名用户赠送1 000元的红包.为了合理确定保费x的值,该手机厂商进行了问卷调查,统计后得到下表(其中y表示保费为x元时愿意购买该“手机碎屏险”的用户比例):
    (1)根据上面的数据求出y关于x的回归直线方程;
    (2)通过大数据分析,在使用该型号手机的用户中,购机后一年内发生碎屏的比例为0.5%.已知更换一次该型号手机屏幕的费用为800元,若该手机厂商要求在这次活动中因销售该“手机碎屏险”产生的利润不少于70万元,能否把保费x定为5元?
    参考公式:回归方程eq \(y,\s\up6(^))=eq \(b,\s\up6(^))x+eq \(a,\s\up6(^))中斜率和截距的最小二乘估计分别为eq \(b,\s\up6(^))=eq \f(\(∑,\s\up6(n),\s\d4(i=1)) xi-\x\t(x)yi-\x\t(y),\(∑,\s\up6(n),\s\d4(i=1)) xi-\x\t(x)2),eq \(a,\s\up6(^))=eq \x\t(y)-eq \(b,\s\up6(^))eq \x\t(x).
    参考数据:表中x的5个值从左到右分别记为x1,x2,x3,x4,x5,相应的y值分别记为y1,y2,y3,y4,y5,经计算有eq \(∑,\s\up6(5),\s\d4(i=1)) (xi-eq \x\t(x))(yi-eq \x\t(y))=-19.2,其中eq \x\t(x)=eq \f(1,5)eq \(∑,\s\up6(5),\s\d4(i=1))xi,eq \x\t(y)=eq \f(1,5)eq \(∑,\s\up6(5),\s\d4(i=1))yi.
    [解] (1)由eq \x\t(x)=30,eq \x\t(y)=0.4,
    eq \(∑,\s\up6(5),\s\d4(i=1)) (xi-eq \x\t(x))(yi-eq \x\t(y))=-19.2,eq \(∑,\s\up6(5),\s\d4(i=1)) (xi-eq \x\t(x))2=1 000,
    得eq \(b,\s\up6(^))=eq \f(\(∑,\s\up6(5),\s\d4(i=1)) xi-\x\t(x)yi-\x\t(y),\(∑,\s\up6(5),\s\d4(i=1)) xi-\x\t(x)2)=-0.019 2,
    eq \(a,\s\up6(^))=eq \x\t(y)-eq \(b,\s\up6(^))eq \x\t(x)=0.976,所以y关于x的回归直线方程为eq \(y,\s\up6(^))=-0.019 2x+0.976.
    (2)能把保费x定为5元.
    理由如下:若保费x定为5元,则估计y=-0.019 2×5+0.976=0.88,估计该手机厂商在这次活动中因销售该“手机碎屏险”产生的利润为2 000 000×0.88×5-2 000 000×0.88×0.5%×800-1 000×1 000=0.76×106(元)=76(万元)>70(万元),所以能把保费x定为5元.
    考法(二) 相关系数
    [例2] 我国大力发展校园足球,为了解某地区足球特色学校的发展状况,社会调查小组得到如下统计数据:
    (1)根据上表数据,计算y与x的相关系数r,并说明y与x的线性相关性强弱;
    (已知:0.75≤|r|≤1,则认为y与x的线性相关性很强;0.3≤|r|<0.75,则认为y与x的线性相关性一般;|r|≤0.25,则认为y与x的线性相关性较弱)
    (2)求y关于x的线性回归方程,并预测该地区2023年足球特色学校的个数(精确到个).
    参考数据:eq \i\su(i=1,5, )(xi-eq \x\t(x))2=10,eq \i\su(i=1,5, )(yi-eq \x\t(y))2=1.3,eq \i\su(i=1,5, )(xi-eq \x\t(x))·(yi-eq \x\t(y))=3.6,eq \r(13)≈3.605 6.
    [解] (1)由题得eq \x\t(x)=eq \f(1,5)×(2 016+2 017+2 018+2 019+2 020)=2 018,
    eq \x\t(y)=eq \f(1,5)×(0.30+0.60+1.00+1.40+1.70)=1,
    ∴r=eq \f(\i\su(i=1,5, )xi-\x\t(x)yi-\x\t(y),\r(\i\su(i=1,5, )xi-\x\t(x)2) \r(\i\su(i=1,5, )yi-\x\t(y)2))=eq \f(3.6,\r(10)×\r(1.3))
    ≈eq \f(3.6,3.605 6)≈0.998>0.7.
    ∴y与x的线性相关性很强.
    (2)设y关于x的线性回归方程为eq \(y,\s\up6(^))=eq \(a,\s\up6(^))+eq \(b,\s\up6(^))x,
    则eq \(b,\s\up6(^))=eq \f(\i\su(i=1,5, )xi-\x\t(x)yi-\x\t(y),\i\su(i=1,5, )xi-\x\t(x)2)=eq \f(3.6,10)=0.36,
    eq \(a,\s\up6(^))=eq \x\t(y)-eq \(b,\s\up6(^))eq \x\t(x)=1-0.36×2 018=-725.48,
    ∴y关于x的线性回归方程是eq \(y,\s\up6(^))=0.36x-725.48.
    当x=2 023时,eq \(y,\s\up6(^))=0.36×2 023-725.48=2.8,故预测该地区2023年足球特色学校有280个.
    考法(三) 非线性回归分析
    [例3] 已知某地区某种昆虫产卵数和温度有关.现收集了一只该品种昆虫的产卵数y(个)和温度x(℃)的7组观测数据,其散点图如图所示:
    根据散点图,结合函数知识,可以发现产卵数y和温度x可用方程y=ebx+a来拟合,令z=ln y,结合样本数据可知z与温度x可用线性回归方程来拟合.
    根据收集到的数据,计算得到如下值:
    表中zi=ln yi,eq \x\t(z)=eq \f(1,7)eq \i\su(i=1,7,z)i.
    (1)求z关于温度x的回归方程(回归系数结果精确到0.001);
    (2)求产卵数y关于温度x的回归方程;若该地区一段时间内的气温在26 ℃~36 ℃之间(包括26 ℃与36 ℃),估计该品种一只昆虫的产卵数的范围.
    参考数据:e3.282≈27,e3.792≈44,e5.832≈341,e6.087≈440,e6.342≈568.
    [解] (1)由题意,z和温度x可以用线性回归方程拟合,设eq \(z,\s\up6(^))=eq \(b,\s\up6(^))x+eq \(a,\s\up6(^)),
    则eq \(b,\s\up6(^))=eq \f(\i\su(i=1,7, )xi-\x\t(x)zi-\x\t(z),\i\su(i=1,7, )xi-\x\t(x)2)=eq \f(46.418,182)≈0.255,
    eq \(a,\s\up6(^))=eq \x\t(z)-eq \(b,\s\up6(^))eq \x\t(x)=3.537-0.255×27=-3.348,故z关于x的线性回归方程为eq \(z,\s\up6(^))=0.255x-3.348.
    (2)由(1)可得,ln y=0.255x-3.348.
    于是产卵数y关于温度x的回归方程为y=e0.255x-3.348.
    当x=26时,y=e0.255×26-3.348=e3.282≈27;
    当x=36时,y=e0.255×36-3.348=e5.832≈341.
    ∵函数y=e0.255x-3.348为增函数,
    ∴在气温在26℃~36℃之间时,一只该品种昆虫的产卵数的估计范围是{y|27≤y≤341,y∈N*}.
    [方法技巧]
    1.线性回归分析问题的类型及解题方法
    (1)求回归直线方程
    ①计算出, eq \i\su(i=1,n, )(xi-eq \x\t(x))2的值;
    ②利用公式计算回归系数eq \(a,\s\up6(^)),eq \(b,\s\up6(^));
    ③写出回归直线方程eq \(y,\s\up6(^))=eq \(b,\s\up6(^))x+eq \(a,\s\up6(^)).
    (2)回归模型的拟合效果:利用相关系数r判断,当|r|越趋近于1时,两变量的线性相关性越强.
    2.非线性回归方程的求法
    (1)根据原始数据作出散点图;
    (2)根据散点图选择恰当的拟合函数;
    (3)作恰当变换,将其转化成线性函数,求线性回归方程;
    (4)在(3)的基础上通过相应变换,即可得非线性回归方程.
    [针对训练]
    1.某兴趣小组欲研究昼夜温差大小与患感冒人数多少之间的关系,他们分别到气象局与某医院抄录了1月份至6月份每月10号的昼夜温差情况与因患感冒而就诊的人数,得到如下数据:
    该兴趣小组确定的研究方案是:先从这6组数据中选取2组,用剩下的4组数据求线性回归方程,再用被选取的2组数据进行检验.
    (1)求选取的2组数据恰好是相邻两个月的概率;
    (2)若选取的是1月份与6月份的两组数据,请根据2月份至5月份的数据,求出y关于x的线性回归方程eq \(y,\s\up6(^))=eq \(b,\s\up6(^))x+eq \(a,\s\up6(^));
    (3)若由线性回归方程得到的估计数据与所选出的检验数据的误差均不超过2,则认为得到的线性回归方程是理想的,试问该小组所得线性回归方程是否理想?
    参考数据:11×25+13×29+12×26+8×16=1 092,112+132+122+82=498.
    解:(1)设选到相邻两个月的数据为事件A.因为从6组数据中选取2组数据共有15种情况,且每种情况都是等可能的,其中,选到相邻两个月的数据的情况有5种,所以P(A)=eq \f(5,15)=eq \f(1,3).
    (2)由表中2月份至5月份的数据可得eq \x\t(x)=11,eq \x\t(y)=24,eq \i\su(i=1,4,x)iyi=1 092,eq \i\su(i=1,4,x)i2=498,所以eq \(b,\s\up6(^))=eq \f(\i\su(i=1,4,x)iyi-4 \x\t(x) \x\t(y),\i\su(i=1,4,x)i2-4 \x\t(x)2)=eq \f(18,7),则eq \(a,\s\up6(^))=eq \x\t(y)-eq \(b,\s\up6(^)) eq \x\t(x)=-eq \f(30,7),
    所以y关于x的线性回归方程为eq \(y,\s\up6(^))=eq \f(18,7)x-eq \f(30,7).
    (3)当x=10时,eq \(y,\s\up6(^))=eq \f(150,7),eq \b\lc\|\rc\|(\a\vs4\al\c1(\f(150,7)-22))<2;
    当x=6时,eq \(y,\s\up6(^))=eq \f(78,7),eq \b\lc\|\rc\|(\a\vs4\al\c1(\f(78,7)-12))<2.
    所以该小组所得线性回归方程是理想的.
    2.某公司为了了解年研发资金投入量x(单位:亿元)对年销售额y(单位:亿元)的影响,对公司近12年的年研发资金投入量xi和年销售额yi的数据进行了对比分析,建立了两个函数模型:①y=α+βx2,②y=eλx+t,其中α,β,λ,t均为常数,e为自然对数的底数.并得到一些统计量的值.令ui=xi2,vi=ln yi(i=1,2,…,12),经计算得如下数据:
    (1)请从相关系数的角度,分析哪一个模型拟合程度更好?
    (2)①根据(1)的选择及表中数据,建立y关于x的回归方程(回归系数精确到0.01);
    ②若下一年销售额y需达到90亿元,预测下一年的研发资金投入量约是多少亿元?
    附:相关系数r=eq \f(\i\su(i=1,n, )xi-\x\t(x)yi-\x\t(y),\r(\i\su(i=1,n, )xi-\x\t(x)2\i\su(i=1,n, )yi-\x\t(y)2)),
    回归直线eq \(y,\s\up6(^))=eq \(a,\s\up6(^))+eq \(b,\s\up6(^))x的斜率和截距的最小二乘估计分别为eq \(b,\s\up6(^))=eq \f(\i\su(i=1,n, )xi-\x\t(x)yi-\x\t(y),\i\su(i=1,n, )xi-\x\t(x)2),eq \(a,\s\up6(^))=eq \x\t(y)-eq \(b,\s\up6(^))eq \x\t(x).
    参考数据:308=4×77,eq \r(90)≈9.486 8,e4.499 8≈90.
    解:(1)设{ui}和{yi}的相关系数为r1,{xi}和{vi}的相关系数为r2,
    则r1=eq \f(\i\su(i=1,12, )ui-\x\t(u)yi-\x\t(y),\r(\i\su(i=1,12, )ui-\x\t(u)2\i\su(i=1,12, )yi-\x\t(y)2))=eq \f(215,\r(31 250×2))=eq \f(43,50)=0.86,
    r2=eq \f(\i\su(i=1,12, )xi-\x\t(x)vi-\x\t(v),\r(\i\su(i=1,12, )xi-\x\t(x)2\i\su(i=1,12, )vi-\x\t(v)2))=eq \f(14,\r(77×3.08))=eq \f(10,11)≈0.91.
    因为|r1|<|r2|,所以从相关系数的角度,模型y=eλx+t的拟合程度更好.
    (2)①先建立v关于x的线性回归方程,
    由y=eλx+t,得ln y=t+λx,即v=t+λx.
    因为λ=eq \f(\i\su(i=1,12, )xi-\x\t(x)vi-\x\t(v),\i\su(i=1,12, )xi-\x\t(x)2)=eq \f(2,11)≈0.18,t=eq \x\t(v)-λeq \x\t(x)=4.20-eq \f(2,11)×20≈0.56,
    所以v关于x的线性回归方程为eq \(v,\s\up6(^))=0.18x+0.56,
    所以eq \(y,\s\up6(^))=e0.18x+0.56.
    ②下一年销售额y需达到90亿元,即y=90,
    代入eq \(y,\s\up6(^))=e0.18x+0.56,得90=e0.18x+0.56,
    又e4.499 8≈90,所以4.499 8≈0.18x+0.56,
    所以x≈eq \f(4.499 8-0.56,0.18)≈21.89,
    所以预测下一年的研发资金投入量约是21.89亿元.
    命题视角三 独立性检验
    [典例] (2021·全国甲卷)甲、乙两台机床生产同种产品,产品按质量分为一级品和二级品,为了比较两台机床产品的质量,分别用两台机床各生产了200件产品,产品的质量情况统计如下表:
    (1)甲机床、乙机床生产的产品中一级品的频率分别是多少?
    (2)能否有99%的把握认为甲机床的产品质量与乙机床的产品质量有差异?
    附:K2=eq \f(nad-bc2,a+bc+da+cb+d),
    .[解] (1)甲机床生产的产品中一级品的频率为eq \f(150,200)=eq \f(3,4);乙机床生产的产品中一级品的频率为eq \f(120,200)=eq \f(3,5).
    (2)由题意知,K2=eq \f(400×150×80-120×502,200×200×270×130)≈10.256.由10.256>6.635知,有99%的把握认为甲机床的产品质量与乙机床的产品质量有差异.
    [方法技巧] 解独立性检验应用问题的2个关注点
    [针对训练]
    (2022·大连一模)在某次测验中,某班40名考生的成绩满分100分统计如图所示.
    (1)估计这40名学生的测验成绩的中位数x0(精确到0.1);
    (2)记80分以上为优秀,80分及以下为合格,结合频率分布直方图完成下表,并判断是否有95%的把握认为数学测验成绩与性别有关?
    解:(1)由频率分布直方图易知0.01×10+0.015×10+0.02×10=0.45,即分数在eq \b\lc\[\rc\)(\a\vs4\al\c1(40,70))的频率为0.45,
    ∴0.03×eq \b\lc\(\rc\)(\a\vs4\al\c1(x0-70))=0.5-0.45,解得x0=eq \f(215,3)≈71.7,
    ∴40名学生的测验成绩的中位数为71.7.
    (2)由频率分布直方图,可得列联表如下:
    ∴K2=eq \f(40×\b\lc\(\rc\)(\a\vs4\al\c1(16×4-14×6))2,30×10×22×18)=eq \f(40,297)≈0.135<3.841,
    故没有95%的把握认为数学测验成绩与性别有关.
    [课时跟踪检测]
    一、基础练——练手感熟练度
    1.下列四个散点图中,变量x与y之间具有负的线性相关关系的是( )
    解析:选D 观察散点图可知,只有D项的散点图表示的是变量x与y之间具有负的线性相关关系.
    2.(2020·全国Ⅰ卷)某校一个课外学习小组为研究某作物种子的发芽率y和温度x(单位:℃)的关系,在20个不同的温度条件下进行种子发芽实验,由实验数据(xi,yi)(i=1,2,…,20)得到下面的散点图:
    由此散点图,在10 ℃至40 ℃之间,下面四个回归方程类型中最适宜作为发芽率y和温度x的回归方程类型的是( )
    A.y=a+bx B.y=a+bx2
    C.y=a+bex D.y=a+bln x
    解析:选D 用光滑的曲线把图中各点连接起来,由图象的大致走向判断,此函数应该是对数函数类型的,故应该选用的函数模型为y=a+bln x.
    3.某模具厂采用了新工艺后,原材料支出费用x与销售额y(单位:万元)之间有如下数据,由散点图可知,销售额y与原材料支出费用x有较好的线性相关关系,其线性回归方程是eq \(y,\s\up6(^))=eq \(b,\s\up6(^))x+48,则当原材料支出费用为40时,预估销售额为( )
    A.252 B.268
    C.272 D.288
    解析:选C 由题意得eq \x\t(x)=20,eq \x\t(y)=160,将点eq \b\lc\(\rc\)(\a\vs4\al\c1(\x\t(x),\x\t(y)))代入回归方程eq \(y,\s\up6(^))=eq \(b,\s\up6(^))x+48中,得eq \(b,\s\up6(^))=5.6,∴回归方程为eq \(y,\s\up6(^))=5.6x+48,∴当x=40时,eq \(y,\s\up6(^))=272,故选C.
    4.随着国家二孩政策的全面放开,为了调查一线城市和非一线城市的二孩生育意愿,某机构用简单随机抽样方法从不同地区调查了100位育龄妇女,结果如下表.
    由K2=eq \f(nad-bc2,a+bc+da+cb+d),
    得K2=eq \f(100×45×22-20×132,65×35×58×42)≈9.616.
    参照下表,
    下列结论正确的是( )
    A.在犯错误的概率不超过0.1%的前提下,认为“生育意愿与城市级别有关”
    B.在犯错误的概率不超过5%的前提下,认为“生育意愿与城市级别无关”
    C.有99%以上的把握认为“生育意愿与城市级别有关”
    D.有99%以上的把握认为“生育意愿与城市级别无关”
    解析:选C 因为K2≈9.616>6.635,所以有99%以上的把握认为“生育意愿与城市级别有关”,故选C.
    5.如表提供了某厂节能降耗技术改造后在生产A产品过程中记录的产量x(吨)与相应的生产能耗y(吨)的几组对应数据,根据表提供的数据,求出y关于x的线性回归方程为eq \(y,\s\up6(^))=0.7x+0.35,则下列结论错误的是( )
    A.产品的生产能耗与产量呈正相关
    B.t的取值必定是3.15
    C.回归直线一定过(4.5,3.5)
    D.A产品每多生产1吨,则相应的生产能耗约增加0.7吨
    解析:选B 由题意,eq \x\t(x)=eq \f(3+4+5+6,4)=4.5,因为eq \(y,\s\up6(^))=0.7x+0.35,所以 eq \x\t(y)=0.7×4.5+0.35=3.5,所以t=4×3.5-2.5-4-4.5=3,故选B.
    6.已知某产品连续4个月的广告费xi(千元)与销售额yi(万元),经过对这些数据的处理,得到如下数据信息:
    ②广告费用x和销售额y之间具有较强的线性相关关系;
    ③回归直线方程为eq \(y,\s\up6(^))=eq \(b,\s\up6(^))x+eq \(a,\s\up6(^))中的eq \(b,\s\up6(^))=0.8(用最小二乘法求得).
    那么广告费用为6千元时,可预测销售额约为( )
    A.3.5万元 B.4.7万元
    C.4.9万元 D.6.5万元
    解析:选B 因为所以eq \x\t(x)=4.5,eq \x\t(y)=3.5,因为回归直线方程为eq \(y,\s\up6(^))=eq \(b,\s\up6(^))x+eq \(a,\s\up6(^))中的eq \(b,\s\up6(^))=0.8,所以3.5=0.8×4.5+eq \(a,\s\up6(^)),所以eq \(a,\s\up6(^))=-0.1,所以eq \(y,\s\up6(^))=0.8x-0.1.故x=6时,可预测销售额约为4.7万元,故选B.
    二、综合练——练思维敏锐度
    1.千百年来,我国劳动人民在生产实践中根据云的形状、走向、速度、厚度、颜色等变化,总结了丰富的“看云识天气”的经验,并将这些经验编成谚语,如“天上钩钩云,地上雨淋淋”“日落云里走,雨在半夜后”……小波同学为了验证“日落云里走,雨在半夜后”,观察了所在地区A的100天日落和夜晚天气,得到如下2×2列联表:
    临界值表
    并计算得到K2≈19.05,下列小波对地区A天气判断不正确的是( )
    A.夜晚下雨的概率约为eq \f(1,2)
    B.未出现“日落云里走”夜晚下雨的概率约为eq \f(5,14)
    C.有99.9%的把握认为“‘日落云里走’是否出现”与“当晚是否下雨”有关
    D.出现“日落云里走”,有99.9%的把握认为夜晚会下雨
    解析:选D 由题意,把频率看作概率可得夜晚下雨的概率约为eq \f(25+25,100)=eq \f(1,2),故A判断正确;未出现“日落云里走”,夜晚下雨的概率约为eq \f(25,25+45)=eq \f(5,14),故B判断正确;由K2≈19.05>10.828,根据临界值表,可得有99.9%的把握认为“‘日落云里走’是否出现”与“当晚是否下雨”有关,故C判断正确,D判断错误,故选D.
    2.为了均衡教育资源,加大对偏远地区的教育投入,调查了某地若干户家庭的年收入x(单位:万元)和年教育支出y(单位:万元),调查显示年收入x与年教育支出y具有线性相关关系,并由调查数据得到y与x的回归直线方程为eq \(y,\s\up6(^))=0.15x+0.2.由回归直线方程可知,家庭年收入每增加1万元,则年教育支出平均增加________万元.
    解析:因为回归直线的斜率为0.15,所以家庭年收入每增加1万元,年教育支出平均增加0.15万元.
    答案:0.15
    3.心理学家分析发现视觉和空间想象能力与性别有关,某数学兴趣小组为了验证这个结论,从所在学校中按分层抽样的方法抽取50名同学(男30,女20),给所有同学几何题和代数题各一题,让各位同学自由选择一道题进行解答.选题情况如下表:(单位:人)
    根据上述数据,推断视觉和空间想象能力与性别有关系,则这种推断犯错误的概率不超过________.
    附表:
    解析:由列联表计算K2的观测值k=eq \f(50×22×12-8×82,30×20×20×30)≈5.556>5.024.∴推断犯错误的概率不超过0.025.
    答案:0.025
    4.(2022·兰州一诊)近五年来某草场羊只数量与草地植被指数两变量间的关系如表所示,绘制相应的散点图,如图所示:
    根据表及图得到以下判断:
    ①羊只数量与草地植被指数成减函数关系;
    ②若利用这五组数据得到的两变量间的相关系数为r1,去掉第一年数据后得到的相关系数为r2,则|r1|<|r2|;
    ③可以利用回归直线方程,准确地得到当羊只数量为2万只时的草地植被指数.
    以上判断中正确的个数是________.
    解析:对于①,羊只数量与草地植被指数成负相关关系,不是减函数关系,所以①错误;对于②,用这五组数据得到的两变量间的相关系数为r1,因为第一年数据(1.4,1.1)是离群值,去掉后得到的相关系数为r2,其相关性更强,所以|r1|<|r2|,②正确;对于③,利用回归直线方程,不能准确得到当羊只数量为2万只时的草地植被指数,得到的只是预测值,所以③错误.综上知,正确的判断序号是②,共1个.
    答案:1
    5.(2022·佛山质检)“学习强国”APP是由中宣部主管以习近平新时代中国特色社会主义思想和党的十九大精神为主要内容的“PC端+手机客户端”两大终端二合一模式的学习平台,2019年1月1日上线后便成了党员干部群众学习的“新助手”.为了调研某地党员在“学习强国”APP的学习情况,研究人员随机抽取了200名该地党员进行调查,将他们某两天在“学习强国”APP上所得的分数统计如表(1)所示:
    表(1)
    (1)现用分层抽样的方法从80分及以上的党员中随机抽取5人,再从抽取的5人中随机选取2人作为学习小组长,求所选取的两位小组长的分数都在eq \b\lc\[\rc\](\a\vs4\al\c1(90,100))上的概率;
    (2)为了调查“学习强国”APP得分情况是否受到所在单位的影响,研究人员随机抽取了机关事业单位党员以及国有企业党员作出调查,得到的数据如表eq \b\lc\(\rc\)(\a\vs4\al\c1(2))所示:
    表(2)
    判断是否有99%的把握认为“学习强国”APP得分情况受所在单位的影响.
    附:K2=eq \f(n\b\lc\(\rc\)(\a\vs4\al\c1(ad-bc))2,\b\lc\(\rc\)(\a\vs4\al\c1(a+b))\b\lc\(\rc\)(\a\vs4\al\c1(c+d))\b\lc\(\rc\)(\a\vs4\al\c1(a+c))\b\lc\(\rc\)(\a\vs4\al\c1(b+d))),n=a+b+c+d.
    解:(1)由题意得,分数在eq \b\lc\[\rc\)(\a\vs4\al\c1(80,90))上抽取2人,记为a,b;分数在eq \b\lc\[\rc\](\a\vs4\al\c1(90,100))上抽取3人,记为A,B,C.
    选取2人作为学习小组长的基本事件有10个,即(a,b),(a,A),(a,B),(a,C),(b,A),(b,B),(b,C),(A,B),(A,C),(B,C),其中两位小组长的分数都在eq \b\lc\[\rc\](\a\vs4\al\c1(90,100))上的有(A,B),(A,C),(B,C)共3个基本事件,∴所求概率P=eq \f(3,10).
    (2)完善表格如下:
    K2=eq \f(500×220×50-150×802,300×200×130×370)≈0.173<6.635,
    故没有99%的把握认为“学习强国”APP得分情况受所在单位的影响.
    6.一汽车销售公司对开业4年来某种型号的汽车“五一”优惠金额与销售量之间的关系进行分析研究并做了记录,得到如下资料:
    (1)求出y关于x的线性回归方程eq \(y,\s\up6(^))=eq \(b,\s\up6(^))x+eq \(a,\s\up6(^));
    (2)若第5年优惠金额8.5千元,估计第5年的销售量y(辆)的值.
    参考公式:
    解:(1)由题中数据可得eq \x\t(x)=11.5,eq \x\t(y)=26,eq \(∑,\s\up6(4),\s\d4(i=1))xiyi=1 211,eq \(∑,\s\up6(4),\s\d4(i=1))xi2=534,∴eq \(b,\s\up6(^))==eq \f(1 211-4×11.5×26,534-4×11.52)=eq \f(15,5)=3,
    故eq \(a,\s\up6(^))=eq \x\t(y)-eq \(b,\s\up6(^))eq \x\t(x)=26-3×11.5=-8.5,
    ∴y关于x的线性回归方程为eq \(y,\s\up6(^))=3x-8.5.
    (2)由(1)得,当x=8.5时,eq \(y,\s\up6(^))=17,
    ∴第5年优惠金额为8.5千元时,销售量估计为17辆.
    7.某公司为确定下一年度投入某种产品的宣传费,需了解年宣传费x(单位:千元)对年销售量y(单位:t)和年利润z(单位:千元)的影响,对近8年的年宣传费xi和年销售量yi(i=1,2,…,8)数据作了初步处理,得到下面的散点图及一些统计量的值.
    表中wi=eq \r(xi),eq \x\t(w)=eq \f(1,8)eq \i\su(i=1,8,w)i.
    (1)根据散点图判断,y=a+bx与y=c+deq \r(x)哪一个适宜作为年销售量y关于年宣传费x的回归方程类型?(给出判断即可,不必说明理由)
    (2)根据(1)的判断结果及表中数据,建立y关于x的回归方程;
    (3)已知这种产品的年利润z与x,y的关系为z=0.2y-x.
    根据(2)的结果回答下列问题:
    ①年宣传费x=49时,年销售量及年利润的预报值是多少?
    ②年宣传费x为何值时,年利润的预报值最大?
    附:对于一组数据(u1,v1),(u2,v2),…,(un,vn),其回归直线eq \(v,\s\up6(^))=eq \(α,\s\up6(^))+eq \(β,\s\up6(^))u的斜率和截距的最小二乘估计分别为eq \(β,\s\up6(^))=eq \f(\i\su(i=1,n, )ui-\x\t(u)vi-\x\t(v),\i\su(i=1,n, )ui-\x\t(u)2),eq \(α,\s\up6(^))=eq \x\t(v)-eq \(β,\s\up6(^))eq \x\t(u).
    解:(1)由散点图可以判断,y=c+deq \r(x)适宜作为年销售量y关于年宣传费x的回归方程类型.
    (2)令w=eq \r(x),先建立y关于w的线性回归方程,由于eq \(d,\s\up6(^))=eq \f(\i\su(i=1,8, )wi-\x\t(w)·yi-\x\t(y),\i\su(i=1,8, )wi-\x\t(w)2)=eq \f(108.8,1.6)=68,
    eq \(c,\s\up6(^))=eq \x\t(y)-eq \(d,\s\up6(^))eq \x\t(w)=563-68×6.8=100.6.
    所以y关于w的线性回归方程为eq \(y,\s\up6(^))=100.6+68w,
    因此y关于x的回归方程为eq \(y,\s\up6(^))=100.6+68eq \r(x).
    (3)①由(2)知,当x=49时,
    年销售量y的预报值eq \(y,\s\up6(^))=100.6+68eq \r(49)=576.6,
    年利润z的预报值eq \(z,\s\up6(^))=576.6×0.2-49=66.32.
    ②根据(2)的结果知,年利润z的预报值
    eq \(z,\s\up6(^))=0.2(100.6+68eq \r(x))-x=-x+13.6eq \r(x)+20.12.所以当eq \r(x)=eq \f(13.6,2)=6.8,即x=46.24时,eq \(z,\s\up6(^))取得最大值,故年宣传费为46.24千元时,年利润的预报值最大.
    众数
    一组数据中出现次数最多的那个数据,叫做这组数据的众数
    中位数
    把n个数据按大小顺序排列,处于最中间位置的一个数据(或最中间两个数据的平均数)叫做这组数据的中位数
    平均数
    把eq \f(a1+a2+…+an,n)称为a1,a2,…,an这n个数的平均数
    标准差
    与方差
    设一组数据x1,x2,x3,…,xn的平均数为eq \x\t(x),则方差为s2=eq \f(1,n)[(x1-eq \x\t(x))2+(x2-eq \x\t(x))2+…+(xn-eq \x\t(x))2],其中s为标准差

    127
    138
    130
    137
    135
    131

    133
    129
    138
    134
    128
    136
    81
    47
    23
    68
    63
    93
    17
    90
    12
    69
    86
    81
    62
    93
    50
    60
    91
    33
    75
    85
    61
    39
    85
    06
    32
    35
    92
    46
    22
    54
    10
    02
    78
    49
    82
    18
    86
    70
    48
    05
    46
    88
    15
    19
    20
    49
    高一年级
    高二年级
    高三年级
    泥塑
    a
    b
    c
    剪纸
    x
    y
    z
    旧设备
    9.8
    10.3
    10.0
    10.2
    9.9
    9.8
    10.0
    10.1
    10.2
    9.7
    新设备
    10.1
    10.4
    10.1
    10.0
    10.1
    10.3
    10.6
    10.5
    10.4
    10.5
    等级
    A
    B
    C
    D
    频数
    40
    20
    20
    20
    等级
    A
    B
    C
    D
    频数
    28
    17
    34
    21
    利润
    65
    25
    -5
    -75
    频数
    40
    20
    20
    20
    利润
    70
    30
    0
    -70
    频数
    28
    17
    34
    21
    y的分组
    [-0.20,0)
    [0,0.20)
    [)
    [0.40,0.60)
    [0.60,0.80)
    企业数
    2
    24
    53
    14
    7

    0
    1
    0
    2
    2
    0
    3
    1
    2
    4

    2
    2
    1
    1
    1
    2
    1
    1
    0
    1
    满意度评分分组
    [50,60)
    [60,70)
    [70,80)
    [80,90)
    [90,100]
    频数
    2
    8
    14
    10
    6
    满意度评分
    低于70分
    70分到89分
    不低于90分
    满意度等级
    不满意
    满意
    非常满意
    y1
    y2
    总计
    x1
    a
    b
    a+b
    x2
    c
    d
    c+d
    总计
    a+c
    b+d
    a+b+c+d
    y1
    y2
    合计
    x1
    a
    21
    73
    x2
    22
    25
    47
    合计
    b
    46
    120
    理科
    文科

    13
    10

    7
    20
    x
    3
    4
    5
    6
    7
    y
    2.5
    3
    4
    4.5
    6
    月份
    1月份
    2月份
    3月份
    4月份
    5月份
    6月份
    收入x
    12.3
    14.5
    15.0
    17.0
    19.8
    20.6
    支出y
    5.63
    5.75
    5.82
    5.89
    6.11
    6.18
    x
    10
    20
    30
    40
    50
    y
    0.79
    0.59
    0.38
    0.23
    0.01
    年份x
    2016
    2017
    2018
    2019
    2020
    足球特色学校y/百个
    0.30
    0.60
    1.00
    1.40
    1.70
    eq \x\t(x)
    eq \x\t(y)
    eq \x\t(z)
    eq \i\su(i=1,7, )(xi-eq \x\t(x))2
    eq \i\su(i=1,7, )(zi-eq \x\t(z))2
    eq \i\su(i=1,7, )(xi-eq \x\t(x))·(zi-eq \x\t(z))
    27
    74
    3.537
    182
    11.9
    46.418
    日期
    1月10日
    2月10日
    3月
    10日
    4月
    10日
    5月
    10日
    6月
    10日
    昼夜温差x/℃
    10
    11
    13
    12
    8
    6
    就诊人数y/个
    22
    25
    29
    26
    16
    12
    eq \x\t(x)
    eq \x\t(y)
    eq \i\su(i=1,12, )(xi-eq \x\t(x))2
    eq \i\su(i=1,12, )(yi-eq \x\t(y))2
    eq \x\t(u)
    eq \x\t(v)
    20
    66
    77
    2
    460
    4.20
    eq \i\su(i=1,12, )(ui-eq \x\t(u))2
    eq \i\su(i=1,12, )(ui-eq \x\t(u))(yi-eq \x\t(y))
    eq \i\su(i=1,12, )(vi-eq \x\t(v))2
    eq \i\su(i=1,12, )(xi-eq \x\t(x))(vi-eq \x\t(v))
    31 250
    215
    3.08
    14
    一级品
    二级品
    合计
    甲机床
    150
    50
    200
    乙机床
    120
    80
    200
    合计
    270
    130
    400
    P(K2≥k)
    0.050
    0.010
    0.001
    k
    3.841
    6.635
    10.828
    两个明确
    明确两类主体;明确研究的两个问题
    两个准确
    准确画出2×2列联表;准确计算K2
    合格
    优秀
    合计
    男生
    16
    女生
    4
    合计
    40
    合格
    优秀
    合计
    男生
    16
    6
    22
    女生
    14
    4
    18
    合计
    30
    10
    40
    x
    10
    15
    20
    25
    30
    y
    110
    125
    160
    185
    220
    非一线
    一线
    合计
    愿生
    45
    20
    65
    不愿生
    13
    22
    35
    合计
    58
    42
    100
    P(K2≥k0)
    0.050
    0.010
    0.001
    k0
    3.841
    6.635
    10.828
    x
    3
    4
    5
    6
    y
    2.5
    t
    4
    4.5
    夜晚天气
    日落云里走
    下雨
    未下雨
    出现
    25
    5
    未出现
    25
    45
    P(K2≥k0)
    0.10
    0.05
    0.010
    0.001
    k0
    2.706
    3.841
    6.635
    10.828
    几何题
    代数题
    总计
    男同学
    22
    8
    30
    女同学
    8
    12
    20
    总计
    30
    20
    50
    P(K2≥k0)
    0.10
    0.05
    0.025
    0.010
    0.001
    k0
    2.706
    3.841
    5.024
    6.635
    10.828
    年份
    1
    2
    3
    4
    5
    羊只数量/万只
    1.4
    0.9
    0.75
    0.6
    0.3
    草地植被指数
    1.1
    4.3
    15.6
    31.3
    49.7
    分数
    [60,70)
    [70,80)
    [80,90)
    [90,100]
    人数
    50
    100
    20
    30
    机关事业单位党员
    国有企业党员
    分数超过80
    220
    150
    分数不超过80
    80
    50
    P(K2≥k0)
    0.100
    0.050
    0.010
    0.001
    k0
    2.706
    3.841
    6.635
    10.828
    机关事业
    单位党员
    国有企业党员
    总计
    分数超过80
    220
    150
    370
    分数不超过80
    80
    50
    130
    总计
    300
    200
    500
    日期
    第一年
    第二年
    第三年
    第四年
    优惠金额x/千元
    10
    11
    13
    12
    销售量y/辆
    22
    24
    31
    27
    eq \x\t(x)
    eq \x\t(y)
    eq \x\t(w)
    eq \i\su(i=1,8, )(xi-eq \x\t(x))2
    eq \i\su(i=1,8, )(wi-eq \x\t(w))2
    eq \i\su(i=1,8, )(xi-eq \x\t(x))·
    (yi-eq \x\t(y))
    eq \i\su(i=1,8, )(wi-eq \x\t(w))·
    (yi-eq \x\t(y))
    46.6
    563
    6.8
    289.8
    1.6
    1 469
    108.8
    相关学案

    高考数学统考一轮复习第9章统计与统计案例第3节变量间的相关关系统计案例学案: 这是一份高考数学统考一轮复习第9章统计与统计案例第3节变量间的相关关系统计案例学案,共12页。

    人教版高考数学一轮复习第10章统计与统计案例第3节变量间的相关关系与统计案例学案理含解析: 这是一份人教版高考数学一轮复习第10章统计与统计案例第3节变量间的相关关系与统计案例学案理含解析,共11页。学案主要包含了疑误辨析,走进教材,易错自纠等内容,欢迎下载使用。

    考点35 统计与统计案例-备战2022年高考数学(理)一轮复习考点微专题学案: 这是一份考点35 统计与统计案例-备战2022年高考数学(理)一轮复习考点微专题学案,共24页。学案主要包含了名师点睛等内容,欢迎下载使用。

    免费资料下载额度不足,请先充值

    每充值一元即可获得5份免费资料下载额度

    今日免费资料下载份数已用完,请明天再来。

    充值学贝或者加入云校通,全网资料任意下。

    提示

    您所在的“深圳市第一中学”云校通为试用账号,试用账号每位老师每日最多可下载 10 份资料 (今日还可下载 0 份),请取消部分资料后重试或选择从个人账户扣费下载。

    您所在的“深深圳市第一中学”云校通为试用账号,试用账号每位老师每日最多可下载10份资料,您的当日额度已用完,请明天再来,或选择从个人账户扣费下载。

    您所在的“深圳市第一中学”云校通余额已不足,请提醒校管理员续费或选择从个人账户扣费下载。

    重新选择
    明天再来
    个人账户下载
    下载确认
    您当前为教习网VIP用户,下载已享8.5折优惠
    您当前为云校通用户,下载免费
    下载需要:
    本次下载:免费
    账户余额:0 学贝
    首次下载后60天内可免费重复下载
    立即下载
    即将下载:资料
    资料售价:学贝 账户剩余:学贝
    选择教习网的4大理由
    • 更专业
      地区版本全覆盖, 同步最新教材, 公开课⾸选;1200+名校合作, 5600+⼀线名师供稿
    • 更丰富
      涵盖课件/教案/试卷/素材等各种教学资源;900万+优选资源 ⽇更新5000+
    • 更便捷
      课件/教案/试卷配套, 打包下载;手机/电脑随时随地浏览;⽆⽔印, 下载即可⽤
    • 真低价
      超⾼性价⽐, 让优质资源普惠更多师⽣
    VIP权益介绍
    • 充值学贝下载 本单免费 90%的用户选择
    • 扫码直接下载
    元开通VIP,立享充值加送10%学贝及全站85折下载
    您当前为VIP用户,已享全站下载85折优惠,充值学贝可获10%赠送
      充值到账1学贝=0.1元
      0学贝
      本次充值学贝
      0学贝
      VIP充值赠送
      0学贝
      下载消耗
      0学贝
      资料原价
      100学贝
      VIP下载优惠
      0学贝
      0学贝
      下载后剩余学贝永久有效
      0学贝
      • 微信
      • 支付宝
      支付:¥
      元开通VIP,立享充值加送10%学贝及全站85折下载
      您当前为VIP用户,已享全站下载85折优惠,充值学贝可获10%赠送
      扫码支付0直接下载
      • 微信
      • 支付宝
      微信扫码支付
      充值学贝下载,立省60% 充值学贝下载,本次下载免费
        下载成功

        Ctrl + Shift + J 查看文件保存位置

        若下载不成功,可重新下载,或查看 资料下载帮助

        本资源来自成套资源

        更多精品资料

        正在打包资料,请稍候…

        预计需要约10秒钟,请勿关闭页面

        服务器繁忙,打包失败

        请联系右侧的在线客服解决

        单次下载文件已超2GB,请分批下载

        请单份下载或分批下载

        支付后60天内可免费重复下载

        我知道了
        正在提交订单

        欢迎来到教习网

        • 900万优选资源,让备课更轻松
        • 600万优选试题,支持自由组卷
        • 高质量可编辑,日均更新2000+
        • 百万教师选择,专业更值得信赖
        微信扫码注册
        qrcode
        二维码已过期
        刷新

        微信扫码,快速注册

        手机号注册
        手机号码

        手机号格式错误

        手机验证码 获取验证码

        手机验证码已经成功发送,5分钟内有效

        设置密码

        6-20个字符,数字、字母或符号

        注册即视为同意教习网「注册协议」「隐私条款」
        QQ注册
        手机号注册
        微信注册

        注册成功

        下载确认

        下载需要:0 张下载券

        账户可用:0 张下载券

        立即下载
        使用学贝下载
        账户可用下载券不足,请取消部分资料或者使用学贝继续下载 学贝支付

        如何免费获得下载券?

        加入教习网教师福利群,群内会不定期免费赠送下载券及各种教学资源, 立即入群

        返回
        顶部
        Baidu
        map