终身会员
搜索
    上传资料 赚现金
    微专题44 统计与成对数据的统计分析-2024高考数学二轮复习微专题
    立即下载
    加入资料篮
    微专题44 统计与成对数据的统计分析-2024高考数学二轮复习微专题01
    微专题44 统计与成对数据的统计分析-2024高考数学二轮复习微专题02
    微专题44 统计与成对数据的统计分析-2024高考数学二轮复习微专题03
    还剩31页未读, 继续阅读
    下载需要10学贝 1学贝=0.1元
    使用下载券免费下载
    加入资料篮
    立即下载

    微专题44 统计与成对数据的统计分析-2024高考数学二轮复习微专题

    展开
    这是一份微专题44 统计与成对数据的统计分析-2024高考数学二轮复习微专题,共34页。试卷主要包含了5%,所以A错误;,9,10)=0,635,,5万元的农户比率估计为6%,2,,484>6,9-7等内容,欢迎下载使用。


    1.(2022·全国甲卷)某社区通过公益讲座以普及社区居民的垃圾分类知识.为了解讲座效果,随机抽取10位社区居民,让他们在讲座前和讲座后各回答一份垃圾分类知识问卷,这10位社区居民在讲座前和讲座后问卷答题的正确率如图,则( )
    A.讲座前问卷答题的正确率的中位数小于70%
    B.讲座后问卷答题的正确率的平均数大于85%
    C.讲座前问卷答题的正确率的标准差小于讲座后正确率的标准差
    D.讲座后问卷答题的正确率的极差大于讲座前正确率的极差
    答案 B
    解析 对于A,讲座前问卷答题的正确率的中位数是eq \f(70%+75%,2)=72.5%,所以A错误;
    对于B,讲座后问卷答题的正确率分别是80%,85%,85%,85%,85%,90%,90%,95%,100%,100%,其平均数显然大于85%,所以B正确;
    对于C,由题图可知,讲座前问卷答题的正确率波动较大,讲座后问卷答题的正确率波动较小,所以讲座前问卷答题的正确率的标准差大于讲座后问卷答题的正确率的标准差,所以C错误;
    对于D,讲座前问卷答题的正确率的极差是95%-60%=35%,讲座后问卷答题的正确率的极差是100%-80%=20%,所以讲座前问卷答题的正确率的极差大于讲座后问卷答题的正确率的极差,所以D错误.故选B.
    2.(2022·全国乙卷)某地经过多年的环境治理,已将荒山改造成了绿水青山.为估计一林区某种树木的总材积量,随机选取了10棵这种树木,测量每棵树的根部横截面积(单位:m2)和材积量(单位:m3),得到如下数据:
    并计算得eq \(∑,\s\up6(10),\s\d4(i=1))xeq \\al(2,i)=0.038,eq \(∑,\s\up6(10),\s\d4(i=1))yeq \\al(2,i)=1.615 8,
    eq \(∑,\s\up6(10),\s\d4(i=1))xiyi=0.247 4.
    (1)估计该林区这种树木平均一棵的根部横截面积与平均一棵的材积量;
    (2)求该林区这种树木的根部横截面积与材积量的样本相关系数(精确到0.01);
    (3)现测量了该林区所有这种树木的根部横截面积,并得到所有这种树木的根部横截面积总和为186 m2.已知树木的材积量与其根部横截面积近似成正比.利用以上数据给出该林区这种树木的总材积量的估计值.
    附:相关系数r=eq \f(\(∑,\s\up6(n),\s\d4(i=1)) (xi-\(x,\s\up6(-)))(yi-\(y,\s\up6(-))),\r(\(∑,\s\up6(n),\s\d4(i=1)) (xi-\(x,\s\up6(-)))2\(∑,\s\up6(n),\s\d4(i=1)) (yi-\(y,\s\up6(-)))2)),eq \r(1.896)≈1.377.
    解 (1)样本中10棵这种树木的根部横截面积的平均值eq \(x,\s\up6(-))=eq \f(0.6,10)=0.06(m2),
    样本中10棵这种树木的材积量的平均值
    eq \(y,\s\up6(-))=eq \f(3.9,10)=0.39(m3),
    据此可估计该林区这种树木平均一棵的根部横截面积为0.06 m2,平均一棵的材积量为0.39 m3.
    (2)r=eq \f(\(∑,\s\up6(10),\s\d4(i=1)) (xi-\(x,\s\up6(-)))(yi-\(y,\s\up6(-))),\r(\(∑,\s\up6(10),\s\d4(i=1)) (xi-\(x,\s\up6(-)))2\(∑,\s\up6(10),\s\d4(i=1)) (yi-\(y,\s\up6(-)))2))=eq \f(\(∑,\s\up6(10),\s\d4(i=1))xiyi-10\(x,\s\up6(-))\(y,\s\up6(-)),\r((\(∑,\s\up6(10),\s\d4(i=1))xeq \\al(2,i)-10\(x,\s\up6(-))2)(\(∑,\s\up6(10),\s\d4(i=1))yeq \\al(2,i)-10\(y,\s\up6(-))2)))=
    eq \f(0.247 4-10×0.06×0.39,\r((0.038-10×0.062)(1.615 8-10×0.392)))=eq \f(0.013 4,\r(0.000 189 6))≈eq \f(0.013 4,0.013 77)≈0.97.
    (3)设该林区这种树木的总材积量的估计值为Y m3,
    又已知树木的材积量与其根部横截面积近似成正比,
    可得eq \f(0.06,0.39)=eq \f(186,Y),
    解得Y=1 209(m3).
    则该林区这种树木的总材积量估计为1 209 m3.
    3.(2022·新高考Ⅰ卷)一医疗团队为研究某地的一种地方性疾病与当地居民的卫生习惯(卫生习惯分为良好和不够良好两类)的关系,在已患该疾病的病例中随机调查了100例(称为病例组),同时在未患该疾病的人群中随机调查了100人(称为对照组),得到如下数据:
    (1)能否有99%的把握认为患该疾病群体与未患该疾病群体的卫生习惯有差异?
    (2)从该地的人群中任选一人,A表示事件“选到的人卫生习惯不够良好”,B表示事件“选到的人患有该疾病”,eq \f(P(B|A),P(\(B,\s\up6(-))|A))与eq \f(P(B|\(A,\s\up6(-))),P(\(B,\s\up6(-))|\(A,\s\up6(-))))的比值是卫生习惯不够良好对患该疾病风险程度的一项度量指标,记该指标为R.
    ①证明:R=eq \f(P(A|B),P(\(A,\s\up6(-))|B))·eq \f(P(\(A,\s\up6(-))|\(B,\s\up6(-))),P(A|\(B,\s\up6(-))));
    ②利用该调查数据,给出P(A|B),P(A|eq \(B,\s\up6(-)))的估计值,并利用①的结果给出R的估计值.
    附:χ2=eq \f(n(ad-bc)2,(a+b)(c+d)(a+c)(b+d)),
    (1)解 χ2=eq \f(200×(40×90-60×10)2,50×150×100×100)=24>6.635,
    所以有99%的把握认为患该疾病群体与未患该疾病群体的卫生习惯有差异.
    (2)①证明 R==eq \f(P(B|A)·P(\(B,\s\up6(-))|\(A,\s\up6(-))),P(\(B,\s\up6(-))|A)·P(B|\(A,\s\up6(-)))),
    由题意知,只需证明eq \f(P(B|A)·P(\(B,\s\up6(-))|\(A,\s\up6(-))),P(\(B,\s\up6(-))|A)·P(B|\(A,\s\up6(-))))=eq \f(P(A|B)·P(\(A,\s\up6(-))|\(B,\s\up6(-))),P(\(A,\s\up6(-))|B)·P(A|\(B,\s\up6(-))))即可,
    上式左边=eq \f(\f(P(AB),P(A))·\f(P(\(A,\s\up6(-)) \(B,\s\up6(-))),P(\(A,\s\up6(-)))),\f(P(A\(B,\s\up6(-))),P(A))·\f(P(\(A,\s\up6(-))B),P(\(A,\s\up6(-)))))=eq \f(P(AB)·P(\(A,\s\up6(-)) \(B,\s\up6(-))),P(A\(B,\s\up6(-)))·P(\(A,\s\up6(-))B)),
    右边=eq \f(\f(P(AB),P(B))·\f(P(\(A,\s\up6(-)) \(B,\s\up6(-))),P(\(B,\s\up6(-)))),\f(P(\(A,\s\up6(-))B),P(B))·\f(P(A\(B,\s\up6(-))),P(\(B,\s\up6(-)))))=eq \f(P(AB)·P(\(A,\s\up6(-)) \(B,\s\up6(-))),P(\(A,\s\up6(-))B)·P(A\(B,\s\up6(-)))).
    左边=右边,故R=eq \f(P(A|B),P(\(A,\s\up6(-))|B))·eq \f(P(\(A,\s\up6(-))|\(B,\s\up6(-))),P(A|\(B,\s\up6(-)))).
    ②解 由调查数据可知
    P(A|B)=eq \f(40,100)=eq \f(2,5),P(A|eq \(B,\s\up6(-)))=eq \f(10,100)=eq \f(1,10),
    且P(eq \(A,\s\up6(-))|B)=1-P(A|B)=eq \f(3,5),
    P(eq \(A,\s\up6(-))|eq \(B,\s\up6(-)))=1-P(A|eq \(B,\s\up6(-)))=eq \f(9,10),
    所以R=eq \f(\f(2,5),\f(3,5))×eq \f(\f(9,10),\f(1,10))=6.
    热点一 用样本估计总体
    1.频率分布直方图中相邻两横坐标之差表示组距,纵坐标表示eq \f(频率,组距),频率=组距×eq \f(频率,组距).
    2.在频率分布直方图中各小长方形的面积之和为1.
    3.利用频率分布直方图求众数、中位数与平均数.
    (1)最高的小长方形底边中点的横坐标即众数.
    (2)中位数左边和右边的小长方形的面积和相等.
    (3)平均数是频率分布直方图的“重心”,等于频率分布直方图中每个小长方形的面积乘以小长方形底边中点的横坐标之和.
    考向1 统计图表与数字特征的应用
    例1 (1)(2022·西安模拟)某市中小学生人数和近视情况分别如图甲和图乙所示,为了解该地区中小学生近视形成的原因,现用分层随机抽样的方法抽取5%的学生进行调查,则样本容量和抽取的高中生近视人数分别为( )
    A.750,100 B.1 500,100
    C.1 500,120 D.750,120
    (2)(多选)(2022·福州三模)空气质量指数(简称AQI)是能够对空气质量进行定量描述的数据,AQI越小代表空气质量越好.甲、乙两地在9次空气质量监测中的AQI数据如图所示,则下列说法正确的是( )
    A.甲地的AQI的平均值大于乙地
    B.甲地的AQI的方差小于乙地
    C.甲地的AQI的中位数大于乙地
    D.甲地的空气质量好于乙地
    答案 (1)B (2)ABC
    解析 (1)由题意,样本容量为(18 500+7 500+4 000)×5%=1 500,
    抽取的高中生近视人数为4 000×5%×0.5=100,故选B.
    (2)由AQI数据图知,甲地9次监测数据有7次均在50以上,只有两次在50以下,并且与50相差较小,乙地9次监测数据有7次均在50以下,有两次在50附近,并且与50相差很小,甲地的AQI的平均值大于50,乙地的AQI的平均值小于50,甲地的AQI的平均值大于乙地,A正确;
    甲地9次监测数据的折线图比较平滑,波动较小,乙地9次监测数据波动较大,即甲地的AQI的方差小于乙地,B正确;
    甲地9次监测数据的中位数大于50,乙地9次监测数据的中位数小于50,甲地的AQI的中位数大于乙地,C正确;
    甲地9次监测数据中有8个都高于乙地对应监测数据,再结合平均值、中位数看,乙地的空气质量要好于甲地,D不正确.
    考向2 用样本的频率分布估计总体分布
    例2 为了解甲、乙两种离子在小鼠体内的残留程度,进行如下试验:将200只小鼠随机分成A,B两组,每组100只,其中A组小鼠给服甲离子溶液,B组小鼠给服乙离子溶液.每只小鼠给服的溶液体积相同、摩尔浓度相同.经过一段时间后用某种科学方法测算出残留在小鼠体内离子的百分比.根据试验数据分别得到如下直方图:
    记C为事件:“乙离子残留在体内的百分比不低于5.5”,根据直方图得到P(C)的估计值为0.70.
    (1)求乙离子残留百分比直方图中a,b的值;
    (2)分别估计甲、乙离子残留百分比的平均值(同一组中的数据用该组区间的中点值为代表).
    解 (1)由已知得0.70=a+0.20+0.15,
    故a=0.35,
    b=1-0.05-0.15-0.70=0.10.
    (2)甲离子残留百分比的平均值的估计值为
    2×0.15+3×0.20+4×0.30+5×0.20+6×0.10+7×0.05=4.05.
    乙离子残留百分比的平均值的估计值为
    3×0.05+4×0.10+5×0.15+6×0.35+7×0.20+8×0.15=6.00.
    规律方法 1.平均数与方差都是重要的数字特征,是对数据的一种简明描述,它们所反映的情况有着重要的实际意义.
    2.在例2中,抓住频率分布直方图各小长方形的面积之和为1,这是求解的关键;本题易混淆频率分布条形图和频率分布直方图,误把频率分布直方图纵轴的几何意义当成频率,导致样本数据的频率求错.
    训练1 (1)(多选)(2022·济南质检)为了解某地农村经济情况,对该地农户家庭年收入进行抽样调查,将农户家庭年收入的调查数据整理得到如下频率分布直方图:
    根据此频率分布直方图,下面结论中正确的是( )
    A.该地农户家庭年收入低于4.5万元的农户比率估计为6%
    B.该地农户家庭年收入不低于10.5万元的农户比率估计为10%
    C.估计该地农户家庭年收入的平均值不超过6.5万元
    D.估计该地有一半以上的农户,其家庭年收入介于4.5万元至8.5万元之间
    答案 ABD
    解析 对于A,根据频率分布直方图可知,该地农户家庭年收入低于4.5万元的农户比率估计为(0.02+0.04)×1×100%=6%,故A正确;
    对于B,根据频率分布直方图可知,该地农户家庭年收入不低于10.5万元的农户比率估计为(0.04+0.02+0.02+0.02)×1×100%=10%,故B正确;
    对于C,根据频率分布直方图可知,该地农户家庭年收入的平均值估计为3×0.02+4×0.04+5×0.10+6×0.14+7×0.20+8×0.20+9×0.10+10×0.10+11×0.04+12×0.02+13×0.02+14×0.02=7.68(万元),故C错误;
    对于D,根据频率分布直方图可知,该地农户家庭年收入介于4.5万元至8.5万元之间的农户比率估计为(0.10+0.14+0.20+0.20)×1×100%=64%>50%,故D正确.
    (2)某工厂A,B两条生产线生产同款产品,若产品按照一、二、三等级分类,则每件可分别获利10元、8元、6元,现从A,B生产线生产的产品中各随机抽取100件进行检测,结果统计如图:
    ①分别计算两条生产线抽样产品获利的方差,以此作为判断依据,说明哪条生产线的获利更稳定;
    ②估计该厂产品产量为2 000件时的利润以及一等级产品的利润.
    解 ①从A生产线随机抽取的100件产品获利的平均数eq \(x,\s\up6(-))1=eq \f(1,100)×(10×20+8×60+6×20)=8(元),
    方差为seq \\al(2,1)=eq \f(1,100)×[(10-8)2×20+(8-8)2×60+(6-8)2×20]=1.6,
    从B生产线随机抽取的100件产品获利的平均数为eq \(x,\s\up6(-))2=eq \f(1,100)×(10×35+8×40+6×25)=8.2(元),
    方差为seq \\al(2,2)=eq \f(1,100)×[(10-8.2)2×35+(8-8.2)2×40+(6-8.2)2×25]=2.36.
    所以seq \\al(2,1)②从A,B生产线共随机抽取的200件产品获利的平均数为eq \f(1,200)×[10×(20+35)+8×(60+40)+6×(20+25)]=8.1(元),
    由样本估计总体,当产品产量为2 000件时,估计该工厂获利2 000×8.1=16 200(元).
    因为从A,B生产线共随机抽取的200件产品中,A生产线生产的一等级产品有20件,B生产线生产的一等级产品有35件,
    由样本频率估计总体概率,得该工厂生产产品为一等级产品的概率估计值为eq \f(20+35,200)=eq \f(11,40),
    当产品产量为2 000件时,估计该工厂一等级产品获利2 000×eq \f(11,40)×10=5 500(元).
    热点二 回归分析
    求经验回归方程的步骤
    (1)依据成对样本数据画出散点图,确定两个变量具有线性相关关系(有时可省略).
    (2)计算出eq \(x,\s\up6(-)),eq \(y,\s\up6(-)),eq \(∑,\s\up15(n),\s\d13(i=1))xeq \\al(2,i),eq \(∑,\s\up15(n),\s\d13(i=1))xiyi的值.
    (3)计算eq \(a,\s\up6(^)),eq \(b,\s\up6(^)).
    (4)写出经验回归方程.
    例3 (2022·合肥二模)《中国统计年鉴2021》数据显示,截止到2020年底,我国私人汽车拥有量超过24千万辆.下图是2011年至2020年十年间我国私人汽车拥有量y(单位:千万辆)折线图.
    (注:年份代码1~10分别对应年份2011~2020)
    (1)由折线图能够看出,可以用线性回归模型拟合y与t的关系,请用相关系数加以说明;
    (2)建立y关于t的经验回归方程(系数精确到0.01),并预测2024年我国私人汽车拥有量.
    参考数据:eq \(y,\s\up6(-))=15.5,eq \(∑,\s\up6(10),\s\d4(i=1)) (ti-eq \(t,\s\up6(-)))(yi-eq \(y,\s\up6(-)))=160.1,eq \(∑,\s\up6(10),\s\d4(i=1)) (yi-eq \(y,\s\up6(-)))2=311.4,eq \(∑,\s\up6(10),\s\d4(i=1)) (ti-eq \(t,\s\up6(-)))2=82.5,eq \r(25 550.5)≈159.8,eq \r(25 690.5)≈160.3.
    参考公式:相关系数
    r=eq \f(\(∑,\s\up6(n),\s\d4(i=1)) (ti-\(t,\s\up6(-)))(yi-\(y,\s\up6(-))),\r(\(∑,\s\up6(n),\s\d4(i=1)) (ti-\(t,\s\up6(-)))2\(∑,\s\up6(n),\s\d4(i=1)) (yi-\(y,\s\up6(-)))2)),
    经验回归方程eq \(y,\s\up6(^))=eq \(b,\s\up6(^))t+eq \(a,\s\up6(^))中,斜率和截距的最小二乘估计公式分别为
    eq \(b,\s\up6(^))=eq \f(\(∑,\s\up6(n),\s\d4(i=1)) (ti-\(t,\s\up6(-)))(yi-\(y,\s\up6(-))),\(∑,\s\up6(n),\s\d4(i=1)) (ti-\(t,\s\up6(-)))2)=eq \f(\(∑,\s\up6(n),\s\d4(i=1))tiyi-n\a\vs4\al(\(t,\s\up6(-)) ) \a\vs4\al(\(y,\s\up6(-)) ),\(∑,\s\up6(n),\s\d4(i=1))teq \\al(2,i)-n\(t,\s\up6(-))2),
    eq \(a,\s\up6(^))=eq \(y,\s\up6(-))-eq \(b,\s\up6(^))eq \(t,\s\up6(-)).
    解 (1)由题意得,
    r=eq \f(\(∑,\s\up6(10),\s\d4(i=1)) (ti-\(t,\s\up6(-)))(yi-\(y,\s\up6(-))),\r(\(∑,\s\up6(10),\s\d4(i=1)) (ti-\(t,\s\up6(-)))2\(∑,\s\up6(10),\s\d4(i=1)) (yi-\(y,\s\up6(-)))2))=eq \f(160.1,\r(82.5×311.4))=eq \f(160.1,\r(25690.5))≈eq \f(160.1,160.3)≈0.998 8.
    相关系数r≈0.998 8,说明y与t的线性相关性很高,
    所以可以用线性回归模型拟合y与t的关系.
    (2)由eq \(t,\s\up6(-))=5.5,eq \(∑,\s\up6(10),\s\d4(i=1)) (ti-eq \(t,\s\up6(-)))2=82.5,
    所以eq \(b,\s\up6(^))=eq \f(160.1,82.5)≈1.94,
    因此eq \(a,\s\up6(^))=eq \(y,\s\up6(-))-eq \(b,\s\up6(^))·eq \(t,\s\up6(-))=15.5-1.94×5.5=4.83,
    所以eq \(y,\s\up6(^))=1.94t+4.83.
    当t=14时,eq \(y,\s\up6(^))=1.94×14+4.83=31.99.
    据此可以预测,2024年我国私人汽车拥有量将达到31.99千万辆.
    易错提醒 1.样本点不一定在经验回归直线上,但点(eq \(x,\s\up6(-)),eq \(y,\s\up6(-)))一定在经验回归直线上.
    2.求eq \(b,\s\up6(^))时,灵活选择公式,注意公式的推导和记忆.
    3.利用样本相关系数判断相关性强弱,看|r|的大小,而不是r的大小.
    4.通过经验回归方程求的都是估计值,而不是真实值.
    训练2 (1)(2022·重庆诊断)已知变量x与y正相关,且由观测数据算得样本平均数eq \(x,\s\up6(-))=2,eq \(y,\s\up6(-))=10,则由观测数据得到的经验回归方程可能为( )
    A.y=-1.5x+11 B.y=-0.5x+11
    C.y=0.5x+9 D.y=1.5x+8
    (2)(多选)(2022·菏泽一模)某地为响应“扶贫必扶智,扶智就是扶知识、扶技术、扶方法”的号召,建立农业科技图书馆,供农民免费借阅,收集了近5年的借阅数据如下表:
    根据上表,可得y关于x的经验回归方程为eq \(y,\s\up6(^))=0.24x+eq \(a,\s\up6(^)),下列结论正确的有( )
    A.eq \(a,\s\up6(^))=4.68
    B.借阅量4.9,5.1,5.5,5.7,5.8的75%分位数为5.7
    C.y与x的线性相关系数r>0
    D.2024年的借阅量一定不少于6.84万册
    答案 (1)C (2)ABC
    解析 (1)因为变量x与y正相关,所以经验回归方程中的斜率大于0,故A,B错误;
    对于C,y=0.5x+9,过点(2,10),故C正确;
    对于D,y=1.5x+8不过点(2,10),故D错误.故选C.
    (2)对于A,eq \(x,\s\up6(-))=eq \f(1,5)×(1+2+3+4+5)=3,
    eq \(y,\s\up6(-))=eq \f(1,5)×(4.9+5.1+5.5+5.7+5.8)=5.4,
    ∵y关于x的经验回归方程为eq \(y,\s\up6(^))=0.24x+eq \(a,\s\up6(^)),
    ∴5.4=0.24×3+eq \(a,\s\up6(^)),解得eq \(a,\s\up6(^))=4.68,故A正确;
    对于B,5×75%=3.75,
    故借阅量4.9,5.1,5.5,5.7,5.8的75%分位数为5.7,故B正确;
    对于C,∵0.24>0,
    ∴y关于x的线性相关系数r>0,故C正确;
    对于D,线性回归方程为eq \(y,\s\up6(^))=0.24x+4.68,
    当x=9时,eq \(y,\s\up6(^))=6.84,
    故2024年的借阅量约为6.84万册,故D错误.
    热点三 独立性检验
    独立性检验的一般步骤
    (1)根据样本数据列2×2列联表;
    (2)根据公式χ2=eq \f(n(ad-bc)2,(a+b)(c+d)(a+c)(b+d)),计算χ2的值;
    (3)查表比较χ2与临界值的大小关系,作统计判断.χ2越大,对应假设事件H0成立(两类变量相互独立)的概率越小,H0不成立的概率越大.
    例4 为加强环境保护,治理空气污染,环境监测部门对某市空气质量进行调研,随机抽查了100天空气中的PM2.5和SO2浓度(单位:μg/m3),得下表:
    (1)估计事件“该市一天空气中PM2.5浓度不超过75,且SO2浓度不超过150”的概率;
    (2)根据所给数据,完成下面的2×2列联表:
    (3)根据(2)中的列联表,依据小概率值α=0.01的χ2独立性检验,能否认为该市一天空气中PM2.5浓度与SO2浓度有关?
    附:χ2=eq \f(n(ad-bc)2,(a+b)(c+d)(a+c)(b+d))
    解 (1)根据抽查数据,该市100天的空气中PM2.5浓度不超过75,且SO2浓度不超过150的天数为32+18+6+8=64,
    因此,该市一天空气中PM2.5浓度不超过75,且SO2浓度不超过150的概率的估计值为eq \f(64,100)=0.64.
    (2)根据抽查数据,可得2×2列联表:
    (3)零假设为H0:该市一天空气中PM2.5浓度与SO2浓度无关.根据(2)的列联表得
    χ2=eq \f(100×(64×10-16×10)2,80×20×74×26)≈7.484>6.635=x0.01.
    根据小概率值α=0.01的χ2独立性检验,我们推断H0不成立,即认为该市一天空气中PM2.5浓度与SO2浓度有关,此推断犯错误的概率不超过0.01.
    易错提醒 1.χ2越大两分类变量无关的可能性越小,推断犯错误的概率越小,通过表格查得无关的可能性.
    2.在犯错误的概率不超过0.01的前提下认为两个变量有关,并不是指两个变量无关的可能性为0.01.
    训练3 (1)某校团委对“学生性别和喜欢某视频APP是否有关”做了一次调查,其中被调查的女生人数是男生人数的一半,男生喜欢某视频APP的人数占男生人数的eq \f(1,6),女生喜欢某视频APP的人数占女生人数的eq \f(2,3),若依据小概率值α=0.050的独立性检验,认为喜欢某视频APP和性别有关,则男生至少有( )
    A.12人 B.6人
    C.10人 D.18人
    附:
    χ2=eq \f(n(ad-bc)2,(a+b)(c+d)(a+c)(b+d)).
    (2)(多选)某大学为了解学生对学校食堂服务的满意度,随机调查了50名男生和50名女生,每位学生对食堂的服务给出满意或不满意的评价,得到如表所示的列联表,经计算χ2≈4.762,则下列结论正确的是( )
    A.该校男生对食堂服务满意的概率的估计值为eq \f(3,5)
    B.调研结果显示,该校男生比女生对食堂服务更满意
    C.依据小概率值α=0.050的独立性检验,可以认为男、女生对该食堂服务的评价有差异
    D.依据小概率值α=0.010的独立性检验,可以认为男、女生对该食堂服务的评价有差异
    答案 (1)A (2)AC
    解析 (1)设被调查的男生人数为x,则被调查的女生人数为eq \f(x,2),则2×2列联表为
    零假设为H0:喜欢某视频APP和性别无关,
    根据小概率值α=0.050的独立性检验,认为喜欢某视频APP和性别有关,
    则χ2≥3.841,即χ2=eq \f(\f(3x,2)\b\lc\(\rc\)(\a\vs4\al\c1(\f(x,6)·\f(x,6)-\f(5x,6)·\f(x,3)))\s\up12(2),x·\f(x,2)·\f(x,2)·x)=eq \f(3x,8)≥3.841=x0.050,
    则x≥eq \f(3.841×8,3)≈10.243,
    又eq \f(x,2),eq \f(x,3),eq \f(x,6)均为整数,
    所以男生至少有12人.
    (2)对于A,该校男生对食堂服务满意的概率的估计值为eq \f(30,30+20)=eq \f(3,5),故A正确;
    对于B,该校女生对食堂服务满意的概率的估计值为eq \f(40,40+10)=eq \f(4,5)>eq \f(3,5),故B错误;
    因为χ2≈4.762>3.841=x0.050,
    所以根据小概率值α=0.050的独立性检验,可以认为男、女生对该食堂服务的评价有差异,故C正确,D错误.
    一、基本技能练
    1.乡村旅游是以旅游度假为宗旨,以村庄野外为空间,以人文无干扰、生态无破坏为特色的村野旅游形式.某机构随机调查了某地区喜欢乡村旅游的1 000名游客,这些游客都是在A,B,C,D,E这5个平台中的一个预订出游的(每名游客只选择1个平台),得到一个不完整的统计图,如图所示.已知在E平台预订出游的人数是在B平台预订出游的人数的1.75倍,则估计1 000名游客中在B平台预订出游的人数为( )
    A.100 B.120
    C.210 D.300
    答案 B
    解析 设在B平台预订出游的人数与在E平台预订出游的人数分别为x,y,
    则y=1.75x,且eq \f(x+y,1 000)=1-20%-17%-30%=33%,
    所以x+y=330,所以x=120.
    2.(2022·厦门模拟)厦门中学生助手通过统计已知某校有教职工560人,其中女职工240人,现按性别用分层随机抽样的方法从该校教职工中抽取28人,则抽取的男职工人数与抽取的女职工人数之差是( )
    A.2 B.4
    C.6 D.8
    答案 B
    解析 某校有教职工560人,其中女职工240人,则男职工320人,
    故男女职工人数之比为eq \f(320,240)=eq \f(4,3),
    现按性别用分层随机抽样方法从该校教职工中抽取28人,
    则抽取的男职工人数与抽取的女职工人数之比为eq \f(4,3),
    则抽取的男职工人数为28×eq \f(4,7)=16,
    抽取的女职工人数为28×eq \f(3,7)=12,
    故抽取的男职工人数与抽取的女职工人数之差是16-12=4.
    故选B.
    3.(2022·福州模拟)中国营养学会把走路称为“最简单、最优良的锻炼方式”,它不仅可以帮助减肥,还可以增强心肺功能、血管弹性、肌肉力量等.下图为甲、乙两人在同一星期内日步数的折线统计图:
    则下列结论中不正确的是( )
    A.这一星期内甲的日步数的中位数为11 600
    B.这一星期内乙的日步数的30%分位数是7 030
    C.这一星期内甲的日步数的平均值大于乙
    D.这一星期内甲的日步数的方差大于乙
    答案 B
    解析 对于A,甲的日步数从小到大排列为:2 435,7 965,9 500,11 600,12 700,16 000,16 800.
    中位数是11 600.故A正确;
    对于B,因为7×30%=2.1,所以乙的日步数的30%分位数是从小到大的第3个数,为10 060.故B不正确;
    对于C,eq \(x,\s\up6(-))甲=eq \f(1,7)(16 000+7 965+12 700+2 435+16 800+9 500+11 600)=11 000,
    eq \(x,\s\up6(-))乙=eq \f(1,7)(14 200+12 300+7 030+12 970+5 340+11 600+10 060)=10 500.
    所以eq \(x,\s\up6(-))甲>eq \(x,\s\up6(-))乙.故C正确;
    对于D,甲的极端值,对方差的影响大,所以甲日步数的方差大于乙.故D正确.
    4.(多选)为学习贯彻党的十九届六中全会精神,某单位组织“筑梦新时代”主题演讲活动.9位评委对某位选手的具体评分如下:7.8,8.4,8.5,8.6,8.8,8.9,9.5,9.7,9.9,则下列说法正确的是( )
    A.9位评委的评分的极差是2.1
    B.9位评委的评分的中位数是8.8
    C.9位评委的评分的平均分是8.8
    D.9位评委的评分的方差是eq \f(31,75)
    答案 ABD
    解析 9位评委的评分的极差是9.9-7.8=2.1,故A正确;
    9位评委的评分的中位数是8.8,故B正确;
    9位评委的评分的平均分是
    eq \f(7.8+8.4+8.5+8.6+8.8+8.9+9.5+9.7+9.9,9)=eq \f(80.1,9)=8.9,故C错误;
    9位评委的评分的方差为s2=eq \f(1,9)×[(7.8-8.9)2+(8.4-8.9)2+(8.5-8.9)2+(8.6-8.9)2+(8.8-8.9)2+(8.9-8.9)2+(9.5-8.9)2+(9.7-8.9)2+(9.9-8.9)2]=eq \f(3.72,9)=eq \f(31,75),故D正确.故选ABD.
    5.(多选)下列说法正确的是( )
    A.将一组数据中的每一个数据都加上同一个常数后,方差不变
    B.设具有线性相关关系的两个变量x,y的相关系数为r,则|r|越接近于0,x和y之间的线性相关程度越强
    C.在一个2×2列联表中,由计算得χ2的值,则χ2的值越小,判断两个变量有关的把握越大
    D.若X~N(1,σ2),P(X>2)=0.2,则P(0<X<1)=0.3
    答案 AD
    解析 对于A,方差反映一组数据的波动大小,将一组数据中的每个数据都加上或减去同一个常数后,方差不变,故A正确;
    对于B,具有线性相关关系的两个变量x,y的相关系数为r,则|r|越接近于1,x和y之间的线性相关程度越强,故B错误;
    对于C,在一个2×2列联表中,由计算得χ2的值,则χ2的值越大,判断两个变量有关的把握越大,故C错误;
    对于D,∵X~N(1,σ2),
    ∴P(0<X<1)=P(1<X<2)=P(X>1)-P(X>2)=0.5-0.2=0.3,故D正确.
    故选AD.
    6.(多选)(2022·济南模拟)某中学为了解高三男生的体能情况,通过随机抽样,获得了200名男生的100米体能测试成绩(单位:秒),将数据按照[11.5,12),[12,12.5),…,[15.5,16]分成9组,制成了如图所示的频率分布直方图.
    由直方图推断,下列选项正确的是( )
    A.直方图中a的值为0.38
    B.由直方图估计本校高三男生100米体能测试成绩的众数为13.75秒
    C.由直方图估计本校高三男生100米体能测试成绩不大于13秒的人数为54
    D.由直方图估计本校高三男生100米体能测试成绩的中位数为13.7秒
    答案 BC
    解析 对A,由于(0.08+0.16+0.3+a+0.52+0.3+0.12+0.08+0.04)×0.5=1,所以a=0.4,所以选项A错误;
    对B,由频率分布直方图可知,[13.5,14)这一组对应的小长方形最高,所以估计众数为eq \f(13.5+14,2)=13.75(秒),所以选项B正确;
    对C,由频率分布直方图知不大于13秒为前三组,前三组的人数为(0.08+0.16+0.3)×0.5×200=54,所以选项C正确;
    对D,由选项A可知,a=0.4,所以前四组的频率为(0.08+0.16+0.3+0.4)×0.5=0.47,前五组的频率为(0.08+0.16+0.3+0.4+0.52)×0.5=0.73,所以中位数在[13.5,14)这一组,设中位数为x秒,则(x-13.5)×0.52=0.5-0.47,解得x≈13.56,所以选项D错误.综上,选BC.
    7.某校高二年级共有学生1 000人,其中男生480人,按性别进行分层,用分层随机抽样的方法从高二全体学生中抽出一个容量为100的样本,若样本按比例分配,则女生应抽取的人数为________.
    答案 52
    解析 某校高二年级有学生1 000人,男生480人,则女生520人,
    设女生应抽取x人,则eq \f(x,520)=eq \f(100,1 000),
    ∴x=52.
    故女生应抽取52人.
    8.某设备的使用年限与所支出的维修费用的统计数据如下表:
    根据上表可得经验回归方程为eq \(y,\s\up6(^))=1.3x+eq \(a,\s\up6(^)),据此模型预测,若使用年限为14年,估计维修费约为________万元.
    答案 18
    解析 eq \(x,\s\up6(-))=eq \f(2+3+4+5+6,5)=4,
    eq \(y,\s\up6(-))=eq \f(1.5+4.5+5.5+6.5+7.0,5)=5,
    则样本点中心为(4,5),代入经验回归方程可得eq \(a,\s\up6(^))=5-1.3×4=-0.2,eq \(y,\s\up6(^))=1.3x-0.2,
    当x=14时,eq \(y,\s\up6(^))=1.3×14-0.2=18(万元),即估计使用14年时,维修费用是18万元.
    9.某驾驶员培训学校为对比了解“科目二”的培训过程采用大密度集中培训与周末分散培训两种方式的效果,调查了105名学员,统计结果为:接受大密度集中培训的55名学员中有45名学员一次考试通过,接受周末分散培训的50名学员一次考试通过的有30名.根据统计结果,认为“能否一次考试通过与是否集中培训有关”犯错误的概率不超过________.
    附:χ2=eq \f(n(ad-bc)2,(a+b)(c+d)(a+c)(b+d)).
    答案 0.025
    解析 零假设为H0:能否一次考试通过与是否集中培训无关.
    由题意,得到列联表如下:
    χ2=eq \f(105×(45×20-10×30)2,55×50×75×30)≈6.109>5.024=x0.025.
    根据小概率值α=0.025的独立性检验推断H0不成立,
    即认为“能否一次考试通过与是否集中培训有关”,此推断犯错的概率不超过0.025.
    10.中国于2022年2月在北京成功地举办了第二十四届冬季奥林匹克运动会.共赴冰雪之约,共享冬奥机遇,“冰雪经济”逐渐升温,“带动三亿人参与冰雪运动”已从愿景变为现实,中国各地滑雪场的数量也由2015年的1 255家增加到2021年的3 100家.下面是2016年至2021年中国滑雪场新增数量和滑雪场类型统计图,下列说法中正确的序号是________.
    ①2021年中国滑雪场产业中大众娱乐型滑雪场占比最高
    ②2016年至2021年中国滑雪场数量逐年上升
    ③2016年至2021年中国滑雪场新增数量逐年增加
    ④2021年业余玩家型滑雪场比2020年大众娱乐型滑雪场数量多
    答案 ①②④
    解析 由扇形统计图可知,2021年中国滑雪场中大众娱乐型滑雪场占比最高,故①正确;
    由柱状图可知,2016年至2021年中国滑雪场数量逐年上升,故②正确;
    由柱状图可知,2020年比2019年下降了,故③不正确;
    2021年,业余玩家型滑雪场的数量为3 100×38%=1 178(家),2020年,大众娱乐型滑雪场的数量为(3 100-385)×40%=1 086(家),故④正确.
    11.甲、乙两台机床生产同种产品,产品按质量分为一级品和二级品,为了比较两台机床产品的质量,分别用两台机床各生产了200件产品,产品的质量情况统计如下表:
    (1)甲机床、乙机床生产的产品中一级品的频率分别是多少?
    (2)根据小概率值α=0.01的独立性检验,分析甲机床生产的产品质量与乙机床生产的产品质量有无差异.
    附:χ2=eq \f(n(ad-bc)2,(a+b)(c+d)(a+c)(b+d)).
    解 (1)因为甲机床生产的200件产品中有150件一级品,
    所以甲机床生产的产品中一级品的频率为eq \f(150,200)=eq \f(3,4),
    因为乙机床生产的200件产品中有120件一级品,
    所以乙机床生产的产品中一级品的频率为eq \f(120,200)=eq \f(3,5).
    (2)零假设为H0:
    甲机床的产品质量与乙机床的产品质量没有差异.
    根据2×2列联表中的数据,
    得χ2=eq \f(400×(150×80-120×50)2,270×130×200×200)=eq \f(400,39)≈10.256,
    因为10.256>6.635=x0.01,
    所以推断H0不成立,
    即认为甲机床的产品质量与乙机床的产品质量有差异.
    12.2022年新冠病毒奥密克戎毒株全球蔓延,传染性更强、潜伏期更短、防控难度更大.为落实动态清零政策下的常态化防疫,某高中学校开展了每周的核酸抽检工作:周一至周五,每天中午13:00开始,当天安排450位师生核酸检测,五天时间全员覆盖.
    (1)该校教职工有410人,高二学生有620人,高三学生有610人,
    ①用分层随机抽样的方法,求高一学生每天抽检人数;
    ②高一年级共15个班,该年级每天抽检的学生有两种安排方案,方案一:集中来自部分班级;方案二:分散来自所有班级.
    你认为哪种方案更合理,并给出理由.
    (2)学校开展核酸抽检的第一周,周一至周五核酸抽检用时记录如下:
    ①计算变量x和y的相关系数r(精确到0.01),并说明两变量线性相关的强弱;
    ②根据①中的计算结果,判定变量x和y是正相关,还是负相关,并给出可能的原因.
    参考数据和公式:eq \r(10)≈3.16,相关系数r=eq \f(\(∑,\s\up13(n),\s\d10(i=1)) (xi-\(x,\s\up6(-)))(yi-\(y,\s\up6(-))),\r(\(∑,\s\up13(n),\s\d10(i=1)) (xi-\(x,\s\up6(-)))2\(∑,\s\up13(n),\s\d10(i=1)) (yi-\(y,\s\up6(-)))2)).
    解 (1)①高一学生每天抽检人数为eq \f(450×5-410-620-610,5)=122(人);
    ②方案二更合理,因为新冠病毒奥密克戎毒株传染性更强、潜伏期更短,分散抽检可以全面检测年级中每班学生的状况,更有利于防控筛查工作.
    (2)①eq \(x,\s\up6(-))=eq \f(1,5)(1+2+3+4+5)=3,eq \(y,\s\up6(-))=eq \f(1,5)(1.2+1.2+1.1+1+1)=1.1,
    所以eq \(∑,\s\up13(5),\s\d10(i=1)) (xi-eq \(x,\s\up6(-)))(yi-eq \(y,\s\up6(-)))=-2×0.1+(-1)×0.1+1×(-0.1)+2×(-0.1)=-0.6,
    eq \(∑,\s\up13(5),\s\d10(i=1)) (xi-eq \(x,\s\up6(-)))2=4+1+1+4=10,eq \(∑,\s\up13(5),\s\d10(i=1)) (yi-eq \(y,\s\up6(-)))2=0.01+0.01+0.01+0.01=0.04.
    变量x和y的相关系数为r=
    eq \f(\(∑,\s\up13(5),\s\d10(i=1)) (xi-\(x,\s\up6(-)))(yi-\(y,\s\up6(-))),\r(\(∑,\s\up13(5),\s\d10(i=1)) (xi-\(x,\s\up6(-)))2\(∑,\s\up13(5),\s\d10(i=1)) (yi-\(y,\s\up6(-)))2))=eq \f(-0.6,\r(10)×\r(0.04))=eq \f(-3,\r(10))≈-0.95,
    因为|r|>0.75,可知两变量线性相关性很强;
    ②由r<0可知变量x和y是负相关,可能的原因:随着抽检工作的开展,学校相关管理协调工作效率提高,因此用时缩短.
    二、创新拓展练
    13.(多选)下表是某生活超市2022年第四季度各区域营业收入占比和净利润占比统计表:
    该生活超市本季度的总营业利润率为32.5%(营业利润率是净利润占营业收入的百分比),则( )
    A.本季度此生活超市营业收入最低的是熟食区
    B.本季度此生活超市的营业净利润超过一半来自生鲜区
    C.本季度此生活超市营业利润率最高的是日用品区
    D.本季度此生活超市生鲜区的营业利润率超过50%
    答案 BC
    解析 对于A,由图表可知,此生活超市营业收入最低的是其它区,故选项A错误;
    对于B,因为生鲜区的净利润占比65.8%>50%,则本季度此生活超市的营业净利润超过一半来自生鲜区,故选项B正确;
    对于C,生活超市生鲜区的营业利润率为32.5%×eq \f(65.8%,48.6%)≈44%,
    生活超市熟食区的营业利润率为32.5%×eq \f(-4.3%,15.8%)≈-8.8%,
    生活超市乳制品区的营业利润率为32.5%×eq \f(16.5%,20.1%)≈26.7%,
    生活超市日用品区的营业利润率为32.5%×eq \f(20.2%,10.8%)≈60.8%,
    生活超市其它区的营业利润率为32.5%×eq \f(1.8%,4.7%)≈12.4%,
    所以本季度此生活超市营业利润率最高的是日用品区,故选项C正确;
    对于D,由上面计算可知,生活超市生鲜区的营业利润率为32.5%×eq \f(65.8%,48.6%)≈44%<50%,故选项D错误.
    故选BC.
    14.(多选)某校计划在课外活动中新增攀岩项目,为了了解学生喜欢攀岩和性别是否有关,面向学生开展了一次随机调查,其中参加调查的男、女生人数相同,并绘制了等高条形图,如图,则( )
    参考数据:
    A.参加调查的学生中喜欢攀岩的男生人数比喜欢攀岩的女生人数多
    B.参加调查的女生中喜欢攀岩的人数比不喜欢攀岩的人数多
    C.若参加调查的男、女生人数均为100,则能根据小概率值α=0.01的独立性检验,推断喜欢攀岩和性别有关
    D.无论参加调查的男、女生人数为多少,都能根据小概率值α=0.01的独立性检验,推断喜欢攀岩和性别有关
    答案 AC
    解析 因为参加调查的男、女生人数相同,
    且男生中喜欢攀岩的占80%,女生中喜欢攀岩的占30%,
    所以参加调查的学生中喜欢攀岩的男生人数比喜欢攀岩的女生人数多,故A正确;
    参加调查的女生中喜欢攀岩的人数占30%,所以不喜欢攀岩的人数占70%,
    所以参加调查的女生中不喜欢攀岩的人数比喜欢攀岩的人数多,故B不正确;
    若参加调查的男、女生人数都为100,则可得2×2列联表:
    所以χ2=eq \f(200×(80×70-20×30)2,100×100×110×90)=eq \f(5 000,99)≈50.505>6.635=x0.01,
    所以能根据小概率值α=0.01的独立性检验,推断喜欢攀岩和性别有关,故C正确;
    若不确定参加调查的男、女生人数,则无法确定能否根据小概率值α=0.01的独立性检验,推断喜欢攀岩和性别有关,故D不正确.
    15.(多选)为了了解市民对各种垃圾进行分类的情况,加强垃圾分类宣传,指导市民尽快掌握垃圾分类的方法,某市垃圾处理厂连续8周对有害垃圾错误分类情况进行了调查.经整理绘制了有害垃圾错误分类重量累积统计图,如图所示,图中横轴表示时间(单位:周),纵轴表示有害垃圾错误分类的累积重量(单位:吨).根据统计图分析,则下列说法正确的是( )
    A.当x∈[0,2)时有害垃圾错误分类的重量加速增长
    B.当x∈[2,4)时有害垃圾错误分类的重量匀速增长
    C.当x∈[4,6)时有害垃圾错误分类的重量相对于当x∈[2,4)时增长了30%
    D.当x∈[6,8]时有害垃圾错误分类的重量相对于当x∈[0,2)时减少了1.2吨
    答案 AB
    解析 由统计图可知,第2周增长数量比第1周增长数量明显要多,所以是加速增长,所以A正确;
    当x∈[2,4)时图象是线段,所以是匀速增长,所以B正确;
    当x∈[4,6)时增长数量比当x∈[2,4)时增长数量要少,所以是减少,所以C错误;
    当x∈[0,2)时共增长2.4吨,当x∈[6,8]时共增长0.6吨,所以减少了1.8吨,所以D错误.
    16.(2022·成都诊断)2020年1月15日教育部制定出台了《关于在部分高校开展基础学科招生改革试点工作的意见》(也称“强基计划”),《意见》宣布:2020年起不再组织开展高校自主招生工作,改为实行“强基计划”,“强基计划”主要选拔培养有志于服务国家重大战略需求且综合素质优秀或基础学科拔尖的学生,据悉“强基计划”的校考由试点高校自主命题,校考中通过笔试后才能进入面试环节.
    (1)为了更好地服务高三学生,某研究机构对随机抽取的5名高三学生的记忆力x和判断力y进行统计分析,得到下表:
    请用相关系数说明该组数据中y与x之间的关系可以用线性回归模型进行拟合,并求出y关于x的经验回归方程eq \(y,\s\up6(^))=eq \(a,\s\up6(^))+eq \(b,\s\up6(^))x.
    (2)现有甲、乙两所大学的笔试环节都设有三门考试科目,且每门科目是否通过相互独立,若某考生报考甲大学,每门笔试科目通过的概率均为eq \f(2,5),该考生报考乙大学,每门笔试科目通过的概率依次为m,eq \f(1,4),eq \f(2,3),其中0<m<1,根据规定每名考生只能报考“强基计划”的一所试点高校,若以笔试过程中通过科目数的数学期望为依据作出决策,求该考生更希望通过乙大学笔试时m的取值范围.
    参考公式:
    ①线性相关系数
    r=eq \f(\(∑,\s\up13(n),\s\d10(i=1))xiyi-n\a\vs4\al(\(x,\s\up6(-)) ) \a\vs4\al(\(y,\s\up6(-)) ),\r(\b\lc\(\rc\)(\a\vs4\al\c1(\(∑,\s\up13(n),\s\d10(i=1))xeq \\al(2,i)-n\(x,\s\up6(-))2))\b\lc\(\rc\)(\a\vs4\al\c1(\(∑,\s\up10(n),\s\d13(i=1))yeq \\al(2,i)-n\(y,\s\up6(-))2)))),一般地,相关系数r的绝对值在0.95以上(含0.95)认为线性相关性较强;否则,线性相关性较弱.
    ②对于一组数据(x1,y1),(x2,y2),…,(xn,yn),其经验回归方程eq \(y,\s\up6(^))=eq \(b,\s\up6(^))x+eq \(a,\s\up6(^))的斜率和截距的最小二乘估计公式分别为eq \(b,\s\up6(^))=eq \f(\(∑,\s\up13(n),\s\d10(i=1))xiyi-n\a\vs4\al(\(x,\s\up6(-)) ) \a\vs4\al(\(y,\s\up6(-)) ),\(∑,\s\up13(n),\s\d10(i=1))xeq \\al(2,i)-n\(x,\s\up6(-))2),eq \(a,\s\up6(^))=eq \(y,\s\up6(-))-eq \(b,\s\up6(^))eq \(x,\s\up6(-)).
    解 (1)根据表格中的数据,
    可得eq \(x,\s\up6(-))=eq \f(6+8+9+10+12,5)=9,
    eq \(y,\s\up6(-))=eq \f(2+3+4+5+6,5)=4,
    eq \(∑,\s\up13(5),\s\d10(i=1))xiyi=12+24+36+50+72=194,
    eq \(∑,\s\up13(5),\s\d10(i=1))xeq \\al(2,i)=36+64+81+100+144=425,
    eq \(∑,\s\up13(5),\s\d10(i=1))yeq \\al(2,i)=4+9+16+25+36=90,
    可得相关系数r=eq \f(194-5×9×4,\r((425-5×81)×(90-5×16)))=eq \f(14,10\r(2))≈0.99>0.95,
    故y与x之间的关系可用线性回归模型进行拟合.
    由eq \(b,\s\up6(^))=eq \f(\(∑,\s\up13(n),\s\d10(i=1))xiyi-n\a\vs4\al(\(x,\s\up6(-)) ) \a\vs4\al(\(y,\s\up6(-)) ),\(∑,\s\up13(n),\s\d10(i=1))xeq \\al(2,i)-n\(x,\s\up6(-))2)=eq \f(194-5×9×4,425-5×81)=0.7,
    可得eq \(a,\s\up6(^))=4-9×0.7=-2.3.
    所以经验回归方程为eq \(y,\s\up6(^))=-2.3+0.7x.
    (2)通过甲大学的考试科目数X~Beq \b\lc\(\rc\)(\a\vs4\al\c1(3,\f(2,5))),
    则E(X)=3×eq \f(2,5)=eq \f(6,5),
    设通过乙大学的考试科目数为Y,
    则Y可能的取值为0,1,2,3,
    则P(Y=0)=(1-m)eq \b\lc\(\rc\)(\a\vs4\al\c1(1-\f(1,4)))eq \b\lc\(\rc\)(\a\vs4\al\c1(1-\f(2,3)))=eq \f(1,4)(1-m),
    P(Y=1)=meq \b\lc\(\rc\)(\a\vs4\al\c1(1-\f(1,4)))eq \b\lc\(\rc\)(\a\vs4\al\c1(1-\f(2,3)))+(1-m)×eq \f(1,4)×eq \b\lc\(\rc\)(\a\vs4\al\c1(1-\f(2,3)))+(1-m)×eq \b\lc\(\rc\)(\a\vs4\al\c1(1-\f(1,4)))×eq \f(2,3)=eq \f(7,12)-eq \f(1,3)m,
    P(Y=2)=m×eq \f(1,4)×eq \b\lc\(\rc\)(\a\vs4\al\c1(1-\f(2,3)))+m×eq \b\lc\(\rc\)(\a\vs4\al\c1(1-\f(1,4)))×eq \f(2,3)+(1-m)×eq \f(1,4)×eq \f(2,3)=eq \f(1,6)+eq \f(5,12)m,
    P(Y=3)=m×eq \f(1,4)×eq \f(2,3)=eq \f(1,6)m,
    所以E(Y)=eq \f(7,12)-eq \f(1,3)m+2eq \b\lc\(\rc\)(\a\vs4\al\c1(\f(1,6)+\f(5,12)m))+3×eq \f(1,6)m=eq \f(11,12)+m,
    因为该考生更希望通过乙大学的笔试,
    所以E(Y)>E(X),
    即eq \f(11,12)+m>eq \f(6,5),
    又由0<m<1,解得eq \f(17,60)<m<1,
    即该考生更希望通过乙大学的笔试时m的取值范围为eq \b\lc\(\rc\)(\a\vs4\al\c1(\f(17,60),1)).样本号i
    1
    2
    3
    4
    5
    6
    7
    8
    9
    10
    总和
    根部横截
    面积xi
    0.04
    0.06
    0.04
    0.08
    0.08
    0.05
    0.05
    0.07
    0.07
    0.06
    0.6
    材积量yi
    0.25
    0.40
    0.22
    0.54
    0.51
    0.34
    0.36
    0.46
    0.42
    0.40
    3.9
    不够良好
    良好
    病例组
    40
    60
    对照组
    10
    90
    年份
    2016
    2017
    2018
    2019
    2020
    年份代码x
    1
    2
    3
    4
    5
    年借阅量y(万册)
    4.9
    5.1
    5.5
    5.7
    5.8
    SO2
    PM2.5
    [0,50]
    (50,150]
    (150,475]
    [0,35]
    32
    18
    4
    (35,75]
    6
    8
    12
    (75,115]
    3
    7
    10
    PM2.5浓度
    SO2浓度
    合计
    [0,150]
    (150,475]
    [0,75]
    (75,115]
    合计
    α
    0.050
    0.010
    0.001

    3.841
    6.635
    10.828
    PM2.5
    浓度
    SO2浓度
    合计
    [0,150]
    (150,475]
    [0,75]
    64
    16
    80
    (75,115]
    10
    10
    20
    合计
    74
    26
    100
    α
    0.050
    0.010

    3.841
    6.635
    性别
    对食堂服务的满意度
    满意
    不满意

    30
    20

    40
    10
    α
    0.100
    0.050
    0.010

    2.706
    3.841
    6.635
    性别
    对某视频APP的态度
    合计
    喜欢
    不喜欢
    男生
    eq \f(x,6)
    eq \f(5x,6)
    x
    女生
    eq \f(x,3)
    eq \f(x,6)
    eq \f(x,2)
    合计
    eq \f(x,2)
    x
    eq \f(3x,2)
    使用年限x(单位:年)
    2
    3
    4
    5
    6
    维修费用y(单位:万元)
    1.5
    4.5
    5.5
    6.5
    7.0
    α
    0.05
    0.025
    0.010
    0.001

    3.841
    5.024
    6.635
    10.828
    培训方式
    合计
    集中
    分散
    一次考过
    45
    30
    75
    一次未考过
    10
    20
    30
    合计
    55
    50
    105
    机床
    等级
    产口质量
    合计
    一级品
    二级品
    甲机床
    150
    50
    200
    乙机床
    120
    80
    200
    合计
    270
    130
    400
    α
    0.050
    0.010
    0.001

    3.841
    6.635
    10.828
    第x天
    1
    2
    3
    4
    5
    用时y(小时)
    1.2
    1.2
    1.1
    1.0
    1.0
    生鲜区
    熟食区
    乳制品区
    日用品区
    其它区
    营业收入占比
    48.6%
    15.8%
    20.1%
    10.8%
    4.7%
    净利润占比
    65.8%
    -4.3%
    16.5%
    20.2%
    1.8%
    α
    0.025
    0.010
    0.005

    5.024
    6.635
    7.879
    性别
    对攀岩的态度
    合计
    喜欢
    不喜欢

    80
    20
    100

    30
    70
    100
    合计
    110
    90
    200
    x
    6
    8
    9
    10
    12
    y
    2
    3
    4
    5
    6
    相关试卷

    备考2024届高考数学一轮复习分层练习第九章统计与成对数据的统计分析第3讲成对数据的统计分析: 这是一份备考2024届高考数学一轮复习分层练习第九章统计与成对数据的统计分析第3讲成对数据的统计分析,共10页。

    微专题18 统计与成对数据的统计分析: 这是一份微专题18 统计与成对数据的统计分析,共12页。

    微专题18 统计与成对数据的统计分析: 这是一份微专题18 统计与成对数据的统计分析,共10页。试卷主要包含了基本技能练,创新拓展练等内容,欢迎下载使用。

    免费资料下载额度不足,请先充值

    每充值一元即可获得5份免费资料下载额度

    今日免费资料下载份数已用完,请明天再来。

    充值学贝或者加入云校通,全网资料任意下。

    提示

    您所在的“深圳市第一中学”云校通为试用账号,试用账号每位老师每日最多可下载 10 份资料 (今日还可下载 0 份),请取消部分资料后重试或选择从个人账户扣费下载。

    您所在的“深深圳市第一中学”云校通为试用账号,试用账号每位老师每日最多可下载10份资料,您的当日额度已用完,请明天再来,或选择从个人账户扣费下载。

    您所在的“深圳市第一中学”云校通余额已不足,请提醒校管理员续费或选择从个人账户扣费下载。

    重新选择
    明天再来
    个人账户下载
    下载确认
    您当前为教习网VIP用户,下载已享8.5折优惠
    您当前为云校通用户,下载免费
    下载需要:
    本次下载:免费
    账户余额:0 学贝
    首次下载后60天内可免费重复下载
    立即下载
    即将下载:资料
    资料售价:学贝 账户剩余:学贝
    选择教习网的4大理由
    • 更专业
      地区版本全覆盖, 同步最新教材, 公开课⾸选;1200+名校合作, 5600+⼀线名师供稿
    • 更丰富
      涵盖课件/教案/试卷/素材等各种教学资源;900万+优选资源 ⽇更新5000+
    • 更便捷
      课件/教案/试卷配套, 打包下载;手机/电脑随时随地浏览;⽆⽔印, 下载即可⽤
    • 真低价
      超⾼性价⽐, 让优质资源普惠更多师⽣
    VIP权益介绍
    • 充值学贝下载 本单免费 90%的用户选择
    • 扫码直接下载
    元开通VIP,立享充值加送10%学贝及全站85折下载
    您当前为VIP用户,已享全站下载85折优惠,充值学贝可获10%赠送
      充值到账1学贝=0.1元
      0学贝
      本次充值学贝
      0学贝
      VIP充值赠送
      0学贝
      下载消耗
      0学贝
      资料原价
      100学贝
      VIP下载优惠
      0学贝
      0学贝
      下载后剩余学贝永久有效
      0学贝
      • 微信
      • 支付宝
      支付:¥
      元开通VIP,立享充值加送10%学贝及全站85折下载
      您当前为VIP用户,已享全站下载85折优惠,充值学贝可获10%赠送
      扫码支付0直接下载
      • 微信
      • 支付宝
      微信扫码支付
      充值学贝下载,立省60% 充值学贝下载,本次下载免费
        下载成功

        Ctrl + Shift + J 查看文件保存位置

        若下载不成功,可重新下载,或查看 资料下载帮助

        本资源来自成套资源

        更多精品资料

        正在打包资料,请稍候…

        预计需要约10秒钟,请勿关闭页面

        服务器繁忙,打包失败

        请联系右侧的在线客服解决

        单次下载文件已超2GB,请分批下载

        请单份下载或分批下载

        支付后60天内可免费重复下载

        我知道了
        正在提交订单

        欢迎来到教习网

        • 900万优选资源,让备课更轻松
        • 600万优选试题,支持自由组卷
        • 高质量可编辑,日均更新2000+
        • 百万教师选择,专业更值得信赖
        微信扫码注册
        qrcode
        二维码已过期
        刷新

        微信扫码,快速注册

        手机号注册
        手机号码

        手机号格式错误

        手机验证码 获取验证码

        手机验证码已经成功发送,5分钟内有效

        设置密码

        6-20个字符,数字、字母或符号

        注册即视为同意教习网「注册协议」「隐私条款」
        QQ注册
        手机号注册
        微信注册

        注册成功

        下载确认

        下载需要:0 张下载券

        账户可用:0 张下载券

        立即下载
        使用学贝下载
        账户可用下载券不足,请取消部分资料或者使用学贝继续下载 学贝支付

        如何免费获得下载券?

        加入教习网教师福利群,群内会不定期免费赠送下载券及各种教学资源, 立即入群

        即将下载

        微专题44 统计与成对数据的统计分析-2024高考数学二轮复习微专题
        该资料来自成套资源,打包下载更省心 该专辑正在参与特惠活动,低至4折起
        [共10份]
        浏览全套
          立即下载(共1份)
          返回
          顶部
          Baidu
          map