数学选修2-3第三章 统计案例综合与测试同步达标检测题
展开易错点1 忽略线性相关性的检验
1.(2020陕西延安吴起高级中学高二下第三次质量检测,)根据统计,某蔬菜基地西红柿亩产量的增加量y(百千克)与某种液体肥料每亩使用量x(千克)之间的对应数据的散点图如图所示.
(1)从散点图可以看出,可用线性回归模型拟合y与x的关系,请计算相关系数r并加以说明(若|r|≥0.75,则线性相关程度很高,可用线性回归模型拟合);
(2)求y关于x的回归方程,并预测液体肥料每亩使用量为12千克时,西红柿亩产量的增加量为多少.
附:相关系数r=∑i=1n(xi-x)(yi-y)∑i=1n(xi-x)2∑i=1n(yi-y)2=∑i=1nxiyi-nx-y-∑i=1nxi2-nx2∑i=1nyi2-ny2,回归方程y^=b^x+a^中斜率和截距的最小二乘估计分别为b^=∑i=1n(xi-x)(yi-y)∑i=1n(xi-x)2=∑i=1nxiyi-nx-y-∑i=1nxi2-nx2,a^=y-b^x.
2.(2020山东济宁高二下期末,)根据国家统计局数据,1999年至2019年我国进出口贸易总额从3万亿元跃升至31.6万亿元,中国在国际市场上的贸易份额越来越大,对外贸易在国民经济中的作用日益突出.将年份1999,2004,2009,2014,2019分别用1,2,3,4,5代替,并表示为t,用y表示全国进出口贸易总额.如图分别是y与t对应数据的条形统计图及散点图.
(1)根据以上统计数据及图表,给出了下列两个方案,请解决方案1中的问题.
方案1:用y^=b^t+a^作为全国进出口贸易总额y关于t的回归方程,根据以下参考数据,求出y关于t的回归方程,并求相关指数R12.
方案2:用y^=c^ed^t作为全国进出口贸易总额y关于t的回归方程,求得回归方程为y^=,相关指数R22=0.9778.
(2)通过对比(1)中两个方案的相关指数,你认为哪个方案中的回归方程更适合作为全国进出口贸易总额y关于t的回归方程,并利用此回归方程估计2020年的全国进出口贸易总额.
参考数据:
①0.142+0.342+0.662+1.862+2.042=8.192;
②≈0.0147.
参考公式:线性回归方程中的斜率和截距的最小二乘法估计分别为b^=∑i=1n(xi-x)(yi-y)∑i=1n(xi-x)2,a^=y-b^x,相关指数R2=1-∑i=1n(yi-y^i)2∑i=1n(yi-y)2.
易错
易错点2 求K2的观测值k 时用错公式致错
3.(2020河南信阳高二下期末,)我国新型冠状病毒肺炎疫情期间,以网络购物和网上服务所代表的新兴消费展现出了强大的生命力,新兴消费将成为我国消费增长的新动能.某市为了了解本地居民在2020年2月至3月两个月间的网络购物消费情况,在网上随机对1000人做了问卷调查,得到如下频数分布表:
(1)作出这些数据的频率分布直方图,并估计本市居民此期间网络购物的消费平均值;
(2)在调查问卷中有一项是填写本人年龄,为研究网购金额和网购人年龄的关系,以网购金额是否超过4000元为标准进行分层抽样,从上述1000人中抽取200人,得到如下表所示的列联表,请将表补充完整并根据列联表判断,是否有95%的把握认为此期间的网购金额与网购人的年龄有关.
参考公式和数据:K2=n(ad-bc)2(a+b)(c+d)(a+c)(b+d).(其中n=a+b+c+d为样本容量)
易错
4.(2019河北枣强中学高二上期末,)某学校为了解高一学生暑假里在家读书的情况,特随机调查了50名男生和50名女生平均每天的读书时间(单位:分钟),统计如下表:
(1)根据统计表判断男生和女生谁的平均每天的读书时间更长,并说明理由;
(2)求100名学生每天读书时间的平均数,并将每天平均时间超过和不超过平均数的人数填入下面的列联表中;
(3)根据(2)中列联表,能否有99%的把握认为“平均读书时间超过或不超过平均数与性别有关”?
附:K2=n(ad-bc)2(a+b)(c+d)(a+c)(b+d),其中n=a+b+c+d.
思想方法练
一、数形结合思想在统计中的应用
1.(2021河北巨鹿中学高二上第一次月考,)某同学暑期做社会实践活动.对气温与某饮料的销量之间的关系进行调研,记录连续5天的数据如下:
(1)在给定的坐标系中画出表中数据的散点图;
(2)求出y关于x的线性回归方程y^=b^x+a^,试预测气温在15℃时大约可销售多少杯(取整数).
注:b^=∑i=1nxiyi-nx-y-∑i=1nxi2-nx-2,a^=y-b^x.
2.(2021陕西部分学校高三上摸底检测,)2019年12月27日,国家统计局公布全国规模以上工业企业月累计营业收入利润率数据如表:
(1)根据表中有关数据请在下图中补充完整y与x的折线图,判断y^=a^+b^x与y^=c^+d^x哪一个更适宜作为y关于x的回归方程模型,并说明理由;
(2)根据(1)的判断结果及表中数据,建立y关于x的回归方程(系数精确到0.01);
(3)根据(2)得出的回归方程,预测1~12月月累计营业收入利润率(%)的值为多少?
参考公式:对于一组数据(u1,v1),(u2,v2),…,(un,vn),其回归直线v=α+βu的斜率和截距的最小二乘估计分别为β^=∑i=1n(ui-u)(vi-v)∑i=1n(ui-u)2,α^=v-β^u.
参考数据:
表中wi=xi,w=110∑i=110wi,11≈3.32.
3.(2019黑龙江哈尔滨第三中学高二上期末,)某校高二年级六班同学用随机抽样的方法对所在学校老师的饮食习惯进行了一次调查,饮食指数结果用如图所示的茎叶图表示,图中饮食指数低于70的人饮食以蔬菜为主,饮食指数高于70的人饮食以肉类为主.
(1)完成下列2×2列联表:
能否有99%的把握认为老师的饮食习惯与年龄有关?
(2)从该校任选一名老师,设“选到45岁以上的老师”为事件A,“饮食指数高于70的老师”为事件B,用调查的结果估计P(B|A)及P(B|A)(用最简分数作答);
(3)为了给食堂提供老师的饮食信息,根据(1)(2)的结论,是否有更好的抽样方法来估计老师的饮食习惯,并说明理由.
附:
K2=n(ad-bc)2(a+b)(c+d)(a+c)(b+d),其中n=a+b+c+d.
二、转化与化归思想在统计中的应用
4.(2021湖南师大附中高二上10月月考,)某工厂生产不同规格的一种产品,根据统计分析,其合格产品的质量y(g)与尺寸x(mm)之间的相关关系可用回归模型y=cxb(b,c都为正数)进行拟合.现随机抽取6件合格产品,其检测数据如下表:
(1)检测标准指出,当产品质量与尺寸的比值在区间(0.302,0.388)内时为优等品.现从所抽取的6件合格产品中任选2件,求选中的2件产品均为优等品的概率;
(2)经计算,∑i=16lnxi≈24.6,∑i=16lnyi≈18.3,∑i=16(lnxi)2≈101.4,∑i=16lnxi·lnyi≈75.3,求y关于x的回归方程.
附:对于样本数据(ui,vi)(i=1,2,…,n),其回归直线v=bu+a的斜率和截距的最小二乘估计公式分别为b^=∑i=1n(ui-u)(vi-v)∑i=1n(ui-u)2=∑i=1nuivi-nu-v-∑i=1nui2-nu2,a^=v-b^u.
本章复习提升
易混易错练
1.解析 (1)由题图可得x=2+4+5+6+85=5,y=3+4+5+6+75=5.
∑i=15(xi-x)(yi-y)=-3×(-2)+(-1)×(-1)+0×0+1×1+3×2=14,
∑i=15(xi-x)2=(-3)2+(-1)2+02+12+32=20,
∑i=15(yi-y)2=(-2)2+(-1)2+02+12+22=10.
∵r=∑i=15(xi-x)(yi-y)∑i=15(xi-x)2∑i=15(yi-y)2=1420×10=7210>0.75,
∴可用线性回归模型拟合y与x的关系.
(2)b^=∑i=15(xi-x)(yi-y)∑i=15(xi-x)2=1420=0.7,
a^=y-b^x=5-0.7×5=1.5,∴y^=0.7x+1.5.
当x=12时,y^=0.7×12+1.5=9.9.∴预测液体肥料每亩使用量为12千克时,西红柿亩产量的增加量为9.9百千克.
2.解析 (1)由题中条形统计图可计算得t=3,∑i=15(ti-t)2=(1-3)2+(2-3)2+(3-3)2+(4-3)2+(5-3)2=10,
b^=∑i=15(ti-t)(yi-y)∑i=15(ti-t)2=7410=7.4,a^=y-b^t=17.14-7.4×3=-5.06,∴y关于t的回归方程为y^=7.4t-5.06.
又∑i=15(yi-y^i)2=0.662+(-0.14)2+(-2.04)2+1.862+(-0.34)2=8.192,
∴R12=1-∑i=15(yi-y^i)2∑i=15(yi-y)2=1-≈1-0.0147=0.9853.
(2)由(1)知,R12=0.9853>0.9778=R22,
∴y^=7.4t-5.06更适合作为全国进出口贸易总额y关于t的回归方程,
∵2020年对应的t=5.2,∴当t=5.2时,y^=7.4×5.2-5.06=33.42,可以估计2020年的全国进出口贸易总额为33.42万亿元.
易错警示
求回归方程之前必须进行相关性检验,只有两个变量具有线性相关关系,才能求线性回归方程,否则就需要用非线性回归方程来表示两个变量之间的关系.
3.解析 (1)由题表中数据及题意可得3001000×2000=0.00015,4001000×2000=0.0002,1801000×2000=0.00009,601000×2000=0.00003,即频率分布直方图中,[0,2000],(2000,4000],(4000,6000],(6000,8000],(8000,10000]对应的纵轴的数据分别是0.00015,0.0002,0.00009,0.00003,0.00003,从而得出频率分布直方图如图所示,
设本市居民此期间网络购物的消费平均值为x,则由频率分布直方图可得
x=1000×0.3+3000×0.4+5000×0.18+7000×0.06+9000×0.06=300+1200+900+420+540=3360(元),
故估计本市居民此期间网络购物的消费平均值为3360元.
(2)由题中频数分布表的数据可知抽取的200人中,网购金额不超过4000元的有700×2001000=140(人),
超过4000元的有300×2001000=60(人),可得列联表如下:
经计算可得k=200×(75×35-25×65)2100×100×140×60=5021≈2.381<3.841.
故没有95%的把握认为此期间网购金额与网购人的年龄有关.
易错警示
在判定两个变量是否相关时,不能根据2×2列联表盲目地进行判断,需要计算统计量K2的观测值,进行更精准的分析,从而得出两变量是否相关.
4.解析 (1)女生平均每天的读书时间更长.
理由如下:
男生平均每天的读书时间为150×152×6+452×13+752×15+1052×8+1352×6+1652×2=37.8(分钟),
女生平均每天的读书时间为150×152×2+452×11+752×15+1052×10+1352×8+1652×4=44.4(分钟),
故女生平均每天的读书时间更长.
(2)100名学生平均每天的读书时间为
1100×152×8+452×24+752×30+1052×18+1352×14+1652×6=41.1(分钟).
完整的列联表如下:
(3)计算得k=100×(31×25-19×25)250×50×56×44≈1.461<6.635,所以没有99%的把握认为“平均读书时间超过或不超过平均数与性别有关”.
思想方法练
1.解析 (1)散点图如图所示,
根据题表中的数据画出散点图,以“形”助
“数”,充分体现了数形结合的思想.
(2)由题意得x=9+10+12+11+85=10,y=22+25+29+26+205=24.4,∑i=15xiyi=9×22+10×25+12×29+11×26+8×20=1242,∑i=15xi2=92+102+122+112+82=510.∴b^=1242-5×10×24.4510-5×100=2.2,a^=24.4-2.2×10=2.4,∴回归方程为y^=2.2x+2.4,令x=15,得y^=2.2×15+2.4=35.4≈35,∴预测气温在15℃时大约可销售35杯.
2.解析 (1)补充完整的折线图如下,
根据表中数据描点,然后画出折线图,“以
形助数”,体现了数形结合思想.
可知选用y^=c^+d^x更适宜.理由:根据折线图知折线的形状更接近y=c+dx的图象.
(2)令w=x,则
d^=∑i=110(wi-w)(yi-y)∑i=110(wi-w)2≈≈0.46,
∵c^=y-d^w≈5.66-0.46×2.25≈4.63,
∴y关于w的线性回归方程为y^=4.63+0.46w,∴y关于x的回归方程为y^=4.63+0.46x.
(3)由(2)可知,当x=11时,y^≈4.63+0.46×3.32≈6.16,因此,预测1~12月月累计营业收入利润率(%)的值为6.16.
3.解析 (1)由茎叶图得出饮食习惯与年龄所
对应的数据,体现了由“形”到“数”的过程,
充分体现了数形结合思想.
完成后的2×2列联表如下:
∴k=30×(8-128)212×18×20×10=10>6.635,故有99%的把握认为老师的饮食习惯与年龄有关.
(2)由题意得P(AB)=230=115,P(A)=1830=35,∴P(B|A)=P(AB)P(A)=19,又P(BA)=830=415,P(A)=25,∴P(B|A)=P(BA)P(A)=23.
(3)可以考虑使用分层抽样,根据(1)的结论,不超过45岁与超过45岁的老师饮食习惯差异较大,为了给食堂提供更科学的有关老师的饮食信息,最佳的抽样方法是按年龄段进行分层抽样.
思想方法
数形结合思想就是通过数和形之间的对应关系和相互转化来解决问题的思想方法. 作为一种数学思想方法,数形结合的应用大致可分为两种情形:或者借助数的精确性来阐明形的某些属性,或者借助形的几何直观性来阐明数之间某种关系,即数形结合包括两个方面:第一种情形是“以数解形”,第二种情形是“以形助数”.
4.解析 (1)由已知,得优等品的质量与尺寸的比值yx∈(0.302,0.388),
则随机抽取的6件合格产品中,有3件为优等品,记为a,b,c,有3件为非优等品,记为d,e,f,现从抽取的6件合格产品中任选2件,基本事件为(a,b),(a,c),(a,d),(a,e),(a,f),(b,c),(b,d),(b,e),(b,f),(c,d),(c,e),(c,f),(d,e),(d,f),(e,f),选中的2件产品均为优等品的基本事件为(a,b),(a,c),(b,c),所以所求概率为315=15.
(2)函数模型是指数函数模型,通过对y=
cxb两边取对数,然后利用换元的思想把它转化为线性回归模型进行处理,体现了转化与化归思想.
对y=cxb两边取自然对数得lny=lnc+blnx,令vi=lnxi,ui=lnyi,则u=b·v+a,且a=lnc,由所给统计量及最小二乘估计有b^=∑i=16viui-6u·v∑i=16vi2-6v2≈75.3-24.6×18.3÷6101.4-24.62÷6=,a^=u-b^v=18.3-12×24.66=1.由a^=lnc^得c^=e,所以y关于x的回归方程为y=ex0.5.
思想方法
应用转化与化归思想解题的原则应是化难为易,化生为熟,化繁为简,尽可能是等价转化,而有些问题的转化是只要注意添加附加条件或所得结论进行必要的验证就能确保转化的等价.常见的转化有:正与反的转化、数与形的转化、相等与不等的转化、整体与局部的转化、空间与平面的转化、常量与变量的转化、图形语言、文字语言与符号语言的转化等.
y
∑i=15(ti-t)(yi-y)
∑i=15(yi-y)2
17.14
74
555.792
网购消费情况(元)
频数
[0,2000]
300
(2000,4000]
400
(4000,6000]
180
(6000,8000]
60
(8000,10000]
60
网购不超过
4000元
网购超过
4000元
总计
40岁以上
75
100
40岁以下
(含40岁)
总计
200
P(K2≥k0)
0.050
0.010
0.001
k0
3.841
6.635
10.828
读书
时间
[0,15)
[15,30)
[30,45)
[45,60)
[60,75)
[75,90)
男生
人数
6
13
15
8
6
2
女生
人数
2
11
15
10
8
4
不超过
超过
总计
男生
女生
总计
P(K2≥k0)
0.050
0.010
0.001
k0
3.841
6.635
10.828
气温x(℃)
9
10
12
11
8
销量y(杯)
22
25
29
26
20
月份累计
月份累计代码x
营业收入利润率y(%)
1~2月
1
4.79
1~3月
2
5.31
1~4月
3
5.52
1~5月
4
5.72
1~6月
5
5.86
1~7月
6
5.87
1~8月
7
5.87
1~9月
8
5.91
1~10月
9
5.85
1~11月
10
5.91
x
5.50
y
5.66
w
2.25
∑i=110(xi-x)2
82.50
∑i=110(wi-w)2
4.52
∑i=110(xi-x)(yi-y)
8.14
∑i=110(wi-w)(yi-y)
2.07
以蔬菜为主
以肉类为主
总计
不超过45岁
45岁以上
总计
P(K2≥k0)
0.050
0.010
0.001
k0
3.841
6.635
10.828
尺寸x(mm)
38
48
58
68
78
88
质量y(g)
16.8
18.8
20.7
22.4
24
25.5
质量与尺寸的比yx
0.442
0.392
0.357
0.329
0.308
0.290
网购不超过
4000元
网购超过
4000元
总计
40岁以上
75
25
100
40岁以下
(含40岁)
65
35
100
总计
140
60
200
不超过
超过
总计
男生
31
19
50
女生
25
25
50
总计
56
44
100
以蔬菜为主
以肉类为主
总计
不超过
45岁
4
8
12
45岁以上
16
2
18
总计
20
10
30
高中数学人教版新课标A选修2-1第三章 空间向量与立体几何综合与测试习题: 这是一份高中数学人教版新课标A选修2-1第三章 空间向量与立体几何综合与测试习题,共17页。试卷主要包含了下列命题正确的是等内容,欢迎下载使用。
高中数学人教版新课标A选修2-3第二章 随机变量及其分布综合与测试课后练习题: 这是一份高中数学人教版新课标A选修2-3第二章 随机变量及其分布综合与测试课后练习题,共11页。试卷主要包含了6931,ln3≈1等内容,欢迎下载使用。
高中数学人教版新课标A选修2-31.3二项式定理课堂检测: 这是一份高中数学人教版新课标A选修2-31.3二项式定理课堂检测,共5页。试卷主要包含了4的展开式中x3的系数为等内容,欢迎下载使用。