- 2 成对数据的线性相关性-2022版数学选择性必修第一册 北师大版(2019) 同步练习 (Word含解析) 试卷 1 次下载
- 3 独立性检验问题-2022版数学选择性必修第一册 北师大版(2019) 同步练习 (Word含解析) 试卷 1 次下载
- 专题强化练15 独立性检验与统计、概率的综合应用-2022版数学选择性必修第一册 北师大版(2019) 同步练习 (Word含解析) 试卷 1 次下载
- 第七章达标检测-2022版数学选择性必修第一册 北师大版(2019) 同步练习 (Word含解析) 试卷 1 次下载
- 全书综合测评-2022版数学选择性必修第一册 北师大版(2019) 同步练习 (Word含解析) 试卷 2 次下载
第七章复习提升-2022版数学选择性必修第一册 北师大版(2019) 同步练习 (Word含解析)
展开本章复习提升
易混易错练
易错点一 选错回归模型致错
1.(2020广东佛山第一中学月考,)在一项调查中有两个变量x和y,下图是由这两个变量近8年来的取值数据得到的散点图,那么适宜作为y关于x的回归方程的函数类型是 ( )
A.y=a+bx B.y=c+d
C.y=m+nx2 D.y=p+qcx(q>0)
2.(2020山西康杰中学高二下月考,)在一次抽样调查中测得5组成对数据,其数值及散点图如下:
x | 0.25 | 0.5 | 1 | 2 | 4 |
y | 16 | 12 | 5 | 2 | 1 |
(1)根据散点图判断y=a+bx与y=c+k·x-1哪一个更适宜作为y关于x的回归方程类型;(给出判断即可,不必说明理由)
(2)根据(1)的判断结果及表中数据,试建立y与x的回归方程;(计算结果保留整数)
(3)在(2)的条件下,设z=y+x且x∈[4,+∞),试求z的最小值.
参考公式:回归方程=x+中,
==,=-.
易错点二 用错χ2公式致错
3.(2020重庆二诊,)“微信运动”已成为当下热门的健身方式,小王的微信朋友圈内也有大量好友参与了“微信运动”,他随机选取了其中的40人(男、女各20人),记录了他们某一天的走路步数,并将数据整理如下:
步数 性别 | 0~2000 | 2001~ 5000 | 5001~ 8000 | 8001~ 10000 | >10000 |
男 | 1 | 2 | 3 | 6 | 8 |
女 | 0 | 2 | 10 | 6 | 2 |
(1)若采用样本估计总体的方式,试估计小王的所有微信好友中每日走路步数超过5000的概率;
(2)已知某人一天的走路步数超过8000被系统评定为“积极型”,否则为“懈怠型”,根据题意完成下面的2×2列联表,试问:“评定类型”与“性别”是否有关?
评定类型 性别 | 积极型 | 懈怠型 | 总计 |
男 |
|
|
|
女 |
|
|
|
总计 |
|
|
|
4.(2020陕西西安高新一中高三期末,)某地区在“精准扶贫”工作中切实贯彻习近平总书记提出的“因地制宜”的指导思想,扶贫工作小组经过多方调研,综合该地区的气候、地质、地理位置等特点,决定向当地农户推行某类景观树苗种植.工作小组根据市场前景重点考察了A,B两种景观树苗,为对比两种树苗的成活率,工作小组进行了引种试验,分别引种树苗A,B各50株,试验发现有80%的树苗成活,未成活的树苗A,B株数之比为1∶3.
(1)完成2×2列联表,试问:树苗A,B的成活率是否有差异?
树苗类别 成活情况 | A | B | 总计 |
成活株数 |
|
|
|
未成活株数 |
|
|
|
总计 | 50 | 50 | 100 |
(2)已知树苗A经引种成活后再经过1年的生长即可作为景观树A在市场上出售,但每株售价y(单位:百元)受其树干的直径x(单位:cm)影响,扶贫工作小组对一批已出售的景观树A的相关数据进行统计,得到结果如下表:
直径x/cm | 10 | 15 | 20 | 25 | 30 |
单株售价y/百元 | 4 | 8 | 10 | 16 | 27 |
根据上述数据,判断是否可用线性回归模型拟合y与x的关系,并用相关系数r加以说明.(一般认为,|r|>0.75为高度线性相关)
参考公式及数据:相关系数r=,(xi-)2=250,(yi-)2=320.
5.(2020河南信阳高二下期末,)我国新型冠状病毒肺炎疫情期间,以网络购物和网上服务所代表的新兴消费展现出了强大的生命力,新兴消费将成为我国消费增长的新动能.某市为了了解本地居民在2020年2月至3月两个月网络购物消费情况(单位:元),在网上随机对1000人进行了问卷调查,得到的频数分布表如下:
网络购物 消费情况(元) | [0, 2000] | (2000, 4000] | (4000, 6000] | (6000, 8000] | (8000, 10000] |
频数 | 300 | 400 | 180 | 60 | 60 |
(1)作出这些数据的频率分布直方图,并估计该市居民此期间网络购物的消费平均值;
(2)在调查问卷中有一项是填写本人年龄,为研究网购金额和网购人年龄的关系,以网购金额是否超过4000元为标准进行分层随机抽样,从上述1000人中抽取200人,得到如下2×2列联表,请将表补充完整.试问:在此期间网购金额与网购人年龄是否有关?
网购金额 网购人年龄 | 不超过4000元 | 超过4000元 | 总计 |
40岁以上 | 75 |
| 100 |
40岁以下(含40岁) |
|
|
|
总计 |
|
|
|
思想方法练
一、函数与方程思想在统计中的应用
1.(2020云南昆明一中月考,)某学校食堂统计了最近5天到餐厅就餐的人数x(百)与食堂向食材公司购买所需食材(原材料)的数量y(袋),得到如下统计表:
| 第一天 | 第二天 | 第三天 | 第四天 | 第五天 |
就餐人数x(百) | 13 | 9 | 8 | 10 | 12 |
原材料y(袋) | 32 | 23 | 18 | 24 | 28 |
(1)根据所给的5组数据,求出y关于x的线性回归方程=x+;
(2)已知购买食材的费用C(元)与数量y(袋)的关系为C=投入使用的每袋食材相应的销售单价为700元,多余的食材必须无偿退还食材公司,据悉下周一大约有1500人到食堂餐厅就餐,根据(1)中求出的线性回归方程,预测食堂应购买多少袋食材才能获得最大利润,最大利润是多少?(注:利润L=销售收入-原材料费用)
参考公式:==,
=-.
参考数据:xiyi=1343,=558,=3237.
二、数形结合思想在统计中的应用
2.(2020陕西安康高新中学高二月考,)某班5名学生的数学和物理成绩如下表:
学生 学科 | A | B | C | D | E |
数学成绩x | 88 | 76 | 73 | 66 | 63 |
物理成绩y | 78 | 65 | 71 | 64 | 61 |
(1)画出散点图;
(2)求物理成绩y关于数学成绩x的线性回归方程.
3.(2021陕西部分学校高三上摸底检测,)2019年12月27日,国家统计局公布全国规模以上工业企业月累计营业收入利润率数据如表:
月份 累计 | 1~ 2月 | 1~ 3月 | 1~ 4月 | 1~ 5月 | 1~ 6月 | 1~ 7月 | 1~ 8月 | 1~ 9月 | 1~ 10月 | 1~ 11月 |
月份 累计 代码x | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | 10 |
营业收 入利润 率y(%) | 4.79 | 5.31 | 5.52 | 5.72 | 5.86 | 5.87 | 5.87 | 5.91 | 5.85 | 5.91 |
(1)根据表中有关数据补充完整y与x的折线图,判断=+x与=+哪一个更适宜作为y关于x的回归方程类型,并说明理由;
(2)根据(1)中的判断结果及表中数据,建立y关于x的回归方程(系数精确到0.01);
(3)根据(2)中得出的回归方程,预测1~12月月累计营业收入利润率(%)的值.
参考公式:对于一组数据(u1,v1),(u2,v2),…,(un,vn),其回归直线v=α+βu的斜率和截距的最小二乘估计分别为=,=-.
参考数据:
(xi -)2 | (wi -)2 | (xi-) ·(yi-) | (wi-) ·(yi-) | |||
5.50 | 5.66 | 2.25 | 82.50 | 4.52 | 8.14 | 2.07 |
表中wi=,=wi,≈3.32.
三、转化与化归思想在统计中的应用
4.(2021湖南师大附中高二上月考,)某工厂生产一种不同规格的产品,根据统计分析,其合格产品的质量y(g)与尺寸x(mm)之间的关系可用回归模型y=cxb(b,c都为正常数)进行拟合.现随机抽取6件合格产品,其检测数据如下表:
尺寸x(mm) | 38 | 48 | 58 | 68 | 78 | 88 |
质量y(g) | 16.8 | 18.8 | 20.7 | 22.4 | 24 | 25.5 |
质量与 尺寸的比 | 0.442 | 0.392 | 0.357 | 0.329 | 0.308 | 0.290 |
(1)检测标准指出,当产品质量与尺寸的比值在区间(0.302,0.388)内时为优等品.现从所抽取的6件合格产品中再任选2件,求选中的2件产品均为优等品的概率;
(2)经计算,lnxi≈24.6,lnyi≈18.3,(lnxi)2≈101.4,(lnxi·lnyi)≈75.3,求y关于x的回归方程.
附:对于样本数据(ui,vi)(i=1,2,…,n),其回归直线v=bu+a的斜率和截距的最小二乘估计分别为==,=-.
答案全解全析
易混易错练
1.B 散点图上的点大致分布在一条光滑的曲线附近,排除A,且增长速度变慢,排除C、D,故选B.
2.解析 (1)由题中散点图可以判断,y=c+k·x-1更适宜作为y关于x的回归方程类型.
(2)令t=x-1,则y=c+kt,构造新的成对数据,如下表:
t | 4 | 2 | 1 | 0.5 | 0.25 |
y | 16 | 12 | 5 | 2 | 1 |
易知y与t存在线性相关关系.
计算得=1.55,=7.2,≈4,=-≈1,
所以y关于t的回归方程为=4t+1,
所以y关于x的回归方程为=+1.
(3)由(2)得z=y+x=+x+1,易得z=+x+1在x∈[4,+∞)上是单调递增函数,即最小值为6.
3.解析 (1)由题知,40人中该日走路步数超过5000的有35人,频率为,所以估计小王的所有微信好友中每日走路步数超过5000的概率为.
(2)依题意知2×2列联表如下:
评定类型 性别 | 积极型 | 懈怠型 | 总计 |
男 | 14 | 6 | 20 |
女 | 8 | 12 | 20 |
总计 | 22 | 18 | 40 |
所以χ2==≈3.636.因为3.636>2.706,所以有90%的把握认为“评定类型”与“性别”有关.
4.解析 试验发现有80%的树苗成活,故未成活的树苗有20株,未成活的树苗A,B株数之比为1∶3,所以树苗A未成活5株,成活45株,树苗B未成活15株,成活35株.
(1)列联表如下:
树苗类别 成活情况 | A | B | 总计 |
成活株数 | 45 | 35 | 80 |
未成活株数 | 5 | 15 | 20 |
总计 | 50 | 50 | 100 |
则χ2==6.25.
因为6.25>3.841,所以有95%的把握认为树苗A,B的成活率有差异.
(2)可以用线性回归模型拟合y与x的关系.由题表中数据易得=20,=13,
所以r=
≈0.95>0.75.故可以用线性回归模型拟合y与x的关系.
误区警示
解决一般的独立性检验问题,首先由题目所给的2×2列联表确定a,b,c,d,n的值,然后代入χ2的计算公式求出χ2,确定有多大的把握认为两个分类变量有关系.
5.解析 (1)由题可知随机对1000人进行问卷调查,消费数据的组距为2000,可求得频率分布直方图中纵轴上每组的数据(频率除以组距),即=0.00015,=0.0002,=0.00009,=0.00003,则[0,2000],(2000,4000],(4000,6000],(6000,8000],(8000,10000]对应的数据分别是0.00015,0.0002,0.00009,0.00003,0.00003,从而得出频率分布直方图如下:
故本市居民此期间网络购物的消费平均值约为1000×0.3+3000×0.4+5000×0.18+7000×0.06+9000×0.06=3360元.
(2)由数据可知网购金额不超过4000元的有700×=140(人),
超过4000元的有300×=60(人),可得列联表如下:
网购金额
网购人年龄 | 不超过 4000元 | 超过 4000元 | 总计 |
40岁以上 | 75 | 25 | 100 |
40岁以下 (含40岁) | 65 | 35 | 100 |
总计 | 140 | 60 | 200 |
则χ2==≈2.381.
因为2.381<2.706,所以在此期间认为网购金额与网购人年龄无关.
易错警示
在判断两个变量是否相关时,不能根据2×2列联表盲目地进行判断,需要计算统计量χ2的值,进行更精准的分析,从而得出两变量是否相关.
思想方法练
1.解析 (1)由所给数据可得==10.4,==25,
则===2.5,=-=25-2.5×10.4=-1,
故y关于x的线性回归方程为=2.5x-1.
(2)由(1)得=2.5x-1,所以当x=15时,=36.5,即预计需要购买食材36.5袋,
因为C=
通过购买食材的费用与数量的分段函数来
建立利润与数量的关系式,再利用函数的性
质求最值,充分体现了函数思想.
所以当y<36时,利润L=700y-(400y-20)=300y+20,
此时当y=35时,Lmax=300×35+20=10520,
当y≥36时,由题意可知,剩余的食材只能无偿退还,
此时当y=36时,利润L=700×36-380×36=11520,
当y=37时,利润L=700×36.5-380×37=11490,
综上所述,食堂应购买36袋食材才能获得最大利润,最大利润为11520元.
2.解析 (1)利用散点图的特征判断线性回归
关系,进而求解回归方程,整个解题过程体现了数形结合的思想方法.
散点图如图所示:
(2)由已知得=×(88+76+73+66+63)=73.2,=×(78+65+71+64+61)=67.8,xiyi=88×78+76×65+73×71+66×64+63×61=25054,
=882+762+732+662+632=27174,
所以==≈0.625,
=-≈67.8-0.625×73.2=22.05.
所以y关于x的线性回归方程是=0.625x+22.05.
3.解析 (1)补充完整的折线图如下.
根据题表中数据描点,然后画出折线图,进而
由折线图解决问题,体现了数形结合思想.
可知选用=+更适宜作为y关于x的回归方程类型.理由:根据折线图知折线的形状更接近y=c+d的图象.
(2)令w=,先建立y关于w的线性回归方程.
=≈≈0.46,
=-≈5.66-0.46×2.25≈4.63,
∴y关于w的线性回归方程为=4.63+0.46w,
∴y关于x的回归方程为=4.63+0.46.
(3)由(2)可知,当x=11时,=4.63+0.46×≈6.16,因此,预测1~12月月累计营业收入利润率(%)的值为6.16.
思想方法
数形结合思想就是通过数和形之间的对应关系和相互转化来解决问题的思想方法.作为一种数学思想方法,数形结合包括两个方面:一是“以数解形”,二是“以形助数”.本章数形结合思想主要体现在通过散点图来刻画线性相关关系.
4.解析 (1)由题意得随机抽取的6件合格产品中,有3件为优等品,3件为非优等品,现从抽取的6件合格产品中再任选2件,选中的2件均为优等品的概率为=.
(2)本例的函数模型是指数函数模型,通过
对y=cxb两边取对数,然后利用换元的思想
将其转化为线性回归模型进行处理,体现了
转化与化归思想.
对y=cxb两边取自然对数得lny=lnc+blnx,令u=lnx,v=lny,a=lnc,则v=bu+a,由所给统计量及最小二乘估计有=≈=0.5,=-≈=1,由=ln得=e,所以y关于x的回归方程为=ex0.5.
思想方法
转化与化归思想是指在处理问题时,把待解决或难解决的问题通过某种方式转化为一类已解决或比较容易解决的问题的一种思想方式.应用转化与化归思想解题的原则是化难为易,化生为熟,化繁为简,尽可能是等价转化.常见的转化有:正与反的转化、数与形的转化、相等与不等的转化、整体与局部的转化、空间与平面的转化、常量与变量的转化、图形语言、文字语言与符号语言的转化等.