9.1.2线性回归方程
一、单选题
1.下列说法错误的是( )
A.线性回归直线一定过样本点中心
B.在回归分析中,为0.91的模型比为0.88的模型拟合的效果好
C.在残差图中,残差点分布的带状区域的宽度越狭窄,其模型拟合的精度越高
D.在线性回归分析中,相关系数r的值越大,变量间的相关性越强
【答案】D
【分析】根据回归方程相关知识逐项判断即可.
【解析】回归直线必过样本点中心,故A正确;
拟合系数越大拟合效果越好,故B正确;
残差点分布区域越窄,拟合精度越高,故C正确;
相关系数越接近于1,相关性越强,故当时,r的值越大,变量间的相关性越弱,故D错误.
故选:D
2.下列说法错误的是( )
A.相关系数r越大,两个变量的线性相关性越强
B.若,且,则
C.相关指数,表示解释变量对于预报变量变化的贡献率为64%
D.在残差图中,残差点分布的带状区域的宽度越狭窄,其模型拟合的精度越高
【答案】A
【分析】根据相关系数的概念,可判定A不正确;C、D正确,根据正态分布曲线的对称性,可判定B正确.
【解析】对于A中,根据相关系数的定义知:相关系数越大且,两个变量的线性相关性越强,所以A不正确;
对于B中,若,且,
可得,所以B正确;
对于C中,根据相关系数的概念,当相关指数,表示解释变量对于预报变量变化的贡献率为,所以C正确;
对于D中,根据数据的残差的定义,在残差图中,残差点分布的带状区域的宽度越狭窄,其模型拟合的精度越高,所以D正确.
故选:A.
3.对四组数据进行统计后,获得了如下图所示的散点图,对于其相关系数的比较,下列说法正确的是( )
A. B.
C. D.
【答案】C
【分析】根据正相关、负相关以及线性相关关系的强弱可得出结果.
【解析】由题意可知,第一、四组数据正相关,第二、三组负相关,
当相关系数的绝对值越大,数据的线性相关性越强,
且第一组数据的线性相关性较第四组强,则,
第二组数据的线性相关性较第三组强,则且,,则.
因此,.
故选:C.
4.据一组样本数据,求得经验回归方程为,且.现发现这组样本数据中有两个样本点和误差较大,去除后重新求得的经验回归直线的斜率为1.1,则( )
A.去除两个误差较大的样本点后,的估计值增加速度变快
B.去除两个误差较大的样本点后,重新求得的回归方程对应直线一定过点
C.去除两个误差较大的样本点后,重新求得的回归方程为
D.去除两个误差较大的样本点后,相应于样本点的残差为0.1
【答案】C
【分析】根据直线的斜率大小判断A;求出判断B;再求出经验回归方程判断C;计算残差判断D作答.
【解析】对于A,因为去除两个误差较大的样本点后,经验回归直线的斜率变小,则的估计值增加速度变慢,A错误;
对于B,由及得:,因为去除的两个样本点和,
并且,因此去除两个样本点后,样本的中心点仍为,
因此重新求得的回归方程对应直线一定过点,B错误;
对于C,设去除后重新求得的经验回归直线的方程为,由选项B知,,解得,
所以重新求得的回归方程为,C正确;
对于D,由选项C知,,当时,,则,
因此去除两个误差较大的样本点后,相应于样本点的残差为,D错误.
故选:C
5.相关变量x,y的散点图如图所示,现对这两个变量进行线性相关分析.方案一:根据图中所有数据,得到回归直线方程,相关系数为;方案二:剔除点,根据剩下的数据得到回归直线方程,相关系数为.则( )
A. B.
C. D.
【答案】D
【分析】根据相关系数的意义:其绝对值越接近1,说明两个变量越具有线性相关,以及负相关的意义作判断即可.
【解析】由散点图可知这两个变量为负相关,所以.
因为剔除点后,剩下点的数据更具有线性相关性,更接近1,
所以 .
故选:D.
6.下表提供了某厂进行技术改造后生产产品过程中记录的产量(单位:)与相应的生产能耗(单位:标准煤)的几组对应数据:
3 4 5 6
标准煤 3 4
已知该厂技术改造前产品的生产能耗为标准煤,试根据以上数据求出的线性回归方程,预测该厂技术改造后产品的生产能耗比技术改造前降低了( )
附:在线性回归方程中,,其中为样本平均值.A.标准煤 B.标准煤
C.标准煤 D.标准煤
【答案】A
【分析】根据表中数据和回归方程公式,代入求解得回归方程,并利用方程对数据进行估计即可.
【解析】,,
,,
所以线性回归方程为,
当,,.
故选:A.
二、多选题
7.对经验回归方程,下列正确的有( )
A.决定系数越小,模型的拟合效果越好
B.经验回归方程只适用于所研究的样本的总体
C.不能期望经验回归方程得到的预报值就是响应变量的精确值
D.残差平方和越小,模型的拟合效果越好
【答案】BCD
【分析】利用相关系数与模型的拟合效果可判断A选项;利用经验回归方程的特点可判断BC选项;利用残差平方和与模型的拟合效果可判断D选项.
【解析】对于A选项,决定系数越小,模型的拟合效果越差,A错;
对于B选项,经验回归方程只适用于所研究的样本的总体,B对;
对于C选项,经验回归方程得到的是响应变量的预报值,不是响应变量的精确值,C对;
对于D选项,残差平方和越小,模型的拟合效果越好,D对.
故选:BCD.
8.已知由样本数据组成的一个样本,得到经验回归方程为,且,去除两个样本点和后,得到新的经验回归方程为.在余下的8个样本数据和新的经验回归方程中( ).
A.相关变量x,y具有正相关关系
B.新的经验回归方程为
C.随着自变量x值增加,因变量y值增加速度变小
D.样本的残差为
【答案】ABD
【分析】根据线性回归方程的求法、意义可判断ABC ,再由残差的概念判断D.
【解析】,x新平均数,.
y新平均数,∴,∴.
新的线性回归方程,x,y具有正相关关系,A对.
新的线性回归方程:,B对.
由线性回归方程知,随着自变量x值增加,因变量y值增加速度恒定,C错;
,,,D对.
故选:ABD.
9.某中学课外活动小组为了研究经济走势,根据该市1999—2021年的GDP(国内生产总值)数据绘制出下面的散点图:
该小组选择了如下2个模型来拟合GDP值随年份的变化情况,模型一:;模型二:,下列说法正确的有( )
A.变量与正相关
B.根据散点图的特征,模型一能更好地拟合GDP值随年份的变化情况
C.若选择模型二,的图象一定经过点
D.当时,通过模型计算得GDP值为70,实际GDP值为71,则残差为1
【答案】AD
【分析】根据散点图和变量关系依次判断即可.
【解析】对A,根据散点图易得变量与正相关,故A正确;
对B,由散点图可得与的变化趋向于一条曲线,所以模型二能更好地拟合GDP值随年份的变化情况,故B错误;
对C,若选择模型二,,令,则图象经过点,故C错误;
对D,当时,通过模型计算得GDP值为70,实际GDP值为71,则残差为1,故D正确.
故选:AD.
10.已知关于变量x,y的4组数据如表所示:
x 6 8 10 12
y a 10 6 4
根据表中数据计算得到x,y之间的线性回归方程为,x,y之间的相关系数为r(参考公式:),则( )A. B.变量x,y正相关 C. D.
【答案】AC
【分析】根据回归直线必过点解得,所以选项A正确;由回归方程和表格可知选项B错误;利用相关系数求出,所以选项C正确,选项D错误.
【解析】回归直线必过点,,,解得,所以选项A正确;
由回归方程和表格可知,变量x,y负相关,所以选项B错误;
,所以选项C正确,选项D错误.
故选:AC
三、填空题
11.以下两个变量成负相关的是_____.
①学生的学籍号与学生的数学成绩;
②坚持每天吃早餐的人数与患胃病的人数;
③气温与冷饮销售量;
④电瓶车的重量和行驶每千米的耗电量.
【答案】②
【分析】根据相关关系的知识确定正确答案.
【解析】①无相关关系;②负相关;③④正相关.
故答案为:②
12.已知某种商品的广告费支出x(单位:万元)与销售额y(单位:万元)之间具有线性相关关系,利用下表中的五组数据可求得回归直线方程为,根据该回归方程,预测当时,,则___________.
广告费支出x(万元) 2 3 4 5 6
销售额y(万元) 25 37 50 56 64
【答案】9.6
【分析】根据预测值以及样本中心点求得.
【解析】,
所以,解得.
故答案为:
13.某种机械设备随着使用年限的增加,它的使用功能逐渐减退,使用价值逐年减少,通常把它使用价值逐年减少的“量”换算成费用,称之为“失效费”.某种机械设备的使用年限x(单位:年)与失效费y(单位:万元)的统计数据如下表所示:
使用年限x(单位:年) 1 2 3 4 5 6 7
失效费y(单位:万元) 2.90 3.30 3.60 4.40 4.80 5.20 5.90
由上表数据可知,y与x的相关系数为______.
(精确到0.01,参考公式和数据:,,,)
【答案】0.99
【分析】分别求出,,,再利用参考公式和数据计算即可.
【解析】由题意,知,
,
.
所以.
所以y与x的相关系数近似为0.99.
故答案为:0.99.
四、解答题
14.已知某绿豆新品种发芽的适宜温度在6℃~22℃之间,一农学实验室研究人员为研究温度(℃)与绿豆新品种发芽数(颗)之间的关系,每组选取了成熟种子50颗,分别在对应的8℃~14℃的温度环境下进行实验,得到如下散点图:
(1)由折线统计图看出,可用线性回归模型拟合与的关系,请用相关系数加以说明;
(2)建立关于的回归方程,并预测在19℃的温度下,种子发芽的颗数.
参考数据:,,,.
参考公式:相关系数,回归直线方程中斜率和截距的最小二乘估计公式分别为
,.
【答案】(1)答案见解析;
(2)44.
【分析】(1)直接套公式求出系数r,即可判断;(2)套公式求出回归方程,把代入,即可求解.
【解析】(1)由题意可知:.
.又,所以相关系数.
因为相关系数,所以与的线性相关性较高,可以利用线性回归模型拟合与的关系.
(2)由(1)知,,,.
所以,
所以.
所以与的回归直线为.
当时,.即在19℃的温度下,种子发芽的颗数为44.
15.某医疗机构承担了某城镇的新冠疫苗接种任务,现统计了前8天每天(用表示)的接种人数y(单位:百人)的相关数据,并制作成如图所示的散点图.
(1)由散点图看出,可用线性回归模型拟合y与t的关系,求y关于t的线性回归方程;(系数用分数表示)
(2)预测哪一天的接种人数会首次突破2500人.(结果保留整数)
参考数据:,,,.
参考公式:对于一组数据,,…,,其线性回归方程的斜率和截距的最小二乘法估计分别为,.
【答案】(1)
(2)第13天
【分析】(1)根据已知条件及参考数据,求出,进而即可求出回归方程;
(2)利用(1)的回归方程及已知条件,结合不等式的解法即可求解.
【解析】(1)∵,,
∴,
又,,
∴,
∴y关于t的线性回归方程为.
(2)令,得,
∴预测第13天的接种人数会首次突破2500人.
16.秋天的第一杯奶茶是一个网络词汇,最早出自四川达州一位当地民警之口,民警用“秋天的第一杯奶茶”顺利救下一名女孩,由此而火爆全网.后来很多人开始在秋天里买一杯奶茶送给自己在意的人.某奶茶店主记录了入秋后前7天每天售出的奶茶数量(单位:杯)
如下:
日期 第一天 第二天 第三天 第四天 第五天 第六天 第七天
日期代码 1 2 3 4 5 6 7
杯数 4 15 22 26 29 31 32
(1)请根据以上数据,绘制散点图,并根据散点图判断,与哪一个更适宜作为y关于x的回归方程模型(给出判断即可,不必说明理由);
(2)建立y关于x的回归方程(结果保留1位小数),并根据建立的回归方程,试预测要到哪一天售出的奶茶才能超过35杯?
(3)若每天售出至少25杯即可盈利,则从第一天至第七天中任选三天,记随机变量X表示盈利的天数,求随机变量X的分布列.
参考公式和数据:其中
回归直线方程中,
22.7 1.2 759 235.1 13.2 8.2
【答案】(1)图见解析,更适宜作为关于的回归方程模型;
(2),到第9天才能超过35杯;
(3)分布列见解析.
【分析】(1)根据散点图趋势即可判断;
(2)利用非线性回归方程转化为线性回归方程的方法求解;
(3)根据超几何分布求分布列.
【解析】(1)
根据散点图,知更适宜作为关于的回归方程模型;
(2)令,则,
由已知数据得,
,
所以,
故关于的回归方程为,
进而由题意知,令,整理得,即,
故当时,即到第9天才能超过35杯;
(3)由题意知,这7天中销售超过25杯的有4天,则随机变量的可能取值为
,,
,,
则随机变量的分布列为
0 1 2 39.1.2线性回归方程
一、单选题
1.下列说法错误的是( )
A.线性回归直线一定过样本点中心
B.在回归分析中,为0.91的模型比为0.88的模型拟合的效果好
C.在残差图中,残差点分布的带状区域的宽度越狭窄,其模型拟合的精度越高
D.在线性回归分析中,相关系数r的值越大,变量间的相关性越强
2.下列说法错误的是( )
A.相关系数r越大,两个变量的线性相关性越强
B.若,且,则
C.相关指数,表示解释变量对于预报变量变化的贡献率为64%
D.在残差图中,残差点分布的带状区域的宽度越狭窄,其模型拟合的精度越高
3.对四组数据进行统计后,获得了如下图所示的散点图,对于其相关系数的比较,下列说法正确的是( )
A. B.
C. D.
4.据一组样本数据,求得经验回归方程为,且.现发现这组样本数据中有两个样本点和误差较大,去除后重新求得的经验回归直线的斜率为1.1,则( )
A.去除两个误差较大的样本点后,的估计值增加速度变快
B.去除两个误差较大的样本点后,重新求得的回归方程对应直线一定过点
C.去除两个误差较大的样本点后,重新求得的回归方程为
D.去除两个误差较大的样本点后,相应于样本点的残差为0.1
5.相关变量x,y的散点图如图所示,现对这两个变量进行线性相关分析.方案一:根据图中所有数据,得到回归直线方程,相关系数为;方案二:剔除点,根据剩下的数据得到回归直线方程,相关系数为.则( )
A. B.
C. D.
6.下表提供了某厂进行技术改造后生产产品过程中记录的产量(单位:)与相应的生产能耗(单位:标准煤)的几组对应数据:
3 4 5 6
标准煤 3 4
已知该厂技术改造前产品的生产能耗为标准煤,试根据以上数据求出的线性回归方程,预测该厂技术改造后产品的生产能耗比技术改造前降低了( )
附:在线性回归方程中,,其中为样本平均值.A.标准煤 B.标准煤
C.标准煤 D.标准煤
二、多选题
7.对经验回归方程,下列正确的有( )
A.决定系数越小,模型的拟合效果越好
B.经验回归方程只适用于所研究的样本的总体
C.不能期望经验回归方程得到的预报值就是响应变量的精确值
D.残差平方和越小,模型的拟合效果越好
8.已知由样本数据组成的一个样本,得到经验回归方程为,且,去除两个样本点和后,得到新的经验回归方程为.在余下的8个样本数据和新的经验回归方程中( ).
A.相关变量x,y具有正相关关系
B.新的经验回归方程为
C.随着自变量x值增加,因变量y值增加速度变小
D.样本的残差为
9.某中学课外活动小组为了研究经济走势,根据该市1999—2021年的GDP(国内生产总值)数据绘制出下面的散点图:
该小组选择了如下2个模型来拟合GDP值随年份的变化情况,模型一:;模型二:,下列说法正确的有( )
A.变量与正相关
B.根据散点图的特征,模型一能更好地拟合GDP值随年份的变化情况
C.若选择模型二,的图象一定经过点
D.当时,通过模型计算得GDP值为70,实际GDP值为71,则残差为1
10.已知关于变量x,y的4组数据如表所示:
x 6 8 10 12
y a 10 6 4
根据表中数据计算得到x,y之间的线性回归方程为,x,y之间的相关系数为r(参考公式:),则( )A. B.变量x,y正相关 C. D.
三、填空题
11.以下两个变量成负相关的是_____.
①学生的学籍号与学生的数学成绩;
②坚持每天吃早餐的人数与患胃病的人数;
③气温与冷饮销售量;
④电瓶车的重量和行驶每千米的耗电量.
12.已知某种商品的广告费支出x(单位:万元)与销售额y(单位:万元)之间具有线性相关关系,利用下表中的五组数据可求得回归直线方程为,根据该回归方程,预测当时,,则___________.
广告费支出x(万元) 2 3 4 5 6
销售额y(万元) 25 37 50 56 64
13.某种机械设备随着使用年限的增加,它的使用功能逐渐减退,使用价值逐年减少,通常把它使用价值逐年减少的“量”换算成费用,称之为“失效费”.某种机械设备的使用年限x(单位:年)与失效费y(单位:万元)的统计数据如下表所示:
使用年限x(单位:年) 1 2 3 4 5 6 7
失效费y(单位:万元) 2.90 3.30 3.60 4.40 4.80 5.20 5.90
由上表数据可知,y与x的相关系数为______.
(精确到0.01,参考公式和数据:,,,)
四、解答题
14.已知某绿豆新品种发芽的适宜温度在6℃~22℃之间,一农学实验室研究人员为研究温度(℃)与绿豆新品种发芽数(颗)之间的关系,每组选取了成熟种子50颗,分别在对应的8℃~14℃的温度环境下进行实验,得到如下散点图:
(1)由折线统计图看出,可用线性回归模型拟合与的关系,请用相关系数加以说明;
(2)建立关于的回归方程,并预测在19℃的温度下,种子发芽的颗数.
参考数据:,,,.
参考公式:相关系数,回归直线方程中斜率和截距的最小二乘估计公式分别为
,.
15.某医疗机构承担了某城镇的新冠疫苗接种任务,现统计了前8天每天(用表示)的接种人数y(单位:百人)的相关数据,并制作成如图所示的散点图.
(1)由散点图看出,可用线性回归模型拟合y与t的关系,求y关于t的线性回归方程;(系数用分数表示)
(2)预测哪一天的接种人数会首次突破2500人.(结果保留整数)
参考数据:,,,.
参考公式:对于一组数据,,…,,其线性回归方程的斜率和截距的最小二乘法估计分别为,.
16.秋天的第一杯奶茶是一个网络词汇,最早出自四川达州一位当地民警之口,民警用“秋天的第一杯奶茶”顺利救下一名女孩,由此而火爆全网.后来很多人开始在秋天里买一杯奶茶送给自己在意的人.某奶茶店主记录了入秋后前7天每天售出的奶茶数量(单位:杯)
如下:
日期 第一天 第二天 第三天 第四天 第五天 第六天 第七天
日期代码 1 2 3 4 5 6 7
杯数 4 15 22 26 29 31 32
(1)请根据以上数据,绘制散点图,并根据散点图判断,与哪一个更适宜作为y关于x的回归方程模型(给出判断即可,不必说明理由);
(2)建立y关于x的回归方程(结果保留1位小数),并根据建立的回归方程,试预测要到哪一天售出的奶茶才能超过35杯?
(3)若每天售出至少25杯即可盈利,则从第一天至第七天中任选三天,记随机变量X表示盈利的天数,求随机变量X的分布列.
参考公式和数据:其中
回归直线方程中,
22.7 1.2 759 235.1 13.2 8.2
转载请注明出处卷子答案网-一个不只有答案的网站 » 2023-2024高二数学苏教版2019选择性必修第二册同步试题 9.1.2线性回归方程(含解析)