2.3.1变量间的相关关系
教学目标
1、知识与技能
(1)了解变量之间的相关关系。
(2)会区别变量之间的函数关系与变量相关关系。
(3)会举例说明现实生活中变量之间的相关关系。
(4)让学生了解产生变量之间的相关关系是由许多不确定的随机因素的影响。
2、过程与方法
(1)通过复习变量之间的函数关系引出变量相关关系,有熟悉到生疏的过程便于学生理解。
(2)通过对变量之间的关系的学习让学生了解从总的变化趋势来看变量之间存在某种关系,但这种关系又不能用确定的函数关系精确表达出来,也让学生了解变量之间的不确定性关系是很普遍的,帮助学生树立科学的辨证唯物主义观点,感受自然的辩证法。
(3)通过对本课的学习,引导学生关注社会,关注生活,进一步学会观察、比较、归纳、分析等一般方法的运用。
3、情感、态度与价值观
(1)通过引导学生观察生活中的例子,使学生由能直接找出变量之间的函数关系引出到无法直接找出变量之间的函数关系,即变量之间的相关关系,激发学生的求知欲。
(2)通过引导学生感受生活中实际问题转化为数学问题,学会查找资料,收取信息,学会用统计知识对实际问题进行数学分析。
教学重点
1、变量之间的相关关系。
2、会区别变量之间的函数关系与变量相关关系。
3、会举例说明现实生活中变量之间的相关关系。
教学难点
1、对变量之间的相关关系的理解。
2、变量之间的函数关系与变量相关关系的区别。
教辅手段
教学过程
一、情景设置
问题1:将汽油以均匀的速度注入桶里,注入的时间t与注入的油量y的关系如下表:
时间t1234
油量y2468
从表里数据得出油量y与时间t之间的函数关系式为:
问题2、甲、乙两地相距150千米,某人骑车从甲地到乙地,则他的速度v(千米/时)和时间t(小时)的函数大致图象是怎样的?
问题3、小麦的产量y千克每亩与施肥量x千克每亩之间的关系如下表:
施肥量量x20304050
产量y440460470480
从表里数据能得出小麦的产量y与施肥量x之间的函数关系式吗?
提问学生以下三个问题。
问题1:因为是以均匀的速度注入桶里,所以注入的油量y与注入的时间t成正比例关系,由数据表格知,注入的油量y与注入的时间t之间的函数关系式为y=2t(t0)(实际问题,因此自变量的取值范围应该有意义)
问题2:路程一定,所以走完全程所用的时间t与速度v成反比例关系所以其函数图象是反
例函数图象。
问题3:问题1、2中的变量间的函数关系是确定的。在我们的现实生活中,两个变量之间
存在确定性的关系是极少的,而两个变量之间存在不确定性的关系是很普遍的。从表格里我
们很容易发现施肥量越大,小麦的产量就越高。但是,施肥量并不是影响小麦产量的唯一因
素,小麦的产量还受土壤的质量、降雨量、田间管理等诸多因素影响,这时两个变量之间就
不是确定性的函数关系,那么这两个变量之间究竟是什么关系呢?这就是我们本节课所要研究的问题——变量之间的相关关系。
二、新知探究
函数关系:当自变量一定时,因变量的取值也是确定的。
当自变量一定时,因变量的取值带有一定的随机性的两个变量之间的关系称为相关关系。
相关关系是非随机变量与随机变量之间的关系,函数关系是两个非随机变量之间的关系是一种因果关系,而相关关系不一定是因果关系。所以相关关系与函数关系是不同的,其变量具有随机性,因此相关关系是一种非确定性关系。
提问:相关关系与函数关系的异同点?
相同点:均是指两个变量的关系
不同点:函数关系是一种确定的关系,而相关关系是一种非确定的关系,函数关系是自变量与因变量之间的关系,这种关系是两个非随机变量的关系,而相关关系是非随机变量与随机变量的关系。
表现在问题3中即小麦的产量是在土壤的质量、降雨量、田间管理等诸多变量共同作用下的结果,本节课只研究其中两个主要变量之间的相关关系。我们只能得出经验性的结论,施肥量越大,小麦的产量就越高,但是经验再丰富,也容易犯经验性的错误,施肥量过大,反而容易造成粮食的减产。现在大家看一个例子:
某班学生在一次数学测验和物理测验中,学号1到20的学生成绩如下表:
学号1234567891011121314151617181920
数学8165747568548392887659728493785367667998
物理84577077625185938978617083897748695877100
从表里数据你能得出什么样的经验性结论呢?
数学成绩好的同学物理成绩好,反之,数学成绩差的同学物理成绩就差,但除此之外还存在其他影响物理成绩的因素,例如是否喜欢物理,用在物理上的时间等等。当我们主要考虑数学成绩对物理成绩的影响时,即考虑的就是这两者之间的相关关系。
三、即时体验
问题1:调查一下本组成员的视力与各自的学习成绩关系。
问题2:调查一下本组成员的身高与各自的体重之间的关系。
让各组的同学共同探究一下,然后将结果宣布一下。
问题1:通过对本组所有的成员的调查,我们得到的结论是:学习成绩好的视力都不太好,都配了近视眼镜。但是,这个结论对全班来说就不一定成立,人的视力还与用眼卫生习惯、遗传因素等密切关系。
问题2:身材高的同学的体重一般来说都比较重要,但是,人的体重还与饮食习惯、遗传因素等有密切关系。
四、归纳提升
引导学生归纳本课时的主要学习内容,交流成果,教师帮助完善。
1、理解变量之间的相关关系是不确定的关系。
2、变量之间的函数关系与变量相关关系的区别。
3、学会全面考察现实生活中变量之间的相关关系。
五、课后延续
(一)回顾本课的学习过程,整理学习笔记。
(二)完成书面作业:习题2.3A组1
(三)选作问题:
有人说,孩子长,公园里的小树也在长,则孩子和小树是相关关系,这种说法对吗?
高二数学必修三考点解析:变量间的相关关系
一、变量间的相关关系
1.常见的两变量之间的关系有两类:一类是函数关系,另一类是相关关系;与函数关系不同,相关关系是一种非确定性关系.
2.从散点图上看,点分布在从左下角到右上角的区域内,两个变量的这种相关关系称为正相关,点分布在左上角到右下角的区域内,两个变量的相关关系为负相关.
二、两个变量的线性相关
1.从散点图上看,如果这些点从整体上看大致分布在通过散点图中心的一条直线附近,称两个变量之间具有线性相关关系,这条直线叫回归直线.
当r0时,表明两个变量正相关;
当r0时,表明两个变量负相关.
r的绝对值越接近于1,表明两个变量的线性相关性越强.r的绝对值越接近于0时,表明两个变量之间几乎不存在线性相关关系.通常|r|大于0.75时,认为两个变量有很强的线性相关性.
三、解题方法
1.相关关系的判断方法一是利用散点图直观判断,二是利用相关系数作出判断.
2.对于由散点图作出相关性判断时,若散点图呈带状且区域较窄,说明两个变量有一定的线性相关性,若呈曲线型也是有相关性.
3.由相关系数r判断时|r|越趋近于1相关性越强.【同步练习题】
1.(2014银川模拟)为了解儿子身高与其父亲身高的关系,随机抽取5对父子的身高数据如下:
父亲身高x(cm)174176176176178;儿子身高y(cm)175175176177177,则y对x的线性回归方程为()
A.y^=x-1B.y^=x+1C.y^=88+12xD.y^=176
解析:因为x=174+176+176+176+1785=176,
y=175+175+176+177+1775=176,
又y对x的线性回归方程表示的直线恒过点(x,y),所以将(176,176)代入A、B、C、D中检验知选C.
答案:C
2.(2014衡阳联考)已知x与y之间的一组数据:
x0123
ym35.57
已求得关于y与x的线性回归方程y^=2.1x+0.85,则m的值为()
A.1B.0.85C.0.7D.0.5
解析:回归直线样本中心点(1.5,y),故y=4,m+3+5.5+7=16,得m=0.5.
答案:D
3.有甲、乙两个班级进行数学考试,按照大于等于85分为优秀,85分以下为非优秀统计成绩,得到如下所示的列联表:
优秀非优秀总计
甲班10b
乙班c30
总计105
已知在全部105人中随机抽取1人,成绩优秀的概率为27,则下列说法正确的是
()
A.列联表中c的值为30,b的值为35
B.列联表中c的值为15,b的值为50
C.根据列联表中的数据,若按95%的可靠性要求,能认为“成绩与班级有关系”
D.根据列联表中的数据,若按95%的可靠性要求,不能认为“成绩与班级有关系”
解析:由题意知,成绩优秀的学生数是30,成绩非优秀的学生数是75,所以c=20,b=45,选项A、B错误.根据列联表中的数据,得到K2=105×10×30-20×45255×50×30×75≈6.1093.841,因此有95%的把握认为“成绩与班级有关系”。
答案:C
4.在吸烟与患肺病这两个分类变量的计算中,下列说法正确的是()
①若K2的观测值满足K2≥6.635,我们有99%的把握认为吸烟与患肺病有关系,那么在100个吸烟的人中必有99人患有肺病;②从独立性检验可知有99%的把握认为吸烟与患肺病有关系时,我们说某人吸烟,那么他有99%的可能患有肺病;③从统计量中得知有95%的把握认为吸烟与患肺病有关系,是指有5%的可能性使得推断出现错误.
A.①B.①③C.③D.②
解析:①推断在100人吸烟的人中必有99人患有肺病,说法错误,排除A,B;③正确.
答案:C
5.调查了某地若干户家庭的年收入x(单位:万元)和年饮食支出y(单位:万元),调查显示年收入x与年饮食支出y具有线性相关关系,并由调查数据得到y对x的回归直线方程:y^=0.254x+0.321.由回归直线方程可知,家庭年收入每增加1万元,年饮食支出平均增加________万元.
解析:解法一:特殊值法.
令x1=1得y^1=0.254+0.321.
令x2=1+1=2得y^2=2×0.254+0.321.
y^2-y^1=0.254.
解法二:由y^1=0.254x1+0.321,
y^2=0.254(x1+1)+0.321,则y^2-y^1=0.254.
答案:0.254
[核心必知]
1.预习教材,问题导入
根据以下提纲,预习教材P84~P91,回答下列问题.
(1)两个变量之间除了函数关系还有其他关系吗?
提示:相关关系.
(2)当两个变量呈负相关关系时,散点图有什么特点?
提示:当两个变量之间呈负相关关系时,散点图中的点散布的位置是从左上角到右下角的区域.
(3)求回归直线方程的主要方法是什么?
提示:求回归直线方程的主要方法是最小二乘法.
2.归纳总结,核心必记
(1)变量之间的相关关系
变量与变量之间的关系常见的有两类:一类是确定性的函数关系,变量之间的关系可以用解析式表示;另一类是相关关系,变量之间有一定的联系,但不能完全用解析式来表达.
(2)两个变量的线性相关
①散点图
将各数据在平面直角坐标系中的对应点画出来,得到表示两个变量的一组数据的图形,这样的图形叫做散点图.
②正相关
在散点图中,点散布在从左下角到右上角的区域,对于两个变量的这种相关关系,我们将它称为正相关.
③负相关
在散点图中,点散布在从左上角到右下角的区域,对于两个变量的这种相关关系,我们将它称为负相关.
④线性相关关系、回归直线
如果散点图中点的分布从整体上看大致在一条直线附近,我们就称这两个变量之间具有线性相关关系,这条直线叫做回归直线,这条直线的方程叫做回归直线方程,简称回归方程.
(3)回归直线方程
①回归直线方程
假设我们已经得到两个具有线性相关关系的变量的一组数据(x1,y1),(x2,y2),…,(xn,yn),则所求回归方程是y^=b^x+a^,其中b^是回归方程的斜率,a^是截距.
其中b^=i=1nxi-xyi-yi=1nxi-x2=i=1nxiyi-nxyi=1nx2i-nx2,a^=y-b^x-.
②最小二乘法
通过求Q=(y1-bx1-a)2+(y2-bx2-a)2+…+(yn-bxn-a)2的最小值而得出回归直线的方法,即使得样本数据的点到回归直线的距离的平方和最小的方法叫做最小二乘法.
[问题思考]
(1)任意两个统计数据是否均可以作出散点图?
提示:可以,不管这两个统计量是否具备相关性,以一个变量值作为横坐标,另一个作为纵坐标,均可画出它的散点图.
(2)任何一组数据都可以由最小二乘法得出回归直线方程吗?
提示:用最小二乘法求回归直线方程的前提是先判断所给数据具有线性相关关系(可利用散点图来判断),否则求出的回归直线方程无意义.
(3)根据a^=y-b^x及回归直线方程y^=b^x+a^,判断点(x,y)与回归直线的关系是什么?
提示:由a^=y-b^x得y=b^x+a^,因此点(x,y)在回归直线上.
[课前反思]
通过以上预习,必须掌握的几个知识点:
(1)相关关系:;
(2)散点图:;
(3)回归直线方程及求回归直线方程的方法步骤:.
瑞雪兆丰年,这不禁使我们想到这样一句谚语:“冬天麦盖三层被,来年枕着馒头睡”,意思是冬天“棉被”盖得越厚,春天小麦就长得越好.
[思考1]下雪与小麦丰收有关系吗?
提示:有关系,但这种关系具有不确定性.
[思考2]若把下雪量和小麦产量看作两个变量,则这两个变量之间的关系是确定的吗?若不是确定的,那会是什么关系?
名师指津:这两个变量之间的关系是不确定的,这两个变量之间的关系是相关关系.
[思考3]怎样理解两个变量之间的关系?
名师指津:两个变量间的关系分为三类:
(1)确定性的函数关系,如正方形的边长与面积的关系;
(2)相关关系,变量间确实存在关系,但又不具备函数关系所要求的确定性,它们的关系是带有随机性的,这种关系就是相关关系,例如,某位同学的“物理成绩”与“数学成绩”之间的关系;
(3)不相关,即两个变量间没有任何关系.
?讲一讲
1.下列关系中,属于相关关系的是________.
①人的身高与视力的关系;
②做自由落体运动的物体的质量与落地时间的关系;
③降雪量与交通事故的发生率之间的关系.
[尝试解答]
题号判断原因分析
①不是相关关系身高与视力无关,不具有函数关系,也不具有相关关系
续表
题号判断原因分析
②不是相关关系自由落体的物体的质量与落地时间无关,不具有相关关系
③相关关系降雪量越大,交通事故发生率越高,不确定性的关系
答案:③
相关关系与函数关系区别
函数关系是一种确定的关系,而相关关系是两个变量间一种不完全确定的关系.函数关系是一种因果关系,而相关关系不一定是因果关系,也可能是伴随关系.
?练一练
1.在下列两个变量的关系中,哪些是相关关系?
①正方形边长与面积之间的关系;
②作文水平与课外阅读量之间的关系;
③人的身高与年龄之间的关系;
解:两变量之间的关系有三种:函数关系、相关关系和不相关.
①正方形的边长与面积之间的关系是函数关系.
②作文水平与课外阅读量之间的关系不是严格的函数关系,但是具有相关性,因而是相关关系.
③人的身高与年龄之间的关系既不是函数关系,也不是相关关系,因为人的年龄达到一定时期身高就不发生明显变化了,因而他们不具备相关关系.
下表为某地搜集到的新房屋的销售价格y(单位:万元)和房屋的面积x(单位:m2)的数据:
x11511080135105
y44.841.638.449.242
[思考1]能否以x为横坐标,以y为纵坐标在平面直角坐标系中作出表示以上数据的点?此图称为什么图形?
名师指津:能,如图所示,此图称为散点图.
[思考2]从散点图看应怎样描述房屋的销售价格与房屋面积之间的变化关系?
名师指津:从大体上看,面积越大,销售价格越高,但不是正比例函数关系.
[思考3]怎样认识散点图?
名师指津:(1)散点图与相关性的关系:
散点图形象地反映了各对数据的密切程度.根据散点图中点的分布趋势分析两个变量之间的关系,可直观地判断并得出结论.
(2)散点图与正、负相关性的关系:
如果散点图中的点散布在从左下角到右上角的区域内,称这两个变量正相关,即两个变量具有相同的变化趋势;如果散点图中的点散布在从左上角到右下角的区域内,称这两个变量负相关,即两个变量具有相反的变化趋势.
?讲一讲
2.下表是某地的年降雨量与年平均气温,判断两者是相关关系吗?求回归直线方程有意义吗?
年平均气温(℃)12.5112.7412.7413.6913.3312.8413.05
年降雨量(mm)748542507813574701432
[尝试解答]以x轴为年平均气温,y轴为年降雨量,可得相应的散点图,如图所示:
因为图中各点并不在一条直线附近,所以两者不具有相关关系,求回归直线方程也是没有意义的.
用散点图判断两个变量x与y的相关关系
(1)判断两个变量x和y间是否具有线性相关关系,常用的简便方法就是绘制散点图,如果图上发现点的分布从整体上看大致在一条直线附近,那么这两个变量就是线性相关的,注意不要受个别点的位置的影响.
(2)画散点图时应注意合理选择单位长度,避免图形过大或偏小,或者是点的坐标在坐标系中画不准,使图形失真,导致得出错误结论.
?练一练
2.对变量x,y有观测数据(xi,yi)(i=1,2,…,10),得散点图①;对变量u,v有观测数据(ui,vi)(i=1,2,…,10),得散点图②.由这两个散点图可以判断()
A.变量x与y正相关,u与v正相关
B.变量x与y正相关,u与v负相关
C.变量x与y负相关,u与v正相关
D.变量x与y负相关,u与v负相关
解析:选C在从散点图来看,图①中的点自左上方向右下方分布,说明变量x与y负相关;图②中的点自左下方向右上方分布,说明u与v正相关.
观察知识点2中的背景实例.
[思考]根据表格中的数据,能否估计出房屋面积为120m2时的销售价格?如何估计?
名师指津:能.可根据散点图作出一条直线,求出直线方程,再进行预测.根据两个变量的取值,画出散点图后作出一条直线,利用最小二乘法求出此直线方程,代入相关数据即可对另一个变量取值进行估计.
?讲一讲
3.一般来说,一个人脚掌越长,他的身高就越高,现对10名成年人的脚掌长x与身高y进行测量,得到数据(单位均为cm)作为一个样本如下表所示:
脚掌长/x20212223242526272829
身高/y141146154160169176181188197203
(1)在上表数据中,以“脚掌长”为横坐标,“身高”为纵坐标,作出散点图后,发现散点在一条直线附近,试求“身高”与“脚掌长”之间的线性回归方程y^=b^x+a^;
(2)若某人的脚掌长为26.5cm,试估计此人的身高.
(参考数据:i=110(xi-x)(yi-y)=577.5,i=110(xi-x)2=82.5)
[尝试解答](1)记样本中10人的“脚掌长”为xi(i=1,2,…,10),“身高”为yi(i=1,2,…,10),
则b^=i=110xi-xyi-yi=110xi-x2=577.582.5=7,
∵x=x1+x2+…+x1010=24.5,
y=y1+y2+…+y1010=171.5,
∴a^=y-b^x=0.∴y^=7x.
(2)由(1)知y^=7x,则当x=26.5时,
y^=7×26.5=185.5(cm).
故估计此人的身高为185.5cm.
用线性回归方程估计总体的一般步骤
(1)作出散点图,判断散点是否在一条直线附近;
(2)如果散点在一条直线附近,用公式求出a^,b^,并写出线性回归方程(否则求出的回归方程是没有意义的);
(3)根据线性回归方程对总体进行估计.
?练一练
3.2016年元旦前夕,某市统计局统计了该市2015年10户家庭的年收入和年饮食支出的统计资料如下表:
年收入x
(万元)24466677810
年饮食支出
y(万元)0.91.41.62.02.11.91.82.12.22.3
(1)如果已知y与x是线性相关的,求回归方程;
(2)若某家庭年收入为9万元,预测其年饮食支出.
(参考数据:i=110xiyi=117.7,i=110x2i=406)
解:(1)由题意可计算得:x=6,y=1.83,x2=36,
xy=10.98,又∵i=110xiyi=117.7,i=110x2i=406,
∴b=i=110xiyi-10xyi=110x2i-10x2≈0.17,a=y-bx=0.81,
∴y^=0.17x+0.81.
∴所求的回归方程为y^=0.17x+0.81.
(2)当x=9时,y^=0.17×9+0.81=2.34(万元),
可估计该年收入为9万元的家庭每年饮食支出约为2.34万元.
——————————————[课堂归纳感悟提升]———————————————
1.本节课的重点是会作两个有关联变量的数据的散点图,会利用散点图认识变量间的相关关系,能根据给出的线性回归方程系数公式建立线性回归方程.难点是了解相关关系、线性相关、回归直线的概念,了解最小二乘法的思想.
2.本节课要掌握以下几类问题:
(1)准确区分相关关系与函数关系,见讲1.
(2)会利用散点图判断两个变量间的相关关系,见讲2.
(3)掌握用线性回归方程估计总体的一般步骤,见讲3.
3.本节课的易错点有两个:
(1)区分不清相关关系与函数关系,如讲1;
(2)求回归直线方程中易出现计算错误,如讲3.
课下能力提升(十四)
[学业水平达标练]
题组1变量间的相关关系
1.下列两个变量之间的关系,哪个不是函数关系()
A.正方体的棱长和体积
B.圆半径和圆的面积
C.正n边形的边数和内角度数之和
D.人的年龄和身高
解析:选DA、B、C都是函数关系,对于A,V=a3;对于B,S=πr2;对于C,g(n)=(n-2)π.而对于年龄确定的不同的人可以有不同的身高,∴选D.
2.下列语句所表示的事件中的因素不具有相关关系的是()
A.瑞雪兆丰年
B.上梁不正下梁歪
C.吸烟有害健康
D.喜鹊叫喜,乌鸦叫丧
解析:选D选项A,B,C中描述的变量间都具有相关关系,而选项D是迷信说法,没有科学依据.
题组2散点图
3.下列图形中,两个变量具有线性相关关系的是()
解析:选B线性相关关系要求两个变量的散点图大致在一条直线上,且不是函数关系.
4.如图是两个变量统计数据的散点图,判断两个变量之间是否具有相关关系?
解:不具有相关关系,因为散点图散乱地分布在坐标平面内,不呈线形.
5.某种产品的广告费支出x与销售额y之间有如下对应数据(单位:百万元):
x24568
y3040605070
(1)画出散点图;
(2)从散点图中判断销售金额与广告费支出成什么样的关系?
解:(1)以x对应的数据为横坐标,以y对应的数据为纵坐标,所作的散点图如图所示:
(2)从图中可以发现广告费支出与销售金额之间具有相关关系,并且当广告费支出由小变大时,销售金额也大多由小变大,图中的数据大致分布在某条直线的附近,即x与y成正相关关系.
题组3线性回归方程的求法及应用
6.下列有关回归方程y^=b^x+a^的叙述正确的是()
①反映y^与x之间的函数关系;
②反映y与x之间的函数关系;
③表示y^与x之间的不确定关系;
④表示最接近y与x之间真实关系的一条直线.
A.①②B.②③
C.③④D.①④
解析:选Dy^=b^x+a^表示y^与x之间的函数关系,而不是y与x之间的函数关系.且它所反映的关系最接近y与x之间的真实关系.故选D.
7.设有一个回归方程为y^=-1.5x+2,则变量x增加一个单位时()
A.y平均增加1.5个单位
B.y平均增加2个单位
C.y平均减少1.5个单位
D.y平均减少2个单位
解析:选C∵两个变量线性负相关,∴变量x增加一个单位,y平均减少1.5个单位.
8.某产品的广告费用x与销售额y的统计数据如下表:
广告费用x(万元)4235
销售额y(万元)49263954
根据上表可得回归方程y^=b^x+a^中的b^为9.4,据此模型预报广告费用为6万元时销售额为()
A.63.6万元B.65.5万元
C.67.7万元D.72.0万元
解析:选B样本中心点是(3.5,42),则a^=y-b^x=42-9.4×3.5=9.1,所以回归直线方程是y^=9.4x+9.1,把x=6代入得y^=65.5,故选B.
9.已知工厂加工零件的个数x与花费时间y(h)之间的线性回归方程为y^=0.01x+0.5,则加工200个零件大约需要________小时.
解析:将200代入线性回归方程y^=0.01x+0.5,得y=2.5.
答案:2.5
10.有人统计了同一个省的6个城市某一年的人均国民生产总值(即人均GDP)和这一年各城市患白血病的儿童数量,如下表:
人均GDP/万元1086431
患白血病的儿童数/人351312207175132180
(1)画出散点图,并判定这两个变量是否具有线性相关关系;
(2)通过计算可知这两个变量的回归直线方程为y^=23.25x+102.15,假如一个城市的人均GDP为12万元,那么可以断言,这个城市患白血病的儿童一定超过380人,请问这个断言是否正确?
解:(1)根据表中数据画散点图,如图所示.
从图中可以看出,在6个点中,虽然第一个点离这条直线较远,但其余5个点大致分布在这条直线的附近,所以这两个变量具有线性相关关系.
(2)上述断言是错误的,将x=12代入y^=23.25x+102.15得y^=23.25×12+102.15=381.15>380,但381.15是对该城市人均GDP为12万元的情况下所作的一个估计,该城市患白血病的儿童可能超过380人,也可能低于380人.
[能力提升综合练]
1.(2014湖北高考)根据如下样本数据
x345678
y4.02.5-0.50.5-2.0-3.0
得到的回归方程为y^=bx+a,则()
A.a0,b0B.a0,b0
C.a0,b0D.a0,b0
解析:选B由表中数据画出散点图,如图,
由散点图可知b0,a0,选B.
2.已知变量x,y之间具有线性相关关系,其散点图如图所示,则其回归方程可能为()
A.y^=1.5x+2B.y^=-1.5x+2
C.y^=1.5x-2D.y^=-1.5x-2
解析:选B设回归方程为y^=bx+a,由散点图可知变量x、y之间负相关,回归直线在y轴上的截距为正数,所以b<0,a>0,因此方程可能为y^=-1.5x+2.
3.在2015年5月1日,某市物价部门对本市的5家商场某商品的一天销售量及其价格进行了调查,5家商场的售价x元和销售量y件之间的一组数据如下表所示:
价格x(元)99.51010.511
销售量y(件)1110865
由散点图可知,销售量y与价格x之间有较好的线性相关关系,其线性回归直线方程是:y^=-3.2x+a(参考公式:回归方程y^=bx+a,a=y-bx),则a=()
A.-24B.35.6
C.40.5D.40
解析:选D价格的平均数是x=9+9.5+10+10.5+115=10,销售量的平均数是y=11+10+8+6+55=8,由y^=-3.2x+a知b=-3.2,所以a=y-bx=8+3.2×10=40,故选D.
4.设某大学的女生体重y(单位:kg)与身高x(单位:cm)具有线性相关关系,根据一组样本数据(xi,yi)(i=1,2,…,n),用最小二乘法建立的回归方程为y^=0.85x-85.71,则下列结论中不正确的是()
A.y与x具有正的线性相关关系
B.回归直线过样本点的中心(x,y)
C.若该大学某女生身高增加1cm,则其体重约增加0.85kg
D.若该大学某女生身高为170cm,则可断定其体重必为58.79kg
解析:选D由于回归直线的斜率为正值,故y与x具有正的线性相关关系,选项A中的结论正确;回归直线过样本点的中心,选项B中的结论正确;根据回归直线斜率的意义易知选项C中的结论正确;由于回归分析得出的是估计值,故选项D中的结论不正确.
5.假设学生在初中的英语成绩和高一英语成绩是线性相关的.现有10名学生的初中英语成绩(x)和高一英语成绩(y)如下:
x74717268767367706574
y76757170767965776272
由此得到的回归直线的斜率约为1.22,则回归方程为________.
解析:将x=71,y=72.3,b^=1.22,代入y=b^x+a^,得a^=72.3-1.22×71=-14.32.
答案:y^=1.22x-14.32
6.对某台机器购置后的运行年限x(x=1,2,3,…)与当年利润y的统计分析知x,y具有线性相关关系,回归方程为y^=10.47-1.3x,估计该台机器最为划算的使用年限为________年.
解析:当年利润小于或等于零时应该报废该机器,当y=0时,令10.47-1.3x=0,解得x≈8,故估计该台机器最为划算的使用年限为8年.
答案:8
7.一项关于16艘轮船的研究中,船的吨位区间为[192,3246](单位:吨),船员的人数5~32人,船员人数y关于吨位x的回归方程为y^=9.5+0.0062x,
(1)若两艘船的吨位相差1000,求船员平均相差的人数;
(2)估计吨位最大的船和最小的船的船员人数.
解:(1)设两艘船的吨位分别为x1,x2,则船员人数为y^1,y^2,
y^1-y^2=9.5+0.0062x1-(9.5+0.0062x2)
=0.0062×1000≈6,
即船员平均相差6人.
(2)当x=192时,y^=9.5+0.0062×192≈11,
当x=3246时,y^=9.5+0.0062×3246≈30.
即估计吨位最大和最小的船的船员数分别为11人和30人.
8.某工厂为了对新研发的一种产品进行合理定价,将该产品按事先拟定的价格进行试销,得到如下数据:
单价x(元)88.28.48.68.89
销量y(件)908483807568
(1)求回归直线方程y^=b^x+a^,其中b^=-20;
(2)预计在今后的销售中,销量与单价仍然服从(1)中的关系,且该产品的成本是4元/件,为使工厂获得最大利润,该产品的单价应定为多少元?(利润=销售收入-成本)
解:(1)由于x=16(x1+x2+x3+x4+x5+x6)=8.5,
y=16(y1+y2+y3+y4+y5+y6)=80.
所以a^=y-b^x=80+20×8.5=250,
从而回归直线方程为y^=-20x+250.
(2)设工厂获得的利润为L元,依题意得
L=x(-20x+250)-4(-20x+250)=-20x2+330x-1000
=-20(x-8.25)2+361.25.
当且仅当x=8.25时,L取得最大值,
故当单价定为8.25元时,工厂可获得最大利润
高二数学《变量间的相关关系》知识点总结
一、变量间的相关关系
1.常见的两变量之间的关系有两类:一类是函数关系,另一类是相关关系;与函数关系不同,相关关系是一种非确定性关系.
2.从散点图上看,点分布在从左下角到右上角的区域内,两个变量的这种相关关系称为正相关,点分布在左上角到右下角的区域内,两个变量的相关关系为负相关.
二、两个变量的线性相关
1.从散点图上看,如果这些点从整体上看大致分布在通过散点图中心的一条直线附近,称两个变量之间具有线性相关关系,这条直线叫回归直线.
当r>0时,表明两个变量正相关;
当r<0时,表明两个变量负相关.
r的绝对值越接近于1,表明两个变量的线性相关性越强.r的绝对值越接近于0时,表明两个变量之间几乎不存在线性相关关系.通常|r|大于0.75时,认为两个变量有很强的线性相关性.
三、解题方法
1.相关关系的判断方法一是利用散点图直观判断,二是利用相关系数作出判断.
2.对于由散点图作出相关性判断时,若散点图呈带状且区域较窄,说明两个变量有一定的线性相关性,若呈曲线型也是有相关性.
3.由相关系数r判断时|r|越趋近于1相关性越强.
文章来源:http://m.jab88.com/j/28616.html
更多