回归分析

时间:2019/9/9 19:05:05   作者:数学名师王老师
1.能通过收集现实问题中两个有关联的变量的数据作出散点图,并利用散点图直观认识变量间的相关关系.
2.能根据给出的线性回归方程系数公式建立线性回归方程.
3.能通过相关性检验,了解回归分析的基本思想与方法.
4.了解非线性回归问题,并能找出解决问题的一般思路.
知识点
  • 1.回归直线方程

    对于一组具有线性相关关系的数据$\left(x_{i}, y_{i}\right)(i=1,2, \dots, n)$,回归直线方程为$\hat{y}=\hat{a}+\hat{b} x$,其中blob.png.

    名师点拨

    (1)回归直线方程只适用于所研究的样本总体.

    (2)建立的回归直线方程一般都有时间性,如不能用20世纪80年代的身高、体重数据所建立的回归直线方程来描述现在的身高和体重的关系.

    (3)样本取值的范围会影响回归直线方程的适用范围.

    (4)回归直线方程得到的预报值不一定就是预报变量的精确值,事实上,它是预报变量的可能取值的平均值.

  • 2.相关性检验

    对于变量x与Y随机抽取到的n对数据$\left(x_{1}, y_{1}\right),\left(x_{2}, y_{2}\right), \ldots,\left(x_{n}, y_{n}\right)$,检验统计量是样本相关系数blob.png.

    $r$具有以下性质:$|r| \leq 1$,并且$|r|$越接近1,线性相关程度越强;$|r|$越接近0,线性相关程度越弱.


    对变量x与Y进行相关性检验分四步:

    (1)作统计假设:$x$与$Y$不具有线性相关关系;

    (2)根据小概率0.05与$n-2$在教材附表中查出$r$的一个临界值$r_{0.05}$;

    (3)根据样本相关系数计算公式算出r的值;

    (4)作统计推断.如果$|r|>r_{0.05}$,表明有95%的把握认为$x$与$Y$之间具有线性相关关系.如果$|r| \leq r_{0.05}$,我们没有理由拒绝原来的假设.这时寻找回归直线方程是毫无意义的.

    【做一做】 下列有关样本相关系数的说法不正确的是 (  )

    A.相关系数用来衡量变量$x$与$Y$之间的线性相关程度

    B.$|r| \leq 1$,且$|r|$越接近1,相关程度越强

    C.$|r| \leq 1$,且$|r|$越接近0,相关程度越弱

    D.$|r| \geq 1$,且$|r|$越接近1,相关程度越强

    答案:D

重难点
  • 两个变量具有相关关系和具有函数关系有何区别?

    剖析相关关系与函数关系不同,因为函数关系是一种确定性的关系;而相关关系是一种非确定性的关系,它包括两种情况:一是两个变量中,一个变量为可控制变量,另一个变量为随机变量;二是两个变量均为随机变量.而函数关系可以看成是两个非随机变量之间的关系.另一方面,函数关系是一种因果关系,而相关关系不一定是因果关系,也可以是伴随关系.

    对两个变量的关系来说,在相关关系中,例如,在水稻产量与施肥量的关系中,施肥量是可控制变量,而水稻的产量是随机变量;在研究一个学生的数学成绩与物理成绩的关系时,这两个变量都是不可控制的随机变量.而正方形的面积$S$与边长$x$之间的关系是一种函数关系,这两个变量就不是随机变量.由于相关关系的不确定性,我们经常运用统计分析的方法,即回归分析法来进行研究.


    我们可以知道,相关关系中,由部分观测值得到的回归直线,可以对两个变量间的线性相关关系进行估计,这实际上是将非确定性问题转化成确定性问题来研究.由于回归直线将部分观测值所反映的规律性进行了延伸,它在情况预报、资料补充等方面有着广泛的应用,从某种意义上看,函数关系是一种理想的关系模型,而相关关系是一种更为一般的情况.因此研究相关关系,不仅可使我们处理更为广泛的数学应用问题,还能使我们对函数关系的认识上升到一个新的高度.

例题解析
  • 题型一 线性回归问题

    【例1】 假设关于某种设备的使用年限$x($单位:年$)$与所支出的维修费用$y($单位:万元$)$有如下统计资料:

    x

    2

    3

    4

    5

    6

    y

    2.2

    3.8

    5.5

    6.5

    7.0

     

    已知$\sum_{i=1}^{5} \mathrm{x}_{\mathrm{i}}^{2}=90, \\ \sum_{\mathrm{i}=1}^{5} y_{i}^{2} \approx 140.8, \\ \sum_{i=1}^{5} x_{i} y_{i}=112.3, \\ \sqrt{79} \approx 8.9, \sqrt{2} \approx 1.4, n-2=3$
    时,$r_{0.05}=0.878$.

    (1)求$\overline{x}, \overline{y}$;

    (2)对$x,y$进行线性相关性检验;

    (3)如果$x$与$y$具有线性相关关系,求出回归直线方程;

    (4)假设使用年限为10年时,维修费用约是多少万元?

    反思  

    作相关性检验,有时也用作散点图的方法,观察所给的数据列成的点是否在一条直线的附近,这样做既直观又方便,因而对解决相关性检验问题比较常用,但在作图中,由于存在误差,有时又很难说这些点是不是分布在一条直线的附近,这时就很难判断两个变量之间是否具有相关关系,这时就必须利用样本相关系数对其进行相关性检验,计算中应该特别细心,不能出现计算的错误.

  • 题型二 非线性回归问题

    【例2】 下表是某种旧货物价格的调查资料,若以$x$表示该种货物的使用年数,$y($单位:元$)$表示相应的年均价格,求$y$关于$x$的回归方程.


    使用年数$x$

    1

    2

    3

    4

    5

    6

    7

    8

    9

    10

    年均价格$y$

    2 651

    1 943

    1 494

    1 087

    765

    538

    484

    290

    226

    204

    分析作出散点图,根据样本点分布情况,选择适当的曲线模型拟合.

    反思

    非线性回归问题有时并不给出经验公式.这时我们可以画出已知数据的散点图,把它与幂函数、指数函数、对数函数等的图象作比较,挑选一种跟这些散点拟合得最好的函数,然后采用适当的变量置换,把问题化为线性回归分析问题,使之得到解决.

  • 题型三 易错辨析

    【例3】 在一次抽样中测得变量$x$与$Y$的一组样本数据如下表:

    $x$

    0.25

    0.5

    1

    2

    4

    $Y$

    16

    12

    5

    2

    1

     

    试建立$Y$与$x$之间的回归方程.

  • 真题

    1.给出下列说法:

    ①线性回归分析就是由样本点去寻找一条直线,使其贴近这些样本点的数学方法;②利用样本点的散点图可以直观判断两个变量的关系是否可以用线性关系表示;③通过回归方程$\hat{y}=\hat{b} x+\hat{a}$及其回归系数$\hat{b}$ ,可以估计和预测变量的取值和变化趋势;④因为由任意一组观测值都可以求得一个回归直线方程,所以没有必要进行相关性检验.

    其中正确的说法有(  )

    A.1个  B.2个  C.3个  D.4个

    2.观测两相关变量得如下数据:

    x

    -1

    -2

    -3

    -4

    -5

    Y

    -9

    -7

    -5

    -3

    -1

    则两变量间的回归直线方程为(  )

     

    A. $\hat{y}=\frac{1}{2} x-1 \qquad$ B. $\hat{y}=-2 x-11$

    C. $\hat{y}=2 x+\frac{1}{3} \qquad$ D. $\hat{y}=x+1$

    3.设某大学的女生体重y(单位:kg)与身高x(单位:cm)具有线性相关关系,根据一组样本数据$\left(x_{i}, y_{i}\right)(i=1,2, \ldots, n)$,用最小二乘法建立的回归方程为$\hat{y}=0.85 x-85.71$,则下列结论中不正确的是(  )

    A.$y$与$x$具有正的线性相关关系

    B.回归直线过样本点的中心$(\overline{\mathrm{x}}, \overline{\mathrm{y}})$

    C.若该大学某女生身高增加1 cm,则其体重约增加0.85 kg

    D.若该大学某女生身高为170 cm,则可断定其体重必为58.79 kg

    4.对具有线性相关关系的变量$x$和$Y$,测得一组数据如下表:


    $x$

    2

    4

    5

    6

    8

    $Y$

    30

    40

    60

    50

    70


    若已求得它们的回归直线方程的斜率为6.5,则这条回归直线方程为_________. 

    5.为了考察两个变量$Y$与$x$的线性相关性,测得$x,Y$的13对数据,若$Y$与$x$具有线性相关关系,则相关系数$|r|$的取值范围是_________. 

声明:本站部分内容搜集整理自互联网,如果涉及侵犯您的版权,请联系我们举报,并提供相关证据,工作人员会在5个工作日内回复您,一经查实,本站将立刻删除涉嫌侵权内容。

相关推荐

构成空间几何体的基本元素

1.理解平面的抽象特征,并会表示平面. 2.知道构成几何体的基本元素,并能从运动的角度理解点、线、面、体之间的关系. 3.了解简单几何体中点、线、面的位置关系.