欢迎访问文稿网!

非线性回归分析

范文之家 分享 时间: 加入收藏 我要投稿 点赞

非线性回归分析

非线性回归分析_统计学教程

    第四节 非线性回归分析

    在实际问题中,有时两个变量间的关系不是线性相关关系,而是某种曲线相关关系,如抛物线相关、双曲线相关、幂函数相关和指数相关等,这时如果仍直接做直线回归,就不能反映出这两个变量之间的内在联系,而必须做非线性回归,即通过变量间的一组观测数据配合一条曲线来描述它们之间的关系。

    对非线性相关关系,可通过对变量进行变换,转换成线性相关,再利用线性回归分析方法进行研究。

    例7-7:炼钢厂出钢时所用盛钢水的钢包,在使用过程中由于钢水及炉渣对包衬耐火材料的侵蚀,容积随使用次数而不断增大。下面是使用次数和增大容积(用钢包盛满时的钢水重量表示)的资料:

    

    表7-5   使用次数和增大容积资料

    img576

    首先做散点图(如图7-4所示)。

    img577

    

    图7-4 使用次数和增大容积散点图

    从散点图可看出,随着使用次数的增加,开始时侵蚀速度较快,然后逐渐减慢。由于钢包容积不会无限增加,必有一条平行于x轴的渐进线,根据这些特点,可拟合双曲线:

    img578

    img579

    计算估计标准误差:

    img585

    根据数据特点,也可考虑拟合指数曲线:

    img586

    将上式两边同取自然对数

    img587

    img590,由此

    img591

    计算估计标准误差Sy=0.2618,较拟合双曲线时的Sy小,因此选择指数曲线作为回归线。

    选择合适的曲线类型不是一件容易的事,下面列出几种可以通过变量代换化成线性回归处理的曲线图形和替换公式,以供参考。

    1.指数函数(见图7-5):

    img592

    对上式两边取自然对数得:

    img593

    令y′=lny,则

    img594

    img595

    

    图7-5

    2.幂函数(见图7-6):

    img596

    

    图7-6

    img597

    对上式两边取自然对数得:

    img598

    令y′=lg y,x′=lgx,则得:

    img599

    3.双曲函数(见图7-7):

    img600

    

    图7-7

    img601

    令img602,则得:

    img603

    4.对数函数(见图7-8):

    img604

    img605

    

    图7-8

    令x′=lgx,则得:

    img606

    5.S型曲线(见图7-9):

    img607

    

    图7-9

    img608

    img609

    令,则得:

    img610

    在应用回归分析时,需要注意以下几个问题:

    第一,在进行回归分析时,首先要根据一定的理论知识、专业知识和实际经验做定性分析,分析变量之间有无真正的联系,是表面联系还是内在的实质联系,是偶然巧合还是必然联系,如果一个自变量和许多变量都有联系,就要分析哪些变量是主要影响因素,哪些是次要因素。在此基础上正确确定以什么变量为自变量,什么变量为因变量,这样做出的方程才有实际意义。如忽视了这一步,把没有实质联系的现象,硬用回归方程联在一起,就会得出荒谬的、虚假的回归,据以进行推算和预测会得出错误的结论。即使在确定了实质性联系后,进行回归分析时,也还要结合定性分析,从理论上和经验上加以验证。特别是对复杂的社会现象进行定量分析时,不能脱离政府的方针政策以及当时的社会环境,人们的思想、心理作用等,这些都是可能影响回归预测的重要因素,不可忽视。

    img613

    

    图7-10

    如果一个回归模型满足假定前提,所有残差应在e=0附近随机变化,并在变化不大的一条带子中,如图7-10中(a);图7-10中(b)的情况表明不能满足E(ε)=0,而(c)的情况表明不能满足V(ε)=σ2即方差相等这一前提。

    随机误差项ε是否满足正态性不影响利用最小平方法估计模型参数,但是影响显著性检验和预测。根据中心极限定理,在大样本情况下,随机误差项均近似服从正态分布,对于小样本,则需进行随机误差项的正态性检验,检验方法可参阅相关书籍,这里不再赘述。

    第三,利用回归方程进行预测时,只适用于原来的试验范围,不能把范围随意扩大。也就是说只适用于内插预测,不适用于外推预测。因为,用最小平方法配合的最适线,只是针对现有资料范围而言,如果外推到范围以外,就不一定是最适线了。

    img617

    利用标准化处理后的样本数据进行回归分析得到的回归方程,回归系数不再有量纲,可以用来比较各自变量对y影响程度的相对重要性。

221381
领取福利

微信扫码领取福利

微信扫码分享