欢迎访问文稿网!

回归分析中自变量与因变量的确定

范文之家 分享 时间: 加入收藏 我要投稿 点赞

回归分析中自变量与因变量的确定

    4.6.1 回归分析中自变量与因变量的确定

    与相关分析不同,在回归分析中,需要确定自变量和因变量。自变量不同,得到的回归方程也不同。

    在研究的对象所采用的描述变量中,确定哪些变量可作为自变量、哪些可作为因变量,可遵循如下两个原则。

    1.根据变量可控与否来确定自变量和因变量

    通常选择可以控制的变量为自变量,而随可控制的变量波动的变量为因变量。

    例如,在分析化学领域,利用分光光度法、色谱建立标准工作曲线时,标准溶液的浓度是人为可控的,通常作为自变量,而仪器的响应值——吸光度(或色谱峰面积)是随样品浓度而变化的,则作为因变量。在化学合成实验中,各实验条件(温度、配比、催化剂用量)是可以人为控制的,通常作为自变量,而产物的收率、纯度是随上述实验因素的大小和组合方式而变化,在回归建模时则作为因变量。

    2.根据回归建模的目的来确定自变量和因变量

    在这一原则下,变量自身是否可以人为控制不再重要,重要的是希望通过回归建模预测什么性质,想要根据某个(或某些)变量去预测另一变量的性质时,则作为依据的变量就选择作为自变量,而希望用模型预测的变量则作为因变量。

    例如,上面讲的分光光度、色谱工作曲线建立的目的是希望根据吸光度(或峰面积)响应值去预测样品中物质的浓度,那么就应该选择吸光度(或峰面积)作为自变量、样品浓度作为因变量。这样就可以在建立好工作曲线后直接根据仪器的响应值求得样品浓度。但是分析化学传统做法仍旧是按照第一种方法建立好以浓度为自变量的标准工作曲线后,将待定样品的仪器响应值(因变量)代入工作曲线后换算出样品浓度。这样做的前提就是工作曲线必须足够准确,即标准工作曲线(一元线性回归方程)的r要尽可能接近1,一般要求r>0.99。这时,无论以哪个变量为自变量,所建立的标准工作曲线所得浓度都基本一致。

    例4-7 对表4-3中的数据以峰面积为自变量、进样量为因变量,可得如下回归方程

    img264

    对应的统计检验指标r2、F值及P值均与例4-2相同。

    对例4-2中的问题(2),峰面积相应为2 000时的柴胡皂苷样品溶液中的柴胡皂苷a的质量=-0.140 9+0.003 2×2 000=6.166 6(μg)。

    样品中柴胡皂苷a的浓度=6.166 6μg/10μL=0.617μg·μL-1

    在有效位数内采用上述两个回归方程得到的样品柴胡皂苷浓度相等。这归结于两个回归方程的精度非常高(r=0.999非常接近于1)。否则,采用不同自变量回归得到的方程进行预测的结果是不会相等的。

    我们来看下一个例子。

    例4-8 例3-2中的腐蚀时间是可以控制的,按照规则(1)选择时间为自变量,而刻蚀深度随腐蚀时间而变化,选其为因变量。根据表3-2,可以得到如下回归方程

    img265

    r=0.984 7,F=286.52>F1,9(0.05)=5.12,方程(4-26)回归的深度值与实测值之间的标准残差img266=2.2。根据方程(4-26),可以预测在某一腐蚀时间下的刻蚀深度。

    譬如要预测腐蚀时间x0=75s时的刻蚀深度是多少,只要将x0=75s代入方程(4-26),有

    img267

    由此可以预测,当腐蚀时间为75s时,刻蚀深度大约为26.4~30.8μ,估计值为28.6μ。

    如果问题是:欲使刻蚀深度为10μ,腐蚀时间应控制在什么范围合适?这就相当于要求根据刻蚀深度预测时间的合适范围,那么应该以深度为自变量x,时间为因变量y,此时根据表3-2,可以得到如下回归方程

    img268

    相关系数r=0.984 7,F=286.52>F1,9(0.05)=5.12,方程(4-27)回归的时间值与实测值之间的标准残差img269=6.8。

    将x0=10μ代入方程(4-27),可得

    img270

    考虑到方程(4-27)模型预测时间的一倍标准方差的影响

    img271

    即要使刻蚀深度=10μ,应该将腐蚀时间控制为11.5~25.1s,腐蚀时间的估计值为18.3s。

    如果采用方程(4-26)(即时间为自变量、深度为因变量得到的回归方程)可以反推出用刻度表示的时间如下

    img272

    由方程(4-28)计算出的时间标准偏差σ=6.9大于由(4-26)计算出的时间标准偏差6.8。

    比较方程(4-28)与方程(4-27)可以发现二者的系数是不同的。由于腐蚀时间与刻蚀深度之间的相关系数r=0.984 7≠1,说明回归方程(4-26)与方程(4-27)不是准确的函数关系,因此由方程(4-26)换算求得的时间=f(刻度)的关系式(4-28)与方程(4-27)不等价。

    令方程(4-28)中的深度=10μ,可以求得

    时间=3.009 4×10-13.511=17.4(s)

    考虑到方程(4-28)模型预测时间的一倍标准方差影响

    时间-6.9=17.4-6.9=10.5(s)

    时间+6.9=17.4+6.9=24.3(s)

    即由方程(4-26)反算得到的方程(4-28)进行预测时,要使刻蚀深度=10μ,应该将腐蚀时间控制为10.5~24.3s,时间的估计值为17.4s。

    显然,对于本例,由于回归方程的精度不是特别高(r=0.984 7<0.99),由方程(4-27)和方程(4-28)预测腐蚀时间时得到的答案是不同的,所以根据规则2来选择自变量和因变量从数学角度而言更方便、可靠些。

221381
领取福利

微信扫码领取福利

微信扫码分享