欢迎访问文稿网!

相关分析的主要方法

范文之家 分享 时间: 加入收藏 我要投稿 点赞

相关分析的主要方法

    

    (一)相关关系的判断

    1.定性分析 在进行相关分析之前,首先根据研究者的理论知识、专业知识和实践经验,对客观现象之间是否存在相关关系以及有何种相关关系做出判断,这就是定性分析。

    2.相关表 就是根据现象之间的原始资料,将一变量的若干变量值按从小到大的顺序排列,并将另一变量的值与之对应排列形成的统计表。

    3.图示法 即制作散点图,相关散点图是观察两个变量之间关系的一种非常直观的方法。具体绘制的方法是以横轴表示两个变量中的一个变量(作为自变量),以纵轴表示另一个变量(作为因变量),然后将两个变量之间相对应的变量值以坐标点的形式逐一标在直角坐标系中,通过点的分布形状和疏密程度来形象描述两个变量之间的相关关系。

    相关散点图可以通过手工绘制而得到,但如果面对的变量值比较多,手工绘制的过程比较费时且图又不够精确。因此,还可以利用电子表格软件Excel、统计软件spss快捷地绘制出相应的相关散点图。

    由于变量之间的关系各不相同,因此所绘制的相关散点图也是形状各异。下面几点可为判断是否相关及其相关方向提供参考。

    (1)当散点图呈现从左下方向右上方递增的趋势时,变量间的关系为正相关。

    (2)当散点图呈现从左上方向右下方递减的趋势时,变量间的关系为负相关。

    (3)当散点图中各相关点很分散时,变量间没有相关关系。

    (4)当散点图中各相关点的分布呈曲线状,变量间的关系即为曲线相关。

    需要补充的是,一般在期刊中不会看到散点图,因为它占用太多版面,但它们有助于了解相关的类型以及相关系数r的含义。

    4.其他 计算法则是根据不同类型的数据,选择不同的计算方法求出相关系数来进行相关分析。

    (二)相关系数的计算方法

    计算相关系数的方法很多,由于各种变量都具有不同的性质和类型,因此应当根据变量的特点选择适当的分析相关的方法。

    1.积差相关法

    (1)积差相关的概念及其适用条件:积差相关是20世纪初英国统计学家卡尔·皮尔逊提出的一种计算相关的方法,故又称为皮尔逊积差相关。皮尔逊积差相关系数一般用样本数据计算,记为r;若用总体全部数据计算,则称为总体相关系数,记为P。它是最常用的计算直线相关的方法。说明在直线相关的条件下,两个现象之间相关关系密切程度的统计指标。

    其基本公式为:

    

    式中:r为积差相关系数,n为成对数据的对数;珡X,珚Y分别表示变量X与Y的平均数。

    (X-珡X)表示X变量的离差,(Y-珚Y)表示Y变量的离差。

    积差是两个变量中每对变量值离均差相乘之积(X-珡X)(Y-珚Y),它是协方差的主要内容,计算积差相关系数离不开协方差,它的离差乘积和的大小,就能反映两个变量之间的关系。如果X与Y两个变量值的变化为X大于珡X时,Y也大于珚Y,或者X小于珡X时,Y也小于珚Y,在这种情况下,两个离差乘积和为正,且数值较大,说明两个变量的变化方向一致,且关系密切;如果两个变量值的变化为X小于珡X时,Y反而大于珚Y,或者X大于珡X时,Y反而小于珚Y,在这种情况下,两个离差乘积为负,且数值较大,这说明两个变量的变化方向相反,但关系密切;如果两个变量值的变化为X大于珡X时,Y可能大于珚Y,也可能小于珚Y,在这种情况下,两个离差乘积和趋于0,说明两个变量之间无相关。

    所以协方差是两个变量X、Y的“一致性”测量。但是,协方差是带有具体单位的绝对量数,它不能与单位不同的资料相比较。而协方差是积差相关量计算的基础,为了使协方差变成相对数,与不同单位的资料可以进行比较,所以将两个离差除以相应的标准差,再将两个标准分数的乘积和除以n,便得到了积差相关系数。由以上计算过程可以看出相关关系中,两个变量不确定哪个是自变量,哪个是因变量,因此,相关的两个变量都是随机变量。相关关系中只能计算出一个相关系数r。

    该方法的适用条件是:①两变量的测量值都是测量数据,并且两个变量的总体是正态分布或近似正态分布。②两个变量之间具有线性关系,并且样本容量应大于30。

    (2)用定义公式计算积差相关系数:定义公式为:r=

    由于公式中的分子和分母都含有公因子,同时将其约掉,r的公式可写成:

    

    (3)等级相关法:在进行相关分析的过程中,经常会遇到一些并不在积差相关方法适用范围之内的具有等级顺序的测量数据,在这种情况下,要研究两个或两个以上变量的相关,就需要采用等级相关。这种相关方法对变量的总体分布不做要求,因此又称这种相关为非参数相关。

    2.斯皮尔曼等级相关的概念及其适用条件 当两列变量值是以等级次序排列或以等级次序表示时,并且变量值所属的两个总体并不一定呈正态分布,样本容量也不一定大于30,表示这样两种变量之间的相关称为斯皮尔曼等级相关。由于这种相关是英国统计学家斯皮尔曼根据积差相关公式推导得到的,因此有人认为斯皮尔曼等级相关是积差相关的一种特殊形式。

    斯皮尔曼等级相关的适用条件为:①两个变量的变量值是以等级次序表示的资料;②一个变量的变量值是等级数据,另一个变量的变量值是等距或比率数据,且其两总体不是正态分布,样本容量n不一定大于30。

    从斯皮尔曼等级相关适用条件中可以看出,等级相关的应用范围要比积差相关广泛,它的突出优点是对数据的总体分布、样本大小都不做要求。但缺点是计算精度不高。斯皮尔曼等级相关系数常用符号rR来表示。

    斯皮尔曼等级相关系数的计算方法其基本公式为:

    

    式中:D是两个变量每对数据等级之差,n是两列变量值的对数。

221381
领取福利

微信扫码领取福利

微信扫码分享