欢迎访问文稿网!

中位数和四分位数的操作与分析

范文之家 分享 时间: 加入收藏 我要投稿 点赞

中位数和四分位数的操作与分析

中位数和四分位数的操作与分析_社会调查与统计分析实验教材

    

    例7-2 计算例7 1中学生每天上网时间的中位数和四分位数。

    (一)分析

    假定学生每天上网时间这一变量不服从正态分布,对于偏态分布的资料,集中趋势的指标需选用中位数,离散趋势的指标需选用四分位数。数据录入格式如图7 1所示。中位数和四分位数等指标的输出可通过“Frequencies”模块实现。

    (二)操作

    (1)通过菜单“Analyze”→“Descriptive Statistics”→“Frequencies...”,可实现中位数和四分位数等指标的输出。点击“Frequencies...”,弹出的对话框如图7 7所示。用鼠标选中“每天上网时间”,单击中间的“”按钮,变量“每天上网时间”的标签就会移入右侧。

    (2)单击图7 7右上方的“Statistics...”按钮,系统会弹出一个新的界面,如图7 8所示。用鼠标在“Percentile(s)”左侧的方框点击一下即可打上“√”,这时即可在“Percentile(s)”右侧的方框中输入需要的百分位数,如输入“25”,然后点击“Percentile(s)”下方的“Add”按钮,则数值“25”进入“Add”按钮右侧的方框中,输入“75”,则输出第75百分位数;用鼠标在“Median”左侧的方框点击一下即可打上“√”(见图7 9)。点击图7 9左下方的“Continue”按钮,即回到如图7 7所示界面,点击左下方的“OK”按钮,其输出结果如图7 10所示。

    

图7-7 Frequencies对话框

    

图7-8 Frequencies:Statistics对话框(1)

    

图7-9 Frequencies:Statistics对话框(2)

    (三)界面说明

    对如图7 7所示的界面简介如下:

    (1)“Display frequency tables”:确定是否在结果中输出频数表。

    (2)“Statistics...”:单击后弹出Statistics对话框(见图7 8),主要用于定义需要计算的描述性统计指标,现将各部分解释如下:

    ①“Percentile Values”复选框组:定义需要输出的百分位数,可计算四分位数(Quartiles)、每隔指定百分位输出当前百分位数(Cut points for equal groups)或直接指定某个百分位数(Percentile(s)),如直接指定输出P 2.5和P 97.5。

    ②“Central Tendency”复选框组:用于定义描述集中趋势的一组指标:均数(Mean)、中位数(Median)、众数(Mode)、总和(Sum)。

    ③“Dispersion”复选框组:用于定义描述离散趋势的一组指标:标准差(Std.deviation)、方差(Variance)、全距(Range)、最小值(Minimum)、最大值(Maximum)、标准误(S.E.mean)。

    ④“Distribution”复选框组:用于定义描述分布特征的两个指标:偏度系数(Skewness)和峰度系数(Kurtosis)。

    ⑤“Values are group midpoints”:当你输出的数据是分组频数数据,并且具体数值是组中值时,选中该复选框以通知SPSS,免得它犯错误。

    (3)“Charts...”:点击后弹出Charts对话框,用于设定所做的统计图。

    ①“Chart type”:定义统计图类型,有四种选择:无、条图(Bar chart)、圆图(Pie chart)、直方图(Histogram),其中直方图还可以选择是否加上正态曲线(Show normal curve on histogram)。

    ②“Chart Values”:定义是按照频数还是按百分比作图(即影响纵坐标刻度)。

    (4)“Format...”:点击后弹出Format对话框,用于定义输出频数表的格式:

    ①“Order by”:定义频数表的排列次序,有四个选项:

    Ascending values为根据数值大小按升序从小到大做频数分布;

    Descending values为根据数值大小按降序从大到小做频数分布;

    Ascending counts为根据频数多少按升序从少到多做频数分布;

    Descending counts为根据频数多少按降序从多到少做频数分布。

    ②“Multiple Variables”:如果选择了两个以上变量做频数表,则:

    Compare variables,可以将它们的结果在同一个频数表过程输出结果中显示,便于互相比较;

    Organize output by variables,则将结果在不同的频数表过程输出结果中显示;

    Suppress Tables with many categories,当频数表的分组数大于下面设定数值时禁止它在结果中输出,这样可以避免产生巨型表格。

    (四)结果解释

    图7 10中大学生每天上网时间的Median(中位数)为2.75小时, Percentile 25(第25百分位数)为2小时,Percentile 75(第75百分位数)为4小时。

    

图7-10 Frequencies主要输出结果

221381
领取福利

微信扫码领取福利

微信扫码分享