日期:20 14 年 月 日
| 班级 | 13应用统计 | 姓名 | 刘金兴 | 学号 | 2013154020 | ||||
| 实验 名称 | 利用spss软件研究货运总量y(万吨)与工业总产值(亿元)、农业总产值(亿元)、居民非商品支出(亿元)的关系。 | ||||||||
| 问题背景描述: 软件研究货运总量y(万吨)与工业总产值(亿元)、农业总产值(亿元)、居民非商品支出(亿元)的关系。 数据见表3.9. 表3.9 编号 | 货运总量 y(万吨) | 工业总产值x1(亿元) | 农业总产值x2(亿元) | 居民非商品支出x3(亿元) | |||||
| 1 | 160 | 70 | 35 | 1.0 | |||||
| 2 | 260 | 75 | 40 | 2.4 | |||||
| 3 | 210 | 65 | 40 | 2.0 | |||||
| 4 | 265 | 74 | 42 | 3.0 | |||||
| 5 | 240 | 72 | 38 | 1.2 | |||||
| 6 | 220 | 68 | 45 | 1.5 | |||||
| 7 | 275 | 78 | 42 | 4.0 | |||||
| 8 | 160 | 66 | 36 | 2.0 | |||||
| 9 | 275 | 70 | 44 | 3.2 | |||||
| 10 | 250 | 65 | 42 | 3.0 | |||||
| 学会运用SPSS软件对数据作回归分析,进一步了解多元线性回归模型的建立过程。 | |||||
| 实验原理与数学模型: 从SPSS软件计算的相关阵可以看出,y与,,的相关系数都在0.5以上,说明所选自变量与y是线性相关的 用y与自变量作多元线性回归是合适的。 | |||||
| 实验所用软件及版本:IBM SPSS 19.0 | |||||
| 主要内容(要点): (1)计算出 y,,,的相关系数矩阵。 (2)求y关于,,的三元线性回归方程。 (3)对所求得的方程作拟合优度检验。 (4)对回归方程做显著性检验。 (5)对每一个回归系数作显著性检验。 (6)如果有的回归系数没通过显著性检验,将其剔除,重新建立回归方程,在作回归方程的显著性检验和回归系数的显著性检验。 (7)求出每一个回归系数的置信水平为%95的置信区间。 (8)求标准化回归方程。 |
| (10)结合回归方程对问题作一些基本分析。 | |||||
| 实验过程记录(含基本步骤、主要程序清单及异常情况记录等): (1)由SPSS软件可得相关系数表如下 相关性 | |||||
| y | x1 | x2 | x3 | ||
| Pearson 相关性 | y | 1.000 | .556 | .731 | .724 |
| x1 | .556 | 1.000 | .113 | .398 | |
| x2 | .731 | .113 | 1.000 | .547 | |
| x3 | .724 | .398 | .547 | 1.000 | |
| Sig. (单侧) | y | . | .048 | .008 | .009 |
| x1 | .048 | . | .378 | .127 | |
| x2 | .008 | .378 | . | .051 | |
| x3 | .009 | .127 | .051 | . | |
| N | y | 10 | 10 | 10 | 10 |
| x1 | 10 | 10 | 10 | 10 | |
| x2 | 10 | 10 | 10 | 10 | |
| x3 | 10 | 10 | 10 | 10 | |
(2)对数据利用SPSS软件作线性回归,得相关系数表如下:
| 系数a | ||||||
| 模型 | 非标准化系数 | 标准系数 | t | Sig. | ||
| B | 标准 误差 | 试用版 | ||||
| 1 | (常量) | -348.280 | 176.459 | -1.974 | .096 | |
| x1 | 3.754 | 1.933 | .385 | 1.942 | .100 | |
| x2 | 7.101 | 2.880 | .535 | 2.465 | .049 | |
| x3 | 12.447 | 10.569 | .277 | 1.178 | .284 | |
| a. 因变量: y 由表可得y关于,,的三元线性回归方程为 | ||||||
| 模型汇总 | ||||
| 模型 | R | R 方 | 调整 R 方 | 标准 估计的误差 |
| 1 | .8a | .806 | .708 | 23.44188 |
| 模型汇总 | ||||||
| 模型 | R | R 方 | 调整 R 方 | 标准 估计的误差 | ||
| 1 | .8a | .806 | .708 | 23.44188 | ||
| a. 预测变量: (常量), x3, x1, x2。 由上表可知,调整后的决定系数为0.708,说明回归方程对样本观测值得拟合程度较好。 (4)利用SPSS软件可以得到方差分析表: Anovab | ||||||
| 模型 | 平方和 | df | 均方 | F | Sig. | |
| 1 | 回归 | 13655.370 | 3 | 4551.790 | 8.283 | .015a |
| 残差 | 3297.130 | 6 | 549.522 | |||
| 总计 | 16952.500 | 9 | ||||
| a. 预测变量: (常量), x3, x1, x2。 b. 因变量: y | ||||||
F统计量服从自由度为(3,6)的F分布,给定显著性水平=0.05,查表得,由方查分析表得,F值=8.283>4.76,p值=0.015,拒绝原假设,由方差分析表可以得到,说明在置信水平为95%下,回归方程显著。
| (5)对每一个回归系数做显著性检验: |
| 系数a | ||||||
| 模型 | 非标准化系数 | 标准系数 | t | Sig. | ||
| B | 标准 误差 | 试用版 | ||||
| 1 | (常量) | -348.280 | 176.459 | -1.974 | .096 | |
| x1 | 3.754 | 1.933 | .385 | 1.942 | .100 | |
| x2 | 7.101 | 2.880 | .535 | 2.465 | .049 | |
| x3 | 12.447 | 10.569 | .277 | 1.178 | .284 | |
| a. 因变量: y | ||||||
统计量服从自由度为n-p-1=6的t分布,给定显著性水平0.05,查得单侧检验临界值为1.943,X1的t值=1.942<1.943,处在否定域边缘。
X2的t值=2.465>1.943。拒绝原假设。
由上表可得,在显著性水平时,只有的P值<0.05,通过检验,即只有的回归系数较为显著 ;其余自变量的P值均大于0.05,即x1,x2的系数均不显著。
(6)根据提议可有:
| 系数a | |||||
| 模型 | 非标准化系数 | 标准系数 | t | Sig. | |
| B | 标准 误差 | 试用版 | |||
| 系数a | ||||||
| 模型 | 非标准化系数 | 标准系数 | t | Sig. | ||
| B | 标准 误差 | 试用版 | ||||
| 1 | (常量) | -348.280 | 176.459 | -1.974 | .096 | |
| x1 | 3.754 | 1.933 | .385 | 1.942 | .100 | |
| x2 | 7.101 | 2.880 | .535 | 2.465 | .049 | |
| x3 | 12.447 | 10.569 | .277 | 1.178 | .284 | |
| 2 | (常量) | -459.624 | 153.058 | -3.003 | .020 | |
| x1 | 4.676 | 1.816 | .479 | 2.575 | .037 | |
| x2 | 8.971 | 2.468 | .676 | 3.634 | .008 | |
| 1 | (常量) | -348.280 | 176.459 | -1.974 | .096 | |
| x1 | 3.754 | 1.933 | .385 | 1.942 | .100 | |
| x2 | 7.101 | 2.880 | .535 | 2.465 | .049 | |
| x3 | 12.447 | 10.569 | .277 | 1.178 | .284 | |
| 2 | (常量) | -459.624 | 153.058 | -3.003 | .020 | |
| x1 | 4.676 | 1.816 | .479 | 2.575 | .037 | |
| x2 | 8.971 | 2.468 | .676 | 3.634 | .008 | |
| a. 因变量: y | ||||||
| Anovac | |||||||||
| 模型 | 平方和 | df | 均方 | F | Sig. | ||||
| 1 | 回归 | 13655.370 | 3 | 4551.790 | 8.283 | .015a | |||
| 残差 | 3297.130 | 6 | 549.522 | ||||||
| 总计 | 16952.500 | 9 | |||||||
| 2 | 回归 | 123.199 | 2 | 46.600 | 11.117 | .007b | |||
| 残差 | 4059.301 | 7 | 579.900 | ||||||
| 总计 | 16952.500 | 9 | |||||||
| a. 预测变量: (常量), x3, x1, x2。 b. 预测变量: (常量), x1, x2。 c. 因变量: y 模型汇总 | |||||||||
| 模型 | R | R 方 | 调整 R 方 | 标准 估计的误差 | 更改统计量 | ||||
| R 方更改 | F 更改 | df1 | df2 | Sig. F 更改 | |||||
| 1 | .8a | .806 | .708 | 23.44188 | .806 | 8.283 | 3 | 6 | .015 |
| 2 | .872b | .761 | .692 | 24.08112 | -.045 | 1.387 | 1 | 6 | .284 |
| a. 预测变量: (常量), x3, x1, x2。 b. 预测变量: (常量), x1, x2。 | |||||||||
原假设:
F服从自由度为(2,7)的F分布,给定显著性水平=0.05,查表得,由方差分析表得,F值=11.117>4.74,p值=0.007,拒绝原假设.
认为在显著性水平=0.05下,x1,x2整体上对y有显著的线性影响,即回归方程是显著的。
对每一个回归系数做显著性检验:
| 做t检验:设原假设为,统计量服从自由度为n-p-1=7的t分布,给定显著性水平0.05,查得单侧检验临界值为1.5,X1的t值=2.575>1.5,拒绝原假设。故 |
同理β2也通过检验。同时从回归系数显著性检验表可知:X1,X2的p值 都小于0.05,可认为对x1,x2分别对y都有显著的影响。
(7)
| 系数a | ||||||||
| 模型 | 非标准化系数 | 标准系数 | t | Sig. | B 的 95.0% 置信区间 | |||
| B | 标准 误差 | 试用版 | 下限 | 上限 | ||||
| 1 | (常量) | -348.280 | 176.459 | -1.974 | .096 | -780.060 | 83.500 | |
| x1 | 3.754 | 1.933 | .385 | 1.942 | .100 | -.977 | 8.485 | |
| x2 | 7.101 | 2.880 | .535 | 2.465 | .049 | .053 | 14.149 | |
| x3 | 12.447 | 10.569 | .277 | 1.178 | .284 | -13.415 | 38.310 | |
| 2 | (常量) | -459.624 | 153.058 | -3.003 | .020 | -821.547 | -97.700 | |
| x1 | 4.676 | 1.816 | .479 | 2.575 | .037 | .381 | 8.970 | |
| x2 | 8.971 | 2.468 | .676 | 3.634 | .008 | 3.134 | 14.808 | |
| a. 因变量: y 由回归系数表可以看到,β1置信水平为95%的置信区间[0.381,8.970], β2置信水平为95%的置信区间[3.134,14.808] (8)由回归系数表(上表)可得,标准化后的回归方程为: (9) | ||||||||
| 系数a | ||||||||
| 模型 | 非标准化系数 | 标准系数 | t | Sig. | B 的 95.0% 置信区间 | |||
| B | 标准 误差 | 试用版 | 下限 | 上限 | ||||
| 1 | (常量) | -348.280 | 176.459 | -1.974 | .096 | -780.060 | 83.500 | |
| x1 | 3.754 | 1.933 | .385 | 1.942 | .100 | -.977 | 8.485 | |
| x2 | 7.101 | 2.880 | .535 | 2.465 | .049 | .053 | 14.149 | |
| x3 | 12.447 | 10.569 | .277 | 1.178 | .284 | -13.415 | 38.310 | |
| 2 | (常量) | -459.624 | 153.058 | -3.003 | .020 | -821.547 | -97.700 | |
| x1 | 4.676 | 1.816 | .479 | 2.575 | .037 | .381 | 8.970 | |
| x2 | 8.971 | 2.468 | .676 | 3.634 | .008 | 3.134 | 14.808 | |
| 由SPSS输出结果可知,当时,(见上表),的置信度为95%的精确预测区间为(204.4,331.2)(见下表),的置信度为95%的近似预测区间为,手工计算得:(219.6,316.0)。 (10)由回归方程 可知农业总产值固定的时候,工业总产值每增加1亿元,货运总量增加4.676万吨;工业总产值固定的时候,农业总产值每增加1亿元,货运总量增加8.971万吨。而居民非商品支出对货运总量没有显著的线性影响。由标准化回归方程可知: 工业总产值、农业总产值与Y都是正相关关系,比较回归系数的大小可知农业总产值X2对货运总量Y的影响程度大一些。 | ||||||||
通过在计算机上作SPSS实验,我深刻地认识到了专业的重要性,以及这门学科对社会和科学的作用。
| 我对SPSS软件的了解还不够深入,我会在以后的学习中深入地学习它。 |
| 教师评语: |