视频1 视频21 视频41 视频61 视频文章1 视频文章21 视频文章41 视频文章61 推荐1 推荐3 推荐5 推荐7 推荐9 推荐11 推荐13 推荐15 推荐17 推荐19 推荐21 推荐23 推荐25 推荐27 推荐29 推荐31 推荐33 推荐35 推荐37 推荐39 推荐41 推荐43 推荐45 推荐47 推荐49 关键词1 关键词101 关键词201 关键词301 关键词401 关键词501 关键词601 关键词701 关键词801 关键词901 关键词1001 关键词1101 关键词1201 关键词1301 关键词1401 关键词1501 关键词1601 关键词1701 关键词1801 关键词1901 视频扩展1 视频扩展6 视频扩展11 视频扩展16 文章1 文章201 文章401 文章601 文章801 文章1001 资讯1 资讯501 资讯1001 资讯1501 标签1 标签501 标签1001 关键词1 关键词501 关键词1001 关键词1501 专题2001
应用回归分析实验报告3
2025-10-03 15:20:51 责编:小OO
文档
应用回归分析实验报告

日期:20 14  年  月  日

班级 13应用统计姓名刘金兴学号2013154020
实验

名称

利用spss软件研究货运总量y(万吨)与工业总产值(亿元)、农业总产值(亿元)、居民非商品支出(亿元)的关系。
问题背景描述:

软件研究货运总量y(万吨)与工业总产值(亿元)、农业总产值(亿元)、居民非商品支出(亿元)的关系。

数据见表3.9.

表3.9

编号

货运总量

y(万吨)

工业总产值x1(亿元)

农业总产值x2(亿元)

居民非商品支出x3(亿元)

116070351.0

226075402.4
321065402.0

426574423.0

524072381.2
622068451.5
727578424.0

816066362.0

927570443.2
1025065423.0

实验目的:

学会运用SPSS软件对数据作回归分析,进一步了解多元线性回归模型的建立过程。
实验原理与数学模型:

从SPSS软件计算的相关阵可以看出,y与,,的相关系数都在0.5以上,说明所选自变量与y是线性相关的

用y与自变量作多元线性回归是合适的。

实验所用软件及版本:IBM SPSS 19.0
主要内容(要点):

(1)计算出 y,,,的相关系数矩阵。

(2)求y关于,,的三元线性回归方程。

(3)对所求得的方程作拟合优度检验。

(4)对回归方程做显著性检验。

(5)对每一个回归系数作显著性检验。

(6)如果有的回归系数没通过显著性检验,将其剔除,重新建立回归方程,在作回归方程的显著性检验和回归系数的显著性检验。

(7)求出每一个回归系数的置信水平为%95的置信区间。

(8)求标准化回归方程。

(9)求当,给定的置信水平为%95,用SPSS软件计算精确置信区间,用手工计算近似预测区间。

(10)结合回归方程对问题作一些基本分析。

实验过程记录(含基本步骤、主要程序清单及异常情况记录等):

(1)由SPSS软件可得相关系数表如下

相关性

yx1x2x3
Pearson 相关性

y1.000.556.731.724
x1.5561.000.113.398
x2.731.1131.000.547
x3.724.398.5471.000
Sig. (单侧)

y..048.008.009
x1.048..378.127
x2.008.378..051
x3.009.127.051.
Ny10101010
x110101010
x210101010
x310101010
由相关系数表得相关系数矩阵为

(2)对数据利用SPSS软件作线性回归,得相关系数表如下:

系数a

模型非标准化系数标准系数tSig.
B标准 误差

试用版
1(常量)

-348.280176.459-1.974.096
x13.7541.933.3851.942.100
x27.1012.880.5352.465.049
x312.44710.569.2771.178.284
a. 因变量: y

由表可得y关于,,的三元线性回归方程为

(3)对所求得的方程作显著性检验:

模型汇总
模型RR 方

调整 R 方

标准 估计的误差

1.8a

.806.70823.44188
模型汇总
模型RR 方

调整 R 方

标准 估计的误差

1.8a

.806.70823.44188
a. 预测变量: (常量), x3, x1, x2。

由上表可知,调整后的决定系数为0.708,说明回归方程对样本观测值得拟合程度较好。

(4)利用SPSS软件可以得到方差分析表:

Anovab

模型平方和df均方FSig.
1回归13655.37034551.7908.283.015a

残差3297.1306549.522
总计16952.5009
a. 预测变量: (常量), x3, x1, x2。

b. 因变量: y

原假设:

F统计量服从自由度为(3,6)的F分布,给定显著性水平=0.05,查表得,由方查分析表得,F值=8.283>4.76,p值=0.015,拒绝原假设,由方差分析表可以得到,说明在置信水平为95%下,回归方程显著。

(5)对每一个回归系数做显著性检验:
系数a

模型非标准化系数标准系数tSig.
B标准 误差

试用版
1(常量)

-348.280176.459-1.974.096
x13.7541.933.3851.942.100
x27.1012.880.5352.465.049
x312.44710.569.2771.178.284
a. 因变量: y

做t检验:设原假设为,

统计量服从自由度为n-p-1=6的t分布,给定显著性水平0.05,查得单侧检验临界值为1.943,X1的t值=1.942<1.943,处在否定域边缘。

X2的t值=2.465>1.943。拒绝原假设。

由上表可得,在显著性水平时,只有的P值<0.05,通过检验,即只有的回归系数较为显著 ;其余自变量的P值均大于0.05,即x1,x2的系数均不显著。

(6)根据提议可有:

系数a

模型非标准化系数标准系数tSig.
B标准 误差

试用版
系数a

模型非标准化系数标准系数tSig.
B标准 误差

试用版
1(常量)

-348.280176.459-1.974.096
x13.7541.933.3851.942.100
x27.1012.880.5352.465.049
x312.44710.569.2771.178.284
2(常量)

-459.624153.058-3.003.020
x14.6761.816.4792.575.037
x28.9712.468.6763.634.008
1(常量)

-348.280176.459-1.974.096
x13.7541.933.3851.942.100
x27.1012.880.5352.465.049
x312.44710.569.2771.178.284
2(常量)

-459.624153.058-3.003.020
x14.6761.816.4792.575.037
x28.9712.468.6763.634.008
a. 因变量: y

选择模型二,重新建立的回归方程为:

Anovac

模型平方和df均方FSig.
1回归13655.37034551.7908.283.015a

残差3297.1306549.522
总计16952.5009
2回归123.199246.60011.117.007b

残差4059.3017579.900
总计16952.5009
a. 预测变量: (常量), x3, x1, x2。

b. 预测变量: (常量), x1, x2。

c. 因变量: y

模型汇总

模型RR 方

调整 R 方

标准 估计的误差

更改统计量
R 方更改

F 更改

df1df2Sig. F 更改

1.8a

.806.70823.44188.8068.28336.015
2.872b

.761.69224.08112-.0451.38716.284
a. 预测变量: (常量), x3, x1, x2。

b. 预测变量: (常量), x1, x2。

对新的回归方程作显著性检验:

原假设:

F服从自由度为(2,7)的F分布,给定显著性水平=0.05,查表得,由方差分析表得,F值=11.117>4.74,p值=0.007,拒绝原假设.

认为在显著性水平=0.05下,x1,x2整体上对y有显著的线性影响,即回归方程是显著的。

对每一个回归系数做显著性检验:

做t检验:设原假设为,统计量服从自由度为n-p-1=7的t分布,给定显著性水平0.05,查得单侧检验临界值为1.5,X1的t值=2.575>1.5,拒绝原假设。故

显著不为零,自变量X1对因变量y的线性效果显著;

同理β2也通过检验。同时从回归系数显著性检验表可知:X1,X2的p值 都小于0.05,可认为对x1,x2分别对y都有显著的影响。

(7)

系数a

模型非标准化系数标准系数tSig.B 的 95.0% 置信区间

B标准 误差

试用版下限上限
1(常量)

-348.280176.459-1.974.096-780.06083.500
x13.7541.933.3851.942.100-.9778.485
x27.1012.880.5352.465.049.05314.149
x312.44710.569.2771.178.284-13.41538.310
2(常量)

-459.624153.058-3.003.020-821.547-97.700
x14.6761.816.4792.575.037.3818.970
x28.9712.468.6763.634.0083.13414.808
a. 因变量: y

由回归系数表可以看到,β1置信水平为95%的置信区间[0.381,8.970],

β2置信水平为95%的置信区间[3.134,14.808]

(8)由回归系数表(上表)可得,标准化后的回归方程为:

(9)

系数a

模型非标准化系数标准系数tSig.B 的 95.0% 置信区间

B标准 误差

试用版下限上限
1(常量)

-348.280176.459-1.974.096-780.06083.500
x13.7541.933.3851.942.100-.9778.485
x27.1012.880.5352.465.049.05314.149
x312.44710.569.2771.178.284-13.41538.310
2(常量)

-459.624153.058-3.003.020-821.547-97.700
x14.6761.816.4792.575.037.3818.970
x28.9712.468.6763.634.0083.13414.808
由SPSS输出结果可知,当时,(见上表),的置信度为95%的精确预测区间为(204.4,331.2)(见下表),的置信度为95%的近似预测区间为,手工计算得:(219.6,316.0)。

(10)由回归方程

可知农业总产值固定的时候,工业总产值每增加1亿元,货运总量增加4.676万吨;工业总产值固定的时候,农业总产值每增加1亿元,货运总量增加8.971万吨。而居民非商品支出对货运总量没有显著的线性影响。由标准化回归方程可知:

工业总产值、农业总产值与Y都是正相关关系,比较回归系数的大小可知农业总产值X2对货运总量Y的影响程度大一些。

思考与深入:

通过在计算机上作SPSS实验,我深刻地认识到了专业的重要性,以及这门学科对社会和科学的作用。

我对SPSS软件的了解还不够深入,我会在以后的学习中深入地学习它。
教师评语:
                                  .                 下载本文
显示全文
专题