视频1 视频21 视频41 视频61 视频文章1 视频文章21 视频文章41 视频文章61 推荐1 推荐3 推荐5 推荐7 推荐9 推荐11 推荐13 推荐15 推荐17 推荐19 推荐21 推荐23 推荐25 推荐27 推荐29 推荐31 推荐33 推荐35 推荐37 推荐39 推荐41 推荐43 推荐45 推荐47 推荐49 关键词1 关键词101 关键词201 关键词301 关键词401 关键词501 关键词601 关键词701 关键词801 关键词901 关键词1001 关键词1101 关键词1201 关键词1301 关键词1401 关键词1501 关键词1601 关键词1701 关键词1801 关键词1901 视频扩展1 视频扩展6 视频扩展11 视频扩展16 文章1 文章201 文章401 文章601 文章801 文章1001 资讯1 资讯501 资讯1001 资讯1501 标签1 标签501 标签1001 关键词1 关键词501 关键词1001 关键词1501 专题2001
spass相关分析实验报告
2025-09-23 22:19:40 责编:小OO
文档

实验主题专业统计软件应用
实验题目相关分析

实训时间  2011 学年  2 学期 15 周 (2011年 5月30日—31日)

学生姓名官其虎学号2009211467班级0360901
实训地点信息管理实验室设备号B25指导教师刘进
一 实验目的

衡量事物之间,或称变量之间线性相关程度的强弱并用适当的统计指标表示出来,这个过程就是相关分析。相关系数是衡量变量之间相关程度的一个指标,总体的相关系数用ρ表示,样本的相关系数用r表示。

理解和学会使用相关分析方法解决问题。

二 实验内容

第一题:K.K.Smith在烟草杂交繁殖的花上收集到如表8.16所示的数据,要求对以上3组数据两两之间进行相关分析,以0.05的显著性水平检验相关系数的显著性。(数据来源:《统计软件SPSS系列应用实践篇》 苏金明 ,电子工业出版社;数据文件:data8-5.sav) 

表8.16 K.K.Smith所调查的长度资料

花瓣长494432423253363937454148453940343735
花枝长27241222132914201212225231820152013
花萼长11612171019151415211422221514151516
1、实验原理:二元变量相关分析

是分析两个变量变量之间的相关关系,称为单相关,三个或以上变量之间的相关关系称为相关,这种相关涉及一个因变量与两个以上的自变量,在实际工作中,如果存在多个自变量与一个因变量的关系,则应抓住其中最主要的因素,研究其相关关系。调用Bivariate过程时允许同时输入两个变量或两个以上变量,但系统输出的是变量间两两相关的相关系数。检测的零假设是两个变量的相关系数为0。

2、实验步骤:

第1步 分析:分析三组数据的两两之间的相关性,而且给出的是具体的数值,这是一个二元相关性问题;

第2步 数据组织:将三个变量分别定义为花瓣、花枝和花萼;

第3步 按Analyze|Correlate|Bivariate顺序打开二元变量的分析主对话框Bivariate Correlations;运行即可(你再单击Options按钮,打开Bivaiate Correlations:Option对话框,选择Statistics方框内的两个复选框,看效果又如何。)

3、实验结果:

 Descriptive Statistics
 MeanStd. DeviationN
 花瓣长40.445.97318
 花枝长19.675.02918
 花萼长16.173.29418
Correlations
花瓣长花枝长花萼长
花瓣长Pearson Correlation1.955**

.797**

Sig. (2-tailed).000.000
Sum of Squares and Cross-poducts606.444487.667266.667
Cvariance35.67328.68615.686
N181818
花枝长Pearson Correlation.955**

1.678**

Sig. (2-tailed).000.002
Sum of Squares and Cross-products487.667430.000191.000
Covariance28.68625.29411.235
N181818
花萼长Pearson Correlation.797**

.678**

1
Sig. (2-tailed).000.002
Sum of Squares and Cross-products266.667191.000184.500
Covariance15.68611.23510.853
N181818
**. Correlation is significant at the 0.01 level (2-tailed).
分析:表中给出了3个变量两两之间的Pearson相关系数(Pearson Correlation)、双侧显著情况 检验概率(Sig.(2-tailed))和数据组数(N)。脚注内容显示相关分析结果在0.01的水平上显著。另外,从表中可以看出,花瓣长和花枝长的数据具有很强的相关性。而双侧检验的显著性概率均小于0.05,因此否定零假设(零假设是变量之间不具有相关性),认为相关系数不为零,变量之间具有相关性。

第二题:试确定1962-1988年安徽省国民收入与城乡居民储蓄存款余额两个变量间的线性相关性,数据如表8.17所示。(数据来源:《数据统计与管理》 1990年第5期,中国商场统计研究会主办;数据文件:data8-6.sav)

表8.17  1962-1988年安徽省国民收入数据表

年份196219631919651966196719681969197019711972197319741975
国民收入(亿元)

34.6135.6739.5247.3254.1450.8649.6951.6165.0672.5777.7283.578287.44
存款余额(亿元)

0.590.10.8511.221.141.321.281.35.61.874.22.552.61
年份1976197719781979198019811982198319841985198619871988
国民收入(亿元)

95.6397.23103.81116.29127.87150.29161.47180.2221.17271.81310.53357.86444.78
存款余额(亿元)

2.743.133.915.758.7612.1916.3620.9528.3238.4355.4374.2.83
1、实验原理:二元变量线性相关性

是分析两个变量变量之间的相关关系,称为单相关,三个或以上变量之间的相关关系称为相关,这种相关涉及一个因变量与两个以上的自变量,在实际工作中,如果存在多个自变量与一个因变量的关系,则应抓住其中最主要的因素,研究其相关关系。调用Bivariate过程时允许同时输入两个变量或两个以上变量,但系统输出的是变量间两两相关的相关系数。检测的零假设是两个变量的相关系数为0。

2、实验步骤:

第1步 分析:分析三组数据的两两之间的相关性,而且给出的是具体的数值,这是一个二元相关性问题;

第2步 数据组织:将2个变量分别定义为国民收入与城乡居民储蓄存款余额;

第3步 按Analyze|Correlate|Bivariate顺序打开二元变量的分析主对话框Bivariate Correlations;运行即可(你再单击Options按钮,打开Bivaiate Correlations:Option对话框,选择Statistics方框内的两个复选框,看效果又如何。)

3、实验结果:

 Descriptive Statistics
 MeanStd. Deviation
 国民收入128.5452106.1875327
 存款余额14.121923.7969327
Correlations
国民收入存款余额
国民收入Pearson Correlation1.976**

Sig. (2-tailed).000
Sum of Squares and Cross-products293170.567137.265
Covariance11275.7912466.818
N2727
存款余额Pearson Crrelation.976**

1
Sig. (2-tailed).000
Sum of Squares and Cross-products137.26514723.639
Covariance2466.818566.294
N2727
**. Correlation is significant at the 0.01 level (2-tailed).
分析:从表中可看出相关系数(Pearson Correlation)为0.976>0,说明呈正相关,而伴随概率sig为0.000<0.05,因此应拒绝零假设(两变量之间不具有相关性),即说明国民收入与城乡居民储蓄存款余额显著性正影响的。

第三题:某高校抽样得到10名短跑运动员,测出100米的名次和跳高的名次如表8.18,问这两个名次是否在0.05的显著性水平下具有相关性。(数据来源:《应用统计学:数据统计方法、数据获取与SPSS应用》 马庆国,科学出版社;数据文件:data8-7.sav)

表8.18 10名运动员的100米及跳高名次

百米名次12345678910
跳高名次43152710896
1、实验原理:二元变量相关分析

2、实验步骤:

第1步 分析:分析三组数据的两两之间的相关性,而且给出的是具体的数值,这是一个二元相关性问题;

第2步 数据组织:将2个变量分别定义为百米名次和跳高名次

第3步 按Analyze|Correlate|Bivariate顺序打开二元变量的分析主对话框Bivariate Correlations;运行即可(你再单击Options按钮,打开Bivaiate Correlations:Option对话框,选择Statistics方框内的两个复选框,看效果又如何。)

3、实验结果:

 Descriptive Statistics
 MeanStd. DeviationN
 百米名次5.503.02810
 跳高名次5.503.02810
Correlations
百米名次跳高名次
百米名次Pearson Correlation1.697*

Sig. (2-tailed).025
Sum of Squares and Cross-products82.50057.500
Covariance9.1676.3
N1010
跳高名次Pearson Correlation.697*

1
Sig. (2-tailed).025
Sum of Squares and Cross-products57.50082.500
Covariance6.39.167
N1010
*. Correlation is significant at the 0.05 level (2-tailed).
分析:从表中可看出相关系数(Pearson Correlation)为0.697>0,说明呈正相关,而伴随概率sig为0.000<0.05,因此应拒绝零假设(两变量之间不具有相关性),即说明百米名次与跳高名次显著性正影响的。

第四题:某公司太阳镜销售情况如表8.19所示,请分析销售量与平均价格、广告费用和日照时间之间的关系,并说明此题用偏相关分析是否有实际意义(显著性水平为0.05)。(数据来源:《SPSS for Windows统计分析(第3版)》 卢纹岱,电子工业出版社;数据文件:data8-8.sav)

表8.19 某公司销售太阳镜的数据

月份123456789101112
销量759014818324226327831825620014080
价格6.86.563.532.92.62.13.13.64.24.2
广告费用2567222528302218102
日照时间2.444.26.888.410.411.59.66.13.42
1、实验原理:偏相关分析

2、实验步骤:

第1步 分析:这4个因素彼此均有影响,分析时应对生长量与4个因素分别求偏相关,在求销售量与一个因素的相关时控制其他因素的影响,然后比较相关系数,按4个因素对销售量的

影响的大小排序。

第2步 定义变量:销售量与平均价格、广告费用和日照时间; 

第3步 按Analyze|Correlate|Partial顺序启动偏相关分析的主对话框,指定分析变量和控制变量,第一次分析变量为销售量与平均价格,其余为控制变量。在主对话框中使用系统默认的双尾检验,显示实际的显著性概率;在Option对话框中选择要求输出各变量的均值和标准差,显示Pearson相关系数矩阵,对缺失值的正理使用系统默认值。

3、实验结果:

 Correlations
 Control Variables销量价格
 广告费用 & 日照时间

销量Correlation1.000-.699
 Significance (2-tailed)..024
 df08
 价格Correlation-.6991.000
 Significance (2-tailed).024.
 df80
Correlations
Control Variables销量广告费用
日照时间 & 价格

销量Correlation1.000.666
Significance (2-tailed)..036
df08
广告费用Correlation.6661.000
Significance (2-tailed).036.
df80
Correlations
Control Variables销量日照时间
价格 & 广告费用

销量Correlation1.000.866
Significance (2-tailed)..001
df08
日照时间Correlation.8661.000
Significance (2-tailed).001.
df80
分析:销量和价格的偏相关分析结果表可得出销量和价格无相关显著性;

销量和广告费用的偏相关分析表可得销量和广告费用无相关显著性;销量和日照时间的偏相关分析表可得销量和日照时间有相关显著性。

第五题:某动物产下3个幼仔,现分别对3个幼仔的长、体重、四肢总长、头重进行测量,试就这几个测量数据而言,用距离分析法分析3个幼仔的相似性,数据如表8.20所示。(数据文件为:data8-9.sav)

表8.20 三个幼仔的数据指标

序号体重四肢总长头重
15021510011
25122011012
35222011212
1、实验原理:距离分析

2、实验步骤:

第1步 分析:这是一个求个案间的相关性(相似性)问题。

第2步 按Analyze|Correlate|Distances打开Distance对话框,并选Between Cases(个案之间)和Similarities(相似性),其它不作任何设置,运行。

3、实验结果:

 Case Processing Summary
 Cases
 ValidMissingTotal
 NPercentNPercentNPercent
 3100.0%0.0%3100.0%
Proximity Matrix
 Euclidean Distance 
123
1.00011.26913.191
211.269.0002.236
313.1912.236.000
This is a dissimilarity matrix
分析:第二个和第三个极相似。

实训的心得与体会

人们在实践中发现,变量之间关系分为两种类型:函数关系和相关关系。函数关系是变量间的一咱确定性关系。但是,在实际问题中,变量间的关系往往并不是那么简单,也就是说,变量之间有着密切关系,但又不能由一个(或几个)变量的值确定另一个变量的值,这种变量之间的关系是不确定性关系,称为相关关系。其特点是:一个变量的取值不能由另一个变量唯一确定,即当自变量x取某个值时,因变量y的值可能会有多个。这种关系不确定的变量显然不能用函数形式予以描述,但也不是杂乱无章、无规律可循的。因此在本章利用spss软件学习了相关分析后,事物之间的相互关系及相似性,就可以很好的通过定量的计算出来而来。

通过本次实验用spass统计分析软件来进相关分析后,感觉统计学中的很多问题不再像以前那么陌生了,同时也感觉统计学不再是想象中那么困难,之前学习统计学最怕的就是对数据进行求解与分析,现在使用这款软件后,让我从之前对统计学的陌生转变为熟悉,从此,在解决统计方面的问题又多了一项解决的工具:spss。下载本文

显示全文
专题