视频1 视频21 视频41 视频61 视频文章1 视频文章21 视频文章41 视频文章61 推荐1 推荐3 推荐5 推荐7 推荐9 推荐11 推荐13 推荐15 推荐17 推荐19 推荐21 推荐23 推荐25 推荐27 推荐29 推荐31 推荐33 推荐35 推荐37 推荐39 推荐41 推荐43 推荐45 推荐47 推荐49 关键词1 关键词101 关键词201 关键词301 关键词401 关键词501 关键词601 关键词701 关键词801 关键词901 关键词1001 关键词1101 关键词1201 关键词1301 关键词1401 关键词1501 关键词1601 关键词1701 关键词1801 关键词1901 视频扩展1 视频扩展6 视频扩展11 视频扩展16 文章1 文章201 文章401 文章601 文章801 文章1001 资讯1 资讯501 资讯1001 资讯1501 标签1 标签501 标签1001 关键词1 关键词501 关键词1001 关键词1501 专题2001
沈阳建筑大学统计学实验报告超级完整版
2025-10-03 15:21:01 责编:小OO
文档
学号: 

实验报告

课程名称:   统计学     学年、学期:  2014年秋季       

实验学时:     16       实验项目数:       四          

实验人姓名:         专业班级:    

                            

实验一:统计软件Spss、Excel介绍;数据的图表展示

实验日期:  2014  年 11  月 20  日

第   十三   教学周

主要实验内容

统计软件Spss、Excel的应用介绍;利用软件进行统计数据的整理和绘制各种统计图表。作业:练习题2.1、2.2、2.3、2.4

实验操作记录:

2.1(1)用Excel绘制频数分布表:选择【插入】菜单中的【数据透视表或数据透视图】

   (2)用Excel绘制条形图:绘制好频数分布表,选择表中数据,然后选择【插入】中的【条形图】

   (3)用Excel绘制帕累托图:绘制好条形图,然后将条形图中的数据按升序或降序顺序重新排列

   (4)用Spass绘制饼图:【Graphs】—>【Interactive-Pie-Clustered】,第2步将某个分类变量选入【Slice】点击【Pies】

2.2(1)用Excel生成定量数据的频数分布表:【数据】——>【数据分析】——>【直方图】,选择【图表输出】单击【确定】

   (2)用Excel绘制直方图:输入输出区域,然后选择【数据】——>【数据分析】——>【直方图】

   (3)用Spass绘制茎叶图:【Analyze】——>【Descriptive statistics-Explore】第2步:将变量选入【Variables】

2.3(1)用Excel绘制环形图:绘制好频数分布表,选择表中数据,然后选择【插入】中的【环形图】再选【环形图】

   (2)用Excel绘制雷达图:绘制好频数分布表,选择表中数据,然后选择【插入】中的【其他图表】再选【雷达图】

2.4  用Excel绘制箱线图:绘制好频数分布表,选择表中数据,然后选择【插入】中的【其他图表】再选【箱线图】

实验总结:通过此次试验,加深了我对Excel和Spass操作软件的应用了解,同时能更好的把实践与理论相结合。首先进行的就是对统计数据的输入与分析。这个输入过程,既要细心也要用心。画图时,不仅是仔细的输入一组数据就可以,还要考虑到整个数据模型的要求,合理而正确的分配输入数据。

教师评语:
本次实验成绩项目预习实验过程 作业

报告书写出勤和课堂纪律其他
得分
成绩合计:
教师签字:批改日期:
2.1为评价家电行业售后服务的质量,随机抽取由100个家庭构成的一个样本。质量服务的等级分别表示为:A.好;B.较好;C.一般;D.较差;E.差。调查结果如下:(数据略)

(1)制作一张频数分布表。

家电行业售后服务质量评价等级频数表
评价等级频数频率
A1414%
B2121%
C3232%
D1818%
E1515%
总计1001
(2)制作一张条形图,反映评价等级的分布。

(3)绘制评价等级的帕累托图。

(4)制作一张饼图,反映评价等级的构成。

2.2为确定灯泡的使用寿命(单位:小时),在一批灯泡中随机抽取100只进行测试,所得数据如下:(数据略)

 (1)以组距为10进行分组,整理成频数分布表。

灯泡使用寿命频数分布表
按销售额分组(万元)频数频率
650-66020.02 
660-67050.05 
670-68060.06 
680-690140.14 
690-700260.26 
700-710180.18 
710-720130.13 
720-730100.10 
730-74030.03 
740-75030.03 
合计1001.00 

答:从直方图可以直观地看出,灯泡使用寿命的分布基本上是对称的,右边的尾部稍长一些,灯泡使用寿命接近正态分布。

(3)制作茎叶图,并与直方图作比较。

使用寿命 Stem-and-Leaf Plot

 Frequency    Stem &  Leaf

1.00 Extremes (=<651)

     1.00       65 .  8

     2.00       66 .  14

     3.00       66 .  568

     3.00       67 .  134

     3.00       67 .  679

     7.00       68 .  1123334

     7.00       68 .  555

    13.00       69 .  0011112223344

    13.00       69 .  556667788

     8.00       70 .  00112234

    10.00       70 .  56667788

     6.00       71 .  002233

     7.00       71 .  56778

     4.00       72 .  0122

     6.00       72 .  5679

     1.00       73 .  3

     2.00       73 .  56

     1.00       74 .  1

     1.00       74 .  7

1.00 Extremes (>=749)

 Stem width:        10

 Each leaf:       1 case(s)

答:比较直方图与茎叶图:直方图的数据分布很方便,但原始数据看不到了,茎叶图则不同,不仅可以看出数据的分布,还能保留原始数据的信息。

2.3甲、乙两班有40名学生,期末统计学考试成绩的分布如下:

(1)画出两个班考试成绩的环形图,比较它们的构成。

(2)画出雷达图,比较两个班考试成绩的分布是否相似。

答:从图中可以看出甲、乙两班的成绩分布不相似,没有相似性。

2.4 下表是我国10个城市2006年各月份的气温(°C)数据:(数据略)

绘制各城市月气温的箱线图,并比较各城市气温分布的特点

答:从箱线图可看出,这10个城市的月气温存在较大差异,离散程度高的城市为沈阳、北京、郑州、武汉;离散程度低的为海口、昆明、广州。月气温较高的城市主要为中位数较大的海口、广州,月气温较低的为城市中位数较小的沈阳;月气温分布较对称的城市主要有北京、沈阳;月气温分布不对称的城市主要有:海口;月气温存在极值的城市有沈阳、北京、重庆。

实验二:用统计量描述数据;概率分布;参数估计

实验日期:  2014  年 11  月 27  日

第  十四    教学周

主要实验内容

利用Spss、Excel软件对数据进行概括性度量、计算概率分布的概率及概率值,进行参数估计。作业:练习题3.5、4.4、5.3、5.7

实验操作记录:

3.5 用Excel计算描述统计量: 【工具】——>【数据分析】——> 【描述统计】——>【确定】——>【输入区域】——>【输出选项】——>【汇总统计】

4.4 用Spass绘制正态概率图:第1步:【Analyze】——>【Descrictive Statistics】——>【P-P Plot】或【Q-Q  Plot】

5.3 用Spass求置信区间:第1步:选择【Analyze】然后选择 【Descriptive statistics-Explore】选项进入主对话框

5.7 用Spass求两个总体均值之差的区间估计:【Analyze】——>【Compare Means—Paired- Samples T Test】将两个样本同时选入【Paired Variables】

实验总结:实验二主要是对描述统计量的计算,像众数,中位数,标准误差,方差,峰度,偏度,置信度等等。通过这次试验,我进一步熟悉了这些描述统计量的计算公式,懂得了该怎么算这些描述统计量,此外,我还掌握了一些数据统计方面的技能:利用EXCEL进行数据处理、描述性统计及区间估计。在具体的操作过程中,我感受到,合理并充分利用EXCEL对我们进行数据统计具有很大的作用,能够使我们更加直观地看到数据,一目了然。

教师评语:
本次实验成 绩

项目预习实验过程练习题报告书写出勤和实验纪律

其他
得分
成绩合计:
教师签字:批改日期:
3.5一种产品需要人工组装,现有3种可供选择的组装方法。为检验哪种方法更好,随机抽取15个工人,让他们分别用3种方法组装。

列1 列2 列3 
平均165.6平均128.7333平均125.5333
标准误差0.550325标准误差0.452155标准误差0.716251
中位数165中位数129中位数126
众数1众数128众数126
标准差2.131398标准差1.75119标准差2.774029
方差4.542857方差3.066667方差7.695238
峰度-0.1345峰度0.454621峰度11.66308
偏度0.351371偏度-0.17448偏度-3.23793
区域8区域7区域12
最小值162最小值125最小值116
最大值170最大值132最大值128
求和2484求和1931求和1883
观测数15观测数15观测数15
答:(1)从集中度,离散度和分布形状三个角度统计量来评价。从集中度看,方法A的平均水平最高,方法C最低;从离散程度看,方法A离散系数最小方法C最大;从分布形状看,方法A和方法B偏斜程度都不大,方法C则较大。

    (2)综合来看,应选择方法A,因为平均水平较高且离散程度小。

4.4由30辆汽车构成的一个随机样本,绘制正态概率图。

答:由正态概率图可以看出,汽车耗油量基本服从正态分布。

5.3某大学为了解学生每天上网的时间,在全校学生中随机抽取36人,调查他们每天上网的时间(单位:小时),得到数据如下:(数据略)

求该校大学生平均上网时间的置信区间,置信水平分别为90%,95%和99%。

One-Sample Statistics
NMeanStd. DeviationStd. Error Mean
加班时间1813.567.8011.839
One-Sample Test
Test Value = 0                                       
tdfSig. (2-tailed)Mean Difference95% Confidence Interval of the Difference
LowerUpper
加班时间7.37317.00013.5569.6817.43
平均数方差标准差置信水平置信下限置信上限
3.322.591.6190%2.883.76
95%2.793.84
99%2.634.01
5.7一家人才测评机构对随机抽取的10名小企业的经理人用两种方法进行自信心测试,得到自信心测试分数如下:(数据略)

构建两种方法平均自信心得分之差μd=μ1-μ2的95%的置信区间。

Paired Samples Statistics
MeanNStd. DeviationStd. Error Mean
Pair 1方法1

72.601014.0734.450
方法2

61.601014.7594.667
Paired Samples Correlations
NCorrelationSig.
Pair 1方法1 & 方法2

10.8.000
Paired Samples Test
Paired DifferencestdfSig. (2-tailed)
MeanStd. DeviationStd. Error Mean95% Confidence Interval of the Difference
LowerUpper
Pair 1方法1 - 方法2

11.0006.5322.0666.32715.6735.3259.000
答:从表中可以看出两种方法平均自信心得分之差μd=μ1-μ2的95%的置信区间为(6.327,15.673)

实验三:假设检验; 分类变量的推断;方差分析与实验设计

实验日期:  2014  年 12 月 4  日

第  十五    教学周

主要实验内容

利用Spss、Excel软件对数据进行假设检验、分类变量的推断、方差分析与实验设计。作业:练习题6.9、7.2、7.4、8.3、8.6

实验操作记录:

6.9(1)1)用Excelt-检验:双样本等方差假设:第1步:将原始数据输入到Excel工作表格中, 选【工具】——>【数据分析】——>【t-检验:双样本等方差假设】 

        2) 用Excelt-检验:双样本异方差假设:第1步:将原始数据输入到Excel工作表格中, 选【工具】——>【数据分析】——>【t-检验:双样本异方差假设】  

(2)用Excelt-检验:F-检验  双样本方差:第1步::【工具】——> 【数据分析】——>【F-检验  双样本方差】

7.2 Spass—期望频数不等拟合优度:先指定“频数”变量,【Analyze】→【NonparametricTest】→【Chi Square】将频数变量选入【Test Variable List】

7.4  Spass性检验:将列联表中的数据转换为原始数据形式,【Analyze】→【Descriptive Statistics-Crosstabs】,行变量【Row(s)】,列选入【Column(s)】

8.3  Excel单因素方差分析:选择“工具 ”下拉菜单,【数据分析】,然后选择【单因素方差分析】选择【确定】,出现 对话框

8.6  Excel: 可重复双因子分析:选择“工具”下拉菜单,并选择【数据分析】选项,在分析工具中选择【方差分析:可重复双因子分析】

    Spass:可重复双因子分析:选择【Analyze】,并选择【General Linear Model-Univaiate】进入主对话框。

实验总结:实验三是对正态整体的均值,比例和方差进行假设检验,在实验过程中,许多地方让我卡住了,后来通过与老师的交流得知了正确的方法,这才知道是课本知识掌握的不够好。除此之外,实验三还进行了方差分析, 这与之前的实验比较相似,都是用到数据分析这个工具,主要的工作量集中在数据的输入和数据的分析方面,比较难的就是就是在根据输入的数据作出数据表,然后要进行数据分析。

教师评语:
本次实验成 绩

项目预习实验过程练习题报告书写出勤和实验纪律

其他
得分
成绩合计:
教师签字:批改日期:
6.9为比较新旧两种肥料对产量的影响,以便决定是否采用新肥料。研究者选择了面积、土壤等条件相同的40块田地,分别施用新旧两种肥料,得到的产量数据如下:(数据略)去显著性水平α=0.05,检验:

(1)新肥料获得的平均产量是否显著地高于旧肥料?假设条件为:

1)两种肥料产量的方差未知但相等,即σ1²=σ2²。 

2)两种肥料产量的方差未知且不相等,即σ1²≠σ2²。

解:(1)设μ1=新肥料,μ2=旧肥料。H0: μ1-μ2≥0;H1: μ1-μ2<0。

                      t-检验: 双样本等方差假设

 变量 1变量 2
平均100.7109.9
方差24.11574733.357474
观测值2020
合并方差28.73684211
假设平均差0
df38
t Stat-5.427106029
P(T<=t) 单尾1.73712E-06
t 单尾临界1.68595446
P(T<=t) 双尾3.47424E-06
t 双尾临界2.0243941 
1)t=-5.427,P=1.73712E-06,拒绝原假设,新肥料获得的平均产量显著地高于旧肥料。

                      t-检验: 双样本异方差假设

 变量 1变量 2
平均100.7109.9
方差24.11574733.357474
观测值2020
假设平均差0
df37
t Stat-5.427106029
P(T<=t) 单尾1.87355E-06
t 单尾临界1.68709362
P(T<=t) 双尾3.74709E-06
t 双尾临界2.026192463 
2)P=1.87355E-06,拒绝原假设,新肥料获得的平均产量显著地高于旧肥料

                   F-检验 双样本方差分析

 变量 1变量 2
平均100.7109.9
方差24.11574733.357474
观测值2020
df1919
F0.722940991
P(F<=f) 单尾0.243109655
F 单尾临界0.4612010 
(2)提出假设:H0:σ1²/σ2²=1;H1: σ1²/σ2²=1

由于P=0.243109655>0.025,不拒绝原假设,没有证据表明两种肥料的方差有显著差异。

7.2一家电视台为了解观众对某档娱乐节目的喜欢程度,对不同年龄段的男女观众进行了调查。

男性
Observed NExpected NResidual
557.0-2.0
6628.1-22.1
121213.2-1.2
161610.55.5
25255.319.7
Total
Test Statistics
男性
Chi-Square94.942a

df4
Asymp. Sig..000
a.0 cells (.0%) have expected frequencies less than 5. The minimum expected cell frequency is 5.3.

解:提出假设:H0:男性观众喜欢该档娱乐节目的比例和女性一致;H1:男性观众喜欢该档娱乐节目的比例和女性不一致

由于P=0.858>0.05,不拒绝原假设,表明男性观众喜欢该档娱乐节目的比例和女性一致。

7.4为分析不同地区的消费者与所购买的汽车价格是否有关,一家汽车企业的销售部门对东部地区、中部地区和西部地区的四百个消费者做抽样调查,检查地区与 所购买的汽车价格是否有关。

Case Processing Summary
Cases
ValidMissingTotal
NPercentNPercentNPercent
汽车价格 * 地区

400100.0%0.0%400100.0%
ValuedfAsymp. Sig. (2-sided)
Pearson Chi-Square29.991a

6.000
Likelihood Ratio30.6836.000
N of Valid Cases400
a. 0 cells (.0%) have expected count less than 5. The minimum expected count is 21.00.
汽车价格 * 地区 Crosstabulation

地区Total
东部地区西部地区中部地区
汽车价格10—20万元

Count505060160
Expected Count56.048.056.0160.0
10万元以下

Count204040100
Expected Count35.030.035.0100.0
20—30万元

Count30202070
Expected Count24.521.024.570.0
30万元以上

Count40102070
Expected Count24.521.024.570.0
TotalCount140120140400
Expected Count140.0120.0140.0400.0
解:提出假设:H0:地区与所购买的汽车价格;H1:地区与所购买的汽车价格不

由于P值接近于0,拒绝原假设,表明地区与所购买的汽车价格不。

8.3  某家电制造公司准备购进一批5#电池,现有A、B、C三个电池生产企业愿意供货,为比较它们生产的电池质量,从每个企业各随机抽取5只电池,经试验得其寿命(单位:h)数据如下。试分析三个企业生产的电池的平均寿命之间有无显著差异(α =0.05)。如果有差异,试用多重比较检验哪些企业之间有差异?

解:单因素方差分析:提出假设: 

H0 : α1= α2 = α3   ; H1 : α1,α2 ,α3  不全为0    

SUMMARY
观测数求和平均方差
列 1522244.428.3
列 251503010
列 3521342.615.8
方差分析
差异源SSdfMSFP-valueF crit
组间615.62307.817.068390.000313.885294
组内216.41218.03333
总计83214    
由于  F= 17.07 >F0.05(2,12) = 3.,因此拒绝原假设H0,即三个企业生产的电池的平均寿命之间有显著差异。

     多重比较检验: 

一:提出假设: 

检验1:H0 :α1 =α2    H1: α1≠α2  

检验2:H0 :α1 =α3    H1: α1≠α3 

检验3:H0 :α2=α3    H1: α2≠α3 

二:计算检验的统计量:  

|y1-y2|=14.4    |y1-y3|=1.8    |y2-y3|=12.6 

三:计算LSD

根据方差分析表可知,MSE=18.03333。t分布的自由度为n-k=12,根据LSD计算公式计算LSD=5.85 

四:做出决策 

|y1-y2|=14.4 >5.85,拒绝H0 ,A企业和B企业的电池的平均寿命之间有显著差异 

|y1-y3|=1.8<5.85, 不拒绝H0  ,A企业和C企业的电池的平均寿命之间没有显著差异 

|y2-y3|=12.6>5.85拒绝H0 ,B企业和C企业的电池的平均寿命之间有显著差异。

8.6城市道路交通管理部门为研究不同的路段和不同的时段对行车时间的影响,让一名交通分别在 3 个路段的高峰期与非高峰期亲自驾车进行试验,通过试验共获得 30 个行车时间的数据单位:分。试分析路段、时段以及路段和时段的交互作用对行车时间的影响 α =0.05。

Exel:

      方差分析:可重复双因素分析

SUMMARY路段1路段2路段3总计
高峰期    
观测数55515
求和181.4151.8172.2505.4
平均36.2830.3634.4433.69333
方差2.2672.5182.7238.702095
非高峰期    
观测数55515
求和150121141.4412.4
平均3024.228.2827.49333
方差5.2656.0255.79711.22067
总计   
观测数101010
求和331.4272.8313.6
平均33.1427.2831.36
方差14.3026714.3373314.32711
方差分析
差异源SSdfMSFP-valueF crit
355.7787939.5309623.008884.18E-082.456281
180.5147290.2573352.534023.06E-083.554557
误差30.92533181.718074
总计567.218729    
解:H0:无影响   H1:有影响

1. 路段对行车时间的影响 

P=4.18E-08<α=0.05,表明路段对行车时间的影响显著。 

2. 时段以对行车时间的影响 

P=3.06E-08<α=0.05,表明时段以对行车时间的影响显著。 

3.路段和时段的交互作用对行车时间的影响 

F=0.026956< F crit=3.885294,表明路段和时段的交互作用对行车时间的影响显著。

Spass:

Between-Subjects Factors
N
时段非高峰期15
高峰期15
路段路段1

10
路段2

10
路段3

10
Tests of Between-Subjects Effects
Dependent Variable:行车时间

SourceType III Sum of SquaresdfMean SquareFSig.
Corrected Model468.815a

3156.27241.290.000
Intercept28078.561128078.5617418.830.000
时段288.3001288.30076.174.000
路段180.515290.25723.848.000
Error98.404263.785
Total285.78030
Corrected Total567.21929
a. R Squared = .827 (Adjusted R Squared = .806)
实验四:一元线性回归;多元线性回归;时间序列预测及对实际数据进行分析

实验日期:   2014   年 11  月 11  日

第  十六    教学周

主要实验内容

利用Spss、Excel软件进行一元线性回归、多元线性回归、时间序列预测及对实际数据进行综合分析。作业:练习题9.2、9.3、11.1、11.3

实验操作记录:

9.2:选择【Analyze】 【Correlate - Bivariate】,将两个变量(本例为销售收入和 广告费用)分别选入【Variables】,点击【OK】。

9.3:选择【工具】下拉菜单,并选择【数据分析】选项在分析工具中选择【回归】,选择【确定】。

11.1:选择【工具】→数据分析。在分析工具中选择【移动平均】,单击确定。

11.3:选择【Analyze-Forecasting】 【Create models】,进入主对话框,将预测变量选入【Dependent Variables】。在【Method】下选择【Exponential Smoothing】,点击【Criteria】,在【Model Type】下选择【Simple】(进行简单指数平滑预测),点击【Continue】返回主对话框。

实验总结:通过本次实验,我不仅仅是掌握操作步骤完成了实验任务,更重要的是在实验中验证自己的所学知识的掌握和运用。统计学的学习就是对数据的学习,而通过实验可以加强我们对统计数据的认知和运用,更好的学习统计学的知识。经过了几节课的实验,我发现做实验有许多需要注意的地方,尤其输入数据时不能出错,只有掌握了这些技巧才能让实验结果变的更加准确和方便。

教师评语:
本次实验成 绩

项目预习实验过程练习题报告书写出勤和实验纪律

其他
得分
成绩合计:
教师签字:批改日期:
9.2下面是7个地区2000年的人均国内生产总值(GDP)和人均消费水平的统计数据:(数据略)

(1)绘制散点图,计算相关系数,说明二者之间的关系。

(2)以人均GDP作自变量,人均消费水平作因变量,利用最小二乘法求出估计的回归方程,并解释回归系数的实际意义。

(3)计算判定系数和估计标准误差,并解释其意义。

(4)检验回归方程线性关系的显著性。(ɑ=0.05)

(5)如果某地区的人均GDP为5000元,预测其人均消费水平。

(6)求人均GDP为5000元时,人均消费水平95%的置信区间和预测区间。

Model Summaryb

ModelRR SquareAdjusted R SquareStd. Error of the Estimate
1.998a

.996.996247.303
a. Predictors: (Constant), 人均GDP(元)

b.Dependent Variable: 人均消费水平(元)

ANOVAb

ModelSum of SquaresdfMean SquareFSig.
1Regression8.144E718.144E71331.692.000a

Residual305795.034561159.007
Total8.175E76
a. Predictors: (Constant), 人均GDP(元)

b. Dependent Variable: 人均消费水平(元)

Coefficientsa
 ModelUnstandardized CoefficientsStandardized CoefficientstSig.
 BStd. ErrorBeta
 1(Constant)734.693139.5405.265.003
 人均GDP(元)

.309.008.99836.492.000
 a. Dependent Variable: 人均消费水平(元)

 Residuals Statisticsa
 MinimumMaximumMeanStd. DeviationN
 Predicted Value1556.4111398.764515.573684.3137
 Std. Predicted Value-.8031.868.0001.0007
 Standard Error of Predicted Value93.871210.510127.36838.2097
 Adjusted Predicted Value1539.1711011.394473.543583.0767
 Residual-341.707290.035.000225.7567
 Std. Residual-1.3821.173.000.9137
 Stud. Residual-1.6121.268.0531.0947
 Deleted Residual-4.815534.61342.035350.1687
 Stud. Deleted Residual-2.0791.376.0061.2377
 Mahal. Distance.0073.490.8571.1847
 Cook's Distance.0101.693.359.6087
 Centered Leverage Value.001.582.143.1977
 a.Dependent Variable: 人均消费水平(元)

(1)由excel的CORREL函数计算相关系数=0.998128,说明人均GDP和人均消费水平高度相关。

(2)ˆβ1=0.308683 ,ˆβ0=734.6928

y =734.6928+0.308683x

回归系数的含义:人均GDP每增加1元,人均消费增加0.309元。

(3)判定系数R²=0.996,估计标准误差=247.303

意义:人均GDP对人均消费水平的影响达到99.6%。

(4)设H0:β1=0,人均消费水平与人均GDP之间的线性关系不显著。

F=1331.6921,Fɑ=6.61,F>Fɑ,拒绝原假设,即线性关系显著。

(5)y =734.6928+0.308683x=734.6928+0.308683×5000=2278.1078(元)

(6)置信区间为(1990.74915,2565.46399)

9.3随机抽取10家航空公司,对其最近一年的航班正点率和顾客投诉次数金子那个调查,所得数据如下:(数据略)

(1)用航班正点率作自变量,顾客投诉次数作因变量,求出估计的回归方程,并解释其意义。

(2)检验回归系数的显著性。(ɑ=0.05)

(3)如果航班的正点率为80%,估计顾客的投诉次数。

Model Summaryb

ModelRR SquareAdjusted R SquareStd. Error of the Estimate
1.869a

.755.72418.887
a. Predictors: (Constant), 航班正点率(%)

b.Dependent Variable: 投诉次数(次)

ANOVAb

ModelSum of SquaresdfMean SquareFSig.
1Regression8772.58418772.58424.592.001a

Residual2853.8168356.727
Total11626.4009
a. Predictors: (Constant), 航班正点率(%)

b. Dependent Variable: 投诉次数(次)

Coefficientsa
 ModelUnstandardized CoefficientsStandardized CoefficientstSig.
 BStd. ErrorBeta
 1(Constant)430.172.1555.962.000
 航班正点率(%)

-4.701.948-.869-4.959.001
 a. Dependent Variable: 投诉次数(次)

 Residuals Statisticsa
 MinimumMaximumMeanStd. DeviationN
 Predicted Value.55108.2073.6031.22110
 Std. Predicted Value-2.3401.108.0001.00010
 Standard Error of Predicted Value5.97515.57.9572.98810
 Adjusted Predicted Value-41.80102.9969.4942.14410
 Residual-24.67824.615.00017.80710
 Std. Residual-1.3071.303.000.94310
 Stud. Residual-1.4511.710.0751.12710
 Deleted Residual-30.42559.8044.11528.04710
 Stud. Deleted Residual-1.5812.009.1001.22010
 Mahal. Distance.0015.474.9001.65710
 Cook's Distance.0013.551.4411.09610
 Centered Leverage Value.000.608.100.18410
 a. Dependent Variable: 投诉次数(次)

(1)y=430.1-4.701x

回归系数的意义:回归系数-4.701表示航班正点率每增加1%,顾客投诉次数平均下降4.7次。

(2)检验回归系数显著性:P=0.0011<0.05,表明回归系数显著,即航班正点率对投诉次数有显著影响。

(3)航班正点率为80%时估计投诉次数为54.139;

航班正点率为80%时,平均投诉次数预测区间为(54.139±16.479);

航班正点率为80%时,某一特定航空公司投诉次数预测区间为(54.13±46.567);

11.1下表是1991-2008年我国小麦产量(单位:万吨)数据:(数据略)

(1)分别采用3期移动平均法和指数平滑法(ɑ=0.3)预测2009年的小麦产量。将实际值和预测值绘图进行比较。

(2)分析预测误差,说明哪种方法预测更合适?

解:(1)

年份小麦产量移动平均法指数平滑法
K=3预测误差ɑ=0.3预测误差
19919595.3     
199210158.7 9595.3 563.4 
199310639.0 10131.0 508.0 97.3 874.7 
19949929.7 10242.5 -312.8 10026.7 -97.0 
199510220.7 10263.1 -42.4 9997.6 223.1 
199611056.9 10402.4 654.5 100.5 992.4 
199712328.9 11202.2 1126.7 10362.2 1966.7 
199810972.6 11452.8 -480.2 10952.2 20.4 
199911388.0 11563.2 -175.2 10958.4 429.6 
20009963.6 10774.7 -811.1 11087.2 -1123.6 
20019387.3 10246.3 -859.0 10750.2 -1362.9 
20029029.0 9460.0 -431.0 10341.3 -1312.3 
200388.8 9021.7 -372.9 9947.6 -1298.8 
20049195.2 57.7 237.5 9558.0 -362.8 
20059744.5 9196.2 548.3 9449.1 295.4 
200610846.6 9928.8 917.8 9537.7 1308.9 
200710929.8 10507.0 422.8 9930.4 999.4 
200811246.4 11007.6 238.8 10230.2 1016.2 
200911088.1 10535.1 
预测误差和  1170.0  3132.6 
(1)3期移动平均法预测值为11088.1万吨,指数平滑法预测值为10535.1万吨。

(2)移动平均法的预测误差比指数平滑法的小,所以前者更合适。

11.3下表是某只股票连续35个交易日的收盘价格。分别拟合回归直线

ˆYt=b0+b1t、二阶曲线ˆYt=b0+b1t+b2t²和三阶曲线ˆYt=b0+b1t+b2t²+b3t³,并对结果进行比较。

直线 

二阶曲线 

三阶曲线 

Intercept374.1613Intercept381.42Intercept372.5617
X Variable 1-0.6137X Variable 1-1.8272X Variable 11.0030
  X Variable 20.0337X Variable 2-0.1601
    X Variable 30.0036
各趋势方程为: 

线性趋势:

二阶曲线:

三阶曲线:

根据趋势方程求得的预测值和预测误差如下表:

时间t 

观测值Y 

直线 

二阶曲线 

三阶曲线 

预测 

误差平方 

预测 

误差平方 

预测 

误差平方 

1372373.52.4379.961.6373.42.0
2370372.98.6378.166.0374.015.6
3374372.32.8376.56.1374.20.1
4375371.710.8374.90.0374.20.6
5377371.134.9373.413.3374.08.9
6377370.542.5371.926.1373.611.6
7374369.917.1370.512.2373.01.1
8372369.37.6369.27.9372.20.0
9373368.619.0367.925.7371.23.1
10372368.015.8366.727.6370.23.3
11369367.42.5365.611.4369.00.0
12367366.80.03.65.9367.70.6
13367366.20.7363.611.6366.40.3
14365365.60.3362.75.4365.10.0
15363365.03.8361.81.4363.70.5
163593.328.5361.04.2362.311.1
17358363.732.8360.35.4361.08.9
18359363.116.9359.70.5359.70.5
19360362.56.3359.10.8358.42.4
20357361.923.9358.62.5357.30.1
21356361.327.8358.14.6356.30.1
22352360.775.0357.833.2355.411.3
23348360.0145.1357.5.3354.643.7
24353359.441.4357.217.7354.01.1
25356358.87.9357.01.1353.75.5
26356358.24.9356.90.9353.56.3
27356357.62.5356.90.8353.65.9
28359357.04.1356.94.4353.925.8
29360356.413.2357.09.0354.529.8
30357355.71.6357.20.0355.52.3
31357355.13.5357.40.2356.70.1
32355354.50.2357.77.2358.311.0
33356353.94.4358.14.2360.318.4
34363353.394.2358.520.4362.70.1
35365352.7151.8359.036.2365.40.2
合计 

— — 854.9— 524.7— 232.1
不同趋势线预测的标准误差如下:

直线:

二阶曲:

三阶曲线:

比较各预测误差可知,直线的误差最大,三阶曲线的误差最小。

从不同趋势方程的预测图也可以看出,三阶曲线与原序列的拟合下载本文

显示全文
专题