统计学实验报告
姓 名: 贾世光 071104109
许威 071104136
黄志宇 071103311
周浩 071103332
年级专业: 2011统计学
2011 财政金融学
2013年 5 月 17日
成 绩:
评 语:
指导教师: (签名)
实验一 统计数据的搜集与整理
一、实验目的:
1.熟悉间接统计数据的搜集方法、搜集途径,能熟练通过网络搜集间接数据。
2.掌握直接数据的搜集,特别是熟悉一项调查工作的各个环节,包括制定调查方案、选取抽样框、设计问卷表、抽取样本、具体的调查和数据搜集过程。通过参与实际调查,掌握搜集直接数据的方法。
3.掌握对不同类型的调查资料进行整理的方法,包括数据的审核、问卷的编码方法、问卷的数据录入方法、对数据进行分组等。
二、实验原理:
利用网络,查阅文献对数据的收集,利用excel中的数据分析和函数语 言frequency对数据进行整理, 同时利用自动筛选和高级筛选对数据筛选。 三、实验所用软件及版本:Excel2003
四、实验主要内容:
1.通过多种途径查询中国各省、直辖市2011年农村居民收入,并对其进行分组。
2.某企业40名工人的月工资如下(单位:元):468、1220、1000、1150、880、770、980、399、1280、920、620、790、1340、1070、590、1270、1180、810、488、1030、870、1110、660、750、1480、380、0、0、1180、1070、567、1350、1490、810、990、1080、610、0、750、840。要求:(1)利用Excel对40名工人的工资排序。(2)分别利用函数FREQUENCY和直方图两种方法,以组距为300进行等距离分组,第一组为300~600。
3.已知甲、乙、丙、丁四家企业从1995-2005年的产量如下表,请分别用自动筛选和高级筛选找出四家企业年产量同时大于1200的年份。
| 年份 | 甲企业 | 乙企业 | 丙企业 | 丁企业 |
| 1995 | 1220 | 1860 | 1960 | 1220 |
| 1996 | 1600 | 1800 | 1580 | 1200 |
| 1997 | 1500 | 1200 | 1760 | 1140 |
| 1998 | 1520 | 1800 | 1240 | 1880 |
| 1999 | 1100 | 1080 | 1620 | 660 |
| 2000 | 1880 | 1060 | 1620 | 1340 |
| 2001 | 10 | 1980 | 1500 | 1700 |
| 2002 | 1540 | 1420 | 1840 | 1480 |
| 2003 | 1320 | 1200 | 1060 | 1440 |
| 2004 | 1680 | 1900 | 840 | 1380 |
| 2005 | 1560 | 1560 | 1220 | 1980 |
| 按月工资分组(元) | 职工人数(人) | 比重(%) | 累计次数(人) | 累计频率(%) | ||
| 向上累计 | 向下累计 | 向上累计 | 向下累计 | |||
| 500以下 | 16 | |||||
| 500-600 | 50 | |||||
| 600-700 | 23 | |||||
| 700-800 | 14 | |||||
| 800以上 | 7 | |||||
| 合计 | 110 | |||||
1.步骤
(1)利用收索引擎收集资料
(2)将数据复制到excel中
(3)点击工具——数据分析——直方图,结果如下:
2.利用编辑栏的排序进行数据排序
2.步骤:1.将题中数据复制入excel文档
2.计算某企业40名工人的最大值,最小值,以及极差,得到如下:
3.利用函数frequency对数据进行等距分组,第一组为300-600,第二组为600-900,第三组是900-1200,第四组是1200-1500,即frequency(数据区域,数据上限),选好公式单元格区域后,按下回车键,再按f2,再按control+shift+enter,结果如下。
4.利用直方图对数据进行等距分组。
第一步,选择工具-加载宏+分析工具
第二步,在工具栏选择数据分析
第三步,在数据分析中选择直方图, 结果如下
三.(1)第一步,在数据菜单中选择筛选命令,再选择自动筛选。
第二步,单击自定义,指定〉1200,结果如下:
(2)第一步,建立条件区域
第二步,选择数据,筛选,高级筛选,结果如下:
四.利用excel中的计算,结果如下:
实验二 绘制统计图表
一、实验目的:
1.熟练利用Excel的统计制表功能,准确的反映统计总体的数量特征及其数量关系
2.熟练利用Excel的统计制图功能,生动、具体的反映统计总体的数量特征及其数量关系
3.掌握各种统计图、表的性能,并能准确的根据不同对象的特点加以应用
二、实验工具和知识准备:
1.Excel2003中“图表绘制”功能
2.Excel 2003中“数据分析”工具的“直方图”命令
3.什么是直方图、折线图、频数分布曲线?
4.什么是条形图、柱形图?
5.什么是饼图?
6.什么是环形图?
三、实验所用软件及版本:Excel2003
四、实验主要内容:
1.已知某电视机生产企业在一个月内生产的产品中有250件为不合格品,经过调查知道产生不合格品的原因。整理数据如下。
| 原因 | 外观 | 电气故障 | 包装 | 喷漆 | 装配 | 其他 |
| 数量(件) | 52 | 41 | 78 | 25 | 37 | 17 |
2.已知资料如下表:
| 年份 | 1980 | 1985 | 1990 | 1995 | 2000 | 2001 | 2002 | 2003 | 2004 | 2005 |
| 城镇居民家庭人均可支配收入(元) | 477 | 739 | 1510 | 4283 | 6280 | 6859 | 7702 | 8472 | 9421 | 10493 |
| 农村居民家庭人均纯收入(元) | 191 | 397 | 686 | 1577 | 2253 | 2366 | 2475 | 2622 | 2936 | 3254 |
3.已知某咖啡厅一周咖啡销售如下表
| 布公主咖啡坊销售一览 | ||||||
| 统计时间:2002/12/21~2002/12/27 | ||||||
| 星期一 | 星期二 | 星期三 | 星期四 | 星期五 | 星期六 | 星期日 |
| 特调咖啡 | 曼特宁咖啡 | 特调咖啡 | 单品咖啡 | 曼特宁咖啡 | 单品咖啡 | 巴西 |
| 特调咖啡 | 曼特宁咖啡 | 单品咖啡 | 单品咖啡 | 曼特宁咖啡 | 单品咖啡 | 巴西 |
| 单品咖啡 | 曼特宁咖啡 | 单品咖啡 | 巴西 | 单品咖啡 | 特调咖啡 | 特调咖啡 |
| 单品咖啡 | 单品咖啡 | 单品咖啡 | 巴西 | 特调咖啡 | 特调咖啡 | 曼特宁咖啡 |
| 巴西 | 美式咖啡 | 单品咖啡 | 单品咖啡 | 单品咖啡 | 特调咖啡 | 曼特宁咖啡 |
| 巴西 | 单品咖啡 | 巴西 | 单品咖啡 | 巴西 | 曼特宁咖啡 | |
| 曼特宁咖啡 | 单品咖啡 | 单品咖啡 | 曼特宁咖啡 | 巴西 | ||
| 曼特宁咖啡 | 特调咖啡 | 特调咖啡 | 巴西 | 低咖啡 | ||
| 曼特宁咖啡 | 特调咖啡 | 单品咖啡 | 巴西 | 低咖啡 | ||
| 单品咖啡 | 特调咖啡 | 单品咖啡 | 单品咖啡 | 低咖啡 | ||
| 巴西 | 巴西 | 单品咖啡 | 特调咖啡 | 巴西 | ||
| 特调咖啡 | 单品咖啡 | 巴西 | 特调咖啡 | 巴西 | ||
| 单品咖啡 | 特调咖啡 | 特调咖啡 | ||||
| 巴西 | ||||||
| 巴西 | ||||||
| 单位:杯 | ||||||
| 特调咖啡 | 巴西 | 单品咖啡 | 曼特宁咖啡 | 低咖啡 | 美式咖啡 | |
| 星期一 | ||||||
| 星期二 | ||||||
| 星期三 | ||||||
| 星期四 | ||||||
| 星期五 | ||||||
| 星期六 | ||||||
| 星期日 | ||||||
| 总计 |
| B | E | C | C | A | D | C | B | A | E |
| D | A | C | B | C | D | E | C | E | E |
| A | D | B | C | C | A | E | D | C | B |
| B | A | C | D | E | A | B | D | D | C |
| C | B | C | E | D | B | C | C | B | C |
| D | A | C | B | C | D | E | C | E | B |
| B | E | C | C | A | D | C | B | A | E |
| B | A | C | E | E | A | B | D | D | C |
| A | D | B | C | C | A | E | D | C | B |
| C | B | C | E | D | B | C | C | B | C |
(1)指出上面的数据属于什么类型。
(2)用Excel制作一张频数分布表。
(3)绘制一张条形图,反映评价等级的分布。
(4)绘制评价等级的帕累托图。
5. 一种袋装食品用生产线自动装填,每袋重量大约为50g,但由于某些原因,每袋重量不会恰好是50g。下面是随机抽取的100袋食品,测得的重量数据如下: 单位:g
| 57 | 46 | 49 | 54 | 55 | 58 | 49 | 61 | 51 | 49 |
| 51 | 60 | 52 | 54 | 51 | 55 | 60 | 56 | 47 | 47 |
| 53 | 51 | 48 | 53 | 50 | 52 | 40 | 45 | 57 | 53 |
| 52 | 51 | 46 | 48 | 47 | 53 | 47 | 53 | 44 | 47 |
| 50 | 52 | 53 | 47 | 45 | 48 | 54 | 52 | 48 | 46 |
| 49 | 52 | 59 | 53 | 50 | 43 | 53 | 46 | 57 | 49 |
| 49 | 44 | 57 | 52 | 42 | 49 | 43 | 47 | 46 | 48 |
| 51 | 59 | 45 | 45 | 46 | 52 | 55 | 47 | 49 | 50 |
| 54 | 47 | 48 | 44 | 57 | 47 | 53 | 58 | 52 | 48 |
| 55 | 53 | 57 | 49 | 56 | 56 | 57 | 53 | 41 | 48 |
(1)构建这些数据的频数分布表。
(2)绘制频数分布的直方图。
(3)说明数据分布的特征。
五:实验过程步骤和结果报告
1. 步骤:
(1)将题中数据复制入excel文档
(2)选定数据——图标向导——条形图——完成
计算百分比,在外观/百分比那栏中输入=J2/$P$2,并且自动填充得出下表
| 原因 | 外观 | 电气故障 | 包装 | 喷漆 | 装配 | 其他 | 总计 |
| 数量(件) | 52 | 41 | 78 | 25 | 37 | 17 | 250 |
| 百分比 | 20.80% | 16.40% | 31.20% | 10.00% | 14.80% | 6.80% | 100.00% |
(4)右击饼图——数据系列格式,然后点选数据标志,点选百分比,确定
2. 步骤:
(1)将题中数据复制入excel文档
(2)选定数据,点选图表向导——标准类型——折线图
结论:城镇居民的家庭收入增长明显高于农村居民家庭人均收入
3. 步骤:
(1)将题中数据复制入excel文档
(2)利用COUNTIF和SUM函数完整下表
| 特调咖啡 | 巴西 | 单品咖啡 | 曼特宁咖啡 | 低咖啡 | 美式咖啡 | |
| 星期一 | 3 | 3 | 3 | 3 | 0 | 0 |
| 星期二 | 0 | 0 | 1 | 3 | 0 | 1 |
| 星期三 | 4 | 1 | 7 | 0 | 0 | 0 |
| 星期四 | 1 | 4 | 8 | 0 | 0 | 0 |
| 星期五 | 1 | 0 | 3 | 0 | 0 | 0 |
| 星期六 | 6 | 6 | 3 | 0 | 0 | 0 |
| 星期日 | 2 | 4 | 0 | 0 | 3 | 0 |
| 总计 | 17 | 18 | 25 | 6 | 3 | 1 |
4. 步骤:
(1) 将题中数据复制入excel文档
(2) 运用countif函数得出下表
| 等级 | 调查结果 | 频数 |
| 好 | A | 14 |
| 较好 | B | 21 |
| 一般 | C | 32 |
| 较差 | D | 17 |
| 差 | E | 16 |
| 总计 | 100 |
(4) 对频数进行从小到大的顺序排列,计算出累计百分数,形成新的频数分布表
| 等级 | 调查结果 | 频数 | 累计百分比 |
| 0 | 0.00% | ||
| 一般 | C | 32 | 32.00% |
| 较好 | B | 21 | 53.00% |
| 较差 | D | 17 | 70.00% |
| 差 | E | 16 | 86.00% |
| 好 | A | 14 | 100.00% |
5. 步骤:
(1) 将题中数据复制入excel文档
(2) 运用max和min函数计算最大值和最小值,确定组数,由于分组的目的之一是观察数据分布的特征,因此组数的多少应适中,由函数得出的最大值和最小值为61和40,由于本题数据较多,可分为10组
(3) 确定组距为2,根据分组整体成频数分布表。点击“工具”——“加载宏”——“分析数据库”,点击“工具”——“数据分析”——“直方图”,输入区域为数据,接收区域为每组的上限,点选“图表输出”和“确定”
(4) 得出下图
结论:袋装食品用生产线自动装填,每袋重量集中于44到54之间,但由于某些原因,每袋重量不会恰好是50g。
实验三 统计数据的描述
一、实验目的:
1.了解描述统计的基本特征
2.学会用Excel计算平均数、众数、中位数等集中趋势指标
3.能够使用Excel计算全距、四份位距、方差、标准差等变异指标
二、实验工具和知识准备:
1.Excel 2003中“数据分析”工具的“描述统计”命令
2.Excel 2003中“数据分析”工具的“排位与百分比排位”命令
3.Excel2003中的部分函数及公式
4.什么是描述统计?
5.常用的数据特征指标有哪两种趋势?
6.集中趋势指标主要有那些?
7.变异指标有哪些?
8.其他指标。
三、实验所用软件及版本:Excel2003
四、实验主要内容:
1.某食品公司为了了解客户的支付方式和金额,做了抽样调查并得到样本资料如下(单位:美元):
| 现金支付 | 个人支票 | 信用卡支付 | 现金支付 | 个人支票 | 信用卡支付 | 现金支付 | 个人支票 | 信用卡支付 |
| 7.40 | 27.6 | 50.3 | 5.51 | 30.6 | 33.76 | 5.98 | 52.04 | 57.55 |
| 4.75 | 41.58 | 25.57 | 15.1 | 36.09 | 46.42 | 7.88 | 18.77 | 27.66 |
| 8.81 | 2.67 | 46.13 | 1.85 | 34.67 | 14.44 | 5.91 | 42.83 | 44.53 |
| 7.41 | 58. | 43.79 | 11.77 | 57.59 | 19.78 | 3.65 | 55.4 | 26.91 |
| 12.07 | 43.14 | 52.35 | 9.00 | 21.11 | 52.63 | 20.48 | 78.16 | 48.11 |
| 14.28 | 48.95 | 55.21 | 1.27 | 36.48 | 54.19 | 2.87 | 51.66 | 22.59 |
| 4.34 | 28.58 | 53.32 | 3.31 | 35. | 26.57 | 15.07 | 39.55 | 27. |
| 5.80 | 52.87 | 69.77 | 20.48 | 78.16 | 48.11 | 16.28 | 25.96 | 0 |
| 15.57 | 31.07 | 0 | 6.93 | 35.38 | 0 | 7.17 | 58.11 | 0 |
| 11.54 | 49.21 | 0 | 13.09 | 31.74 | 0 | 16.69 | 50.58 | 0 |
| 7.02 | 59.78 | 0 | 18.09 | 72.46 | 0 | 2.44 | 37.94 | 0 |
| 1.09 | 42.69 | 0 | 2.96 | 41.1 | 0 | 11.17 | 40.51 | 0 |
| 16.38 | 37.2 | 0 | 8.85 | 54.84 | 0 | 7.22 | 58.75 | 0 |
| 0 | 17.87 | 0 | 0 | 69.22 | 0 |
(1)利用函数分别求现金支付、个人支票和信用卡支付的中位数、算数平均数、众数、最大值、最小值、四分位距离、样本标准差、样本方差。
(2)运用Excel对此样本数据作出分析,并写出分析报告,分析报告应包括:(1)利用各种描述统计指标概括样本数据(中位数、算术平均值、众数、最大值、最小值、四份位距离、样本标准差、样本方差);(2)对于各个平均数的比较和理解;(3)对于各个标准差的比较和理解。
2. 某生产车间50名工人日加工零件数(单位:个)如下。
117
108
110
112
| 137 | 122 131 118 134 114 | 124 125 123 127 120 | 129 117 126 123 128 | 139 122 133 119 124 | 107 133 134 113 115 | 117 126 127 120 139 | 130 122 123 123 128 | 122 118 118 127 124 | 125 108 112 135 121 |
3.在某地区抽取120家企业,按利润额进行分组,结果如下:
| 按利润额分组(万元) | 企业数(个) |
| 200~300 300~400 400~500 500~600 600以上 | 19 30 42 18 11 |
| 合 计 | 120 |
(1)计算120家企业利润额的平均数、中位数、众数、标准差和离差系数。
(2)计算分布的偏态系数和峰态系数。
五:实验过程步骤和结果报告
1.步骤:
(1)利用函数算,例如众数=mode(选中区域),结果如下:
2.(2)利用excel
| (3)结论:a.顾客的支付方式最多是个人支票为43.5961,其次是信用卡支付为23.11171,最少的是现金支付,为8.71902439 |
| 8.71902439 |
2.步骤:
(1)某生产车间50名工人日加工零件数
利用函数
利用数据分析
(2)结论:工人加工的零件数平均是122.98,中位数是123,众数是122,最大值是139,最小值是107,工人加工的零件数样本标准差是8.026715596,所以加工的零件数差距比较大,不稳定。
3.步骤:
(1)将数据复制到excel中。
(2)制作表格
| 按利润额分组(万元) | 企业数(个) | 组中值(m) | m与企业个数的乘积 |
| 200~300 | 19 | 250 | 4750 |
| 300~400 | 30 | 350 | 10500 |
| 400~500 | 42 | 450 | 100 |
| 500~600 | 18 | 550 | 9900 |
| 600以上 | 11 | 650 | 7150 |
| 合 计 | 120 | 51200 |
| 列1 | |
| 平均 | 426.6666667 |
| 标准误差 | 10.63352695 |
| 中位数 | 450 |
| 众数 | 450 |
| 标准差 | 116.4844515 |
| 方差 | 13568.62745 |
| 峰度 | -0.624699913 |
| 偏度 | 0.208442033 |
| 区域 | 400 |
| 最小值 | 250 |
| 最大值 | 650 |
| 求和 | 51200 |
| 观测数 | 120 |
| 最大(1) | 650 |
| 最小(1) | 250 |
| 置信度(95.0%) | 21.05544515 |
实验四 假设检验
一、实验目的:
1.掌握t检验的概念和使用方法
2.利用t检验解决实际问题
二、实验工具和知识准备:
1.Excel 2003中“数据分析”工具的“t检验:成对双样本分析”命令
2.Excel 2003中“数据分析”工具的“t检验:双样本等方差假设”命令
3.Excel 2003中“数据分析”工具的“t检验:双样本异方差假设”命令
三、实验所用软件及版本:Excel2003
四、实验主要内容:
1. 某商场计划采用一种新的售货奖励办法,为对新办法进行评估,选定5名售货员试行了一周,试行前后的销售额数据。
| 售货员编号 | 试行前的销售额(万元) | 试行后的销售额(万元) | |
| 1 | 12 | 14 | |
| 2 | 15 | 18 | |
| 3 | 16 | 18 | |
| 4 | 15 | 18 | |
| 5 | 18 | 19 |
2. 从甲、乙两煤矿生产的原煤中各抽取一个样本,测得其灰分率数据。根据过去经验,两煤矿原煤灰分率的方差相等,要求在显著性水平0.05下用“t-检验”工具判断两煤矿原煤的平均灰分率有无显著差异?
| 甲矿灰分率 | 乙矿灰分率 |
| 16.9 | 20.8 |
| 16.7 | 17.4 |
| 18.2 | 20.3 |
| 20.2 | 23.7 |
| 21.3 |
| 装配时间 (分钟) | 甲方法 | 35 | 32 | 34 | 31 | 29 | 38 | 30 | 34 | 32 | 29 | 26 | 31 |
| 乙方法 | 29 | 28 | 24 | 26 | 30 | 32 | 29 | 31 | 26 | 32 | 26 | 29 |
1、研究新的销售办法对销售额的影响
1.将题目数据复制如Excel中
2.因为题目是对比销售额的差距,又为小样本,所以使用t检验
3.[工具]→[数据分析]→[t检验,成对双样本均值分析],对数据进行分析,作出下表:
4.P值小于α=0.05
分析:由表得,P单尾检验值0.002<α=0.05,所以拒绝原假设,新的售货奖励办法能明显增加销售额。
2、研究两煤矿原煤的平均灰分率有无显著差异
1.由题目已知,两煤矿原煤灰分率的方差相等,题目为小样本且方差未知,并判断平均灰分率有无显著差异,所以选择双样本等方差检验
2.[工具]→[数据分析]→[t检验,双样本等方差检验],作出下表:
3.表中,P双尾值<α=0.05
分析:由表得,P双尾检验值0.08>α/2=0.025,所以不拒绝原假设,两煤矿原煤的平均灰分率没有显著差异
3、研究某产品两种方法的装配时间有无显著差异
1.题目告知方差不等且为未知,样本数量为小样本,宜采用双样本异样本
2.[工具]→[数据分析]→[t检验,双样本等方差检验],作出下表:
3.P双尾值小于α=0.05
分析:由表得,P双尾检验值为0.012<α/2=0.025,所以拒绝原假设,两种方法的装配时间有显著差别
实验五 方差分析
一、实验目的:
1.了解方差分析的意义、作用及应用范围
2.掌握方差分析的简单运用,会应用方差分析解决实际问题
二、实验工具和知识准备:
1.Excel 2003中“数据分析”工具的“方差分析:单因素方差分析”命令
2.Excel 2003中“数据分析”工具的“方差分析:无重复双因素方差分析”命令
3.Excel 2003中“数据分析”工具的“方差分析:可重复双因素方差分析”命令
4.什么是方差分析?
三、实验所用软件及版本:Excel2003
四、实验主要内容:
已知大白鼠核黄素和食物的供给会对尿液中氨基氮的排出量有影响。现在以此做方差分析。
1.对大白鼠进行核黄素控制,控制水平分别为满足供应(100%),略低(70%)、很低(40%)以及极度控制(10%),得到四组不同大白鼠的尿液氨基氮水平,数据如下,试比较这四种控制水平下的大白鼠尿液中氨基氮含量平均水平。
| 大白鼠编号 | 满足供应(100%) | 略低(70%) | 很低(40%) | 极度控制(10%) | |
| 1 | 6.85 | 6.9 | 5.69 | 2.7 | |
| 2 | 7.16 | 6.58 | 6. | 3.21 | |
| 3 | 7.2 | 6.73 | 5.88 | 4.61 | |
| 4 | 7.05 | 5.91 | 6.5 | 3.69 | |
| 5 | 8.48 | 5.79 | 4.5 | 2.29 | |
| 6 | 7.88 | 6.75 | 3.5 | 3.88 | |
| 7 | 7.83 | 6.48 | 6.17 | 3.72 | |
| 8 | 8.72 | 6.71 | 3.36 | 2.88 | |
| 9 | 7.69 | 6.41 | 4.39 | 3.43 | |
| 10 | 8.76 | 7.1 | 3.43 | 5.54 | |
| 11 | 8.62 | 5.95 | 4.51 | 1.9 | |
| 满足供应(100%) | 略低(70%) | 很低(40%) | 极度控制(10%) | |
| 不限 | 8.8 | 8.34 | 8.18 | 7.61 |
| 90% | 8.29 | 7.81 | 7.46 | 7.16 |
| 80% | 8.19 | 7.47 | 7.09 | 6.56 |
| 70% | 7.6 | 7.41 | 6.67 | 6.22 |
| 60% | 7.26 | 7.16 | 6.1 | 5.99 |
| 50% | 6.97 | 6.65 | 5.91 | 5.39 |
| 40% | 6.51 | 6.24 | 5.55 | 4.92 |
| 30% | 6.54 | 6.09 | 4.71 | 4.08 |
| 20% | 6.6 | 5.41 | 4.35 | 3.49 |
| 10% | 5.99 | 4.96 | 4.29 | 2.9 |
| 0% | 5.53 | 4.63 | 3.81 | 3.24 |
| 满足供应(100%) | 略低(70%) | 很低(40%) | 极度控制(10%) | |||||||||
| 不限 | 8.8 | 8.65 | 8.6 | 8.34 | 8.34 | 8.33 | 8.18 | 8.01 | 7.82 | 7.61 | 7.6 | 7.58 |
| 90% | 8.29 | 8.51 | 8. | 7.81 | 8.01 | 8.09 | 7.46 | 7.66 | 7.73 | 7.16 | 6.93 | 6.9 |
| 80% | 8.19 | 7.91 | 8.31 | 7.47 | 7.57 | 7.5 | 7.09 | 7.06 | 7.07 | 6.56 | 6.43 | 6.52 |
| 70% | 7.6 | 7.77 | 7.55 | 7.41 | 7.13 | 7.05 | 6.67 | 6.63 | 7 | 6.22 | 5.91 | 6.29 |
| 60% | 7.26 | 7.5 | 7.6 | 7.16 | 7.04 | 6.67 | 6.1 | 6.41 | 6.33 | 5.99 | 5.4 | 5.93 |
| 50% | 6.97 | 7.26 | 6.9 | 6.65 | 6.36 | 6.82 | 5.91 | 5.59 | 5.94 | 5.39 | 5.1 | 5.15 |
| 40% | 6.51 | 7.05 | 6.76 | 6.24 | 5.87 | 6.27 | 5.55 | 5.69 | 5.38 | 4.92 | 5.01 | 4.53 |
| 30% | 6.54 | 6.36 | 6.51 | 6.09 | 6.07 | 5.75 | 4.71 | 5.38 | 4.93 | 4.08 | 4.42 | 4.65 |
| 20% | 6.6 | 6.25 | 5.96 | 5.41 | 5.16 | 5.37 | 4.35 | 4.21 | 4.48 | 3.49 | 3.86 | 3.68 |
1、研究不同的核黄素控制水平对大白鼠对尿液中氨基氮的排出量的影响。
1.讲题目数据复制如Excel中
2.[工具]→[加载宏]→[数据分析]
3.题目只有核黄素控制水平,所以为单因素方差分析,选择[数据分析]中的单因素方差分析,以题目数据为输入区域,作出下表:
4.表中,P值为3.05E-13<α=0.05
分析:由表得,方差分析表中的P=3.0528E-13<α=0.05,所以拒绝原假设,不同的核黄素控制水平对大白鼠尿液中氨基氮含量有显著影响
2、研究核黄素控制水平和限定食量对大白鼠对尿液中氨基氮的排出量的影响。
1.题目中有不同水平的核黄素控制量和不同程度的限定食量,所以选择无重复双因素分析
2.选择[工具]→[数据分析]→[无重复双因素方差分析],作出下表:
3.由表得,行P值小于α=0.05,列P值小于α=0.05
分析:用于检验行因素的P=5.8654E-17<α=0.05,所以拒绝原假设,限定食量对大白鼠尿液中氨基氮含量有显著影响
用于检验列因素的P=3.4516E-13<α=0.05,所以拒绝原假设,限定核黄素对大白鼠尿液中氨基氮含量有显著影响
3、研究核黄素控制水平和限定食量以及两因素的共同作用对大白鼠对尿液中氨基氮的排出量的影响。
1.使用选择性粘贴中的”转置”,使行因素变为核黄素控制水平,使列因素变为限定食量,如图:
2.[工具]→[数据分析]→[双因素重复方差分析],以题目数据为基础,作出下表:(省略部分)
3.由表得:样本因素P值<α=0.05,列因素P值<α=0.05,交互P值<α=0.05
分析:由表得,用于检验行因素的P=1E-45<α=0.05,所以拒绝原假设,控制核黄素对大白鼠尿液中氨基氮含量有显著影响
用于检验列因素的P=9E-56<α=0.05,所以拒绝原假设,食量对大白鼠尿液中氨基氮含量有显著影响
用于检验交互作用的P=2E-05<α=0.05,所以拒绝原假设,控制核黄素和食量对大白鼠尿液中氨基氮含量有显著影响
实验六 相关与回归分析
一、实验目的:
1.掌握相关分析与回归分析的概念;
2.掌握相关分析、回归分析等统计分析方法
3.掌握回归预测的基本概念
4.学会使用Excel回归分析工具对实际问题进行回归预测
二、实验工具和知识准备:
1.Excel 2003中“数据分析”工具的“相关系数”命令
2.Excel 2003中“数据分析”工具的“回归”命令
3.Excel2003中“图表绘制”功能
4.什么是相关分析?
5.什么是回归分析?
6.相关系数的显著性检验
7..线性预测方法
三、实验所用软件及版本:Excel2003
四、实验主要内容:
1. 农场通过实验取得早稻收获量与春季降雨量、春季温度的数据如下:
| 收获量(公斤/公顷) | 降雨量(毫米) | 温度(摄氏度) |
| 2250 | 25 | 6 |
| 3450 | 33 | 8 |
| 4500 | 45 | 10 |
| 6750 | 105 | 13 |
| 7200 | 110 | 14 |
| 7500 | 115 | 16 |
| 8250 | 120 | 17 |
2. 某大型连锁店调查了12家分店的营业收入和营业支出,结果如下表所示:(单位:万元)
| 编号 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | 10 | 11 | 12 |
| 支出 | 5 | 8 | 6 | 4 | 8 | 9 | 11 | 12 | 5 | 6 | 9 | 7 |
| 收入 | 8 | 12 | 7 | 5 | 11 | 13 | 15 | 19 | 4 | 8 | 10 | 9 |
五:实验过程步骤和结果报告
实验1:
步骤:一,1、将题中数据复制入excel文档
2、点击excel文档中的“图表向导”-“XY散点图”-“下一步”-“系列”-“X值导入降雨量数据,Y值导入收获量数据”-“早稻收获量与春季降雨量的散点图”
3、步骤同2,得出早稻收获量与春季温度的散点图,如下:
早稻收获量与春季降雨量的散点图
早稻收获量与春季温度的散点图
二,1、选择“工具”—“加载宏”—“分析工具库”。
2、“分析工具库”-“相关”-导入表格数据”-“收获量、降雨量、温度之间的相关系数矩阵”,如下:
| 收获量(公斤/公顷) | 降雨量(毫米) | 温度(摄氏度) | |
| 收获量(公斤/公顷) | 1 | ||
| 降雨量(毫米) | 0.983592787 | 1 | |
| 温度(摄氏度) | 0.97052 | 0.965066573 | 1 |
步骤一:点击excel文档中的“图表向导”-“XY散点图”-“下一步”-“导入表格数据”,得营业支出和营业收入的散点图,如下:
由图可判断营业收入与营业支出呈线性关系。
步骤二:1、“点住图上一点”-“点左键”-“点右键”-“添加趋势线”-“选项”-“显示公式”,得用添加趋势线方法拟合的线性方程为y=1.6343x-2.1741.
2,函数法:分别计算出xy、x^2、x平均、y平均、x的总和、y的总和、x^2的总和、xy的总和,然后利用最小二乘法公式分别计算出a=1.6343,b=-2.1741,由此得拟合的线性方程为y=1.6343x-2.1741.
3、数据分析法:“数据分析”-“回归”-“分别导入X,Y值”-“输入接收区域”-“点击确定”,得如下结果:
分析如下:由分析数据可得拟合的线性的方程为y=1.6343x-2.1741,又由于R Square=0.96679776650,即营业收入的变动中,.97%可由营业支出解释,故该方程可以说明实际情况。
3、如下:当x=10时,营业收入y=14.16
当x=15时,营业收入y=22.3404
当x=20时,营业收入y=30.5119
实验七 时间序列
一、实验目的:
二、实验工具和知识准备:
三、实验所用软件及版本:Excel2003
四、实验主要内容:
1. 下表是1981年—2000年我国油彩油菜籽单位面积产量数据(单位:kg / hm2)
| 年份 | 单位面积产量 | 年份 | 单位面积产量 |
| 1981 | 1451 | 1991 | 1215 |
| 1982 | 1372 | 1992 | 1281 |
| 1983 | 1168 | 1993 | 1309 |
| 1984 | 1232 | 1994 | 1296 |
| 1985 | 1245 | 1995 | 1416 |
| 1986 | 1200 | 1996 | 1367 |
| 1987 | 1260 | 1997 | 1479 |
| 1988 | 1020 | 1998 | 1272 |
| 19 | 1095 | 1999 | 1469 |
| 1990 | 1260 | 2000 | 1519 |
(2)用5期移动平均法预测2001年的单位面积产量。
(3)采用指数平滑法,分别用平滑系数a=0.3和a=0.5预测2001年的单位面积产量,分析预测误差,说明用哪一个平滑系数预测更合适?
2. 下表是1981年—2000年我国财政用于文教、科技、卫生事业费指出额数据
| 年份 | 支出(万元) | 年份 | 支出(万元) |
| 1981 | 171.36 | 1991 | 708.00 |
| 1982 | 196.96 | 1992 | 792.96 |
| 1983 | 223.54 | 1993 | 957.77 |
| 1984 | 263.17 | 1994 | 1278.18 |
| 1985 | 316.70 | 1995 | 1467.06 |
| 1986 | 379.93 | 1996 | 1704.25 |
| 1987 | 402.75 | 1997 | 1903.59 |
| 1988 | 486.10 | 1998 | 2154.38 |
| 19 | 553.33 | 1999 | 2408.06 |
| 1990 | 617.29 | 2000 | 2736.88 |
(2)选择一条适合的趋势线拟合数据,并根据趋势线预测2001年的支出额。
3. 下表中的数据是一家水产品加工公司最近几年的加工量数据(单位:t)。对该序列进行分解,计算季节指数、剔除季节变动、计算剔除季节变动后趋势方程。
| 年/月 | 1997 | 1998 | 1999 | 2000 | 2001 |
| 1 | 78.8 | 91.9 | 90.4 | 66.8 | 99.5 |
| 2 | 78.1 | 92.1 | 100.1 | 73.3 | 80.0 |
| 3 | 84.0 | 80.9 | 114.1 | 85.3 | 108.4 |
| 4 | 94.3 | 94.5 | 108.2 | 94.6 | 118.3 |
| 5 | 97.6 | 101.4 | 125.7 | 74.1 | 126.8 |
| 6 | 102.8 | 111.7 | 118.3 | 100.8 | 123.3 |
| 7 | 92.7 | 92.9 | .1 | 106.7 | 117.2 |
| 8 | 41.6 | 43.6 | 46.1 | 44.0 | 42.0 |
| 9 | 109.8 | 117.5 | 132.1 | 132.1 | 150.6 |
| 10 | 127.3 | 153.1 | 173.9 | 162.5 | 176.6 |
| 11 | 210.3 | 229.4 | 273.3 | 249.0 | 249.2 |
| 12 | 242.8 | 286.7 | 352.1 | 330.8 | 320.6 |
试验1:1、“图表向导”-“折线图”-“导入数据范围”-“确定”,得如下图形:
其形态为:不含有趋势,有一定的随机性。
2、步骤:1、“数据分析”-“移动平均”-“导入数据区域”-“间隔为5”-“导入输出区域”-“确定”。
2、“数据分析”-“指数平滑”-“导入数据区域”-“阻尼系数为0.7”-“导入输出区域”-“确定”
3、步骤同2,将阻尼系数改为0.5。
4、分别计算预测误差、误差平方及合计。以上4步骤得如下结果:
分析:,用5期移动平均法预测的2001年的产量为1421.2,由于a=0.5的指数平滑法预测值得误差平方小于a=0.3的指数平滑法预测值的误差平方,故用a=0.5的平滑系数更为合适。
实验2:1、“图表向导”-“折线图”-“导入数据范围”-“确定”,得如下图形
其趋势为:其趋势为持续上升的指数形式。
2、点击上图中的一点,点右键,添加趋势线,系列,显示公式。得拟和的曲线方程:y=145.78*exp(0.1491x),则预测的2001值为3338.239。
实验3:1、“将数据导入excel表格”-“数据分析”-“移动平均”-“导入数据范围”-“间隔12”-“导入输出区域”-“确定”,得12期移动平均数据。
2、对12期移动平均数据进行2期移动平均(步骤如上),得中心化移动平均值。
3、计算加工量与移动平均值的比值。得如下表:
续上表
2、将上面表格中的整理成表格,并分别计算合计,平均,总平均,季节指数(其中季节指数等于平均除以总平均,平均为各季度比值的平均,总平均为所有比值的平均),得如下表:
3、计算季节分离后的序列Y/S,其中Y为加工量、S为季节指数,根据季节分离后的序列制作散点图,步骤如下:1、“图表向导”-“折线图”-“导入数据范围”-“确定”。
2、点击上图中的一点,点右键,添加趋势线,系列,显示公式。得拟和的曲线方程:y=0.4324x+116.44,如图:
对以上数据进行整理,计算回归趋势值、最终预测值、预测误差得如下表格:(其中回归趋势值即为时间编号t即(x),代入上面拟合趋势方程所得值,最终预测值为季节指数S乘以回归趋势值,预测误差为最终预测值减去实际加工量)下载本文