第1章 绪论(略)
第2章 统计数据的描述
2.1某家商场为了解前来该商场购物的顾客的学历分布情况,随机抽取了100名顾客。其学历表示为:1.初中;2.高中/中专;3.大专;4.本科及以上学历。调查结果如下:
| 4 | 2 | 2 | 2 | 4 | 3 | 4 | 4 | 1 | 4 |
| 2 | 2 | 4 | 4 | 4 | 3 | 2 | 4 | 2 | 2 |
| 3 | 1 | 2 | 1 | 4 | 4 | 1 | 4 | 2 | 4 |
| 2 | 3 | 3 | 2 | 1 | 3 | 4 | 3 | 4 | 4 |
| 3 | 3 | 1 | 2 | 4 | 2 | 4 | 3 | 2 | 4 |
| 2 | 3 | 2 | 2 | 2 | 1 | 2 | 2 | 4 | 4 |
| 2 | 1 | 2 | 3 | 3 | 3 | 3 | 3 | 3 | 4 |
| 2 | 3 | 4 | 3 | 3 | 1 | 3 | 2 | 3 | 2 |
| 4 | 3 | 1 | 3 | 4 | 3 | 4 | 2 | 1 | 4 |
| 2 | 2 | 4 | 2 | 3 | 3 | 4 | 1 | 2 | 1 |
(2)绘制一张条形图,反映学历分布。
2.2在一项研究中,某调查公司为了解某品牌变速箱是否存在缺陷,从一家该汽车的维修公司获得该汽车变速箱失效前行驶的实际里程数的资料数据如下:
| 85092 | 39323 | 342 | 74276 | 74425 | 37832 | 77539 | 32609 | 1 | 61254 |
| 59465 | 94219 | 67998 | 40001 | 118444 | 73341 | 77437 | 116803 | 59817 | 70209 |
| 92857 | 101769 | 25066 | 79294 | 138114 | 090 | 63436 | 95774 | 77098 | 544 |
| 121352 | 69922 | 86813 | 85586 | 59902 | 85861 | 69868 | 69346 | 35662 | 116269 |
| 53402 | 324 | 65605 | 53500 | 85288 | 32524 | 66681 | 67201 | 341 | 88798 |
(2)用直方图来表现数据的分布特征。
2.3为了解某电信客户对该电信公司的服务的满意度情况,某调查公司分别对两个地区的电信用户在以下五个方面对受访用户的满意情况进行了问卷调查得到的数据如下(表中数据为平均满意度打分,从1分到10分满意度依次递增):
| 地区 | 企业形象 | 客户期望 | 质量感知 | 价值感知 | 客户总体满意度 |
| A | 8.269504 | 7.51773 | 9.262411 | 7.9144 | 8.411348 |
| B | 7.447368 | 8.368421 | 8.973684 | 8.105263 | 7.394737 |
2.4下面是一个班50个学生的经济学考试成绩:
| 88 | 56 | 91 | 79 | 69 | 90 | 88 | 71 | 82 | 79 |
| 98 | 85 | 34 | 74 | 48 | 100 | 75 | 95 | 60 | 92 |
| 83 | 65 | 69 | 99 | 45 | 76 | 63 | 69 | ||
| 68 | 74 | 94 | 81 | 67 | 81 | 84 | 53 | 91 | 24 |
| 84 | 62 | 81 | 83 | 69 | 84 | 29 | 66 | 75 | 94 |
(2)用茎叶图将原始数据表现出来。
2.5如下数据反映的是某大学近视度数的情况,共120名受访同学,男女同学各60名。
| 男 | 149 | 160 | 176 | 180 | 210 | 310 | 80 | 95 | 108 | 140 |
| 140 | 144 | 145 | 150 | 150 | 150 | 160 | 168 | 188 | 210 | |
| 210 | 210 | 210 | 105 | 210 | 210 | 210 | 110 | 168 | 175 | |
| 210 | 356 | 460 | 210 | 210 | 210 | 210 | 210 | 310 | 210 | |
| 210 | 210 | 210 | 210 | 210 | 210 | 375 | 375 | 380 | 380 | |
| 388 | 450 | 560 | 600 | 650 | 120 | 30 | 120 | 75 | 210 | |
| 女 | 120 | 330 | 345 | 374 | 375 | 380 | 700 | 90 | 700 | 60 |
| 140 | 150 | 160 | 210 | 210 | 210 | 210 | 150 | 175 | 175 | |
| 210 | 175 | 210 | 210 | 210 | 400 | 430 | 450 | 120 | 175 | |
| 178 | 180 | 180 | 185 | 185 | 190 | 195 | 196 | 200 | 200 | |
| 210 | 210 | 210 | 210 | 210 | 210 | 210 | 210 | 330 | 330 | |
| 350 | 360 | 360 | 360 | 380 | 400 | 470 | 486 | 500 | 550 |
(2)用一张条形图将男女两组数据同时表现出来。
(3)分别绘制直方图,并对比男女近视度数的分布特征。
2.6为了研究各国第三产业的发展状况,我们需要分析各国的第三产业占其国内生产总值的比重,下表中的数据为33个国家和地区的第三产业占其GDP的比重的数据。
单位%
| 25.1 | 30.1 | 36.1 | 38.4 | 39.9 | 42 | 44 | 44.2 | 47.3 | 48.4 | 49.3 |
| 49.5 | 51.1 | 51.1 | 51.2 | 54.7 | 55.7 | 57 | 58 | 60.3 | 60.3 | 61.6 |
| 62.2 | 62.3 | 65.2 | 65.6 | 66.4 | 66.7 | 68.6 | 70.6 | 71.5 | 71.8 | 84.1 |
(2)制作直方图。
2.7一家连锁店拥有多家分店,为分析各家分店的销售状况,管理部门收集了两家规模相近的分店的销售额数据,下面是A、B两家分店50天销售额数据的排序(单位:万元):
A分店:
| 44 | 57 | 59 | 60 | 61 | 61 | 62 | 63 | 63 | 65 |
| 66 | 66 | 67 | 69 | 70 | 70 | 71 | 72 | 73 | 73 |
| 73 | 74 | 74 | 74 | 75 | 75 | 75 | 75 | 75 | 76 |
| 76 | 77 | 77 | 77 | 78 | 78 | 79 | 80 | 80 | 82 |
| 85 | 85 | 86 | 86 | 90 | 92 | 92 | 92 | 93 | 96 |
| 35 | 39 | 40 | 44 | 44 | 48 | 51 | 52 | 52 | 54 |
| 55 | 56 | 56 | 57 | 57 | 57 | 58 | 59 | 60 | 61 |
| 61 | 62 | 63 | 66 | 68 | 68 | 70 | 70 | 71 | |
| 71 | 73 | 74 | 74 | 79 | 81 | 82 | 83 | 83 | 84 |
| 85 | 90 | 91 | 91 | 94 | 95 | 96 | 100 | 100 | 100 |
(2)比较两个分店销售额分布的特点。
2.8下表中的数据为2001年全国研究生入学考试报考某专业的12名考生的5门课程的成绩,
| 考生编号 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | 10 | 11 | 12 |
| 英语 | 66 | 44 | 39 | 58 | 52 | 34 | 74 | 71 | 51 | 41 | 51 | |
| 政治 | 69 | 66 | 58 | 56 | 68 | 40 | 73 | 65 | 62 | 48 | 58 | |
| 专业课1 | 54 | 25 | 20 | 36 | 21 | 4 | 82 | 42 | 28 | 35 | 39 | 19 |
| 专业课2 | 90 | 62 | 85 | 81 | 54 | 73 | 78 | 68 | 66 | 80 | 75 | |
| 专业课3 | 81 | 56 | 45 | 62 | 70 | 63 | 76 | 86 | 65 | 21 | 74 | 73 |
2.9某公司招收推销员,要测定男女推销员的推销能力是否有差别,名随机抽选了8人,经过一段时间销售,取得数据如下:
男推销员销售额
| (千元) | 女推销员销售额 (千元) |
| 31 | 35 |
| 12 | 27 |
| 52 | 24 |
| 51 | 22 |
| 20 | 55 |
| 19 | 49 |
| 28 | 14 |
| 29 | 44 |
(2)并用描述数据集中趋势的测度值说明男女推销员销售额的差异。
2.10下表中的数据反映的是1992年到2001年我国职工平均工资和居民消费价格增长指数:
| 年份 | 1992 | 1993 | 1994 | 1995 | 1996 | 1997 | 1998 | 1999 | 2000 | 2001 |
| 职工工资增长指数(%) | 118.5 | 124.8 | 135.4 | 121.7 | 112.1 | 103.6 | 100.2 | 106.2 | 107.9 | 111.0 |
| 居民消费价格指数(%) | 106.4 | 114.7 | 124.1 | 117.1 | 108.3 | 102.8 | 99.2 | 98.6 | 100.4 | 100.7 |
试根据上表数据比较我国1992年到2001年间职工工资增长指数与平均居民消费价格指数的平均增长速度。
2.11下表所给数据为某楼盘一年四个季度的出租情况:
| 社区 | 外租套数 | 出租率(%) | 租金 |
| A | 516 | 95 | 400 |
| B | 481 | 97 | 450 |
| C | 3 | 92 | 600 |
| D | 427 | 520 |
2.12气象局为研究我国的气温变化,对我国北方两个城市1月份和2月份的气温作了记录。数据如下表:
| 气温(℃) | 城市A的天数 | 城市B的天数 |
| -30~-25 | 6 | 1 |
| -25~-20 | 12 | 4 |
| -20~-15 | 20 | 9 |
| -15~-10 | 10 | 15 |
| -10~-5 | 4 | 16 |
| -5~0 | 3 | 7 |
| 0~5 | 3 | 4 |
| 5~10 | 1 | 3 |
| 合计 | 59 | 59 |
(2)计算两城市气温的标准差。
(3)比较两城市气温离散程度的大小。
第3章 概率与概率分布
3.1抛掷一枚硬币,观察其出现的是正面还是反面,并将事件A定义为:事件A=出现正面, 这
一事件的概率记作。请说明概率的含义。
3.2某学院历史专业的85名学生年龄和性别数据如下表:
| 年龄 | 总计 | ||
| 性别 | 20或更小 | 超过20 | |
| 男生 | 15 | 30 | 45 |
| 女生 | 20 | 20 | 40 |
| 总计 | 35 | 50 | 85 |
(1)P(年龄为20岁或更小的男生)。
(2)P(男生)。
(3)P(年龄为20岁或更小)。
(4)P(男生或女生)。
3.3在一所城市中随机抽取600个家庭,用以确定拥有个人电脑的家庭所占的比例。定义如下事件:
:600个家庭中恰好有265个家庭拥有电脑。
:恰好有100个家庭拥有电脑。
:特定户主张三家拥有电脑。
说明下列各对事件是否为互斥事件,并说明你的理由。
(1)与 (2)与 (3)与
3.4一个轮胎检验员收到1000个轮胎,不合格率为2%,他取出一个容量为5的样本,并记录样本中的不合格轮胎个数。
(1)给出不合格品个数的概率分布。
(2)计算不合格品个数的期望和方差。
3.5一家超市所作的一项调查表明,有80%的顾客到超市是来购买食品,60%的人是来购买其他商品,35%的人既购买食品也购买其他商品。求:
(1)已知某顾客来超市购买食品的条件下,也购买其他商品的概率。
(2)已知某顾客来超市购买其他的条件下,也购买食品的概率。
3.6假定某航空公司预订票处平均每小时接到42次订票电话,那么10分钟内恰好接到6次电话的概率是多少?
3.7假定有10支股票,其中有3支购买后可以获利,另外7支购买后将会亏损。如果你打算从10支股票中选择4支购买,但你并不知道哪3支是获利的,哪7支是亏损的。求:
(1)所有3支能获利的股票都被你选中的概率有多大?
(2)3支可获利的股票中有2支被你选中的概率有多大?
3.8假定某公司职员每周的加班津贴服从均值为50元、标准差为10元的正态分布,那么全公司中有多少比例的职员每周的加班津贴会超过70元,又有多少比例的职员每周的加班津贴在40元到60元之间呢?
3.9考虑某离散型随机变量,若~B(100,0.2),试计算这100次贝努里试验中恰好有15次成功的概率。
第4章 抽样与抽样分布
4.1已知某树苗培植园内的树苗的树茎直径服从正态分布,从中随机抽取了10株,测得其树茎直径数据如下(单位:厘米):
| 10.1 | 8.9 | 7.6 | 11.3 | 10.7 | 9.4 | 9.9 | 10.2 | 10.5 | 11.7 |
(2)你能否推断该园内树苗直径的具体分布是什么?
4.2设一总体的由5个元素构成,其指标值为。问:
(1)该总体的均值和方差是多少?
(2)若采用重复抽样的方法从该总体中抽取样本量为2的样本,则样本均值的数学期望和方差是多少?
(3)若采用不重复抽样的方法从该总体中抽取样本量为2的样本,计算所有可能样本的及,计算E()并与第二问作比较。
4.3某县欲统计今年小麦产量,调查了全县100个村子的小麦产量,测得全县每个村子小麦产量的平均值为1700(百斤)标准差为200(百斤)。若从全县的100个村子中按重复抽样的方法随机抽取10个村子,则由10个村子组成的样本平均产量的期望值是多少?平均产量的标准差又是多少?若采用的是不重复抽样的方法,那么由10个村子组成的样本平均产量的期望值是多少?平均产量的标准差又是多少?
4.4某地区工人的平均工资是15元/小时,标准差为4元/小时。若从该地区抽取n=50个工厂,问所取得样本的平均工资的期望和方差各是多少?平均工资的抽样分布是什么?
第5章 参数估计
5.1一家调查公司进行一项调查,其目的是为了了解某市电信营业厅大客户对该电信的服务的满意情况。调查人员随机访问了30名去该电信营业厅办理业务的大客户,发现受访的大客户中有9名认为营业厅现在的服务质量较两年前好。试在95%的置信水平下对大客户中认为营业厅现在的服务质量较两年前好的比例进行区间估计。
5.2为了确定某大学学生配戴眼镜的比例,调查人员欲对该大学的学生进行抽样调查。而根据以往的调查结果表明,该大学有75%的学生配戴眼镜。则对于边际误差E分别为(1)5%;(2)10%;(3)15%时,抽取的样本量各为多少较合适?()
5.3为调查某单位每个家庭每天观看电视的平均时间是多长,从该单位随机抽取了16户,得样本均值为6.75小时,样本标准差为2.25小时。
(1)试对家庭每天平均看电视时间进行区间估计。
(2)若已知该市每个家庭看电视时间的标准差为2.5小时,此时若再进行区间估计,并且将边际误差控制在第一问的水平,问此时需调查多少户才能满足要求?()
5.4据某市场调查公司对某市80名随机受访的购房者的调查得到了该市购房者中本地人购房比例p的区间估计,在置信水平为下,其边际误差E=0.08。则:
(1)这80名受访者样本中为本地购房者的比例p是多少?
(2)若置信水平为,则要保持同样的精度进行区间估计,需要调查多少名购房者。
5.5为了解某银行营业厅办理某业务的办事效率,调查人员观察了该银行营业厅办理该业务的柜台办理每笔业务的时间,随机记录了15名客户办理业务的时间,测得平均办理时间为=12分钟,样本标准差为s=4.1分钟,则:
(1)其95%的置信区间是多少?
(2)若样本容量为40,而观测的数据不变,则95%的置信区间又是多少?
第6章 假设检验
6.1电视机显像管批量生产的质量标准为平均使用寿命1200小时,标准差为300小时。某电视机厂宣称其生产的显像管质量大大超过规定的标准。为了进行验证,随机抽取了100件为样本,测得平均使用寿命1245小时。能否说该厂的显像管质量显著地高于规定的标准?
(1)给出上题的原假设和被择假设。
(2)构造适当的检验统计量,并进行假设检验,分析可能会犯的错误(取α=0.05)。
(3)若要拒绝原假设,样本平均寿命至少要达到多少,此时可能会犯哪类错误,大小如何?
6.2由于时间和成本对产量变动的影响很大,所以在一种新的生产方式投入使用之前,生产厂家必须确信其所推荐新的生产方法能降低成本。目前生产中所用的生产方法成本均值为每小时200元。对某种新的生产方法,测量其一段样本生产期的成本。
(1)在该项研究中,建立适当的原假设和备择假设。
(2)当不能拒绝时,试对所做的结论进行评述。
(3)当可以拒绝时,试对所做的结论进行评述。
6.3某种生产线的感冒冲剂规定每包重量为12克,超重或过轻都是严重问题。从过去的资料知是0.6克,质检员每2小时抽取25包冲剂称重检验,并作出是否停工的决策。假定产品重量服从正态分布。
(1)建立适当的原假设和备择假设。
(2)在α=0.05时,该检验的决策准则是什么?
(3)如果=12.25克,你将采取什么行动?
(4)如果=11.95克,你将采取什么行动?
6.4某厂生产需用玻璃纸作包装,按规定供应商供应的玻璃纸的横向延伸率不应低于65。已知该指标服从正态分布,一直稳定于5.5。从近期来货中抽查了100个样品,得样本均值=55.06,试问:
(1)在α=0.05水平上能否接收这批玻璃纸,并分析检验中会犯哪类错误。
(2)抽查的100个样本的样本平均值为多少时可以接收这批玻璃纸,此时可能犯的错误属于哪种类型?
6.5已知某种零件的尺寸服从正态分布,现从一批零件中随机抽取16只,测得其长度(厘米)如下:
15.1 14.5 14.8 14.6 15.2 14.8 14.9 14.6
14.8 15.1 15.3 14.7 15.0 15.2 15.1 14.7
(1)若要求该种零件的标准长度应为15毫米,检验这批零件是否符合标准要求?(α=0.05)
(2)若已知方差为0.09,问该批零件是否符合标准要求。
6.6某灯泡厂灯泡的合格标准为灯泡的使用寿命至少为1000小时,现从该厂生产的一批灯泡中随机抽取15只,测得其寿命(小时)如下:
1040 990 9 945 1026 933 987 1036
995 948 1014 931 1045 1010 1004
假定灯泡寿命服从正态分布,取显著性水平为α=0.05,试考虑分别用左侧检验和右侧检验来验证该厂声称“灯泡平均使用寿命在1000小时以上”这一说法是否成立?
6.7某洗涤剂厂有一台瓶装洗洁精的灌装机,在生产正常是地,每瓶洗涤洁精的净重服从正态分布,均值为454g,标准差为12g。为检查近期机器是否正常,从中抽出16瓶,称得其净重的平均值为=456.g。
(1)试对机器正常与否作出判断。(取α=0.01,并假定不变)
(2)若标准差未知,但测得16瓶洗涤洁精的样本标准差为s=12g,试对机器是否正常作出判断。(取α=0.01)
6.8某厂产品的优质品率一直保持在40%,近期技监部门来厂抽查,共抽查了15件产品,其中优质品为5件,在α=0.05水平上能否认为其优质品率仍保持在40%?
6.9为了评价两家旅游服务企业的服务质量,分别在两个企业抽取样本,在A企业随机抽取30名顾客,在B企业随机抽取40名顾客,让他们分别对服务质量进行打分,评分标准是0~100分。顾客给出的服务质量评分如下表。
| 企业A | 企业B | ||||||||||||
| 70 | 97 | 85 | 87 | 73 | 76 | 91 | 57 | 62 | 82 | 93 | |||
| 86 | 90 | 82 | 83 | 92 | 74 | 80 | 78 | 99 | 59 | 79 | 82 | 70 | 85 |
| 72 | 94 | 76 | 73 | 88 | 83 | 87 | 78 | 84 | 84 | 70 | 79 | 72 | |
| 91 | 79 | 84 | 76 | 87 | 88 | 91 | 93 | 75 | 85 | 65 | 74 | 79 | |
| 85 | 78 | 83 | 84 | 91 | 74 | 84 | 66 | 66 | 85 | 78 | 83 | 75 | 74 |
6.10某企业管理人员对采用两种方法组装新产品所需的时间(分钟)进行测试,随机抽取6个工人,让他们分别采用两种方法组装同一种产品,采用方法A组装所需的时间和采用方法B组装所需的时间如下表。假设组装的时间服从正态分布,以的显著性水平比较两种组装方法是否有差别。
| 方法A | 方法B |
| 8.2 | 9.5 |
| 5.3 | 8.3 |
| 6.5 | 7.5 |
| 5.1 | 10.9 |
| 9.7 | 11.3 |
| 10.8 | 9.3 |
7.1为检验不同品牌电池的质量,质检部门抽检了3家生产商生产的5#电池,在每个厂家随机抽取5个电池,测得使用寿命(小时)数据如下:
| 试验号 | 电池生产商 | ||
| 生产商A | 生产商B | 生产商C | |
| 1 2 3 4 5 | 50 50 43 40 39 | 32 28 30 34 26 | 45 42 38 48 40 |
| 方差分析:单因素方差分析 | ||||||
| SUMMARY | ||||||
| 组 | 计数 | 求和 | 平均 | 方差 | ||
| 列 1 | 5 | 222 | 44.4 | 28.3 | ||
| 列 2 | 5 | 150 | 30 | 10 | ||
| 列 3 | 5 | 213 | 42.6 | 15.8 | ||
| 方差分析 | ||||||
| 差异源 | SS | df | MS | F | P-value | F crit |
| 组间 | 307.8 | 0.00031 | 3.88529 | |||
| 组内 | 216.4 | |||||
| 总计 | 14 | |||||
(2)分析三个生产商生产的电池的平均寿命之间有无显著差异()?
(3)如果有差异,到底是哪些生产商之间有差异?
7.2某生产厂家开发了一种新的家庭用供水净化器,其元件需要从几个供应商处购买,然后由工厂组装这些元件。为了确定一种最佳的装配方法,以取得最大的生产数量,工厂准备采用A1、A2、A3三种方法进行组装。为比较不同方法的优劣,随机抽取技术水平比较接近的5名工人,然后由这5 名工人分别按三种方法组装产品。表9.1是5名工人一天组装的产品数量(单位:个):
5名工人一天组装的产品数量(个)
工人
| 序号 | 组装方法(A) | ||
| A1 | A2 | A3 | |
| 1 2 3 4 5 | 42 50 44 41 48 | 28 36 32 30 34 | 41 42 43 52 52 |
7.3为研究食品的包装和销售地区对其销售量是否有影响,在某周的三个不同地区中用三种不同包装方法进行销售,获得的销售量数据如下:
| 销售地区(A) | 包装方法(B) | ||
| B1 | B2 | B3 | |
| A1 A2 A3 | 45 50 35 | 75 50 65 | 30 40 50 |
7.45中不同品牌的鲜牛奶在不同的超市上出售。为研究不同品牌的牛奶销售量是否有差异,随机抽取了8家超市,记录了一周中各品牌牛奶的销售量数据(单位:箱。每箱30袋,每袋500克),结果如下:
| 品牌 | 商场 | |||||||
| 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | |
| A1 | 71 | 73 | 66 | 69 | 58 | 60 | 70 | 61 |
| A2 | 71 | 78 | 81 | 78 | 85 | 90 | 84 | |
| A3 | 73 | 78 | 76 | 86 | 74 | 80 | 81 | 76 |
| A4 | 73 | 75 | 73 | 80 | 75 | 71 | 73 | 72 |
| A5 | 62 | 66 | 69 | 81 | 60 | 61 | 57 | |
| 方差分析:无重复双因素分析 | ||||||
| 差异源 | SS | df | MS | F | P-value | F crit |
| 行(品牌) | 1760 | 4 | 0.0000 | 2.7141 | ||
| 列(商场) | 520 | 7 | 0.0053 | 2.3593 | ||
| 误差 | 552 | 28 | ||||
| 总计 | 2832 | 39 | ||||
(2)分析品牌和商场对牛奶销售量是否有影响?
第8章 相关与回归分析
8.1为了了解某班的学习效率,调查了该班中的14名同学的每天的自习时间和他们的数学成绩。如下表:
| 学生编号 | 每天自习时间(小时) x | 数学成绩 y | 学生编号 | 每天自习时间(小时) x | 数学成绩 y |
| 1 | 5.2 | 91 | 8 | 0.9 | 55 |
| 2 | 1.9 | 65 | 9 | 1.7 | 69 |
| 3 | 3.7 | 80 | 10 | 1.2 | 60 |
| 4 | 4.3 | 86 | 11 | 3.1 | 75 |
| 5 | 3.1 | 72 | 12 | 2.9 | 75 |
| 6 | 2.6 | 77 | 13 | 3.4 | 79 |
| 7 | 1.3 | 14 | 4.8 | 87 |
(2)计算线性相关系数,并对相关系数的显著性进行检验。说明两者之间关系的密切程度。()
8.2下表中所列数据为我国23个城市2001年的经济指标数据。
| 城市 | 固定资产投资总额(亿元) x | GDP(亿元) y1 | 工业总产值(亿元) y2 |
| 1 | 52.95 | 104.8208 | 87.1815 |
| 2 | 68.9508 | 485.6173 | 285.1619 |
| 3 | 69.2708 | 104.4875 | 84.6394 |
| 4 | 72.1010 | 145.52 | 100.1338 |
| 5 | 97.3925 | 211.1188 | 124.5826 |
| 6 | 122.7084 | 386.3400 | 332.1319 |
| 7 | 124.3629 | 363.4412 | 355.3352 |
| 8 | 140.5708 | 315.0000 | 251.78 |
| 9 | 146.7685 | 302.7470 | 258.8494 |
| 10 | 172.4216 | 348.7465 | 396.5228 |
| 11 | 178.7947 | 828.1974 | 0.0503 |
| 12 | 184.2512 | 558.3268 | 803.2877 |
| 13 | 199.2565 | 1003.0125 | 953.5921 |
| 14 | 207.7632 | 1074.22 | 787.4438 |
| 15 | 253.0586 | 1235.00 | 1103.9275 |
| 16 | 256.9496 | 733.8500 | 482.6105 |
| 17 | 257.8558 | 1066.2000 | 786.7011 |
| 18 | 258.1724 | 1085.4284 | 860.8672 |
| 19 | 263.9050 | 673.0627 | 411.0030 |
| 20 | 279.8029 | 728.0774 | 370.0281 |
| 21 | 283.5581 | 1236.4727 | 757.1867 |
| 22 | 293.4728 | 1316.0846 | 1671.74 |
| 23 | 311.7781 | 1120.1156 | 527.6195 |
(2)分别计算两对变量间的相关系数,看看哪组变量的相关性强,并对相关系数进行显著性检验。
(3)利用最小二乘法求出估计的回归方程,并解释回归系数的实际意义。并计算判定系数,并解释其意义。
(4)检验回归方程的线性关系的显著性()。
(5)求当固定资产投资总额为400亿元时GDP和工业总产值的置信区间和预测区间。
8.3研究结果表明受教育时间与个人的薪金之间呈正相关关系。研究人员搜集了不同行业在职人员的有关受教育年数和年薪的数据,如下:
受教育年数
| x | 年薪(万元) y | 受教育年数 x | 年薪(万元) y |
| 8 | 3.00 | 7 | 3.12 |
| 6 | 2.00 | 10 | 6.40 |
| 3 | 0.34 | 13 | 8.54 |
| 5 | 1. | 4 | 1.21 |
| 9 | 4.30 | 4 | 0.94 |
| 3 | 0.51 | 11 | 4. |
(2)用最小二乘法估计回归方程的参数,并对参数进行显著性检验。
(3)当受教育年数为15年时,试对其年薪进行置信区间和预测区间估计(取)。
8.4计量经济学中的柯布-道格拉斯生产函数的有关理论认为一地区的经济增长率同该地区的劳动力增长率和投资增长率成线性相关关系。下表中的数据为某地区的GDP年增长率、就业人数年增长率和投资年增长率。
| 年份 | GDP年增长率 | 投资增长率 | 劳动力增长率 |
| 1991 | 13.83% | 0.24% | 0.33% |
| 1992 | 15.85% | 0.57% | 0.36% |
| 1993 | 12.79% | 0.72% | 0.49% |
| 1994 | 14.35% | 0.% | 0.59% |
| 1995 | 15.63% | 0.95% | 0.72% |
| 1996 | 21.23% | 1.02% | 0.77% |
| 1997 | 13.74% | 1.09% | 0.% |
| 1998 | 20.02% | 1.31% | 1.15% |
| 1999 | 24.38% | 2.28% | 1.29% |
(2)再以该地区的GDP的年增长率为因变量,以就业人数年增长率和投资的年增长率为自变量建立回归模型,并作相应的检验。
(3)比较以上所作的两个模型的拟合效果。
第9章 时间序列分析
9.1我国1998年到2001年房地产行业投资总额如下:
指标 | 1998 | 1999 | 2000 | 2001 |
| 投资总额(亿元)I | 3614.23 | |||
| 累积增长量(亿元)D | ─ | 1369.82 | ||
| 环比增长率Y | ─ | 13.53% | 27.29% |
(1)将上面的表格填完整。
(2)计算投资额的年平均增长量。
(3)计算投资的定基增长率和平均环比增长率,并根据平均增长率预测2002年和2003年的投资总额。
9.2我国1990年到2001年职工平均工资指数如下表所示:
| 年份 | 平均工资指数(环比) | 年份 | 平均工资指数(环比) |
| 1990 | 112.70% | 1996 | 112.10% |
| 1991 | 112.60% | 1997 | 103.60% |
| 1992 | 118.50% | 1998 | 100.20% |
| 1993 | 124.80% | 1999 | 106.20% |
| 1994 | 135.40% | 2000 | 107.90% |
| 1995 | 121.70% | 2001 | 111.00% |
(2)采用5期移动平均法描述该时间序列的平均趋势,作趋势图,并与原时间序列图比较。
9.3以下数据为我国GDP的定基发展速度(以1978年GDP为基数),
| 年份 | GDP指数 | 年份 | GDP指数 |
| 1978 | 100.00% | 1990 | 283.00% |
| 1979 | 107.60% | 1991 | 308.80% |
| 1980 | 116.00% | 1992 | 352.20% |
| 1981 | 122.00% | 1993 | 398.40% |
| 1982 | 133.30% | 1994 | 448.70% |
| 1983 | 148.20% | 1995 | 4.10% |
| 1984 | 170.90% | 1996 | 536.80% |
| 1985 | 193.50% | 1997 | 582.90% |
| 1986 | 209.90% | 1998 | 628.40% |
| 1987 | 234.10% | 1999 | 673.50% |
| 1988 | 260.50% | 2000 | 730.10% |
| 19 | 271.50% | 2001 | 781.20% |
(1)根据以上数据绘制时间序列图,并观察其发展趋势。
(2)根据时间序列图的形状特点配合适当的曲线进行拟合。
9.4某研究机构调查了某市人均旅游支出的年度数据,如下:
| 年份 | 人均旅游支出 | 年份 | 人均旅游支出 |
| 1987 | 99.83 | 1995 | 516.32 |
| 1988 | 94.03 | 1996 | 539.86 |
| 19 | 170.40 | 1997 | 665.70 |
| 1990 | 232.81 | 1998 | 883.99 |
| 1991 | 269.94 | 1999 | 908.57 |
| 1992 | 323.62 | 2000 | 1060.81 |
| 1993 | 284.78 | 2001 | 1405.23 |
| 1994 | 390.74 | ─ | ─ |
(2)选择恰当的方程对曲线进行拟合,并用拟合的曲线对2002年的旅游支出进行预测。
9.5下表中的数据为我国餐饮业1997年到2002年各季度的销售额。
单位:亿元
| 季度 | 1997年 | 1998年 | 1999年 | 2000年 | 2001年 | 2002年 |
| 第一季度 | 538.1 | 629.97 | 732.4 | 873.76 | 1010.26 | 1176.74 |
| 第二季度 | 567.1 | 639.97 | 715.62 | 847.97 | 981.2 | 1132.09 |
| 第三季度 | 598.1 | 684.87 | 770. | 906.23 | 1049.95 | 1223.17 |
| 第四季度 | 730 | 830.97 | 958.82 | 1109.93 | 1293.02 | 1520.11 |
(1)绘制该序列的时间序列图,并观察其变化特点。
(2)试对该时间序列进行分解。
第10章 统计指数
10.1下表为越南1999年和2000年咖啡种植面积和产量的统计资料:
| 地区 | 亩产量 | 播种面积 | ||
| 1999年 | 2000年 | 1999年 | 2000年 | |
| A | 70 | 80 | 52 | 54 |
| B | 65 | 73 | 49 | 46 |
(1)播种面积变动的综合指数,并说明其意义。
(2)计算亩产量变动的综合指数,并说明其意义。
10.2某两家上市公司的盈利情况如下表所示:
| 企业 | 盈利额(亿元) | 利润率(%) | ||
| 1999年 | 2000年 | 1999年 | 2000年 | |
| A | 0.4 | 0.5 | 8.9 | 9.1 |
| B | 1.2 | 1.1 | 7.3 | 7.1 |
10.3我们要研究某化肥厂的劳动生产率,若劳动生产率=。下表为该化肥厂三个车间的职工人数为劳动生产率的统计资料。
| 车间 | 职工人数n | 劳动生产率(吨/人) | ||
| 基期 | 报告期 | 基期 | 报告期 | |
| A | 80 | 82 | 4.1 | 3.8 |
| B | 91 | 92 | 3.9 | 4.2 |
| C | 73 | 75 | 3.8 | 3.9 |
10.4某超市对A、B、C三地开通了购物直通车,超市每天都会记录乘坐直通车的顾客的人次和消费额,下表中的数据为星期一和星期日的统计数据。
| 地区 | 日购物人次 | 人均消费额(元) | ||
| 星期一 | 星期日 | 星期一 | 星期日 | |
| A | 180 | 230 | 70 | 100 |
| B | 120 | 150 | 120 | 150 |
| C | 280 | 340 | 110 | |
(2)用指数体系分析顾客总消费额。
10.5某省2001年和2002年三种农作物的种植情况的有关统计资料如下:
| 农作物 | 亩产量(公斤) y | 播种面积(万亩) s | 价格(元/吨) p | |||
| 2001年 | 2002年 | 2001年 | 2002年 | 2001年 | 2002年 | |
| 花生 | 215 | 240 | 1100 | 1350 | 3400 | 3600 |
| 玉米 | 200 | 225 | 2900 | 2800 | 1200 | 1280 |
| 大豆 | 150 | 175 | 1400 | 1420 | 2100 | 2170 |
(2)计算三种作物价格的综合指数,并说明指数的实际意义。
(3)计算三种作物播种面积的综合指数,并说明指数的实际意义。
(4)用指数体系分析三种农作物的总产量的增长率。
第11章 统计决策
第12章 国民经济统计基础知识下载本文