1、某快餐店对顾客的平均花费进行抽样调查,随机抽取了49名顾客构成一个简单随机样本,调查结果为:样本平均花费为12.6元,标准差为2.8元。试以95.45%的置信水平估计该快餐店顾客的总体平均花费数额的置信区间;(φ(2)=0.9545)是大样本,由中心极限定理知,样本均值的极限分布为正态分布,故可用正态分布对总体均值进行区间估计。
已知:
则有:平均误差=
极限误差
据公式
代入数据,得该快餐店顾客的总体平均花费数额95.45%的置信区间为(11.8,13.4)
3、从某一行业中随机抽取5家企业,所得产品产量与生产费用的数据如下:
| 产品产量(台)xi | 40 | 50 | 50 | 70 | 80 |
| 生产费用(万元)yi | 130 | 140 | 145 | 150 | 156 |
附:
3题解
1计算估计的回归方程:
==0.567
144.2–0.567×58=111.314
估计的回归方程为:=111.314+0.567
2计算判定系数:
4、某家具公司生产三种产品的有关数据如下:
| 产品名称 | 总生产费用/万元 | 报告期产量比 基期增长(%) | |
| 基期 | 报告期 | ||
| 写字台 | 45.4 | 53.6 | 14.0 |
| 椅子 | 30.0 | 33.8 | 13.5 |
| 书柜 | 55.2 | 58.5 | 8.6 |
4题解:
1拉氏加权产量指数
=
②帕氏单位成本总指数=
模拟试卷(二)
一、填空题(每小题1分,共10题)
1、我国人口普查的调查对象是,调查单位是。
2、___频数密度=频数÷组距,它能准确反映频数分布的实际状况。
3、分类数据、顺序数据和数值型数据都可以用饼图条图图来显示。
4、某百货公司连续几天的销售额如下:257、276、297、252、238、310、240、236、265,则其下四分位数是。
5、某地区2005年1季度完成的GDP=30亿元,2005年3季度完成的GDP=36亿元,则GDP年度化增长率为。
6、某机关的职工工资水平今年比去年提高了5%,职工人数增加了2%,则该企业工资总额增长了7.1%。
7、对回归系数的显着性检验,通常采用的是t检验。
| 1 | 2 | 3 | 4 | 5 | 6 | 7 | ||||||||
| ② | ② | ① | ③ | ② | ③ | ③ | ||||||||
| 8 | 9 | 10 | 11 | 12 | 13 | 14 | ||||||||
| ① | ① | ③ | ② | ③ | ② | ② | ||||||||
| 1 | 2 | 3 | 4 | 5 | 6 | 7 | ||||||||
| ①② | ①②③ | ①③ | ①③ | ①②③ | ②③ | ①②③ | ||||||||
1、二手数据审核的主要内容是数据的()
①、适用性②、时效性③、准确性
2、下列命题正确的有()
①、样本容量与置信水平与正比②、样本容量与总体方差成反比
③、样本容量与边际误差成反比
3、统计中计算数值型数据的平均数时,依据资料的不同,平均数的计算形式有()
①、算术平均数②、移动平均数③、调和平均数
4、某商业企业今年与去年相比,各种商品的价格总指数为117.5%,这一结果说明()
①、商品零售价格平均上涨了17.5%②、商品零售量平均上涨了17.5%
③、由于价格提高使零售额增长了17.5%
5、指出下列表述中哪些肯定是错误的()
①、②、
③、
6、区间估计()
①、没有考虑抽样误差大小②、考虑了抽样误差大小③、能说明估计结论的可靠程度
7、回归分析中()
①、t检验是双侧检验②、F检验是检验回归方程的显着性
③、在一元线性回归分析中,t检验和F检验是等价的
四、判断题:(判断命题的正误,对的,在题干前的括号内打√号;错的,在题干前的括号内打×号。共10题,每题1分。)
| 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | 10 |
| × | × | × | × | √ | × | √ | √ | × | × |
(Y)2、询问调查属于定性方法,它通常围绕一个特定的主题取得有关定性资料。
(Y)3、箱线图主要展示分组的数值型数据的分布。
(N)4、异众比率主要用于衡量中位数对一组数据的代表程度。
(N)5、统计数据的误差通常有抽样误差和非抽样误差两类。
(N)6、若一组数据的均值是450,则所有的观测值都在450周围。
(Y)7、移动平均不仅能消除季节变动,还能消除不规则变动。
(N)8、右侧检验中,如果P值<α,则拒绝H0。
(Y)9、r=0说明两个变量之间不存在相关关系。
(Y)10、方差分析是为了推断多个总体的方差是否相等而进行的假设检验。
五、简要回答下列问题(共2题,每题6分。)
2、根据下面的方差分析表回答有关的问题:
| 方差分析 | ||||||
| 差异源 | SS | df | MS | F | P-value | Fcrit |
| 组间 | 0.001053 | 2 | 0.000527 | 32.91667 | 1.34E-05 | 3.88529 |
| 组内 | 0.000192 | 12 | 0.000016 | |||
| 总计 | 0.001245 | 14 | ||||
⑴写出原假设及备择假设;
⑵写出SST,SSA,SSE,,MSA,MSE,n以及P值;
⑶判断因素A是否显着。
答案⑴原假设
备择假设不全等
⑵SST=0.001245SSA=0.001053SSE=0.000192 MSA=0.000527MSE=0.000016
P值=1.34E-05
⑶F值=32.91667>
拒绝原假设,因素A显着。
六、计算题:(要求写出计算公式、过程,结果保留两位小数,共4题,每题10分)
1、某小区居民共有居民500户,小区管理者准备采用一项新的供水设施,想了解居民是否赞成。采取重复抽样方法随机抽取了50户,其中有32户赞成,18户反对。
(1)求总体中赞成该项改革的户数比例的置信区间,置信水平为95.45%(Zα/2=2)
(2)如果小区管理者预计赞成的比例能达到80%,应抽取多少户进行调查?(设边际误差E=0.08)
1题解:
(1)n=50p=32/50=%
E=
应抽取100户进行调查。
2、下面是某商店过去9周的营业额数据:
| 周序号 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 |
| 营业额 | 473 | 470 | 481 | 449 | 544 | 601 | 587 | 4 | 660 |
2题解:
(2)平滑系数α=0.5时误差均方=3847.31<平滑系数
α=0.3时误差均方=5112.92
用平滑系数α=0.5预测更合适。
3、某汽车生产商欲了解广告费用x对销售量y的影响,收集了过去12年的有关数据。通过计算得到下面的有关结果:
方差分析表
| 变差来源 | df | SS | MS | F | SignificanceF |
| 回归 | 1 | A | 1422708.6 | C | 2.17E-09 |
| 残差 | 10 | 220158.07 | B | ||
| 总计 | 11 | 12866.67 |
| Coefficients | 标准误差 | tStat | P-value | |
| Intercept | 363.61 | 62.45529 | 5.823191 | 0.000168 |
| XVariable1 | 1.420211 | 0.071091 | 19.97749 | 2.17E-09 |
③销售量与广告费用之间的相关系数是多少?④写出估计的回归方程并解释回归系数的实际意义。⑤检验线性关系的显着性(a=0.05)
3题解
(1)A=SSR/1=1422708.6B=SSE/(n-2)=220158.07/10=22015.807
C=MSR/MSE=1422708.6/22015.807=.6221
(2)
表明销售量的变差中有88.60%是由于广告费用的变动引起的。
(3)
(4)估计的回归方程:
回归系数表示广告费用每增加一个单位,销售量平均增加1.420211个单位。
(5)检验线性关系的显着性:
H0:
∵SignificanceF=2.17E-09<α=0.05
∴拒绝H0,,线性关系显着。
4、某企业三种产品的出口价及出口量资料如下:
| 出口价 | 出口量 | |||
| 基期p0 | 报告期p1 | 基期q0 | 报告期q1 | |
| 甲 | 100 | 150 | 80 | 82 |
| 乙 | 80 | 140 | 800 | 1000 |
| 丙 | 120 | 120 | 60 | 65 |
4题解:
统计学试卷及答案(三)
一、判断题
1.统计学是一门方科学,其目的是探索数据的内在数量规律性,以达到对客观事物的科学认识。()
2.统计研究的过程包括数据收集、数据整理、分析数据和解释数据四个阶段。()
3.统计数据误差分为抽样误差和非抽样误差。()
4.按所采用的计量尺度不同,可以将统计数据分为时间序列数据和截面数据()
5.用来描述样本特征的概括性数字度量称为参数。()
6.如果数据呈左偏分布,则众数、中位数和均值的关系为:均值<中位数<众数。()
7.通过散点图可以判断两个变量之间有无相关关系。()
8.所有可能样本均值的数学期望等于总体均值。()
9.影响时间序列的因素可分为:长期趋势、季节变动、循环波动和不规则变动四种。()
10.狭义的统计指数是用来说明那些不能直接加总的复杂现象综合变动的一种特殊相对数。()
二、单项选择题1.D2.C3.B4.C5.B6.C7.A8.C9.B10.B11.B12.C13.C14.B15.B
1.为了估计全国高中生的平均身高,从20个城市选取了100所中学进行调查。在该项研究中样本是()。
A100所中学B20个城市C全国的高中生D100所中学的高中生
2.一名统计学专业的学生为了完成其统计作业,在《统计年鉴》中找到的2005年城镇家庭的人均收入数据。这一数据属于()。
A分类数据B顺序数据C截面数据D时间序列数据
3.某连续变量数列,其首组为50以下。又知其邻近组的组中值为75,则首组的组中值为()
A24B25C26D27
4.两组数据相比较()。
A标准差大的离散程度也就大B标准差大的离散程度就小
C离散系数大的离散程度也就大D离散系数大的离散程度就小
5.在下列指数中,属于质量指数的是()。
A产量指数B单位产品成本指数C生产工时指数D销售量指数
6.定基增长速度与环比增长速度的关系为()。
A定基增长速度等于相应的各个环比增长速度的算术和
B定基增长速度等于相应的各个环比增长速度的连乘积
C定基增长速度等于相应的各个环比增长速度加1后的连乘积再减1
D定基增长速度等于相应的各个环比增长速度的连乘积加1(或100%)
7.某企业报告期产量比基期增长了10%,生产费用增长了8%,则其产品单位成本降低了()。
A1.8%B2.5%C20%D18%
8.用简单随机重复抽样方法抽取样本单位,如果要使抽样标准差降低50%,在其他条件不变的情况下,则样本容量需要扩大到原来的()。
A2倍B3倍C4倍D5倍
9.如果变量x和变量y之间的相关系数为﹣1,这说明两个变量之间是()。
A低度相关关系B完全相关关系C高度相关关系D完全不相关
10.合理施肥量与农作物亩产量之间的关系是()。
A函数关系B相关关系C没有关系D正比例关系
11.在回归分析中,描述因变量如何依赖自变量和误差项的方程称为()。
A回归方程B回归模型C估计的回归方程D理论回归方程
12.平均指标是用来反映一组数据分布的()的指标。
A相关程度B离散程度C集中程度D离差程度
13.在正态总体方差已知时,在小样本条件下,总体均值在1-置信水平下的置信区间可以写为()。
ABCD
14.在其他条件不变的情况下,降低估计的置信水平,其估计的置信区间将()。
A变宽B变窄C保持不变D无法确定
15.在同等条件下,重复抽样误差和不重复抽样误差相比()。
A两者相等B前者大于后者C前者小于后者D无法判断
三、多项选择题
1.按计量尺度不同,统计数据可分为三类即()
A时间序列数据B实验数据C分类数据
D顺序数据E数值型数据
2.统计调查方案的内容包括()。
A确定调查目的B确定调查对象和调查单位C设计调查项目和调查表
D调查所采用的方式和方法E调查时间及调查组织和实施的具体细则
3.反映分类数据的图示方法包括()。
A条形图B直方图C圆饼图D累积频数分布图E茎叶图
4.具有相关关系的有()。
A工号和工作效率B受教育程度与收入水平C子女身高和父母身高
D收入水平与消费量E人口与物价水平
5.下列属于时期数列的有()。
A某商店各月库存数B某商店各月的销售额C某企业历年产品产量
D某企业某年内各季度产值E某企业某年各月末人数
1.CDE2.ABCDE3.AC4.BCD5.BCD
五、计算分析题
1.从一个正态总体中随机抽取样本容量为8的样本,各样本值分别为:10,8,12,15,6,13,5,11。求总体均值95%的置信区间。(已知)。(12分)
1.解:已知n=8,总体服从正态分布,未知,样本抽样分布服从t分布
置信下限=10-2.=7.11
置信上限=10+2.=12.
总体均值的95%的置信区间为[7.11,12.]
2.已知某企业连续5年钢产量资料如下:
| 年份 | 1997 | 1998 | 1999 | 2000 | 2001 | |
| 钢产量(千吨) | 200 | 240 | 360 | 540 | 756 | |
| 发展速度(%) | 环比 | - | ||||
| 定基 | ||||||
| 增长速度(%) | 环比 | |||||
| 定基 | ||||||
3.某商场出售三种商品销售资料如下表所示:(14分)
商品
| 名称 | 计量 单位 | 销售量 | 价格(元) | 销售额(元) | ||||
| 基期 q0 | 报告期 q1 | 基期 p0 | 报告期 p1 | p0q0 | p1q1 | p0q1 | ||
| 甲 乙 丙 | 台 件 吨 | 100 250 400 | 120 300 600 | 80 18 40 | 82 20 50 | |||
| 合计 | — | — | — | — | ||||
4.某地区1991—1995年个人消费支出和收入资料如下:(14分)
| 年份 | 1991 | 1992 | 1993 | 1994 | 1995 |
| 个人收入(万元) | 70 | 77 | 82 | 92 | |
| 消费支出(万元) | 56 | 60 | 66 | 75 | 88 |
(2)用个人收入作自变量,消费支出作因变量,求出估计的直线回归方程,并解释回归系数的实际意义。
(3)当个人收入为100万元时预测该地区的消费支出为多少?(注:计算结果保留4位小数)
答案:
统计学试卷(三)标准答案
一、判断题(在题后的括号里正确划“√”、错误划“×”,每题1分,共计10分)
1.√2.√3.√4.×5.×6.√7.√8.√9.√10.√
五、计算分析题(本题共50分)
2.已知某企业连续五年钢产量资料如下:
| 年份 | 1997 | 1998 | 1999 | 2000 | 2001 | |
| 钢产量(千吨) | 200 | 240 | 360 | 540 | 756 | |
| 发展速度(%) | 环比 | (—) | (120) | (150) | (150) | (140) |
| 定基 | (100) | (120) | (180) | (270) | (378) | |
| 增长速度(%) | 环比 | (—) | (20) | (50) | (50) | (40) |
| 定基 | (0) | (20) | (80) | (170) | (278) | |
商品
| 名称 | 计量 单位 | 销售量 | 价格(元) | 销售额(元) | ||||
| 2000年 q0 | 2002年 q1 | 2000年 p0 | 2002年 p1 | p0q0 | p1q1 | p0q1 | ||
| 甲 乙 丙 | 台 件 吨 | 100 250 400 | 120 300 600 | 80 18 40 | 82 20 50 | (8000) (4500) (16000) | (9840) (6000) (30000) | (9600) (5400) (24000) |
| 合计 | — | — | — | — | — | (28500) | (45840) | (39000) |
相对数:商品销售额指数
绝对数:
(2)价格综合指数
(3)相销售量综合指数
(4)综合分析
160.84%=136.84%*117.54%
17340(元)=10500(元)+3840(元)
从相对数上看:三种商品销售额报告期比基期提高了60.84%,是由于销售价格的提高是销售额提高了17.54%和由于销售量的增加使销售额提高了36.84%两因素共同影响的结果。从绝对值上看,报告期比基期多销售17340元,由于销售价格的提高而使销售额增加6840元和由于销售量的提高是销售额增加10500元两因素共同影响的结果。
4.某地区1991-1995年个人消费支出和收入资料如下:
| 年份 | 个人收入(万元)x | 消费支出(万元)y | |||
| 1991 | 56 | 4096 | 3136 | 3584 | |
| 1992 | 70 | 60 | 4900 | 3600 | 4200 |
| 1993 | 77 | 66 | 5929 | 4356 | 5082 |
| 1994 | 82 | 75 | 6724 | 5625 | 6150 |
| 1995 | 92 | 88 | 84 | 7744 | 8096 |
| 合计 | 385 | 345 | 30113 | 24461 | 2712 |
,所以两个变量之间为高度相关。
(2)设估计的值直线回归方程为
∴
回归系数1.1688说明当个人收入增加1个万元时,消费支出平均增加1.1688万元。
(3)当万时,下载本文