4.1 一家汽车零售店的10名销售人员5月份销售的汽车数量(单位:台)排序后如下:
2 4 7 10 10 10 12 12 14 15
要求:
(1)计算汽车销售量的众数、中位数和平均数。
(2)根据定义公式计算四分位数。
(3)计算销售量的标准差。
(4)说明汽车销售量分布的特征。
解:
| Statistics | ||
| 汽车销售数量 | ||
| N | Valid | 10 |
| Missing | 0 | |
| Mean | 9.60 | |
| Median | 10.00 | |
| Mode | 10 | |
| Std. Deviation | 4.169 | |
| Percentiles | 25 | 6.25 |
| 50 | 10.00 | |
| 75 | 12.50 | |
4.2 随机抽取25个网络用户,得到他们的年龄数据如下:
单位:周岁
| 19 | 15 | 29 | 25 | 24 |
| 23 | 21 | 38 | 22 | 18 |
| 30 | 20 | 19 | 19 | 16 |
| 23 | 27 | 22 | 34 | 24 |
| 41 | 20 | 31 | 17 | 23 |
(1)计算众数、中位数:
排序形成单变量分值的频数分布和累计频数分布:
| 网络用户的年龄 | |||||
| Frequency | Percent | Cumulative Frequency | Cumulative Percent | ||
| Valid | 15 | 1 | 4.0 | 1 | 4.0 |
| 16 | 1 | 4.0 | 2 | 8.0 | |
| 17 | 1 | 4.0 | 3 | 12.0 | |
| 18 | 1 | 4.0 | 4 | 16.0 | |
| 19 | 3 | 12.0 | 7 | 28.0 | |
| 20 | 2 | 8.0 | 9 | 36.0 | |
| 21 | 1 | 4.0 | 10 | 40.0 | |
| 22 | 2 | 8.0 | 12 | 48.0 | |
| 23 | 3 | 12.0 | 15 | 60.0 | |
| 24 | 2 | 8.0 | 17 | 68.0 | |
| 25 | 1 | 4.0 | 18 | 72.0 | |
| 27 | 1 | 4.0 | 19 | 76.0 | |
| 29 | 1 | 4.0 | 20 | 80.0 | |
| 30 | 1 | 4.0 | 21 | 84.0 | |
| 31 | 1 | 4.0 | 22 | 88.0 | |
| 34 | 1 | 4.0 | 23 | 92.0 | |
| 38 | 1 | 4.0 | 24 | 96.0 | |
| 41 | 1 | 4.0 | 25 | 100.0 | |
| Total | 25 | 100.0 | |||
(2)根据定义公式计算四分位数。
Q1位置=25/4=6.25,因此Q1=19,Q3位置=3×25/4=18.75,因此Q3=27,或者,由于25和27都只有一个,因此Q3也可等于25+0.75×2=26.5。
(3)计算平均数和标准差;
Mean=24.00;Std. Deviation=6.652
(4)计算偏态系数和峰态系数:
Skewness=1.080;Kurtosis=0.773
(5)对网民年龄的分布特征进行综合分析:
分布,均值=24、标准差=6.652、呈右偏分布。如需看清楚分布形态,需要进行分组。
为分组情况下的直方图:
为分组情况下的概率密度曲线:
分组:
1、确定组数:
,取k=6
2、确定组距:组距=( 最大值 - 最小值)÷组数=(41-15)÷6=4.3,取5
3、分组频数表
| 网络用户的年龄 (Binned) | |||||
| Frequency | Percent | Cumulative Frequency | Cumulative Percent | ||
| Valid | <= 15 | 1 | 4.0 | 1 | 4.0 |
| 16 - 20 | 8 | 32.0 | 9 | 36.0 | |
| 21 - 25 | 9 | 36.0 | 18 | 72.0 | |
| 26 - 30 | 3 | 12.0 | 21 | 84.0 | |
| 31 - 35 | 2 | 8.0 | 23 | 92.0 | |
| 36 - 40 | 1 | 4.0 | 24 | 96.0 | |
| 41+ | 1 | 4.0 | 25 | 100.0 | |
| Total | 25 | 100.0 | |||
| Mean | 23.3000 |
| Std. Deviation | 7.02377 |
| Variance | 49.333 |
| Skewness | 1.163 |
| Kurtosis | 1.302 |
4.3 某银行为缩短顾客到银行办理业务等待的时间。准备采用两种排队方式进行试验:一种是所有颐客都进入一个等待队列:另—种是顾客在三千业务窗口处列队3排等待。为比较哪种排队方式使顾客等待的时间更短.两种排队方式各随机抽取9名顾客。得到第一种排队方式的平均等待时间为7.2分钟,标准差为1.97分钟。第二种排队方式的等待时间(单位:分钟)如下:
5.5 6.6 6.7 6.8 7.1 7.3 7.4 7.8 7.8
要求:
(1)画出第二种排队方式等待时间的茎叶图。
第二种排队方式的等待时间(单位:分钟) Stem-and-Leaf Plot
Frequency Stem & Leaf
1.00 Extremes (=<5.5)
3.00 6 . 678
3.00 7 . 134
2.00 7 . 88
Stem width: 1.00
Each leaf: 1 case(s)
(2)计算第二种排队时间的平均数和标准差。
| Mean | 7 |
| Std. Deviation | 0.714143 |
| Variance | 0.51 |
第二种排队方式的离散程度小。
(4)如果让你选择一种排队方式,你会选择哪—种?试说明理由。
选择第二种,均值小,离散程度小。
4.4 某百货公司6月份各天的销售额数据如下:
单位:万元
| 257 | 276 | 297 | 252 | 238 | 310 | 240 | 236 | 265 | 278 |
| 271 | 292 | 261 | 281 | 301 | 274 | 267 | 280 | 291 | 258 |
| 272 | 284 | 268 | 303 | 273 | 263 | 322 | 249 | 269 | 295 |
(1)计算该百货公司日销售额的平均数和中位数。
(2)按定义公式计算四分位数。
(3)计算日销售额的标准差。
解:
| Statistics | ||
| 百货公司每天的销售额(万元) | ||
| N | Valid | 30 |
| Missing | 0 | |
| Mean | 274.1000 | |
| Median | 272.5000 | |
| Std. Deviation | 21.17472 | |
| Percentiles | 25 | 260.2500 |
| 50 | 272.5000 | |
| 75 | 291.2500 | |
| 产品 | 单位成本 | 总成本(元) | |
| 名称 | (元) | 甲企业 | 乙企业 |
| A B C | 15 20 30 | 2 100 3 000 1 500 | 3 255 1 500 1 500 |
| 产品名称 | 单位成本(元) | 甲企业 | 乙企业 | ||
| 总成本(元) | 产品数 | 总成本(元) | 产品数 | ||
| A | 15 | 2100 | 140 | 3255 | 217 |
| B | 20 | 3000 | 150 | 1500 | 75 |
| C | 30 | 1500 | 50 | 1500 | 50 |
| 平均成本(元) | 19.411771 | 18.247368 | |||
4.6 在某地区抽取120家企业,按利润额进行分组,结果如下:
| 按利润额分组(万元) | 企业数(个) |
| 200~300 300~400 400~500 500~600 600以上 | 19 30 42 18 11 |
| 合计 | 120 |
(1)计算120家企业利润额的平均数和标准差。
(2)计算分布的偏态系数和峰态系数。
解:
| Statistics | ||
| 企业利润组中值Mi(万元) | ||
| N | Valid | 120 |
| Missing | 0 | |
| Mean | 426.6667 | |
| Std. Deviation | 116.48445 | |
| Skewness | 0.208 | |
| Std. Error of Skewness | 0.221 | |
| Kurtosis | -0.625 | |
| Std. Error of Kurtosis | 0.438 | |
4.7 为研究少年儿童的成长发育状况,某研究所的一位调查人员在某城市抽取100名7~17岁的少年儿童作为样本,另一位调查人员则抽取了1 000名7~17岁的少年儿童作为样本。请回答下面的问题,并解释其原因。
(1)两位调查人员所得到的样本的平均身高是否相同?如果不同,哪组样本的平均身高较大?
(2)两位调查人员所得到的样本的标准差是否相同?如果不同,哪组样本的标准差较大?
(3)两位调查人员得到这l 100名少年儿童身高的最高者或最低者的机会是否相同?如果不同,哪位调查研究人员的机会较大?
解:(1)不一定相同,无法判断哪一个更高,但可以判断,样本量大的更接近于总体平均身高。
(2)不一定相同,样本量少的标准差大的可能性大。
(3)机会不相同,样本量大的得到最高者和最低者的身高的机会大。
4.8 一项关于大学生体重状况的研究发现.男生的平均体重为60kg,标准差为5kg;女生的平均体重为50kg,标准差为5kg。请回答下面的问题:
(1)是男生的体重差异大还是女生的体重差异大?为什么?
女生,因为标准差一样,而均值男生大,所以,离散系数是男生的小,离散程度是男生的小。
(2)以磅为单位(1ks=2.2lb),求体重的平均数和标准差。
都是各乘以2.21,男生的平均体重为60kg×2.21=132.6磅,标准差为5kg×2.21=11.05磅;女生的平均体重为50kg×2.21=110.5磅,标准差为5kg×2.21=11.05磅。
(3)粗略地估计一下,男生中有百分之几的人体重在55kg一65kg之间?
计算标准分数:
Z1===-1;Z2===1,根据经验规则,男生大约有68%的人体重在55kg一65kg之间。
(4)粗略地估计一下,女生中有百分之几的人体重在40kg~60kg之间?
计算标准分数:
Z1===-2;Z2===2,根据经验规则,女生大约有95%的人体重在40kg一60kg之间。
4.9 一家公司在招收职员时,首先要通过两项能力测试。在A项测试中,其平均分数是100分,标准差是15分;在B项测试中,其平均分数是400分,标准差是50分。一位应试者在A项测试中得了115分,在B项测试中得了425分。与平均分数相比,该应试者哪一项测试更为理想?
解:应用标准分数来考虑问题,该应试者标准分数高的测试理想。
ZA===1;ZB===0.5
因此,A项测试结果理想。
4.10 一条产品生产线平均每天的产量为3 700件,标准差为50件。如果某一天的产量低于或高于平均产量,并落人士2个标准差的范围之外,就认为该生产线“失去控制”。下面是一周各天的产量,该生产线哪几天失去了控制?
| 时间 | 周一周二周三周四周五 周六周日 |
| 产量(件) | 3 850 3 670 3 690 3 720 3 610 3 590 3 700 |
| 时间 | 周一 | 周二 | 周三 | 周四 | 周五 | 周六 | 周日 |
| 产量(件) | 3850 | 3670 | 3690 | 3720 | 3610 | 3590 | 3700 |
| 日平均产量 | 3700 | ||||||
| 日产量标准差 | 50 | ||||||
| 标准分数Z | 3 | -0.6 | -0.2 | 0.4 | -1.8 | -2.2 | 0 |
| 标准分数界限 | -2 | -2 | -2 | -2 | -2 | -2 | -2 |
| 2 | 2 | 2 | 2 | 2 | 2 | 2 | |
4.11 对10名成年人和10名幼儿的身高进行抽样调查,结果如下:
| 成年组 | 166 169 l72 177 180 170 172 174 168 173 |
| 幼儿组 | 68 69 68 70 7l 73 72 73 74 75 |
(1)如果比较成年组和幼儿组的身高差异,你会采用什么样的统计量?为什么?
均值不相等,用离散系数衡量身高差异。
(2)比较分析哪一组的身高差异大?
| 成年组 | 幼儿组 | ||
| 平均 | 172.1 | 平均 | 71.3 |
| 标准差 | 4.201851 | 标准差 | 2.4966 |
| 离散系数 | 0.024415 | 离散系数 | 0.035016 |
4.12 一种产品需要人工组装,现有三种可供选择的组装方法。为检验哪种方法更好,随机抽取15个工人,让他们分别用三种方法组装。下面是15个工人分别用三种方法在相同的时间内组装的产品数量:
单位:个
| 方法A | 方法B | 方法C |
| 1 167 168 165 170 165 1 168 1 162 163 166 167 166 165 | 129 130 129 130 131 ]30 129 127 128 128 127 128 128 125 132 | 125 126 126 127 126 128 127 126 127 127 125 126 116 126 125 |
(1)你准备采用什么方法来评价组装方法的优劣?
均值不相等,用离散系数衡量身高差异。
(2)如果让你选择一种方法,你会作出怎样的选择?试说明理由。
解:对比均值和离散系数的方法,选择均值大,离散程度小的。
| 方法A | 方法B | 方法C | |||
| 平均 | 165.6 | 平均 | 128.7333333 | 平均 | 125.5333333 |
| 标准差 | 2.131397932 | 标准差 | 1.751190072 | 标准差 | 2.774029217 |
均值A方法最大,同时A的离散系数也最小,因此选择A方法。
4.13 在金融证券领域,一项投资的预期收益率的变化通常用该项投资的风险来衡量。预期收益率的变化越小,投资风险越低;预期收益率的变化越大,投资风险就越高。下面的两个直方图,分别反映了200种商业类股票和200种高科技类股票的收益率分布。在股票市场上,高收益率往往伴随着高风险。但投资于哪类股票,往往与投资者的类型有一定关系。
(1)你认为该用什么样的统计量来反映投资的风险?
标准差或者离散系数。
(2)如果选择风险小的股票进行投资,应该选择商业类股票还是高科技类股票?
选择离散系数小的股票,则选择商业股票。
(3)如果进行股票投资,你会选择商业类股票还是高科技类股票?
考虑高收益,则选择高科技股票;考虑风险,则选择商业股票。下载本文