假设X 是正态分布,表示X~N(μ,σ2密度函数: ff (xx )
=1σ√2π−(x −μ)2σ2 )。μ是随机变量的均值,σ是随机变量的标准差。正态分布的密度函数完全由它的均值和标准差决定。
二、几何平均
假设投资n 个周期,并且每个周期简单收益率不相同,周期收益率分别用R i 经过整理,可以证明:
1+R
�=�(1)(2)(n )n 表示,i=1,2,……,n 。初始投资额为P 。我们可以想象存在一个与该投资等价的新投资。所谓等价就是初始投资相同,并且按照复利计算的期末收入相同。新投资包括相同的周期,但是每个周期具有相
同的简单收益率R
�。因此新投资的单周期简单收益率就是原来投资活动的平均周期简单收益率。按照复利方式计算n 个周期后的收入。两个投资活动期末收入用公式表示如下: P 1n =P 0(1+R 1) (1+R 2)⋯(1+R n ) P 2n =P 0(1+R �) P 1n =P 2n
该公式被称为几何平均,R �被称为几个平均收益率。
三、JB 统计量
Bera-Jarque 检验是被广泛使用的检验数据是否服从正态分布的一种方法。如果分布是正态分布,那么它的偏度应该等于0,峰度等于3,JB 检验就是衡量偏度和峰度偏度0和3的程度。 JB =n [S 2+(K −3)2] 其中S 是偏度的度量,K 是峰度的度量,n 是样本个数。
四、样本偏度及其统计意义。(P17)
样本偏度(Skewness ) S =1�(x i −x �)3n i=1 偏度反应了数据分布是否对称。
S=0,说明该随机变量分布对称,这时均值等于中位数。
S<0,说明分布向左偏,有个较长的右尾部,宏观经济变量的分布一般是这种情况,即数据有下界没有上届,有时均值>中位数。
S=0 S>0 S<0
S<0,说明分布向右偏,有个较长的左尾部,这时均值<中位数。
在正态分布的假设下,样本偏度S 服从渐进分布N(0,n/6),均值等于0,方差等于n/6。
五、多周期收益率 (P3)
如果投资长度不止一个周期,我们可以计算多周期收益率。
图表示投资多个周期的情况。初始时刻记为时刻0,价格P 0,从时刻0到时刻1称为第一个周期,R 1
表示第一个周期的简单收益率,以此类推。每个单周期都可以计算相应的简单收益率和连续复利收益率。
一般地,t-1
时刻到t
时刻的简单收益率用R t 类似地,t-1时刻到t 时刻的连续复利收益率用r 表示,定义为:
R t =p t −p t −1p t −1
t 例如: R 1=P 1−P 00,R 2=P 2−P 11,R 3=P 3−P 22 r 1=ln (P 1)−ln (PP 0),r 2=ln (P 2)−ln (PP 1),r 3=ln (P 3)−ln (PP 2) 表示,定义为:
r t =ln (P t )−ln(P t −1) 除了计算单周期收益率,还可以计算多个周期的收益率。
六、样本峰度及其统计意义。(P17)
样本峰度(Kurtosis )
K =1�(x i −x �)4n i=1 峰度反映了数据分布的尖峭程度。
正态分布的峰度等于3,注意峰度的定义是把随机变量标准化后的4阶矩。K>3说明峭于正态分布,意思是该随机变量标准化以后,峭于标准正态分布,或者说有更厚的尾部。这0 1 2 3 P 0
P 1 P 2 P 3 K=3 K>3 K<3
尖峰分布主要强调分布尾部的特点。尾部厚的含义是尾部比正态分布有更大的概率,用公式表示为:P{|Y|≥t}>pp{|X|≥t},Y代表尖峰分布的变量,X代表正态分布变量,t 是非常大的一个数。其意义是如果小概率事件发生的可能性大于正态分布所描述的情形,那该变量的分布应用尖峰分布来描述。
假设随机变量服从正态分布,样本峰度K-3服从渐进分布N(0,24/n),均值等于0,方差等于24/n。
如果某个分布可以近似看作正态分布,则可近似看作均值等于中位数,S=0,K=3。
七、分位数相关系数
1.分位数(Quantile)
分位数一般可以采用如下定义:
定义:对于一个届于0和1之间的小数q,q分位数x(q)是满足如下条件的数值:
P�x 小于该数的概率是q,大于该数的概率是1−q。 对于一组观测值,计算分位数的方法有很多种这里介绍一种简单的方法: 令P i=(i−5)/n,是一个概率值,i=1,……,n。 与P i对应的分位数是把数据从小到大排列后的第i个数,记为Q(P i)。下载本文