沪深两市股票指数收益率分布特征的实证研究
①
———用MAT LAB 软件实现对中国股票市场数据的检验
张 敏1, 强世应2
(1.湘潭大学商学院,湖南湘潭411105;2.安徽大学数学系,安徽
合肥230026)摘 要:用Matlab 软件对中国股票市场数据进行了分布和非线性检验,为了解决这些问题,采用并进一步开发了一套算法工具。
关键词:股指收益率;K olm og orov -Smirnov 检验;非线性;算法
中图分类号:F832 文献标识码:A 文章编号:1671-0231(2004)01-0122-05
在世界经济金融化和“金融工具/”创新化的推动下,以及随着我国金融改革的不断深入,股票市场越来越成为经济活动中最为活跃的成分之一,深入研究我国股票市场的运动规律具有重大的现实意义。1952年,Markowits 创立现代组合投资理论(M odern P ortfolio Theory ),在收益率的正态分布假设下提出以证券投资收益率的方差计量风险;而著名的“Black -scholes 期权定价公式”则直接建立于期权收益的
正态分布假设之上。J.Mayers (1987年)提出
“最优投资组合理论”成立的必要条件是金融资产价格的变化(收益)服从所谓的“线性分布族”
(Linear Distribution Class )。然而股票收益的运动是极其复杂的,这些为简化模型而主观设计的前提假设常常与实际不符。闫冀楠(1997年)针对上海股市收益进行了K uiper 、Jarque -Beta 等非参数方法和参数方法的正态分布检验,得出收益的非正态性在统计上显著的结论;刘志新(2001年)研究了有关股票收益的非正态性和非线性问题。本文则从另一个角度,从软件实现上对相关问题进行进一步的研究。本文采用Matlab 软件实现的方法,利用其功能强大的模块集或工具箱和简单的编程环境以及方便的数据可视化功能,对中国股票市场数据进行实证检验,为了解决这些问题,作者采用并进一步开发了一套算法工具,且侧重于研究相关实证检验的有效技术手段。
1 样本数据
价格是表征股市运动最原始也是最基础的特征变量,价格度量的一种自然考虑是股指(Index ),但由于其显著的“广义非平稳性”,致使它的统计特性随时间变化而呈现出不稳定性,不便于深刻描述,所以金融研究常把平稳的收益率作为股市运动的测度。经济学中股票收益定义为资本利得(Capital G ain )和股息红利(Dividends )之和,但我国各上市公司分派红利普遍不甚规范,有时数据还会包括许多伪信息;另一方面,Fama (1988)研究表明:股息对于收益整体性质影响不大,统计意义上讲完全可以忽略,因此滤去股息只考虑资本利得。这样就分别得到以下价格度量的两种收益:
R t =(I t -I t -1)/I t
(1) R t =ln I t -ln I t -1
(2)由于(2)式对于多期的计算只用简单的相减,而(1)式要用到复杂的Fisher 指数公式,而且为了与国外大多数相关研究保持可比性,本文的收益定义为(2)式。
2
21①
收稿日期:2003-11-01
作者简介:张敏(1977-),女,湖南花垣人,硕士研究生,研究方向:数量经济学.
图1 沪市股票指数序列走势图 图2 沪市股票指数收益率序列走势图
2 模型与语法
2.1 股指收益率的分布特征分析
2.1.1 基本统计量检验
为了计算沪深两市股指收益率的基本统计量的值,使用Matlab统计工具箱中的基本统计量的命令,考虑到数据量较大,采取调用数据文件的方式来作各种统计分析,即采用数据文件方式。进行统计分析前,先用如下命令调用数据文件data.txt中的数据,保存在向量变量x中:
load data.txt;x=data(x);
然后用如下命令分别求出收益率的均值、标准差、偏度和峰度:
mean(x);std(x);skewness(x);kurtosis(x);
2.1.2 K olm og orov-Smirnov检验
为了进一步分析沪深两市股指收益率的分布,用Matlab进行单样本K olm og orov-Smirnov检验。该检验为拟合优度检验,其数学原理是利用统计量nD n=n sup|F n(X)-F(X)|的极限分布Q(y),对原假设H0:X具有分布函数F(X)=F0(X);备择假设H1:F(X)≠F0(X)作显著性检验,其中F0(X)为某一已知分布。具体地取检验统计量D n=max
|F n(x k)-F0(x k)|,其中F n(X)为经验分布函数。则样本数据
1ΦkΦn
服从指定分布时,D n的观测值应该较小,如果D n的观测值较大,则零假设不成立。相关函数采用kstest 函数,零假设为x服从标准正态分布。命令格式如下:
[H,P,K SST AT,C V]=kstest(x,cdf,alpha,tail);
其中H、P、K SST AT、C V是返回值,如果拒绝零假设,则H=1,否则H=0;P返回的是双尾检验P值; K SST AT返回的是K olm og orov-Smirnov统计量的值,C V是判断K SST AT是否显著的临界值。cdf取值为[]; alpha指定显著性水平,tail是备选假设代码。
2.2 股指收益率序列的相关性检验
设平稳序列滞后τ期的自相关函数为ρτ,Anders on和Walker(19)针对线性过程分析了大样本情况下ρτ的分布,提出了线性过程下关于(ρ
ρ2,…,ρk)多变量分布的一般性理论。且根据正态分布的分布规
1,
律,在5%显著水平下,自相关函数ρτ(X),ρτ(X2),ρτ(|X|)均应落在-1.96/n,1.96/n区间内,若自相关函数值落在上述区问范围外,则拒绝原假设,说明收益率序列并不是过程,而是存在弱相关性。
为了计算沪深两市股指收益率序列的自相关函数ρτ(X),ρτ(X2),ρτ(|X|),因为没有相关Matlab函数可以使用,另外在Medit窗口中编写Matlab程序。比如计算沪市股指收益率的ρτ(X),先定义新的向量
321
变量y =x -mean (x ),然后用一个简单的for 循环计算ρτ(X )的值,用向量变量R 1存放其值,得到样本数n.
2.3 股指收益率的非线性检验Chan (1993)给出如下检验收益率序列线性问题的方法:设X t 有有限峰度,如果收益率序列呈非线性关系,则应满足
0Φ∑k τ=1ρτ(X 2)Φmax ∑k τ=1ρ2τ(X ),θ/(1-θ)2(3)
其中θ为最优估计的均方差的比例差值。很难确定θ的合理数值,但在这里,对于收益率而言,可以
很安全地假定0ΦθΦ0.1,表示没有人能得到比随机游走预测准确度高10%的结果,所以,θ/(1-θ
)2Φ0.123,即
∑k τ=1ρτ(X 2)Φmax ∑k τ=1ρ2τ(X ),0.123(4)
检验收益率的非线性关系可用(4)式表示,如果收益率序列计算的结果不满足(4)式,则可以否定收益率序列的线性关系。
3 实证分析
3.1 股指收益率的分布特征分析
3.1.1 基本统计量检验
用命令mean (x );std (x );skewness (x );kurtosis (x );分别计算沪深两市股指收益率的基本统计量的值,结果显示汇总如表1。
表1 沪深两市指数收益率基本统计量样本容量
均 值标准差偏 度峰 度沪市
15210.000790.02130.809625.9612深市8630.001750.0198-1.5053114.9677
将以上结果同正态分布的各项指标相比,可以看到:沪深股指收益率的峰度远远大于3,说明股指收益率具有尖峰态;沪市股指收益率的偏度为0.8096,远大于0,呈正偏态,深市股指收益率为-1.5053,呈负偏态,说明股指收益率分布不对称,具有倾斜的特征。这些都是收益率分布非正态性的征兆。有必要对收益率是否真的服从正态分布作严格的统计检验。
3.1.2 K olm og orov -Smirnov 检验
在本研究中取如下参数,结果显示汇总如表2。
[H ,P ,K SST AT ,C V ]=kstest (x ,[],0.05,0);
表2 K olm og orov -Smirnov 检验
样本容量
H 值双尾检验P 值K olm og orov -Smirnov 统计量C V 值沪市
152110.0000.46730.0347深市86310.0000.47180.0461
由上表H 值为1(或双尾检验P 值为0)可知,拒绝沪深两市股指收益率服从正态分布。上述研究的4
21
结论为:沪深两市股指收益率序列不服从正态分布,具有显著的“高峰厚尾性”,且具有明显的偏态。3.2 股指收益率序列的相关性检验
用前述的for 循环计算ρτ(X )、ρτ(X 2)和ρτ(|X |)的值,分别用向量变量R 1、R 2和R 3存放。在Mat 2lab 主命令窗口中执行以下命令,得到各自的自相关函数图分别见图3和图4。
t =1:30;plot (t ,R 1,R 2,R 3);
图3 沪市股指收益率序列自相关函数 图4 深市股指收益率序列自相关函数
注:图3、4中两条直线分别为y =-1.96/n 和y =1.96/n
在5%的显著性水平下,自相关函数ρτ(X )、ρτ(X 2)和ρτ(|X |)均应落在-1.96/n ,1.96/n 内。
对于沪市而言,该区间近似为(-0.05,0.05),对于深市而言,该区间近似为(-0.07,0.07)。从计算结果
可以看出,两市只有ρτ(X )、ρτ(X 2)。大致落在了该区间内,两市几乎全部的ρτ(|X |)都落在该区间以外。
沪市相应的百分比分别为90%、86.67%和83.33%;深市相应的百分比分别为93.33%、93.33%和90%。
从自相关函数图(见图3和图4)可直观地看出,两市的ρτ(X )、ρτ(X 2)大致夹在两条直线之间,而两市几乎
全部的ρτ(|X |)都落在两条直线之外。这表明,沪深两市股指收益率存在相互依赖性。但沪深两市均有约90%的ρτ(X )落在-1.96/n 和1.96/n 之间,这又说明这种依赖性很小。以上分析表明,沪深两市股指收益率在线性假设下存在弱自相关性。
总之,可以在假设收益率序列是一个线性过程的条件下得到收益率序列存在弱自相关。若收益序列的确是线性过程,该实证结果说明收益率并不服从随机游走;若收益率序列是非线性过程,则上述自相关检验所得到的结果不可靠。有必要进一步研究股指收益率是否为线性过程。
3.3 股指收益率的非线性检验
根据前面的分析,对于沪市,执行如下命令:
sum (R 2);sum (R 13R 1);
算出∑30τ=1ρτ(X 2)=0.9223,∑30τ=1ρ2τ(X 2)=0.0324,则∑30τ=1
ρτ(X 2)>max ∑30τ=1ρ2τ(X ),0.123=0.123,从而沪市综合指数收益率序列为非线性过程。对于深市,可以算出∑30τ=1
ρτ(X 2)=0.9378,∑30τ=1ρ2τ(X )=0.0593,∑30τ=1ρτ(X 2)>max ∑30τ=1
ρ2τ(X ),0.123=0.123,从而深市综合指数收益率序列也是非线性过程。4 结论
本文采用并开发了一套算法工具,在Matlab 软件环境下,对中国股票市场数据———沪深两市股票指数收益率的分布及非线性检验作了实证研究,并且得出了收益率序列确实不服从正态分布以及沪深两市股票指数收益率序列为非线性过程的结论。
5
21
[1]Fama E F,French K R.Permanent and T emporary C omponents of S tock Prices[J].Journal of Political E conomy,1988,96.
[2]Anders on T W,Walker A M.On the Asymptotic Distribution of the Autocorrelations of a S ample from a linear Stoch astic Pro2
cess[M].Annals of Mathematical S tatistics,19.
[3]Chan K C,Hamao yasushi,lakonishok Josef.Can Fundamentals Predict Japanese S tock Returns[J].Financial Analysts Journal,
1993,July/August.
[4]王沫然.Matlab6.0与科学计算[M].北京:电子工业出版社,2001.
[5]罗伯特S平狄克,丹尼尔L鲁宾费尔德.计量经济模型与经济预测[M].北京:机械工业出版社,1999.
Empirical research on the nonlinear testing and distributions of the H u&Shen City’s general index rate of return
———Implementation with Matlab of testing
on the data of China stock m arket
ZH ANG Min1, QI ANG Shi-yin2
(1.Business School,X iangtan University,X iangtan411105,China;
2.Department of M athematics,Anhui University,Hefei230026,China)
Abstract:C onsiderable am ount of research was dedicated during recent years to break the irrational hypothesis in classical m odels to get true features of the w orld.This paper g oes bey ond relative testing methods and addresses the im plementation with programming to have a test about distribution and nonlinearity on the data of China stock market. In order to s olve these problems it adapts and further develops alg orithmic tools for them.
K ey w ords:stock index rate of return;K olm og orov-Smirnov testing;nonlinearity;alg orithm
621下载本文