基于马尔可夫链模型的沪深300指数日收益率研究(1)

(整期优先)网络出版时间:2009-09-04
/ 2
 摘要研究了沪深300指数日收益率时间序列,经检验其具有马氏性,并建立了马尔可夫链模型。取交易日分时数据,根据分时数据确定状态初始概率分布,通过一步转移概率矩阵对下一交易日的日收益率进行了预测。对该模型分析和计算,得出其为有限状态的不可约、非周期马尔可夫链,求解其平稳分布,从而得到沪深300指数日收益率概率分布。并预测了沪深300指数上涨或下跌的概率,可为投资管理提供参考。
  关键词马尔可夫链模型沪深300指数日收益率概率分布平稳分布

1引言
  沪深300指数于2005年4月正式发布,其成份股为市场中市场代表性好,流动性高,交易活跃的主流投资股票,能够反映市场主流投资的收益情况。众多证券投资基金以沪深300指数为业绩基准,因此对沪深300指数收益情况研究显得尤为重要,可为投资管理提供参考。
  取沪深300指数交易日收盘价计算日收益率,可按区间将日收益率分为不同的状态,则日收益率时间序列可视为状态的变化序列,从而可以尝试采用马尔可夫链模型进行处理。马尔可夫链模型在证券市场的应用已取得了不少成果。参考文献[1]、[2]、[3]和[4]的研究比较类似,均以上证综合指数的日收盘价为对象,按涨、平和跌划分状态,取得了一定的成果。但只取了40~45个交易日的数据进行分析,历史数据过少且状态划分较为粗糙。参考文献[5]和[6]以上证综合指数周价格为对象,考察指数在的所定义区间(状态)的概率,然其状态偏少(分别只有6个和5个状态),区间跨度较大,所得结果实际参考价值有限。参考文献[7]对单只股票按股票价格划分状态,也取得了一定成果。
然而收益率是证券市场研究得更多的对象。本文以沪深300指数日收益率为对考察对象进行深入研究,采用matlab7.1作为计算工具,对较多状态和历史数据进行了处理,得出了沪深300指数日收益率概率分布,并对日收益率的变化进行了预测。
2马尔可夫链模型方法
2.1马尔可夫链的定义
  设有随机过程{Xt,t∈T},T是离散的时间集合,即T={0,1,2,L},其相应Xt可能取值的全体组成状态空间是离散的状态集I={i0,i1,i2,L},若对于任意的整数t∈T和任意的i0,i1,L,it+1∈I,条件概率则称{Xt,t∈T}为马尔可夫链,简称马氏链。马尔可夫链的马氏性的数学表达式如下:
P{Xn+1=in+1|X0=i0,X1=i1,L,Xn=in}=P{Xn+1=in+1|Xn=in}(1)
2.2系统状态概率矩阵估计
  马尔可夫链模型方法的基本内容之一是系统状态的转移概率矩阵估算。估算系统状态的概率转移矩阵一般有主观概率法和统计估算法两种方法。主观概率法一般是在缺乏历史统计资料或资料不全的情况下使用。本文采用统计估算法,其主要过程如下:假定系统有m种状态S1,S2,L,Sm根据系统的状态转移的历史记录,可得到表1的统计表格。其中nij表示在考察的历史数据范围内系统由状态i一步转移到状态j的次数,以■ij表示系统由状态i一步转移到状态的转移概率估计量,则由表1的历史统计数据得到■ij的估计值和状态的转移概率矩阵P如下:
■ij=nij■nik,P=p11Kp1mMOMpm1Lpmn(2)
2.3马氏性检验
  随机过程{Xt,t∈T}是否为马尔可夫链关键是检验其马氏性,可采用χ2统计量来检验。其步骤如下:(nij)m×m的第j列之和除以各行各列的总和所得到的值记为■.j,即:
■.j=■nij■■nik,且■ij=nij■nik(3)
当m较大时,统计量服从自由度为(m-1)2的χ2分布。选定置信度α,查表得χ2α((m-1)2),如果■2>χ2α((m-1)2),则可认为{Xt,t∈T}符合马氏性,否则认为不是马尔可夫链。
■2=2■■nijlog■ij■.j(4)
2.4马尔可夫链性质
  定义了状态空间和状态的转移概率矩阵P,也就构建了马尔可夫链模型。记Pt(0)为初始概率向量,PT(n)为马尔可夫链时刻的绝对概率向量,P(n)为马尔可夫链的n步转移概率矩阵,则有如下定理:
P(n)=PnPT(n)=PT(0)P(n)(5)
  可对马尔可夫链的状态进行分类和状态空间分解,从而考察该马尔可夫链模型的不可约闭集、周期性和遍历性。马尔可夫链的平稳分布有定理不可约、非周期马尔可夫链是正常返的充要条件是存在平稳分布;有限状态的不可约、非周期马尔可夫链必定存在平稳过程。
3马尔可夫链模型方法应用
3.1观测值的描述和状态划分
  取沪深300指数从2005年1月4日~2007年4月20日共555个交易日收盘价计算日收益率(未考虑分红),将日收益率乘以100并记为Ri,仍称为日收益率。计算公式为:
Ri=(Pi-Pi-1)×100/Pi-1(6)
其中,Pi为日收盘价。
沪深300指数运行比较平稳,在考察的历史数据范围内日收益率有98.38%在[-4.5,4.5]。可将此范围按0.5的间距分为18个区间,将小于-4.5和大于4.5各记1区间,共得到20个区间。根据日收益率所在区间划分为各个状态空间,即可得20个状态(见表2)。


3.2马氏性检验
  采用χ2统计量检验随机过程{Xt,t∈T}是否具有马氏性。用前述统计估算法得到频率矩阵(nij)20×20。
由(3)式和(4)式可得:■.j=■nij■■nik,且■ij=nij■nik,■2=2■■nijlog■ij■.j=446.96,令自由度为k=(m-1)2即k=361,取置信度α=0.01。由于k>45,χ2α(k)不能直接查表获得,当k充分大时,有:
χ2α(k)≈■(zα+■)2(7)
其中,zα是标准正态分布的上α分位点。查表得z0.01=2.325,故可由(1)、(7)式得,即统计量,随机过程{Xt,t∈T}符合马氏性,所得模型是马尔可夫链模型。