基于HHT的高频数据波动率的估计

(整期优先)网络出版时间:2022-08-08
/ 3

基于HHT的高频数据波动率的估计

刘因科

山东工程职业技术大学    250200

摘要:鉴于经济学与统计学的研究意义, 在经济学科和统计学科的高频率金融时间序列的分析研究已成为目前研究的热点问题,,高频率金融时间序列的产生中经过计算和研究存在着需要研究的不确定因素,因此对其波动性的估计与分形特征问题的研究对当前股票市场的涨幅和一段时间内的发展的规律,具有非常重要的意义。即对金融资产的价格随时间的变化而变化的规律探索。针对此问题高频数据波动率的估计变得越来越重要,结合数据进行实验,采用高频率数据的定义和性质特征,HHT方法、波动率、ARCH模型和SV模型,然后基于Hilbert-Huang变换的高频率数据波动频率对研究的问题进行进一步估计。

关键词:高频数据波动率;SV模型;ARCH模型;Hilb

1.1研究背景及意义

1.1.1研究背景

近年研究,根据经济学和统计学的研究发展,现在经济和统计界的热点问题之一是高频率金融时间序列的分析研究,即对金融资产的价格随时间的变化而变化的理论与实践的研究和探索。不确定因素是高频率金融时间序列的产生中存在着需要研究的至关重要的问题,因此对国目前股票市场的结构和规律其波动性的估计与分形特征问题的研究对探究我具有非常重要的意义。[1-3]。上海证券交易所、深圳证券交易所自我国上世纪90年代初正式开业以来, 成千上万复杂的股票数据每天每小时每分钟每秒钟都会产生。随着中国乃至世界的金融股票市场功能与规模伴随着经济发展的速度也不断扩大,高频数据研究分析其的作用变得越来越重要,且变得越来越具有研究意义。由于近些年随着经济发展,投资股票和金融市场的人越来越多,因此,了解股票价格波动频率是怎么样的、波动范围大小是多少和波动率高低程度成为人们关注的重点。随着老百姓参与股票市场人数一直在不间断的增加,高频数据在中国当前甚至未来的经济体系中的作用变得越来越重要,经目前各项研究发现股票价格起伏情况和波动规律已经成为中国目前影响社会经济中至关重要的因素,当然股票价格变化的程度和波动的大小也是衡量股票市场发展的重要指标和研究的重要问题。因此,研究中国股票价格的波动规律,获取股票市场发展的正常的结构特征,具有非常重要研究价值和学习探索。

1.1.2研究意义

"沪深300指数",沪深300指数由沪深市场中规模大、流动性好的最具代表性的300只证券组成,于2005年4月8日正式发布,以反映沪深市场上市公司证券的整体表现。,1998年启动——2001年上交所首先研究方案——证监会协调沪深交易所共同开发——2003年达成共识——细节设计——2005年4月8日正式推出。

有市场就有指数。1991年上证、深证综合指数诞生,1992年上证A股B股指数陆续推出,1995年至2004年,深沪两市又陆续推出了深证成指上证180指数(前身为上证30指数)、深证100指数、巨潮100指数、上证50指数……中国股市指数体系在沪深两个交易所推动下有了较大突破和进展,以成分股为样本的指数开发使中国指数市场出现了真正风格化、投资型的指数产品。在当今世界主要发达国家股市中,被投资者广泛接受的、能代表市场变化的指数基本上都是成分股指数。但业内专家指出,我国现有的指数体系,尚不足以满足市场的投资需求,市场迫切需要一些覆盖沪深两市的指数产品。

衡量沪深300指数成功与否的标志,是看其是否能够涵盖沪深两个A股市场,客观真实地反映A股市场运行状况。在这一方面,不少业内人士对沪深300指数给予了积极评价和充分看好。他们认为,沪深300指数的市值覆盖率高、与上证180指数及深证100指数等现有市场指数相关性高、样本股集中了市场中大量优质股票,因此,可以成为反映沪深两个市场整体走势的“晴雨表”。

沪深300指数中高频数据的变化规律研究在统计学和经济学中具有重要意义。研究沪深300指数波动性的研究方法和规律应用,找出波动规律,便于社会经济进而实施有效的方法和机制来规范市场运行秩序[4]。股票市场作为借款人和投资者之间的桥梁,不同的投资者可以根据价格波动、预测模型、自身的风险和收益偏好,灵活的投资组合有助于减少和消除股票市场的不稳定因素,从而进一步提高各国宏观经济的运行质量。因此,有效估计中国股市的波动具有重要意义[5] 从国际上看,主板与创业板是两个独立的体系,香港主板与创业板存在巨大价值投资差异。美国道-琼斯指数也与代表高科技的纳斯达指数分属两个体系。

2.1高频金融数据的定义及性质

高频金融数据是指从非常精细的时间间隔收集金融数据,这些金融数据按时间顺序排列为金融时间序列数据。高频率发展的数据比低频率发展的数据具有许多独特的特性。高频率发展的数据比低频率发展的数据的时间划分不同,因为受市场信息的不确定性和连续性的影响,低频率并不具有不规则的交易间隔和周期性,但是高频数据具有。

2.2波动率的定义

所谓”波动率”就是指衡量事物在一定时间内横向或者纵向的变化程度的指标。实际波动率又称作未来波动率,它是指对期权有效期内投资回报率波动程度的度量,由于投资回报率是一个随机过程,实际波动率永远是一个未知数。或者说,实际波动率是无法事先精确计算的,人们只能通过各种办法得到它的估计值。显然,波动性与股票价格等不同,通常无法直接观察股票市场的具体价值。

2.3波动率估计的方法

2.3.1已实现波动率

首先定义是股票收盘价格的对数价格,则在时段上股票收盘价格的对数收益率,统计计算公式,根据时间间隔与当时的日收益率,然后计算出第几天的"已实现"波动率,其中,两个采样时间的时间间隔,是采样的频率。

2.3.2 ARCH模型

ARCH模型(Autoregressive conditional heteroskedasticity model) ARCH模型由美国加州大学圣迭戈分校罗伯特恩格尔(Engle)教授1982年在《计量经济学》杂志(Econometrica)第一次提出。ARCH模型由美国经济学家恩格尔在1982年最早提出。它一般被应用于低频领域,在计量经济学尤其是是金融时间的序列分析中得到了迅速飞快的发展。ARCH模型作为一种全新的理论,在近十几年里得到了极为迅速的发展,已被广泛地用于验证金融理论中的规律描述以及金融市场的预测和决策,是最集中反映了频率变化在金融时间次序分析中广泛的应用。

2.3.3 SV模型

Taylor(1982),Tauchen & Pitts(1983)通过分析和研究先后将随机波动变化改变的原理应用于金融时间次序研究,形成了著名的SV模型。其中参考均值去除后的收益、收益序列扰动、波动序列扰动、波动率持续性参数。

2.4本章小结

本章简要介绍了低频率数据与高频率数据的区别,以及高频数据有关的概念和常用的研究估计计算波动率方法,包括关于波动变化率的定义、高频率数据的定义和特征、HHT研究方法、已实现的波动变化率、ARCH相关模型和SV相关模型等,并对以上研究的几种估计方法进行了不同的概述。

在本章中,Hilbert-Huang变换用于研究和探索高频率数据在一定时间范围内的波动性。利用希尔伯特变换对波动率进行估计,并与实际波动率方法进行比较,表明HHT方法是一种有效的方法。

3.1波动率的估计形式

本小节利用Hilbert-Huang变换估计波动率,首先,采用经验模式分解(EMD)对对数收益进行分解。分解后得到一系列固有模态函数。然后,选择高频固有模式函数(IMF)来估计波动率吗,估计前要对IMFs进行Hilbert变换。

其中,由于EMD分解是由高频到低频的,所以本文这里为所取的经验模态分解后固有模态函数(IMFs)的个数。

最后,为了验证Hilbert-Huang变换方法得到的高频数据波动率估计值的可靠性和有效性,将该方法的估计结果与实际波动率方法进行了比较,本章采取了具体操作流程步骤。

3.2实证分析

3.2.1数据选取

本文研究的数据采用2010年1月初至2011年12月末沪深300指数每5分钟的收盘价。本文以股票每每收盘的价格数据的对数收益率为研究本身的分析变量,使得当时的收盘价为,收益率为,通过计算和研究得到大约23327个收益。

收盘价格对数收益率走势。可以计算出每5分钟的数据是非平稳的时间序列,有许多尖峰,所以要先对原始数据进行EMD分解。

3.2.2描述性统计分析

为了得到不同时间尺度上的样本数据,然后进行波动率估计的比较分析,因为原始数据是每5分钟的高频数据,所以对原始数据进行随机系统抽样,分别按样本点间隔长度为2、6、24、48进行采样,从而得到了不同尺度下的样本数据。为了更深入地分析研究样本,描述并再次执行统计分析,即不同采样频率下对数收益率的统计,沪深300指数的对数收益率在不同采样频率下的描述性统计量,其计算结果表明:随着采样频率的增加,样本均值和标准差都越来越小,峰度值却越来越大,而偏度在一定程度上偏离了0,且偏度都为负值,结果证实,所研究计算的对数收益率序列变化的具体分布具有长左拖尾,表明沪深股市存在一定的偏离行为,峰值一直都很大,说明所研究的数据中收盘价格的对数各个序列收益率有显而易见的尖峰现象,为了更好地的进行波动率的估计,本章节对收盘价对数的收益率进行了经验模式的分解。

3.2.3波动率估计

1)首先,对原始数据进行经验模式分解(EMD),即每5分钟对数收益率。分解后,共得到16个IMF和1个趋势。得到了一些分解的固有模态函数和趋势项的趋势。

其中经验模态分解(EMD)方法对收盘价格的对数收益率时间序列的分解,目的是把原始时间序列分解为若干个不同尺度的分量,由高频到低频的一些固有模态函数IMFs,选取具有代表性的高频固有模态函数IMFs,进而对这些固有模态函数进行波动率的研究和分析。

2)对在5分钟采样频率下分解样本数据后获得的高频固有模态函数进行希尔伯特变换。

3)对分解后的固有模态函数运用公式(其中,为经验模态分解后固有模态函数的个数),求解出分解后的部分高频固有模态函数IMFs的瞬时波动率,进而得到此采样频率下的高频数据样本的波动率;

4)求5分钟采样频率下的对数收益率序列的已实现波动率。

①对数据取对数,然后运用公式,求得对数收益率;

②利用公式,对对数收益率求平方,作和,得到每5分钟的对数收益率的已实现波动率。

5)将上述用HHT方法得到的波动率估计和已实现波动的最终估计结果进行对比

分析,找出它们之间的相对误差;

6)估计10分钟采样频率下高频数据样本的波动率。对10分钟采样频率的数据进行经验模态分解(EMD),最终分解的结果,即部分固有模态函数及趋势项。

采样频率为10分钟的高频数据样本经过经验模态分解后,共得到13个固有模态函数(IMFs)和1个趋势项(trend),此时,取,此采样频率下分解得到的固有模态函数与采样频率为5分钟的数据分解后的结果相比,10分钟的振幅显得略大,而且得到的趋势项是单调递增的。

7)同理,对10分钟的数据继续重复步骤2)~4),最终得到的估计。

8)对于采样频率为30分钟,2小时,4小时的高频数据样本经过EMD分解后分别得到了10个、8个、7个固有的模态函数和1个走势趋势项,所以分别取、3、2,对EMD分解后得到的结果再次进行Hilbert变换,进而计算出不同采样频率的高频数据样本的波动(均按照上述方法重复计算即可)。

最终所有的波动率估计值在5分钟、10分钟、30分钟、120分钟、240分钟的不同采样频率下, Hilbert-Huang变换得到的高频数据的估计波动率与已实现波动率计算得到的估计波动率基本一致。绝对误差及相对误差均非常小,特别是相对误差几乎都在0.1以下,充分验证了Hilbert-Huang变换的可靠性和有效性。

通过HHT方法得到的波动率估计值与已实现波动率方法得到的波动率估计值之间的绝对误差与相对误差都非常小,并且相对误差的总体趋势是下降的,所以,最终的结果表明:HHT方法是估计高频数据波动率非常有效的方法之一。

本文的研究背景是我国股票市场自90年代初以来,沪深证券交易所运营至今,每分钟都会有成千上万的股票数据,随着我国金融功能和股票市场的扩展,其功能越来越重要,因此,股票价格波动的频率,波动率和波动率已成为人们关注的焦点。所以针对此问题,我们对高频数据波动率的估计问题展开了分析、实验、估计,从而得出结论。首先先对国内外股票收益进行分析,傅里叶分析只适合平稳的数据分析。HHT方法首先利用经验模态分解(EMD)将信号分解为一系列固有模态函数,然后对这些分量进行希尔伯特变换,得到时频平面上能量分布的希尔伯特谱,从而达到研究效果。

参考文献

[1] 黄大吉,赵进平,苏纪兰等-《华东政法大学学报》-2003, 33(3):232-235

[2] 宋劲松,付晓建等-《沪深300指数期货投资策略与风险管理》-2014.15(2):243一248

[3] 赵树然,任培民,赵昕.-基于非参数GARCH模型的汇率波动性预测[J]. 统计与决策. 2012(06).17(1):24-29

[4] 方立兵,郭炳伸,曾勇.GARCH族模型的预测能力比较:一种半参数方法[J]. 数量经济技术经济研究. 2010(04).17 (1) : 42-47.

[5] (英)特伦斯 C 米尔斯(TerenceC.Mills)著,俞卓菁译.金融时间序列的经济计量学模型[M]. 经济科学出版社, 2002

[6] 魏宇,余怒涛.中国股票市场的波动率预测模型及其SPA检验[J]. 金融研究. 2007(07).15(2):243一248.

[7] 段希波,张计光,颜勇.基于Hilbert-Huang变换的多自由度参数辨识[J]. 上海大学学报(自然科学版). 2006(04)

[8] 汤华颖,郭永刚.希尔伯特—黄变换谱与傅立叶谱的比较分析[J]. 山西建筑. 2009(24)

[9] 顾岚,刘长标.中国股市与宏观经济基本面的关系[J]. 数理统计与管理. 2001(03)