统计学视角下的金融高频数据挖掘理论与方法研究
上QQ阅读APP看书,第一时间看更新

第四节 本章小结

金融高频数据不能简单作为时间序列来理解,这样做可能会忽略日内与日间两个维度各自具有的分布特征,为此提出了序贯面板数据变换,得到一个看待金融高频数据的双重视角。前者可以用来理解取样间隔加细,但更重要的是后者,它用于研究日内微观结构。

在金融市场上,“交易高频数据”与“高频交易数据”是两个概念,后者是对“高频交易”的记录,前者很大程度上是对“一般交易”的高频记录,二者的共同点是对短期的关注。事实上,高频交易策略也依赖于(超) 高频数据,比如采用高频数据验证市场有效性可以为高频交易是否存在获利机会提供佐证。

数据分析的基本命题是“从数据中挖掘尽可能多的信息”,基于中国金融市场数据研究了金融高频数据的经验统计性质,主要结论有:(1) 平均日内价格呈U形,但平均已实现波动率并不呈U形;(2) 高频收益率仍呈尖峰厚尾,但已经实现波动率调整之后则近似正态分布;(3) 价格变动的基本特征是离散的、跳跃的、惰性的 (矩形水平方向),同时交易的价格也可能变化 (矩形的垂直方向),显然这些因素都增加了日内价格波动建模的困难;(4) 随机交易间隔的特征我们在后面第九章详述。

此外,金融高频数据的理论特征,包括收益率的均值为什么在高频数据分析中通常可以略去,日内已实现波动率为什么不必采用均值矫正,市场微结构噪声如何导致日内平均收益率一阶负相关和方差高估,市场微结构噪声如何引出最优取样间隔的权衡,为什么采用高频数据建立连续时间模型需要包含跳跃成分等,我们都一一给出了证明。