上QQ阅读APP看本书,新人免费读10天
设备和账号都新为新人
2.1 数据格式
保存金融交易数据,可以使用多种文件格式:文本格式、CSV格式、数据库格式,以及Pandas的DataFrame格式等。
需要注意的是,这里所说的CSV格式是数据文件格式,而OHLC格式是数据字段格式,这两者是不同的。
就笔者个人而言,比较喜欢CSV数据文件格式,这是金融行业的标准数据文件格式,也是Pandas默认的数据文件格式。
有些用户喜欢采用数据库格式,这种格式表面上看起来很方便,但数据库的安装、调试、配置过程非常复杂。
BackTrader底层数据为了提高运算效率,采用了特殊的内部格式,而不是标准的CSV格式和OHLC格式。
笔者经常说:无数据,不量化。这里所说的数据主要是指金融市场中的历史交易数据(OHLC)。
OHLC数据格式是金融行业的标准数据格式,OHLC是四个英文单词的缩写,即Open、High、Low、Close,其中,Open为开盘价,High为最高价,Low为最低价,Close为收盘价。
通常,OHLC数据格式包括时间/日期(time/date)和成交量字段(vol),有些还包括修正成交量字段(AdjClose)。
BackTrader量化软件的数据处理,主要集中在DataSeries子模块,如图2-1所示是DataSeries子模块内部属性分布图。
BackTrader量化程序中的DataSeries数据流子模块架构图,如图2-2所示。
图2-1 DataSeries子模块内部属性分布图
图2-2 DataSeries数据流子模块架构图(示意图)
由以上两图可以看出,在BackTrader量化程序中,OHLC是回测数据的核心要素之一。