平台、设备与算法——量化交易的昨天、今天与明天 平台、设备与算法——量化交易的昨天、今天与明天

太白说:

本篇是EM量化圈公众号的首篇文章,漫谈了量化交易的平台、设备与算法等方面的话题,权且充当本公众号的卷首语。

EM量化圈是东方财富证券Fintech业务团队,为服务日渐繁荣的量化交易市场,重磅推出的量化科技硬核公众号。

欢迎广大量化科技从业者与量化交易爱好者们关注、收藏、转发~

本期主题:量化与量化平台

缘起:平台、设备与算法——量化交易的昨天、今天与明天

纵览:它山之石,可以攻玉——一文了解全球量化生态

调查:雨后春笋般的境内互联网量化平台

故事:Quantopian的失败告诉我们了什么?

量化平台:曲折与光明

全球最大的在线量化平台下线了。

2020年10月底,全球最大的在线量化平台之一——Quantopian发布公告,其网站将在11月14日关闭下线。

Quantopian公告关闭下线

届时,全球的量化研究爱好者除了把自己在Quantopian上保存的算法下载下来之外,无法继续使用平台的所有研究和回测功能。

Quantopian成立于2011年,核心产品是Zipline研究引擎,一款免费向个人用户提供的量化分析工具,使个人客户使用几行Python就能在云端实现策略构建与回测,除此之外,Quantopian也为客户提供免费的高质量数据源等量化交易全链条产品,成为了全球量化研究者最早的俱乐部与大本营之一。

一代巨星就此陨落,噩耗传遍了整个量化圈。

但值得庆幸的是,猝然离世的Quantopian给整个量化圈留下了一系列宝贵的遗产:Zipline算法交易研究与回测库、Alphalens因子研究库、Pyfolio收益与风险分析库、Trading Calendars交易所日历库,以及其他共计97个大大小小功能不同的技术组件,这些组件均被开源共享于GitHub平台。

似乎是受“开放、平等、协作、快速、分享”的互联网精神所感召,Quantopian早在2012年,便将其核心的Zipline模块上传到GitHub,任何人都可以直接下载Zipline,阅读其所有代码,而无需事先付费或申请。

Zipline采用了一种“事件驱动的回测模式”(an event-driven system for backtesting),用户只需要在初始化函数(initialize)中定义相关参数,并在事件函数(handle_data)中调用有关数据、实现交易逻辑,就可以方便的实现回测,而无需关心具体的回测执行代码,极大的方便了策略开发人员进行及时地策略构建与敏捷地策略迭代。

更进一步,Zipline的整个架构都是基于Python语言,极大的方便了量化交易的研究者和爱好者们快速上手。

毕竟,人生苦短。

巨人倒下的原因众说纷纭。

好在,沉舟侧畔千帆过,病树前头万木春。

2014年之后,国内市场上也逐渐诞生了一批以在线策略开发与回测为主要业务的量化社区。

在当时,量化交易并不是一个被广大投资者所熟知的东西。

即便知道了量化交易,但从数据抓取、数据分析,到策略构建、策略回测,都具有相当程度的技术门槛,量化交易始终是少数人秘而不传的禁脔,一些简单的量化交易策略只要研发出来回测稳定,就能赚钱。

“众量化社区的一声炮响,宣告了过去境外背景的量化交易机构靠两根均线就能在A股市场收割投资者的日子一去不复返了。”有量化私募这样回忆道。

一时间,众多量化爱好者涌入量化社区,乐此不疲的研发各种量化策略,导致了一些简单的量化策略逐渐失效,各大量化专业机构逐步走向了策略更加复杂,硬件更加先进的升级打怪之路,便是后话了。

无独有偶,这些雨后春笋般的量化社区基本上都采用了事件驱动的回测模式,用户只需要在初始化函数和事件函数中获取相关数据、定义策略模式,就可以进行方便快捷的在线回测。

量化社区中的策略开发大多基于Python语言,一定程度上可谓当今金融圈里人人学Python的滥觞。

一款量化终端的界面

极速交易:交易科技皇冠上的明珠

2015年开年后,股市历经狂热与急冻,程序化交易在其中的作用众说纷纭,量化交易也彻底从不为投资者所知的“隐学”,变为陆家嘴路人皆知的“显学”。

在境内,量化交易(Quantitative Trading)与程序化交易(Algorithmic trading)的分野,并不那么清晰。

一般而言,量化交易指的算法由数量化手段生成,偏重于策略产生的逻辑;而程序化交易指的交易执行是通过程序触发,偏重于策略执行的逻辑。

但是就境内市场而言,大部分构建量化策略的投资机构与投资者,基本上也利用了电脑程序进行订单执行。

下单程序把订单报到券商柜台,柜台系统通过前置机报到交易所的撮合主机,撮合主机通过撮合规则进行交易撮合并返回成交回报。

最基础的撮合规则是:价格优先、时间优先。

为了能够最早的进行成交,各大交易相关方在交易速度上进行了孜孜不倦的研发升级。

毕竟,天下武功,唯快不破。

极速交易最著名的例子是北美的Spread Networks公司。

《蜂鸟计划》海报

2009年中期,Spread Networks耗资3亿美元,逢山开路遇水架桥,从芝加哥到新泽西,笔直地建设了一条827英里(1331公里)的光缆,唯一的目标是将两地的数据传输时间从17毫秒减少到13毫秒。

这一事件被华尔街交易员迈克尔·刘易斯(Michael Lewis)记述在其畅销书《高频交易员》(Flash Boys)中,并在2018年电影《蜂鸟计划》(The Hummingbird Project)中得以戏剧化的呈现。

这条光缆所缩短的,是芝加哥交易所到纽交所机房的通信距离。

美国全境分布有14家交易所,同一证券产品可以在多个交易所挂牌交易,其中芝加哥交易所和纽交所规模排名前列,有大量证券产品在两地同时交易,一旦两地通讯时间被缩短,就可以抢在交易对手之前,提前发现两地证券的价差波动与交易机会,独享丰厚的投资回报。

值得一提的是,缩短通信时间,只是极速交易技术众多方面中的一环。

为了获得更短的数据传输距离,证券公司向合格的投资机构提供主机托管服务(co-location),将投资机构的交易策略服务器托管到离交易所更近的专业机房。

为了获得更快的行情数据,众多金融服务公司从硬件层面研究了可编程硬件(FPGA)进行行情加速。

为了获得更高效的数据处理能力,证券公司升级柜台技术,部署低延迟高可用的分布式总线,全内存处理客户报单数据。

为了获得精确的传输与执行时间,交易服务供应商推出了铯原子钟+卫星的对时服务,误差可到1微秒。

 NIST-F1铯喷泉原子钟

时至今日,诸如内存柜台、FPGA硬件解码、原子钟等名噪一时的交易“黑科技”,已逐渐成为各家机构交易服务提供商的“标配”,软硬件多方面的军备竞赛只是为了让自己客户的订单跑的快一点,再快一点。

交易算法与机器学习:量化交易新前沿

总的来说,下单再快,也只是交易执行层面,关系到证券买不买的到,卖不卖出,买卖能不能及时。

而交易策略研发层面,关系到买(卖)什么,怎么买(卖),什么时候用什么价格买(卖),则更为复杂。

传统上,“算法交易”领域粗略算是程序化交易的肇始。

算法交易最经典的是TWAP(时间加权平均价格)和VWAP(成交量加权平均价格)。

TWAP (Time Weighted Average Price),时间加权平均价格算法,是一种最简单的传统算法交易策略。

TWAP模型设计的目的是使交易对市场影响减小的同时提供一个较低的平均成交价格,从而达到减小交易成本的目的。在分时成交量无法准确估计的情况下,该模型可以较好地实现算法交易的基本目的。

VWAP (Volume Weighted Average Price),成交量加权平均价格。

VWAP策略即是一种拆分大额委托单,在约定时间段内分批执行,以期使得最终买入或卖出成交均价尽量接近该段时间内整个市场成交均价的算法交易策略。

近年来,全球范围内各大券商基于自身技术实力,在传统的算法交易基础上,逐步研发推出了各种类型的算法交易服务,不仅有TWAP、VWAP、POV及其变种为代表的下单执行算法,也有网格交易、统计套利等为代表的交易策略算法,甚至还出现了被监管机构严厉制止的Stuffing、Spoofing等欺诈算法,不一而足。

公允的说,合规、高效的量化交易算法,一是可以降低大额交易对市场产生的冲击,既显著降低投资者交易成本,又降低了市场价格的波动;二是可以发掘价格偏差导致的套利机会,既为投资者发现并把握转瞬即逝的投资机会,又有助于市场价格形成机制的完善,有助于标的产品的价格向公允价值的回归。

合规、高效的量化交易算法,必将成为券商为其客户提供的高附加值服务中的秘密武器,必将成为传统经纪业务转型过程中的重要抓手与突破点,也是整个交易服务中的重要一环。

 包含算法交易的机构交易终端界面

而在整个量化交易圈,最前沿、最热门、最有想象力的部分,就是将机器学习(Machine Learning)领域的相关知识,多方面多角度地应用在量化交易层面。

从学术界来看,随着数据挖掘和机器学习理论及应用的发展,诸如遗传算法(Genetic Algorithm)、决策树(Decision Tree)、支持向量机(SupportVector Machines)等较为热门的机器学习算法,均已被检验用于证券市场的价格预测、投资组合构建、风险分析等领域。

一方面,随着计算机性能的提高和深度学习相关理论的发展,以人工神经网络(Artificial Neural Networks)、多臂老虎机(Bandit)算法等,由于能够拟合输入和输出的非线性关系,在多因子模型等领域有着较为显著的理论优势。

另一方面,机器学习算法也将结合金融数据自身的特点:金融数据噪声大,分布上尖峰厚尾,且具有较强的自相关性,由此从传统的自回归移动平均模型(ARIMA),到多层次感知机(MLP),再到动态人工神经网络(DAN)和卷积神经网络(CNN),乃至暗含经济周期理论与市场动量理论的长短期记忆网络(LSTM),均是各大高校与研究者的研究热点。

从行业界来看,无论从券商、公募还是私募领域,在机器学习与量化交易结合方面,均进行了大量资本与人力的投入。

各家机构在机器学习领域的竞争,是数据、算法与算力的竞争。

在数据层面,传统的量价数据已经被充分挖掘,曾经的“另类数据”——基本面数据在各家机构的努力下早已“标准化”,数据商们转战新的战场,发掘“股吧”数据、手机信号数据、搜索引擎数据,网络舆情数据等新时代的“另类数据”。

在算法层面,量化交易领域一方面搭了互联网领域高速发展的便车,借用、化用、挪用了互联网领域宵衣旰食研发出来的开源算法,用于自己的交易研究;另一方面大量头部机构也在用超过互联网企业的高薪招徕顶尖的算法研究人员闭关研究撒手锏。

在算力层面,雄厚的金融资本在机房搭建、设备采购方面一往无前,用显卡阵列、超算机房等高科技装备武装到牙齿,成为科技赋能量化交易的排头兵。

 超算机房示例

EM量化圈:雅俗共赏的量化科技赋能圈

过去5年以来,在经历了政策风向的急剧变化,程序化接入的八仙过海之后,量化交易领域越来越脱离了初创时期的蛮荒与草莽,循着交易手段愈加规范、策略开发愈加复杂、基础设备愈加先进的方向大步前进。

2020年,私募基金规模整体大幅度增长,量化策略管理人规模实现了大发展。根据东方财富优优私募数据显示,2020年私募证券类基金规模从年初的2.45万亿增长到了年底的约3.76万亿,年涨幅达53.4%,其中量化私募基金管理规模预计超过了5500亿。

量化交易的蓬勃发展带来了更大的日均交易总量,也带来了更加丰富和多样化的量化投资策略,量化策略管理人普遍对券商交易系统的稳定性、功能全面性、服务高效性以及交易过程中的超低延迟提出了更高要求。

东方财富证券有着互联网的基因,我们更加理解科技在交易服务领域中的核心作用。

立足于多年积累的技术研发经验,我们希望通过EM量化圈公众号,将我们对量化交易的思考,对交易系统的研究,对交易服务的理解,对极速交易、极速柜台、机器学习等前沿领域的经验积累与成就感悟,无偿的分享给大家。

我们将解读最前沿的交易科技,讲述卫星、微波、铯原子与股票交易的联系。

我们将剖析极速交易中的种种难题,分享极速柜台与极速行情的研发心得。

我们将对比高频量化与低频量化中的差异,探究量化不同宗派的源起与演变。

我们将系统性介绍机器学习在程序化交易过程中的前沿实践,为你分享最in也最硬的技术蓝图。

科技赋能,量化先行。

—END—

***** 东方财富证券提示您

股市有风险,投资需谨慎