在高频交易中,lee_ready algorithm, 该办法对每笔的成交偏向停止了辨别。
而内行情数据中,真实的交易的信息是弗成得的,请问若何评价该算法?
假设是说equdity, level2 数据的trans是有bsflag的, 比较以后, lee-ready的精确率接近70%, 固然还有很多lee-ready算法的变形,不过大致思路都是一样的,后果也是迥然不同。
futures的话, 有一些小的trick, 由于没有交易所逐笔成交, 所以须要researcher 来做一些simulation, 至于sim的后果, 只能经过过程eval factor 来看了。
很多关于microstructure的 research 是从这个偏向开真个, 它的重要性也不言而喻, 这个器械可以用来断定市场的short term liqudity, 至于取得这个信息怎样去trade, 各家公司的做法又不太一样,不过可以肯定的是, 在国际, 很多人靠这个确切赚了很多钱.
Lee and Ready (JF,1991)供给的算法感化是在order level data(订单级别数据)弗成得的情况下,用Trade and Quote (TAQ) 数据库里的trade level data(逐笔成交数据)和quote level data(各交易所最优报价数据)来揣摸liquidity taker(交易提议者)的交易偏向。
详细操作准绳是,
(1)假设以后成交价高于(低于)以后最优生意报价均匀值,剖断为"买"("卖");
(2)假设以后成交价等于以后最优生意报价均匀值,那么假设以后成交价比上一笔成交价高(低),剖断为"买"("卖")。
这类剖断办法能找到大多半交易的提议偏向,然则其实不精确。比以下图中第一种情况就出现了误判。但整体而言,由于应用简单,精确率也还行,LR是遭到广泛接收的算法。
至于在国际市场的应用,我比较懵逼的是A股市场实施T+1,有高频交易吗? 不谈高频,假设目标是对(股票或期货)逐笔的汗青成交作偏向剖断,那么只需采取的是基于电子现价订单簿的持续竞价市场设计,LR算法应当可以直策应用。
剖断后果取决因而数据质量。倘如有订单级别数据,研究者可以自行用超等计算机将订单簿的一切汗青静态完美复盘,天然不须要再去“揣摸”成交偏向。LR算法毕竟是穷汉的办法,可用的数据越精确天然后果越好。美国市场今朝经有地下的纳秒级别逐笔成交和最优报价汗青数据,对最优报价的更新异常精确,及时订单级别数据也能够从交易所买。我不知道中国市场能拿到的数据是甚么情况。