Skip to main content
QUICK REVIEW

[论文解读] Endogeneous Dynamics of Intraday Liquidity

Mikołaj Bińkowski, Charles‐Albert Lehalle|arXiv (Cornell University)|Nov 9, 2018
Complex Systems and Time Series Analysis被引用 2
一句话总结

本文利用美国、英国、日本和中国香港的300只股票在五分钟频率下的数据,研究了股票市场中的内生日内流动性动态。研究采用自回归(AR)和向量自回归(VAR)模型对平稳化的流动性变量——交易量、买卖价差、波动率以及首次观察到的订单簿规模——进行分析,揭示了显著的自相关性以及持续30分钟至两小时以上的‘记忆效应’,并识别出若干关键的典型事实,包括‘流动性效应’、‘最小报价单位效应’和‘国家驱动效应’,这些效应在预测性能中表现明显。

ABSTRACT

In this paper we investigate the endogenous information contained in four liquidity variables at a five minutes time scale on equity markets around the world: the traded volume, the bid-ask spread, the volatility and the volume at first limits of the orderbook. In the spirit of Granger causality, we measure the level of information by the level of accuracy of linear autoregressive models. This empirical study is carried out on a dataset of more than 300 stocks from four different markets (US, UK, Japan and Hong Kong) from a period of over five years. We discuss the obtained performances of autoregressive (AR) models on stationarized versions of the variables, focusing on explaining the observed differences between stocks. Since empirical studies are often conducted at this time scale, we believe it is of paramount importance to document endogenous dynamics in a simple framework with no addition of supplemental information. Our study can hence be used as a benchmark to identify exogenous effects. On the other hand, most optimal trading frameworks (like the celebrated Almgren and Chriss one), focus on computing an optimal trading speed at a frequency close to the one we consider. Such frameworks very often take i.i.d. assumptions on liquidity variables; this paper document the auto-correlations emerging from real data, opening the door to new developments in optimal trading.

研究动机与目标

  • 在不依赖外生信息的前提下,建立5分钟时间尺度下内生日内流动性动态的基准。
  • 量化过去四个关键流动性变量——交易量、买卖价差、波动率以及首次观察到的订单簿规模——在多个全球市场中的预测能力。
  • 通过记录真实市场数据中持续存在的自相关性,挑战最优交易框架中常见的独立同分布(i.i.d.)假设。
  • 为最优交易和交易成本分析(TCA)模型中纳入内生动态提供实证依据。

提出的方法

  • 本研究使用美国、英国、日本和中国香港的300只股票在过去五年中以五分钟为间隔采样的数据集。
  • 通过取对数并进行平稳化处理,对流动性变量进行变换以消除日内季节性,从而实现可靠的AR和VAR建模。
  • 以样本外R²作为主要评估指标,并采用10折交叉验证以确保结果稳健性。
  • 应用格兰杰因果关系卡方检验,评估某一变量的过去值是否能提升对另一变量的预测能力,从而识别变量间的相互依赖关系。
  • 将VAR模型与单变量AR模型进行比较,以评估多变量动态带来的附加价值。
  • 本分析区分了‘记忆效应’(预测的滞后长度)、‘信息含量’(R²的提升程度)以及‘因果结构’(影响方向)。

实验结果

研究问题

  • RQ1在五分钟频率下,流动性变量的过去值中包含多少预测信息?该信息量在不同股票和市场间如何变化?
  • RQ2哪些关键典型事实主导了内生日内流动性动态,特别是自相关性和跨变量依赖关系?
  • RQ3以‘档位’为单位的买卖价差在多大程度上影响流动性变量的可预测性?这种影响在全球市场中是否一致?
  • RQ4市值如何影响AR模型对不同流动性变量的‘记忆长度’和预测准确性?
  • RQ5股票的地理来源(美国、英国、日本、中国香港)是否显著影响其流动性动态的可预测性?如果是,原因是什么?

主要发现

  • 在预测波动率方面,AR模型的样本外R²在美国显著高于亚洲市场(美国约0.5,亚洲约0.25),英国介于两者之间,表明预测性能存在‘国家驱动效应’。
  • 观察到‘流动性效应’:对于大多数流动性变量,市值越大,AR模型中的记忆长度越短,表明大市值股票的动态更具可预测性。
  • 确认了‘最小报价单位效应’:以‘档位’为单位的买卖价差越小,订单簿规模的可预测性越高,而价差本身的可预测性越低,表明最小报价单位与可预测性之间存在结构性关联。
  • ‘记忆效应’持续时间为30分钟至两小时以上,最具信息量的滞后阶数因股票和变量而异,其中美国市场的信息含量最高。
  • VAR模型始终优于单变量AR模型,尤其在预测买卖价差和换手率方面表现更优,英国市场在换手率与订单簿规模之间表现出双向因果关系。
  • 波动率表现出独特行为:其预测能力受其他变量影响较小,且在不同股票间预测性能相对均匀,表明其可能反映宏观层面的外生信息,而非微观结构动态。

更好的研究,从现在开始

从论文设计到论文写作,大幅缩短您的研究时间。

无需绑定信用卡

本解读由 AI 生成,并经人工编辑审核。