【统计套利:用数学打败市场】
如果说趋势交易是在"预测未来",那统计套利就是在"利用现在"。它不赌方向,只赌概率——当两个高度相关的资产价格偏离历史正常关系时,押注它们会回归。
1️⃣ 什么是统计套利?核心逻辑:- 找到两个(或多个)高度相关的资产- 当它们的价差偏离统计意义上的"正常范围"时- 做空贵的、做多便宜的- 等待价差回归均值时平仓获利
关键假设:均值回归(Mean Reversion)- 价格偏离不会永远持续- 相关性在长期会恢复- 偏离越大,回归动力越强
2️⃣ 配对交易(Pairs Trading)——最经典的统计套利什么是配对交易?- 同时监控两只相关性高的股票/期货合约- 计算它们的价格比率或价差- 当比率偏离历史均值超过N个标准差时建仓- 回归至均值附近时平仓
配对选择标准:① 基本面相关:同一行业、上下游、替代品② 统计相关:历史相关系数>0.7(越高越好)③ 流动性匹配:成交量级别相近④ 波动率相近:避免一方剧烈波动导致价差失控
经典配对示例:- 螺纹钢 vs 热卷(同一产业链不同产品)- 豆粕 vs 豆油(压榨利润关系)- 沪深300ETF vs 中证500ETF(大盘vs中小盘)- 铜期货 vs 铝期货(有色金属内部)
3️⃣ 价差构建方法方法一:绝对价差 = Price_A - Price_B- 简单直观- 适用于同单位、同量级的品种- 问题:如果A和B价格量级差异大,价差不稳定
方法二:价格比率 = Price_A / Price_B- 解决了量级差异问题- 取对数后更符合正态分布假设- 问题:比率可能存在趋势性(非平稳)
方法三:协整(Cointegration)残差- 用回归模型拟合 A = α + β×B + ε- 残差ε就是"剔除趋势后的纯偏离"- 协整检验确保长期均衡关系存在- 最严谨的方法,也是机构主流做法
4️⃣ 信号生成——何时入场?Z-Score方法:- 计算价差/比率的滚动均值和标准差- Z = (当前值 - 滚动均值) / 滚动标准差- |Z| > 2 → 触发信号(约95%置信区间外)- |Z| > 3 → 强信号(99.7%置信区间外)- Z归零 → 平仓
参数选择:- 滚动窗口:通常20-60天(日频)或60-240根K线- 入场阈值:±2σ(保守)或 ±1.5σ(激进)- 出场阈值:±0.5σ(回归至均值附近)- 止损阈值:±3.5σ 或 ±4σ(极端情况认输)
5️⃣ 仓位管理等风险权重:- 两腿的金额应该相等(或按Beta调整)- 不是手数相等,而是金额相等- 例:A单价5000元,B单价10000元- 若做多A做空B各10万金额→ 买入A 20手 vs 卖出B 10手
动态再平衡:- 随着价格变化,两腿市值比例会偏移- 定期(如每周)调整回初始比例- 或者设定偏离阈值触发再平衡
6️⃣ 风险控制相关性失效风险:- 原本相关的资产可能突然脱钩- 行业结构性变化、政策冲击、突发事件- 监控实时相关系数,低于0.5时减仓或平仓
单边风险:- 配对交易的理想状态是Delta中性- 但实际执行中可能出现短暂的单边暴露- 用期货对冲或限制单边敞口
均值不再回归:- 有些偏离是结构性的(基本面永久改变)- 区分"暂时性偏离"和"永久性脱钩"- 设置最大持仓时间和止损线
流动性风险:- 一边成交了另一边没成交- 导致裸露的单边头寸- 使用限价单而非市价单来降低此风险
7️⃣ 实战案例:螺纹钢 vs 热轧卷板基本面逻辑:- 两者原料相同(铁矿石+焦炭)- 螺纹用于建筑,热卷用于制造- 通常热卷价格 > 螺纹钢价格(加工成本溢价)- 价差反映建筑 vs 制造业的相对强弱
操作框架:① 计算历史价差分布(过去2年数据)② 确定均值和标准差③ 当价差 < 均值 - 2σ 时:做多螺纹、做空热卷④ 当价差 > 均值 + 2σ 时:做空螺纹、做多热卷⑤ 价差回归至均值 ± 0.5σ 时平仓⑥ 止损:价差突破 ± 4σ
8️⃣ 新手进阶建议第一阶段(学习期,1-2个月):- 用Excel手动计算几个配对的Z-Score- 观察价差的走势,感受均值回归的过程- 不需要实盘,纸上交易即可
第二阶段(验证期,2-3个月):- 选1-2个你熟悉的配对- 用Python/backtrader做回测- 关注夏普比率和最大回撤- 对比不同参数的表现
第三阶段(小资金实战,持续):- 单个配对分配不超过总资金5%- 同时运行3-5个不相关的配对(分散化)- 严格记录每笔交易的入场理由和平仓结果- 每月复盘一次策略有效性
💡 深度思考:统计套利的魅力在于它把交易从"预测艺术"变成了"统计科学"。你不需要知道市场明天是涨还是跌,只需要知道"A相对于B太贵了"这个事实,然后等待数学规律发挥作用。当然,均值回归不是物理定律——它只是一个统计规律,有失效的时候。但只要你控制好仓位、设置好止损、分散化配置多个配对,即使个别案例失效也不会伤及根本。这就是量化思维的核心——不追求每一笔都赢,而是追求在大量独立决策中保持正期望值。