从零开始学Bates模型
1/5Heston + 跳跃 = Bates
Heston 解释长期限微笑:随机方差产生平滑的偏斜和期限结构。Merton 解释短期限微笑:价格过程中的跳跃在短到期日处产生陡峭的两翼。Bates 将两者合并为一个模型。
核心问题很简单。Heston 是连续运动的——现货价格从不瞬移。这意味着仅靠 Heston 无法解释为什么 1 周期 25-delta 看跌期权可以以 80% 的波动率成交,而 1 年期的只有 55%。短期限两翼的陡峭度需要连续扩散无法提供的东西:瞬时跳空。
Merton(1976)通过在几何布朗运动上加入泊松跳跃过程解决了跳空问题。但 Merton 没有随机方差,因此无法再现期限结构动态。它能很好地为单一到期日定价,但在整条曲线上就失效了。
Bates(1996)将两者粘合在一起。其结果成为奇异期权交易台的主力模型,既有真实的动态特性,又保持定价的可解性。
第二行: 方差遵循与Heston相同的CIR过程。此处没有任何变化。
第三行: 相同的相关结构。ρ仍然驱动平滑的偏斜。
想象一辆行驶在颠簸道路上的汽车(Heston:路面质量随机变化)。再加上随机出现的坑洞(Merton 跳跃:车身突然下坠)。您需要悬挂系统应对颠簸,需要安全气囊应对坑洞。Bates 两者兼备。
关键的数学洞察:由于跳跃分量独立于方差过程,Bates 的特征函数就是 Heston 特征函数乘以 Merton 跳跃因子。这意味着定价仍是半解析的——傅里叶反演依然适用。为香草期权定价无需蒙特卡洛。
新增参数的作用
Bates继承了Heston的五个参数(κ, θ,σ, ρ, v₀),并增加了三个跳跃参数:λ (跳跃频率)、μⱼ (平均跳跃幅度),以及 σⱼ (跳跃波动率)。总共八个调节旋钮。
λ (lambda) ——跳跃强度。 每年预期的跳跃次数。λ = 0 时恢复为纯Heston模型。λ = 2 表示平均每年大约两次跳跃。更高的 λ 会使尾翼进一步抬升,因为市场将更多跳空事件计入期权定价。
μⱼ (mu-J) ——平均跳跃幅度。 跳跃的平均对数收益。负的 μⱼ 意味着跳跃偏向下方(崩盘式跳跃)。这会造成不对称:Put侧尾翼比Call侧尾翼更陡。在加密市场中,μⱼ 通常介于 −0.05 and−0.15之间,反映了强制平仓连锁反应和闪崩。
σⱼ (sigma-J) ——跳跃波动率。 跳跃幅度的标准差。即使平均跳跃为零,非零的 σⱼ 也会造成对称的翼部抬升。这是随机大小跳跃产生的纯粹超额峰度。更大的σⱼ 意味着更厚的尾部。
在上方开启和关闭跳跃。当跳跃关闭时,您看到的是纯粹的 Heston(蓝色虚线)。开启它们后翼部会抬升——尤其是左翼,因为 μⱼ < 0 使跳跃偏向下方。将 λ 调到 3 或 4,效果会非常明显。设置 μⱼ = 0,您会注意到抬升变得对称。
关键的洞察:ρ(Heston)和 μⱼ(跳跃)都会产生偏斜,但通过完全不同的机制。ρ 通过现货-波动率相关性产生偏斜,这会随时间逐渐累积。μⱼ 通过定向跳跃产生偏斜,这会瞬间出现。这就是为什么 Bates 能够同时拟合短期端和长期端。
期限结构分解
短期限微笑主要由跳跃驱动。长期限微笑主要由随机波动率驱动。这种分离正是 Bates 存在的原因——任何单一分量都无法拟合完整的期限结构。
其机制是方差缩放。扩散方差与 T 成比例累积:在一年之内,扩散成分有时间累积起来。跳跃方差也随 T 缩放(λ · T 个预期跳跃),但无论时间跨度如何,每一次单独的跳跃大小都相同。
在 T = 7 天时,扩散方差几乎没有时间累积,但单次跳跃仍能以完整的幅度击中您。一周内一次 −10% 的暴跌,与一年内一次−10% 的暴跌具有相同的到期收益影响——但相对于 7 天内的总预期波动,这次暴跌所占的比例要比 365 天内大得多。
在 T = 1 年时,随机波动率有足够时间遍历方差路径的完整分布。均值回归、波动率聚集和现货-波动率相关性都充分展现。跳跃分量仍然存在,但在总方差中的占比较小。
看看上方的四张图表。在 T = 7d 时,红色区域(跳跃贡献)主导着翼部。在 T = 1y 时,它只是一条细缝。增大 λ,观察交叉点如何移动——更频繁的跳跃会将跳跃贡献推向曲线的更远处。
这种分解具有直接的交易意义。如果您认为跳跃风险被错误定价,就交易短端;如果您认为方差动态被错误定价,就交易长端。Bates 为您提供了区分这两类押注的框架。
Bates 模型校准
八个参数很多。不同的组合可以产生相似的微笑,优化器可能陷入不稳定的区域。实用的校准需要纪律。
标准方法是两阶段策略:
阶段 1:固定可观测的参数。 v₀ 由当前 ATM 隐含方差锁定。漂移率 r 是已知的。这就剩下七个自由参数。
阶段 2:分组校准。 首先将 κ, θ, σ, ρ 拟合到长期微笑(此处跳跃贡献很小)。然后将λ, μⱼ, σⱼ 拟合到短期残差。迭代几次以进行优化。
此方法有效是因为两组参数控制曲面的不同部分。Heston 参数塑造远端;跳跃参数塑造近端。依次拟合可以降低每一步优化的维度。
过拟合陷阱。 更多的参数总能改善样本内拟合。但如果您让所有八个参数自由浮动,就有拟合噪声的风险。明显的迹象是:参数每天剧烈变化却产生相似的微笑。如果 λ 在连续几次校准中在 0.5 和 3.0 之间震荡,那么您的拟合是不稳定的。
上图展示了一个真实的对比。Heston(橙色,5 个参数)能很好地拟合 ATM 区域,但系统性地偏离深度虚值 (OTM) 看跌期权。Bates(绿色,8 个参数)精准命中两翼,因为跳跃分量捕捉到了 Heston 无法企及的陡峭短期限偏斜。
查看主图下方的残差图。Heston 残差在两翼较大且呈系统性——模型存在偏差,不只是噪声。Bates 残差更小、更随机。这才是真正改进的标志,而非过拟合。
经验法则:如果增加 3 个参数能使 SSE 降低 50% 以上,额外的复杂度就是值得的。如果只降低 10-20%,您也许更应该坚持使用 Heston 并接受两翼误差。
加密市场的主力模型
Bates 是加密奇异期权交易台的标准模型,因为加密市场同时存在随机波动率和频繁跳跃。强制平仓连锁、脱锚和交易所宕机造成了 Heston 独自无法定价的真实跳空风险。
加密波动率曲面具有 Bates 能够很好处理的独特特征:
持续的波动率状态。 BTC 可以连续数周保持在 30% 的 IV,然后在一次强制平仓级联中骤然跳升至 80%。低κ(缓慢的均值回归)结合高 v₀捕捉了冲击后的环境。这就是 Heston 成分发挥的作用。
频繁的跳空行情。 10% 的日内暴跌在股票市场中不常见,但在加密市场中每年会发生多次。这些是真正的跳跃,而不仅仅是大幅的扩散性波动。它们表现为极其陡峭的短期 Put 翼部,任何数量的σ(波动率的波动率)都无法匹配。跳跃成分处理这一点。
双向跳空。 与几乎总是向下跳跃的股票市场不同,加密市场也有显著的上行跳空风险(轧空、意外的 ETF 批准、交易所上币)。将μⱼ设为更接近零(对某些币种甚至略微为正),可以让模型捕捉对称的跳空风险。
上方的方差分解展示了 ATM 总方差如何在扩散分量与跳跃分量之间拆分。对于典型的加密参数,跳跃可占总方差的 20-40%。这不是一个修正项——而是一阶效应。
超越 Bates:SLV。 Bates 对观测曲面的拟合优于 Heston,但它仍然无法精确拟合每一个行权价和到期日。对于生产级的奇异期权定价,大多数交易台会在其上叠加一层局部波动率,从而创建一个随机-局部波动率(SLV)模型。Bates 提供动力学引擎;局部波动率提供精确的校准。详见 SLV 参考 了解详情。
何时 Bates 过于复杂: 如果您只需要为单个到期日插值单个微笑,请使用 SVI。如果您需要一个不含动力学的完整曲面, SSVI 更快也更稳定。当您需要标的资产动力学时——用于奇异期权定价、对冲路径依赖型产品,或将微笑分解为经济成分——Bates 才配得上它的复杂性。
Black-Scholes:没有微笑。单一波动率什么都拟合不了。
Heston:平滑的微笑动态。适用于长端。
Bates:平滑 + 跳跃。两端兼顾。
SLV:精确校准 + 动态特性。生产环境标准。
每一步都增加复杂度和校准成本。关键在于判断额外的机制对您的具体用途是否值得。