投资世界的危险误判

投资世界里,有一种很常见、也很危险的误判:线性相关接近零,就以为两个资产没关系。

可市场从来不是只按直线运行。

有些资产平时看着各走各路,一到剧烈波动时却突然一起下跌;有些资产平时没什么同步性,但一旦某个阈值被触发,就会出现明显联动。真正重要的,不是它们表面上像不像,而是:知道 A 的变化后,你对 B 的判断有没有变得更准。

问题的根源在于:我们手里的尺子,很多时候只能量直线,但市场里真正危险的关系,常常藏在曲线里。

互信息(Mutual Information)正是为这个问题而生。它不去问”两者是不是同涨同跌”,而是去问:A 是否帮你减少了对 B 的不确定性?

本文只讲三件事:

  • 一个思维转换:从”线性相关”到”信息共享”
  • 一把新尺子:互信息是怎么工作的
  • 一个实战提醒:它如何改变你的投资判断

一、思维转换:从”同涨同跌”到”信息共享”

传统方法最爱问的问题是:这两个资产有没有一起动?

但互信息问得更深一层:如果我已经知道 A 的状态,我对 B 的判断会不会更准?

换成日常语言,会更容易理解。

想象你在猜明天的天气:

  • 盲猜,你有 50% 把握
  • 但如果你能看到今天的云图,把握提升到 80%
  • 这 30% 的提升,就是”互信息”

核心洞察:互信息不衡量”走势长得像不像”,只衡量”知道一个,对猜另一个有没有帮助”。

所以它能捕捉的,不只是直线关系,而是几乎所有统计依赖:直线、曲线、阈值、周期性,都算。线性相关能看到的,只是其中最简单的一类。

维度线性相关互信息
问的问题是不是同涨同跌?知道一个,猜另一个有帮助吗?
能捕捉的关系直线任何形状
结果为 0 意味着什么没有直线关系真正独立

所以,当两只股票的线性相关接近零,但互信息仍然大于零时,意思不是”它们没关系”,而是:它们的关系不走直线,而是藏在更复杂的结构里。

二、双钟摆账本:一把尺子的实战演示

为了把这个概念彻底讲透,我们用一个最简单的二元例子。

把两只股票想成两个钟摆。每次观察时,它们都只有两种状态:向左,或向右。并且各自向左、向右的概率都一样,都是 50%。

如果它们彼此完全独立,那么四种组合出现的概率应该完全平均:

AB概率
25%
25%
25%
25%

也就是说,只要独立成立,四格都应该是 25%,不会哪一格特别高,也不会哪一格特别低。

但如果两个钟摆之间其实有耦合,比如中间偷偷连着一根很弱的弹簧,实际观测到的分布就会变成:

AB实际独立假设
40%25%
10%25%
10%25%
40%25%

这张表一眼就能看出问题:

  • 同向摆动(左左、右右)从 25% 提高到了 40%
  • 反向摆动(左右、右左)从 25% 降到了 10%

核心发现:A 的状态显然影响了 B 的状态,所以两者在共享信息。

互信息做的事情,其实很朴素:拿每个格子的实际概率,去和“如果独立,本来应该是多少”做比较。偏离越大,说明共享的信息越多。

\[I(X;Y) = \sum_{x,y} p(x,y) \log_2 \frac{p(x,y)}{p(x)p(y)}\]

别被公式吓到。它只是把四个格子逐个记账,然后加总。

在这个例子里,$p(x)=p(y)=0.5$,所以独立假设下每个格子的基准概率都是:

\[p(x)p(y) = 0.5 \times 0.5 = 0.25\]

于是四项分别是:

\[I = 0.4 \times \log_2\frac{0.4}{0.25} + 0.1 \times \log_2\frac{0.1}{0.25} + 0.1 \times \log_2\frac{0.1}{0.25} + 0.4 \times \log_2\frac{0.4}{0.25}\]

先算括号里的比值和对数:

  • $\log_2(0.4/0.25) = \log_2(1.6) \approx 0.678$
  • $\log_2(0.1/0.25) = \log_2(0.4) \approx -1.322$

再乘概率权重:

\[I \approx 0.4 \times 0.678 + 0.1 \times (-1.322) + 0.1 \times (-1.322) + 0.4 \times 0.678\] \[= 0.271 - 0.132 - 0.132 + 0.271\] \[\approx \mathbf{0.278 \text{ 比特}}\]

这个结果怎么理解?

  • 0 比特:真正独立,A 对 B 没有任何帮助
  • 0.278 比特:已经有明确的信息共享,A 的状态会改变你对 B 的判断

也就是说,这两个钟摆不是各玩各的,它们之间确实存在耦合。与此同时,线性相关在这个例子里仍然可能很弱,因为它只盯着直线关系看。

这一节真正要记住的不是公式,而是结论:”线性相关 ≈ 0”不等于”独立”。真正确认独立的标准只有一个:互信息 ≈ 0

三、实战提醒:别让”低相关”骗了你

说到这里,互信息的现实意义就很清楚了。

它确实比线性相关更难计算,因为它需要估计联合概率分布;但也正因为如此,它才能看到那些更真实、也更危险的联动结构。如果世界真的全是直线,线性相关早就够用了。

问题恰恰在于,现实并不是直线世界。市场里常见的是非线性、阈值效应,以及极端行情下突然放大的联动。

所以,互信息在投资上至少给您三个提醒:

  1. 不要迷信”低相关”组合 构建投资组合时,可以先看线性相关,但不要停在那里。下一句必须追问:极端行情下,它们会不会突然联动?如果怀疑存在阈值效应、尾部依赖或危机共振,就应该用互信息做第二层检查。

  2. 警惕”虚假分散” 很多所谓的分散投资,只在平静时期成立;一到市场真正承压时,原本看似无关的资产会一起掉下去。互信息更容易暴露这种”平时分散、危机串联”的结构。

  3. 遇到”组合很安全”的说法,问自己一句话

“它们只是没有直线关系,还是真正信息独立?”

如果答案只是前者,那么这套组合可能只是看起来分散,实际上并不安全


结语

金融市场里,真正危险的东西,往往不是那些一眼就能看见的关系,而是那些平时不显山露水、关键时刻突然联动的隐藏结构

互信息的价值,就在于它不替世界做过度简化。它不预设关系一定是直的,也不因为表面上“不一起动”就草率下结论。它只问一个最朴素、也最诚实的问题:知道 A 之后,你对 B 的判断有没有变得更准?

当您开始用这个问题重新审视投资组合时,许多过去被忽略的风险,才会真正浮出水面。


[注]:本文遵循《数据卡真实性准则》。