信息的共振:互信息如何丈量资产的隐秘关联
投资世界的危险误判
投资世界里,有一种很常见、也很危险的误判:线性相关接近零,就以为两个资产没关系。
可市场从来不是只按直线运行。
有些资产平时看着各走各路,一到剧烈波动时却突然一起下跌;有些资产平时没什么同步性,但一旦某个阈值被触发,就会出现明显联动。真正重要的,不是它们表面上像不像,而是:知道 A 的变化后,你对 B 的判断有没有变得更准。
问题的根源在于:我们手里的尺子,很多时候只能量直线,但市场里真正危险的关系,常常藏在曲线里。
互信息(Mutual Information)正是为这个问题而生。它不去问”两者是不是同涨同跌”,而是去问:A 是否帮你减少了对 B 的不确定性?
本文只讲三件事:
- 一个思维转换:从”线性相关”到”信息共享”
- 一把新尺子:互信息是怎么工作的
- 一个实战提醒:它如何改变你的投资判断
一、思维转换:从”同涨同跌”到”信息共享”
传统方法最爱问的问题是:这两个资产有没有一起动?
但互信息问得更深一层:如果我已经知道 A 的状态,我对 B 的判断会不会更准?
换成日常语言,会更容易理解。
想象你在猜明天的天气:
- 盲猜,你有 50% 把握
- 但如果你能看到今天的云图,把握提升到 80%
- 这 30% 的提升,就是”互信息”
核心洞察:互信息不衡量”走势长得像不像”,只衡量”知道一个,对猜另一个有没有帮助”。
所以它能捕捉的,不只是直线关系,而是几乎所有统计依赖:直线、曲线、阈值、周期性,都算。线性相关能看到的,只是其中最简单的一类。
| 维度 | 线性相关 | 互信息 |
|---|---|---|
| 问的问题 | 是不是同涨同跌? | 知道一个,猜另一个有帮助吗? |
| 能捕捉的关系 | 直线 | 任何形状 |
| 结果为 0 意味着什么 | 没有直线关系 | 真正独立 |
所以,当两只股票的线性相关接近零,但互信息仍然大于零时,意思不是”它们没关系”,而是:它们的关系不走直线,而是藏在更复杂的结构里。
二、双钟摆账本:一把尺子的实战演示
为了把这个概念彻底讲透,我们用一个最简单的二元例子。
把两只股票想成两个钟摆。每次观察时,它们都只有两种状态:向左,或向右。并且各自向左、向右的概率都一样,都是 50%。
如果它们彼此完全独立,那么四种组合出现的概率应该完全平均:
| A | B | 概率 |
|---|---|---|
| 左 | 左 | 25% |
| 左 | 右 | 25% |
| 右 | 左 | 25% |
| 右 | 右 | 25% |
也就是说,只要独立成立,四格都应该是 25%,不会哪一格特别高,也不会哪一格特别低。
但如果两个钟摆之间其实有耦合,比如中间偷偷连着一根很弱的弹簧,实际观测到的分布就会变成:
| A | B | 实际 | 独立假设 |
|---|---|---|---|
| 左 | 左 | 40% | 25% |
| 左 | 右 | 10% | 25% |
| 右 | 左 | 10% | 25% |
| 右 | 右 | 40% | 25% |
这张表一眼就能看出问题:
- 同向摆动(左左、右右)从 25% 提高到了 40%
- 反向摆动(左右、右左)从 25% 降到了 10%
核心发现:A 的状态显然影响了 B 的状态,所以两者在共享信息。
互信息做的事情,其实很朴素:拿每个格子的实际概率,去和“如果独立,本来应该是多少”做比较。偏离越大,说明共享的信息越多。
\[I(X;Y) = \sum_{x,y} p(x,y) \log_2 \frac{p(x,y)}{p(x)p(y)}\]别被公式吓到。它只是把四个格子逐个记账,然后加总。
在这个例子里,$p(x)=p(y)=0.5$,所以独立假设下每个格子的基准概率都是:
\[p(x)p(y) = 0.5 \times 0.5 = 0.25\]于是四项分别是:
\[I = 0.4 \times \log_2\frac{0.4}{0.25} + 0.1 \times \log_2\frac{0.1}{0.25} + 0.1 \times \log_2\frac{0.1}{0.25} + 0.4 \times \log_2\frac{0.4}{0.25}\]先算括号里的比值和对数:
- $\log_2(0.4/0.25) = \log_2(1.6) \approx 0.678$
- $\log_2(0.1/0.25) = \log_2(0.4) \approx -1.322$
再乘概率权重:
\[I \approx 0.4 \times 0.678 + 0.1 \times (-1.322) + 0.1 \times (-1.322) + 0.4 \times 0.678\] \[= 0.271 - 0.132 - 0.132 + 0.271\] \[\approx \mathbf{0.278 \text{ 比特}}\]这个结果怎么理解?
- 0 比特:真正独立,A 对 B 没有任何帮助
- 0.278 比特:已经有明确的信息共享,A 的状态会改变你对 B 的判断
也就是说,这两个钟摆不是各玩各的,它们之间确实存在耦合。与此同时,线性相关在这个例子里仍然可能很弱,因为它只盯着直线关系看。
这一节真正要记住的不是公式,而是结论:”线性相关 ≈ 0”不等于”独立”。真正确认独立的标准只有一个:互信息 ≈ 0。
三、实战提醒:别让”低相关”骗了你
说到这里,互信息的现实意义就很清楚了。
它确实比线性相关更难计算,因为它需要估计联合概率分布;但也正因为如此,它才能看到那些更真实、也更危险的联动结构。如果世界真的全是直线,线性相关早就够用了。
问题恰恰在于,现实并不是直线世界。市场里常见的是非线性、阈值效应,以及极端行情下突然放大的联动。
所以,互信息在投资上至少给您三个提醒:
-
不要迷信”低相关”组合 构建投资组合时,可以先看线性相关,但不要停在那里。下一句必须追问:极端行情下,它们会不会突然联动?如果怀疑存在阈值效应、尾部依赖或危机共振,就应该用互信息做第二层检查。
-
警惕”虚假分散” 很多所谓的分散投资,只在平静时期成立;一到市场真正承压时,原本看似无关的资产会一起掉下去。互信息更容易暴露这种”平时分散、危机串联”的结构。
-
遇到”组合很安全”的说法,问自己一句话
“它们只是没有直线关系,还是真正信息独立?”
如果答案只是前者,那么这套组合可能只是看起来分散,实际上并不安全。
结语
金融市场里,真正危险的东西,往往不是那些一眼就能看见的关系,而是那些平时不显山露水、关键时刻突然联动的隐藏结构。
互信息的价值,就在于它不替世界做过度简化。它不预设关系一定是直的,也不因为表面上“不一起动”就草率下结论。它只问一个最朴素、也最诚实的问题:知道 A 之后,你对 B 的判断有没有变得更准?
当您开始用这个问题重新审视投资组合时,许多过去被忽略的风险,才会真正浮出水面。
[注]:本文遵循《数据卡真实性准则》。