1103-COV hartlap correction
非常好的问题 👍。
我们来仔细说明一下为什么**样本协方差矩阵(sample covariance matrix)**在求逆时会产生 bias。
🧩 1️⃣ 背景:什么是样本协方差
假设我们有 (N_s) 个独立样本 (\mathbf{d}_k)(每个是维度为 (p) 的向量),它们来自某个真实协方差为 (\mathbf{C}) 的高斯分布: [ \mathbf{d}_k \sim \mathcal{N}(0, \mathbf{C}) ]
我们用常规方式估计协方差: [ \widehat{\mathbf{C}} = \frac{1}{N_s - 1} \sum_{k=1}^{N_s} (\mathbf{d}_k - \bar{\mathbf{d}})(\mathbf{d}_k - \bar{\mathbf{d}})^{!\top} ] 其中 (\bar{\mathbf{d}}) 是样本均值。
这个 (\widehat{\mathbf{C}}) 是对 (\mathbf{C}) 的无偏估计量,即: [ \mathbb{E}[\widehat{\mathbf{C}}] = \mathbf{C}. ] 到这里一切正常。
🧩 2️⃣ 问题出现在求逆时
我们通常需要用到精度矩阵(precision matrix) (\mathbf{\Psi} = \mathbf{C}^{-1}), 但在实际中只能用样本协方差的逆 (\widehat{\mathbf{C}}^{-1}) 近似它。 这一步才是 bias 的来源。
原因是 (\widehat{\mathbf{C}}) 本身是一个随机矩阵,它服从 Wishart 分布: [ \widehat{\mathbf{C}} \sim \frac{1}{N_s - 1} \mathcal{W}_p(\mathbf{C}, N_s - 1), ] 其中 (p) 是维度,(N_s-1) 是自由度。
Wishart 分布的数学性质告诉我们: [ \mathbb{E}[\widehat{\mathbf{C}}^{-1}] \neq \mathbf{C}^{-1}. ]
更精确地说: [ \mathbb{E}[\widehat{\mathbf{C}}^{-1}] = \frac{N_s - 1}{N_s - p - 2},\mathbf{C}^{-1}, \quad \text{当 } N_s > p + 2. ] 也就是说,(\widehat{\mathbf{C}}^{-1}) 系统性地偏小(即低估协方差的逆)。
🧩 3️⃣ Hartlap 校正因子
为了消除这种偏差,通常引入一个缩放系数: [ \alpha_H = \frac{N_s - p - 2}{N_s - 1}, ] 然后使用: [ \mathbf{\Psi} = \alpha_H ,\widehat{\mathbf{C}}^{-1}. ] 这个修正是由 Hartlap, Simon & Schneider (2007, A&A 464, 399) 提出的,被广泛用于宇宙学参数估计(Planck、DES、KiDS、ACT 等都在用)。
🧩 4️⃣ 直观理解
你可以这样理解:
我们用有限样本估计协方差 → 有统计波动;
对于多维分布,这种波动会“放大”在矩阵逆的操作中;
结果是:(\widehat{C}^{-1}) 平均值偏大于真值;
Hartlap 因子通过缩放修正这个偏差。
🧩 5️⃣ 举例
如果:
模拟数 (N_s = 200),
bandpower 维度 (p = 10),
则: [ \alpha_H = \frac{200 - 10 - 2}{199} \approx 0.94. ] 也就是说,不校正时 (\widehat{C}^{-1}) 会高估真实的 (\mathbf{C}^{-1}) 约 6%。
✅ 总结
样本协方差 (\widehat{C})
✅ 无偏 ((\mathbb{E}[\widehat{C}] = C))
样本逆协方差 (\widehat{C}^{-1})
❌ 有偏 ((\mathbb{E}[\widehat{C}^{-1}] \neq C^{-1}))
校正后 (\alpha_H \widehat{C}^{-1})
✅ 期望无偏 ((\mathbb{E}[\alpha_H \widehat{C}^{-1}] = C^{-1}))
是否希望我帮你画一张简单的图(比如 1D 或 2D 示例)展示这个 bias 的数值差异?那样可以在回复或补充材料里直观展示 “为何要 Hartlap 修正”。
Last updated