Skip to content

4.4 协方差与相关系数

Summary

协方差计算公式

cov(X,Y)=E(XY)E(X)E(Y)D(X±Y)=D(X)+D(Y)±2cov(X,Y)

相关系数

ρXY=cov(X,Y)D(X)D(Y)

性质

线性性 (由定义或公式得到)

cov(aX,bY)=abcov(X,Y)cov(X,Y)=cov(Xa,Yb)

线性可加性

cov(X+Y,Z)=cov(X,Z)+cov(Y,Z)

概念

协方差

随机变量 X,Y 的协方差为

cov(X,Y)=E[(XE(X))(YE(Y))]
  • D(X)=cov(X,X)

相关系数

D(X)>0,D(Y)>0, 则有 XY 的相关系数

ρXY=cov(X,Y)D(X)D(Y)
  • 相关系数为标准化的协方差 ρXY=cov(X,Y)
  • ρXY=0 时, XY 不相关

协方差矩阵

(D(X)cov(X,Y)cov(X,Y)D(Y))

计算

公式

cov(X,Y)=E(XY)E(X)E(Y)D(X±Y)=D(X)+D(Y)±2cov(X,Y)

定义

离散型

cov(X,Y)=i=1+j=1+[xiE(X)][yjE(Y)]pij

连续型

cov(X,Y)=++[xE(X)][yE(Y)]f(x,y)dxdy

正态分布

(X,Y)N(μ1,σ12;μ2,σ22;ρ), 相关系数为 ρ

运算性质

协方差的性质

设以下随机变量的协方差存在

可换性 cov(X,Y)=cov(Y,X)

变量与常数的协方差

cov(X,C)=0

变量与自己的协方差为方差

cov(X,X)=D(X)

线性性 (由定义或公式得到)

cov(aX,bY)=abcov(X,Y)cov(X,Y)=cov(Xa,Yb)

线性可加性

cov(X+Y,Z)=cov(X,Z)+cov(Y,Z)

柯西施瓦茨不等式

|cov(X,Y)|D(X)D(Y)

相关系数的性质

规范性 |ρXY|1

随机变量完全相关

|ρXY|=1P(Y=±X)=1
  • ρXY=1P(Y=X)=1 此时 X,Y 完全正相关
  • ρXY=1P(Y=X)=1 此时 X,Y 完全负相关

|ρXY| 反映了由 X 的线性函数 aX+b 估计 Y 所产生的均方误差的大小

  • P(Y=aX+b)=1(a0)|ρXY|=1

*均方误差

mina,bE{[Y(a+bX)]2}=E{[Y(a0+b0X)]2}=(1ρXY2)D(Y)
  • b0=cov(X,Y)D(X)
  • a0=E(Y)b0E(X)

均方误差为关于 |ρXY| 的严格递减函数