什么是协方差矩阵

2024-04-29

1. 什么是协方差矩阵

在统计学与概率论中,，协方差矩阵是一个矩阵，其每个元素是各个向量元素之间的方差。是从标量随机变量到高维度随机向量的自然推广。 　　假设 X 是以 n 个标量随机变量组成的列向量，并且μk 是其第k个元素的期望值, 即, μk = E(Xk), 协方差矩阵然后被定义为： 　　Σ=E{(X-E[X])(X-E[X])T}=(如图) 　　矩阵中的第(i,j)个元素是Xi与Xj的协方差. 这个概念是对于标量随机变量方差的一般化推广

什么是协方差矩阵

2. 协方差矩阵？

1、协方差矩阵中的每一个元素是表示的随机向量X的不同分量之间的协方差，而不是不同样本之间的协方差，如元素Cij就是反映的随机变量Xi, Xj的协方差。2、协方差是反映的变量之间的二阶统计特性，如果随机向量的不同分量之间的相关性很小，则所得的协方差矩阵几乎是一个对角矩阵。对于一些特殊的应用场合，为了使随机向量的长度较小，可以采用主成分分析的方法，使变换之后的变量的协方差矩阵完全是一个对角矩阵，之后就可以舍弃一些能量较小的分量了（对角线上的元素反映的是方差，也就是交流能量）。特别是在模式识别领域，当模式向量的维数过高时会影响识别系统的泛化性能，经常需要做这样的处理。3、必须注意的是，这里所得到的式（5）和式（6）给出的只是随机向量协方差矩阵真实值的一个估计（即由所测的样本的值来表示的，随着样本取值的不同会发生变化），故而所得的协方差矩阵是依赖于采样样本的，并且样本的数目越多，样本在总体中的覆盖面越广，则所得的协方差矩阵越可靠。4、如同协方差和相关系数的关系一样，我们有时为了能够更直观地知道随机向量的不同分量之间的相关性究竟有多大，还会引入相关系数矩阵。 在概率论和统计学中，相关或称相关系数或关联系数，显示两个随机变量之间线性关系的强度和方向。在统计学中，相关的意义是用来衡量两个变量相对于其相互独立的距离。在这个广义的定义下，有许多根据数据特点而定义的用来衡量数据相关的系数。对于不同数据特点，可以使用不同的系数。最常用的是皮尔逊积差相关系数。其定义是两个变量协方差除以两个变量的标准差（方差）。皮尔逊积差系数
数学特征其中，E是数学期望，cov表示协方差。因为μX = E(X)，σX2 = E(X2) �6�1 E2(X)，同样地，对于Y，可以写成
当两个变量的标准差都不为零，相关系数才有定义。从柯西—施瓦茨不等式可知，相关系数不超过1. 当两个变量的线性关系增强时，相关系数趋于1或-1。当一个变量增加而另一变量也增加时，相关系数大于0。当一个变量的增加而另一变量减少时，相关系数小于0。当两个变量独立时，相关系数为0.但反之并不成立。 这是因为相关系数仅仅反映了两个变量之间是否线性相关。比如说，X是区间［－１，１］上的一个均匀分布的随机变量。Y = X2. 那么Y是完全由X确定。因此Y 和X是不独立的。但是相关系数为0。或者说他们是不相关的。当Y 和X服从联合正态分布时，其相互独立和不相关是等价的。当一个或两个变量带有测量误差时，他们的相关性就受到削弱，这时，“反衰减”性（disattenuation）是一个更准确的系数。

3. 协方差矩阵

a的协方差矩阵就是E(aa')。其中E代表数学期望，a'代表a的转置。我这里默认你这个a是写成列向量的形式的。
所以a/||a||的协方差矩阵就是E(aa')/||a||^2，就是把a的协方差矩阵里的每个元素都除以||a||^2。
当a的协方差矩阵是单位阵时，a的任意一个元素（都是随机变量）的方差都是1，而且任意两个元素不相关（不相关不代表独立）。

协方差矩阵

4. 协方差矩阵

用matlab算：
a=[-1.54    -5.93    -258.1    -3.5    2.26    0.13];
cov(a)

ans =
1.0963e+004
或者：
a=[-1.54    -5.93    -258.1  ;  -3.5    2.26    0.13];
 cov(a)

ans =
  1.0e+004 *
    0.0002   -0.0008   -0.0253
   -0.0008    0.0034    0.1057
   -0.0253    0.1057    3.3341
或者：
 a=[-1.54    -5.93  ;  -258.1    -3.5 ;   2.26    0.13]
 cov(a)

ans =
  1.0e+004 *
    2.2271    0.0057
    0.0057    0.0009

5. 协方差的矩阵

分别为m与n个标量元素的列向量随机变量X与Y，这两个变量之间的协方差定义为m×n矩阵.其中X包含变量X1.X2......Xm,Y包含变量Y1.Y2......Yn,假设X1的期望值为μ1，Y2的期望值为v2，那么在协方差矩阵中（1,2）的元素就是X1和Y2的协方差。两个向量变量的协方差Cov(X,Y)与Cov(Y,X)互为转置矩阵。协方差有时也称为是两个随机

协方差的矩阵

6. 协方差矩阵

 在统计学上，协方差用来刻画两个随机变量之间的相关性，反映的是变量之间的二阶统计特性，两个随机变量Xi和Yj的协方差定义为
                                           所以
                                           是一个矩阵，其  i ,  j  位置的元素是第  i  个与第  j  个随机向量（即随机变量构成的向量）之间的协方差。   设X1，X2，...,Xn为一组随机变量，记X=(X1，X2，...,Xn)T为由这n个随机变量构成的随机向量，假设每个随机变量有m个样本，将所有的样本拼接在一起可以得到如下的 样本矩阵 
                                           协方差矩阵是计算不同维度间的协方差，要时刻牢记这一点。因此样本矩阵的每行是一个样本，每列为一个维度，所以我们要按列计算均值。 但是 peghoty 博客中用的是矩阵第i行元素表示第i个随机变量Xi的m个样本 ，所以以下分析暂时用的peghoty的方案。
   引入向量αi和βi
                                           αi是样本矩阵的行向量，βi是样本矩阵的列向量，所以样本矩阵表示为
                                           对于n维的随机变量X=(X1,X2,…,Xn)T的协方差矩阵定义为
   
                                           
    协方差矩阵中的对角线元素表示方差，非对角线元素表示随机向量X的不同随机量之间的协方差 ，因此协方差矩阵可以作为 刻画不同分量之间相关性的一个评判量 ，不同分量之间的相关性越小，则C的非对角线元素的值就越小，特别地，如果不同分量彼此不相关，那么C就变成一个 对角阵 。    注意：我们并不能得到协方差矩阵C的真实性，只能根据所提供的X的样本数据，对其进行近似估计，因此，这样计算得到的协方差矩阵是依赖于样本数据的，通常提供的样本数目越多（m越大），样本在总体中的覆盖面就越广，所得协方差矩阵就越可靠。 
   **协方差公式推导

7. 协方差矩阵的理解

  为了便于理解和验证，可以参考一下， http://www.ab126.com/shuxue/2788.html 所提供的协方差的在线计算器。
  
   统计里最基本的概念就是样本的均值，方差，或者再加个标准差。假定有一个含有n个样本的集合X={X1,…,Xn}，依次给出这些概念的公式描述:
  
   
     很显然，均值描述的是样本集合的中间点，它告诉我们的信息是很有限的。
     
     而标准差给我们描述的则是样本集合的各个样本点到均值的距离之平均。以这两个集合为例，[0，8，12，20]和[8，9，11，12]，两个集合的均值都是10，但显然两个集合差别是很大的，计算两者的标准差，前者是8.3，后者是1.8，显然后者较为集中，故其标准差小一些，标准差描述的就是这种“散布度”。
  
   
     看出方差与标准差关系没有?
     为什么除以n-1而不是除以n? 这个称为贝塞尔修正。在统计学中样本的均差多是除以自由度（n-1)，它的意思是样本能自由选择的程度,当选到只剩一个时，它不可能再有自由了，所以自由度是（n-1)。这样能使我们以较小的样本集更好的逼近总体的标准差，即统计上所谓的“无偏估计”。
  
   下面采用Python演算一下:
     参考: https://blog.csdn.net/lyl771857509/article/details/79439184 
  
 计算步骤:
   求和：   1+2+3+4=10
   平均值：   =2.5
  
   
     
     
     
  
 方差：  
  
   上面几个统计量看似已经描述的差不多了，但我们应该注意到，标准差和方差一般是用来描述一维数据的，但现实生活我们常常遇到含有多维数据的数据集，这个时候怎么办？
     协方差该出场了！
     协方差可以通俗的理解为：两个变量在变化过程中是同方向变化？还是反方向变化？同向或反向程度如何？
  
 换种说法:
     协方差是度量各个维度偏离其均值的程度。协方差的值如果为正值，则说明两者是正相关的，结果为负值就说明负相关的，如果为0，也是就是统计上说的“相互独立”。
   与方差对比:
     方差是用来度量单个变量“自身变异”大小的总体参数，方差越大表明该变量的变异越大
     协方差是用来度量两个变量之间“协同变异”大小的总体参数，即二个变量相互影响大小的参数，协方差的绝对值越大，则二个变量相互影响越大。
  
   采用协方差在线计算器练习一下：
       输入值 X=1 ,5 ,6
       输入值 Y=4, 2,  9
  
 计算步骤:
  
   在分析协方差矩阵之前有必要搞清矩阵维数的概念！以女孩子找对象为例，一般关心几个点
     
   这里是5个维数。如果同时有几个男孩子备选，则会形成多个行，有对比才有会伤害。
  
   
     可以这样形象理解：在女孩心中，多个男孩形成一个个行向量，即多个样本。
     另外，再回忆一下系数矩阵的来历。含有n个未知量，由m个方程组成线性方程组的一般形式为：
     
   将系数按它们的位置排列形成一个表格：
     
   这个表格就是方程组的系数矩阵，它的维数是由未知量个数即n来决定的。
     下面介绍的协方差矩阵仅与维数有关，和样本数量无关。
  
   
   设  为n维随机变量，称矩阵
     
   为n维随机变量  的协方差矩阵（covariance matrix），也记为  ，其中
     
  
   为了简易起见，先举一个简单的三变量的例子，假设数据集有{x,y,z}三个维度，
  
   
  
 则协方差矩阵为：
  
   
   更进一步:
   矩阵
     
   其协方差矩阵为
     
   还是有点抽象???
   那就结合实例来理解，可能更方便一些。
   假定有下列矩阵:
     
  
 我们来计算一下协方差矩阵。
  
 结果如下:
     
   可以看出
  
 验算一下:
     
   输入值 X= [1, 5,  6]
   输入值 Y= [4 ,3 , 9]
  
 再验算一下:
     
   输入值 X= [4 ,3 , 9]
   输入值 Y= [4 ,7 , 2]

协方差矩阵的理解

8. 协方差矩阵有什么意义

1、协方差矩阵中的每一个元素是表示的随机向量X的不同分量之间的协方差，而不是不同样本之间的协方差，如元素Cij就是反映的随机变量Xi,Xj的协方差。 

2、协方差是反映的变量之间的二阶统计特性，如果随机向量的不同分量之间的相关性很小，则所得的协方差矩阵几乎是一个对角矩阵。对于一些特殊的应用场合，为了使随机向量的长度较小，可以采用主成分分析的方法，使变换之后的变量的协方差矩阵完全是一个对角矩阵，之后就可以舍弃一些能量较小的分量了（对角线上的元素反映的是方差，也就是交流能量）。特别是在模式识别领域，当模式向量的维数过高时会影响识别系统的泛化性能，经常需要做这样的处理。 

3、必须注意的是，这里所得到的式（5）和式（6）给出的只是随机向量协方差矩阵真实值的一个估计（即由所测的样本的值来表示的，随着样本取值的不同会发生变化），故而所得的协方差矩阵是依赖于采样样本的，并且样本的数目越多，样本在总体中的覆盖面越广，则所得的协方差矩阵越可靠。

 4、如同协方差和相关系数的关系一样，我们有时为了能够更直观地知道随机向量的不同分量之间的相关性究竟有多大，还会引入相关系数矩阵。