概率机器学习中的互信息（Mutual Information）

ZJ.WANG

1322人浏览 · 2022-03-30 11:22:58

ZJ.WANG · 2022-03-30 11:22:58 发布

1.Mutual Information概念

互信息是信息论中用以评价两个随机变量之间的依赖程度的一个变量

2.信息论的基础概念

信息量： 是对某个时间发生的概率的度量，通常来讲一个事件发生的概率越低，则这个事件包含的信息量越大。在现实生活中，越稀奇的新闻（发生的概率小）包含的信息量越大。香农提出了一个定量衡量信息量的公式：
$log\frac{1}{p}=-logp$
熵（entropy）： 衡量一个系统的稳定程度。其实就是一个系统所有变量信息量的期望或者均值。离散变量 公式为：
$H(X)=\sum_{x \in X} P(x) \cdot log \frac{1}{P(x)}=-\sum_{x\in X}P(x) logP(x)= -ElogP(X)$
$P (x)$ 表示事件 $X$ 为 $x$ 发生的概率。如果一个系统越简单，出现情况种类很少（极端情况为1种情况，那么对应概率为1，那么对应的信息熵为0），此时的信息熵较小。连续变量，此时可以理解成它的概率密度函数，公式为：
$H(X)=\int P(x) \cdot log \frac{1}{P(x)}dx$
联合熵（joint entropy）： 多个联合变量的熵，也就是将熵的定义推广到多变量的范围。
$H(X,Y)=\sum_{x \in X} \sum_{y \in Y}P(x,y) \cdot log \frac{1}{P(x,y)}=-\sum_{x \in X} \sum_{y \in Y}P(x,y) logP(x,y)= -ElogP(X，Y)$
条件熵（conditional entropy）： 一个随机变量在给定的情况下，系统的熵。
$H(Y|X)=\sum_{x\in X}P(x)H(Y|X=x)=\sum_{x\in X}P(x)[\sum_{y\in Y}P(y|x)log\frac{1}{P(y|x)}]=\sum_{x \in X} \sum_{y \in Y}P(x)P(y|x)log\frac{1}{P(y|x)}=-ElogP（Y|X）$

条件熵就是假设在给定的一个变量下，该系统信息量的期望
相对熵（relative entropy）： 也被称作KL散度（Kullback-Leibler divergence）。当我们获得了一个变量的概率分布时，一般我们会找一种近似且简单的分布来代替。相对熵就是用来衡量两个分布对于同一个变量的差异情况。
$D_{KL}(p||q)=\sum_i p(x_i) \cdot[log\frac{1}{q(x_i)}-log \frac{1}{p(x_i)}]=\sum_i p(x_i) \cdot log\frac{p(x_i)}{q(x_i)}$
交叉熵（cross entropy）： 也是用来衡量两个分布之间的差异性。
$H_{CE}(p，q)=\sum_i p(x_i) \cdot log \frac{1}{q(x_i)}$
显然交叉熵是相对熵的第一部分，因为在通常情况下我们是已知,即第二部分是常量，此时交叉熵和相对熵是一个线性关系，在考虑计算量的情况下，所以我们通常都用这部分交叉熵来做。
互信息（Mutual Information）： 如下图，互信息就是交叉的部分。根据熵的联锁规则，有：
$H (X ∣ Y) = H (X) + H (Y ∣ X) = H (Y) + H (X ∣ Y)$ .因此，
$H (X) - H (X ∣ Y) = H (Y) - H (Y ∣ X)$
这个差叫做X和Y的互信息，记做 $I (X ∣ Y)$ .按照熵的定义可以展开得到：
$H(X)-H(X|Y)=H(X)+H(Y)-H(X,Y)=\sum_x p(x) log \frac{1}{p(x)}+\sum_y p(y) log \frac{1}{p(y)} -\sum_{x,y} p(x,y) log \frac{p(x,y)}{p(x)p(y)}$

亚马逊云科技技术品牌专区

更多推荐

STM32节点移植lorawan协议连接腾讯云物联网开发平台（IoT Explorer）

STM32移植lorawan协议连接腾讯云物联网开发平台（IoT Explorer）前言前言在移植协议之前，先给大家科普一下Lora 和 lorawan 的区别。LoRa 是LPWAN通信技术中的一种，是美国Semtech公司采用和推广的一种基于扩频技术的超远距离无线传输方案。这一方案改变了以往关于传输距离与功耗的折衷考虑方式为用户提供一种简单的能实现远距离、长电池寿命、大容量的系统，进而扩...

亚马逊云科技技术品牌专区

物联网主机E6000引领工业自动化的新篇章

亚马逊云科技技术品牌专区

搞 IoT 物联网，你居然要懂这么多种协议...

物联网协议是指在物联网环境中用于设备间通信和数据传输的协议。根据不同的作用，物联网协议可分为传输协议、通信协议和行业协议。传输协议：一般负责子网内设备间的组网及通信。例如 Wi-Fi、Ethernet、NFC、 Zigbee、Bluetooth、GPRS、3G/4G/5G等。这些协议能够确保在网络上传输的数据的安全性和可靠性。通讯协议：主要是运行在传统互联网TCP/IP协议之上的设备通讯协议，负责