极大似然估计

极大似然估计的原理；例子

馋学习的身子

12572人浏览 · 2022-03-06 22:10:26

馋学习的身子 · 2022-03-06 22:10:26 发布

概念

极大似然估计(Maximum likelihood estimation, 简称MLE)是统计学中常用的参数估计方法，极大似然估计的关键就是，利用已知的样本结果信息，反推最大概率导致这些样本结果出现的模型参数值。

也就是首先假定其具有某种确定的概率分布，但是其参数未知，然后基于训练样本对概率分布的参数进行估计。

其中，极大似然估计中的经典方法，就是根据数据采样去估计概率分布的参数，而采样需要满足一个重要的假设，就是所有的采样都是独立同分布的。

对于似然函数 $p(x∣θ)p(x|\theta)$ ，它描述对于不同的概率模型的参数，出现x这个样本点的概率，其中x表示样本点数据， $θ\theta$ 表示样本假设的概率模型的参数。

而极大似然估计要做的就是，基于对样本采样估计使得似然函数的值最大时的模型参数 $θ\theta$ .

例子

例如：给定一组样本x1,x2,…,xn，假设他们服从高斯分布 $N(u,σ)N(u,\sigma)$ ，利用最大似然估计参数 $u,σu,\sigma$
解：
首先根据高斯分布的概率密度函数作为样本Xi的概率估计
在这里插入图片描述
对参数 $u,σu,\sigma$ 进行极大似然估计，L(x)为似然函数，直观上看即为试图在 $u,σu,\sigma$ 的所有取值中，找到一个能使这组数据出现的可能性最大的值。

进一步地，为了避免连乘操作造成下溢，使用对数似然并化简得到
在这里插入图片描述
此时的目标函数可以写成如下 $l (x)$ 函数，由于求 $l (x)$ 函数的最大值时 $u,σu,\sigma$ 的取值，即 $u,σu,\sigma$ 导数等于0时的值即为所求，最终的解如下：

在求多元函数极值时有，各偏导等于零点的点为临界点。求二次导确定是否为极大值点。
例如：f(x, y)的一个临界点是(x0, y0)，即fx(x0, y0) = 0 && fy(x0, y0) = 0，f的二阶导数是fxx,fxy,fyy满足
在这里插入图片描述