稀疏编码—将数据向量建模为基向量的线性组合,大量地应用于机器学习、神经科学、信号处理及统计学。这篇文章主要学习基向量也就是字典使之适应特定数据,在声音、图像处理领域信号重构与分类是一种近来被证明非常有效的方法。这篇文章基于随机近似,提出了一种新的,可以很容易推广至大数据情形的在线字典学习优化算法。

近来使用学习获得字典的有限原子而不是预先定义的字典如小波对信号进行分解,在大量的低水平数据处理任务如去噪和高水平数据处理如分类方面取得了非常好的结果,说明学习得到的模型对自然信号非常适用。不像基于PCA及其变形的分解,这些方法不需要基向量之间是正交的。在字典学习被证明可有效提高学习效率的同时,有效地求解相对应的优化问题也成为了一个重要的计算上的挑战。最近的字典学习方面的算法是二阶迭代批处理方法,在某些约束下,在每次迭代过程中为了最小化价值函数。与一阶方法梯度法相比,尽管运算速度大大提高,但仍然无法有效地处理大规模训练数据。

经典的字典学习技术研究有限的信号训练集,优化经验损失函数

Logo

CSDN联合极客时间,共同打造面向开发者的精品内容学习社区,助力成长!

更多推荐