概述

今天开始,笔者将开始一个全新的系列博文:信号与信息处理。在这里,我们将一起探讨信号与信息处理领域的诸多问题,既包含经典问题的回顾,也包含学术前沿的初探

信号与信息处理,事实上是许多科学与工程问题得以解决的基础。这个系列的文章,也将作为之前【机器学习】和【模式识别】两个系列文章的概化统一与扩展,在每篇文章里,笔者会尽自己所能将问题描述清楚,内容将涵盖基础数学理论算法设计结构示例应用演示等。此外,笔者也会开源所有博客中用到的程序代码(以 MATLAB 语言实现的代码为主),以供读者参考与校正。

初衷

实话说,笔者撰写每篇博客,并非出于任何高尚的目的,主要就是为了强化自己对所学知识的理解。是的,如果你想加深对一个问题的理解,那么请尝试独立向他人描述这个问题。哪里没有描述清楚,哪里就存在知识漏洞。所以读者在阅读本系列文章过程中,如果发现有不好理解的地方,大可在评论区直接指出,笔者将持续地对文章的措辞加以改进。

当然,如果藉此系列文章,可以让中文社区的技术人员更好地欣赏每项技术背后数学的魅力和思辨的哲学,笔者也将感到无比欣慰。此外,笔者也希望借此平台,认识同样关注信号与信息处理领域发展的志同道合者。如果个别读者也有兴趣参与这一系列文章的编辑撰写,可发邮件与笔者联系,具体联系方式可见笔者个人英文主页

典型问题

Created with Raphaël 2.1.0 输入信号 系统/模型/映射 输出信号

上述框图给出了一个典型问题:根据输入和输出信号如何推断出系统(System)或者模型(Model)的参数?解决方案通常分为两个步奏:

  • 模型选取
  • 参数估计

在控制理论中,这是系统辨识问题。在统计学习理论中,这是空间映射学习问题。模型选取往往需要依赖个人经验。在机器学习中,不同类型算法一般意味着不同表达模型,比如线性回归采用的是线性模型,支持向量机对线性模型进行和扩展,而神经网络则是采用层级网络的模型。而同一类别的算法还可以进一步按照不同的参数估计方法进行细分。

总而言之,这一类问题的目标要么是用系统模型(数学上称之为映射关系)来抽象数据,以提取出对数据的一种描述(或者概念),比如数据挖掘;要么则是要用学到的模型,对未来数据进行预测和分析,比如推荐系统。

还有另一类问题,我们把测试数据代入已知的数学模型中,希望解出模型中的未知量。这类问题在通信领域尤为常见,比如移动设备的定位问题,其中一种定位依据是移动设备信号发射到达基站的时间(Time of Arrival,简称TOA)。

无线定位示例

图1 无线定位示例

图1 是 TOA 无线定位图例。FT1,FT2 和 FT3 表示三个基站的位置,MT 表示移动设备位置,红色交叉表示估计算法得到的 MT 的位置。设三个基站的位置设为 (x1,y1) (x2,y2) (x3,y3) ,移动设备的位置为 (x0,y0) ,则有

(x1x0)2+(y1y0)2(x2x0)2+(y2y0)2(x3x0)2+(y3y0)2=d21=d22=d23

其中 di 表示移动设备 MT 到基站 FT i 的真实距离。根据信号从移动设备发送到基站的时间,可以得到 di 的估计 d^i 。代入上述三个方程中,可解得 x0 y0 ,即移动设备的位置。

这一类问题与第一类问题的第二步,参数估计,有共通之处。数学上,他们都可以表达为解方程组的问题。线性方程组的解按照一定的判据,如最小平方误差,往往可以得到唯一的解。非线性方程组的解法可以分为两大类,一种是通过线性化处理转换为线性方程组进行求解,另一种则是利用数值优化方法。数值优化方法又可以进一步分为两类,凸优化问题和非凸优化问题。当然,再深层次讲,这类优化问题还存在是否带约束条件两种情况。这里,我们不对这些问题进行展开。在后面系列文章中,我们将在具体的情境中作详细描述。

最后,我们再梳理一下获取知识的四个步骤:

Created with Raphaël 2.1.0 数据 信息 理解 知识

首先,我们通过建立相关模型,从数据中提取出关键信息。这些信息,使我们对研究问题有了更深的理解。最后,我们通过整理总结,得到知识。


Logo

CSDN联合极客时间,共同打造面向开发者的精品内容学习社区,助力成长!

更多推荐