0b6f162d26f046e4a79836d778157858.png

《数学之美》的主要内容是通过数学工具建立模型来解决通信领域的问题。从而本书说明了通信,语音识别,机器翻译,密码学,信息度量,文本分类,搜索排名,地图路线规划,人工智能,大数据等问题的基本数学模型以及运用相应算法解决相应问题的效果(正确率)。

通过《数学之美》我们可以了解数学建模的过程。数学建模的第一步:提出问题。第二步:模型假设,即根据问题给出基本假设。虽然这两步看起来似乎很简单,但其实后面模型建立,模型分析,模型评价应用和效果都是以这个为基础而产生的。最好的例子之一就是自然语言处理(应用在语音识别,机器翻译等)在统计模型之前一直采取的是语法规则模型。采用语法规则模型费时费力,效果不佳而且进展缓慢以至于人们基本放弃了自然语言处理这一领域。后来人们转变了自然语言处理问题的基本假设采用了统计模型即词的划分和含义是与上下文内容有关的。从而使自然语言处理领域得到快速的发展。

第三步:模型简化。即为简化模型而再加上新的基础假设。现实中一个问题的影响因素有很多,要完全解决一个问题可能涉及很多方面和细节。这就需要抓住问题的本质和主要影响因素来简化模型,方便模型的建立,可以在后面应用模型的阶段再逐步完善模型的相应细节。举例来说自然语言处理的统计模型之一马尔可夫链模型假设每一个字词的含义只与相邻前后两个字词含义有关。这样简化模型大大的减少了计算量并且应用该模型实践得到的效果也不错。

第四步:模型建立和分析。在有了各种根据问题而给出的基础假设后,我们需要根据基础假设建立数学公式,关系式,函数等等并应用相应数学理论的定理和性质进行相应运算。举例来说,自然语言处理的统计模型中的马尔可夫模型应用相应的概率公式和大数定理得出只要统计大量语料中相应字词出现的次数代入公式就能得到求解。

第五步:模型应用,评价反馈。模型建立分析完成后,就可以将模型应用到相应领域。并且根据模型建立的过程和应用反馈来评价模型的优缺点和适用范围也很重要。举例来说,自然语言处理的马尔可夫模型假设一个字词的含义只与相邻两个字词含义有关其实并不完全正确,因为文中一个字词的含义可能相隔较远的上下文内容有关。所以这一假设虽然大大减少了计算量但也限制了模型的正确率。

第六步:模型完善。现实中模型建立应用的过往往不是一劳永逸的。为了使模型实践效果提升,我们常常要继续完善模型,补充细节。例如自然语言处理中的高阶马尔可夫链模型。甚至有时需要推翻原基础假设建立新的基础假设。这可能基于硬件性能提升和人们对相应问题认识越来越充分而产生的完善。同样一个问题也会根据分析方法不同,采用不同的数学模型,而不同数学模型之间也各有优缺点,可以根据具体情况采用不同模型。例如文本分类问题可以采用余弦定理模型,也可以采用矩阵奇异值分解模型。

阅读《数学之美》的过程中也领悟到万事万物相互联系和一定条件下相互转化的规律。例如算法的空间复杂性(储存空间)和时间复杂性(计算量)之间的平衡。例如文本分类问题中余弦定理模型时间复杂度高,空间复杂度低;矩阵奇异值分解模型空间复杂度高,时间复杂度低。但有时好的数学模型可以同时降低时间复杂度和空间复杂度。例如将信息指纹应用在两个集合元素比较上。

注:有时好的数学模型可以同时降低时间复杂度和空间复杂度,但可能会牺牲别的优势。例如应用信息指纹的判断两个集合是否相同时,由于信息指纹随机生成和配对元素,使用该模型就失去了根据储存信息唯一找回原信息的优势。所以具体问题解决过程中要明确目标(例如目标就是降低空间复杂度和时间复杂度,其他暂不考虑)和已具备的资源,例如当我们具有较大储存空间的硬件时,我们可以采用空间复杂度高,时间复杂度低的算法模型。当我们具有较快运算能力的处理器时,我们可以采用时间复杂度高,空间复杂低的算法模型。

f22149c84a5cfb29eedd957fcad921f5.png
Logo

CSDN联合极客时间,共同打造面向开发者的精品内容学习社区,助力成长!

更多推荐