本次分享会的主要内容如下:

  • 什么是机器学习
  • 日常生活中如何用到机器学习以及机器学习如何改进我们的工作和生活
  • 使用机器学习解决问题的一般方法

什么是机器学习

接下来,正式分享,首先问下大家,什么叫机器学习?

官方定义:[Mitchell,1997]给出了一个更形式化的定义:假设用P来评估计算机程序在某任务类T上的性能,若一个程序通过利用经验E在T中任务上获得了性能改善,则我们就说关于T和P,该程序对E进行了学习。

上面的定义很绕口,我们用通俗易懂的话来解释,机器学习它首先是一门学科,它致力于研究如何通过计算的手段,利用经验来改善系统自身的性能。

为了进一步加深对机器学习定义的了解,我们再来看几个词汇,在学习过程中,我们经常会看到一些词汇:"数据","模型","学习算法"。其中,"数据"指从周围环境所获取的大量人为数据及非人为数据,也就是官方定义中的E;"模型"在此处泛指计算机通过数据产生的结果;而"学习算法"则是产生"模型"的算法。那么归纳一下,机器学习呢是研究关于"学习算法"的学问。(混淆,模型与算法)

机器学习的应用现状

    我从网上搜集了Top 10的机器学习的应用场景总结如下:

  1. 数据安全

    恶意软件是一个巨大且不断增长的问题。卡巴斯基实验室(Kaspersky Lab)表示,它每天都检测到32.5万个新的恶意软件文件。但是,机构情报公司说,每一个新的恶意软件都倾向于和以前的版本几乎一样的代码——只有2%到10%的文件在这次迭代中改变。他们的学习模式与这2% - 10%的变化没有联系,因此能够准确预测哪些文件是恶意软件。在其他情况下,机器学习算法可以寻找云中的数据如何访问的模式,并报告可以预测的安全漏洞的异常情况。

  2. 个人安全

    如果你最近坐飞机或参加了一个大型的公共活动,你几乎可以肯定要在长长的安检队伍中等待。但机器学习正在证明,它可以帮助消除虚假警报,并检测在机场、体育场、音乐会和其他场所的安检中遗漏一些人可能会错过的东西。这可以大大加快安检进程,确保安全。

  3. 金融交易

    许多人渴望能够预测股票市场在任何一天会做什么——原因显而易见。机器学习算法越来越接近这个目标。许多著名的证券公司使用专家系统来预测和执行高速度和高容量的交易。这些公司中的许多人都依赖于概率,但即使是一个概率相对较小的交易,其巨大的成交量和流水,也能给公司带来巨大的利润。当涉及到大量的数据或交易的快速时,人类不可能与机器竞争。

  4. 医疗

    机器学习算法可以处理更多的信息,比人类发现更多的模式。一项研究使用计算机辅助诊断(CAD)来回顾早期乳腺癌的乳房x光检查,计算机发现了52%的癌症是可以在女性被正式确诊前一年被检测出来的,机器学习可以用来了解疾病的危险因素。公司Medecision开发了一种算法,能够识别8个变量来预测糖尿病患者,从而可以避免住院治疗。

  5. 个性化营销

    你越能了解你的客户,你就越能为他们服务,你就会卖得越多。这是个性化营销的基础。也许你有过这样的经历:你在网上购物,看一件产品,但不买它——然后在网上看到数字广告,在之后的几天里,你会看到这个产品。这种个性化营销只是冰山一角。公司可以对客户收到的邮件进行个性化处理,这些产品显示为"推荐"产品,所有这些都是为了让消费者去消费产品。

  6. 欺诈检测

    机器学习正在越来越好地发现许多不同领域的潜在欺诈案例。例如,PayPal正在使用机器学习来打击洗钱。该公司拥有比较数百万笔交易的工具,可以精确区分买家和卖家之间的合法交易和欺诈交易。

  7. 推荐

    如果您使用Amazon或Netflix等服务,您可能很熟悉这个用法。智能机器学习算法分析你的活动,并将其与数百万其他用户进行比较,以确定你可能喜欢购买或观看的内容。这些建议一直在变得越来越聪明,例如,它能识别你可能会购买某些东西作为礼物(而不是自己想要的东西),或者可能有不同的家庭成员,他们有不同的电视偏好。

  8. 在线搜索

    这也许是机器学习最著名的应用,谷歌和它的竞争对手不断改进他们对搜索引擎的理解。每当你在谷歌上执行搜索时,程序会观察你对结果的反应。如果你点击顶部的结果并停留在那个网页上,我们可以假设你得到了你正在寻找的信息,而搜索是成功的。另一方面,如果你点击第二页的结果,或输入一个新的搜索字符串不点击任何的结果,我们可以推测,搜索引擎没有提供你想要的结果,错误的程序可以学习在未来提供一个更好的结果。

  9. 自然语言处理(NLP)

    NLP正被应用于各个学科的各种令人兴奋的应用程序中。使用自然语言的机器学习算法可以代替客户服务代理,更快地将客户路由到他们需要的信息。它被用来将晦涩难懂的法律术语翻译成普通的语言,并帮助律师整理大量的信息,为案件做准备。

  10. 智能车

    IBM最近调查了几位汽车高管,74%的人预计到2025年我们会看到智能汽车上路。智能汽车不仅能融入物联网,还能了解它的主人及其环境。它可以调整内部设置——温度、音频、座位位置等——自动根据驾驶员、报告、甚至解决问题本身,自行驾驶,并提供关于交通和道路状况的实时咨询。

    观看相关视频

使用机器学习解决问题的一般方法

    利用机器学习算法来开发应用程序,通常遵循以下步骤。

  1. 收集数据:网络爬虫抽取数据;RSS反馈;API获取;嵌入式设备发送过来的实测数据(一般用公开可用的数据)
  2. 准备输入数据:构造符合要求的数据格式
  3. 分析输入数据:数据探索与分析,诸如异常值、空缺值、差异值
  4. 训练算法:机器学习算法,从这一步才算真正开始学习
  5. 测试算法:评估算法,测试算法工作的效果
  6. 使用算法:将机器学习算法转换成应用程序,执行实际任务,检测在实际环境中是否正常工作
Logo

CSDN联合极客时间,共同打造面向开发者的精品内容学习社区,助力成长!

更多推荐