机器学习 🤖是当今最受欢迎的研究领域,它在商业分析📊、天气预报🌡、股票预测📈、医疗保健行业👨u200d⚕️等多个领域取得了重大成就。 ML 现在几乎用于所有可以想象的行业,其重要性呈指数级增长🌟。但是,如果我们可以让 ML 过程更直接、更流畅并泛化使用呢?这就是自动化机器学习 (AutoML) 的用武之地! 🤗

自动化机器学习 (AutoML) 将机器学习任务自动化到现实世界的问题。 AutoML 涵盖了整个工作流程,从原始数据集📚 到可部署的机器学习模型🤖。它使机器学习变得容易,即使对于那些没有该学科经验的人来说也是如此。

🚩 传统的机器学习模型具有以下工作流程:

ML 工作流.png

AutoML 的重要性

近年来,对机器学习系统的需求猛增。这是由于 ML 目前在广泛的应用中取得的成功。尽管机器学习可能对特定公司有所帮助,但许多企业未能采用 ML 模型。

首先,他们必须组建一支经验丰富的数据科学家团队👩u200d💻,他们可以拿到高薪💰。其次,即使您拥有一支优秀的团队,确定哪种模型适合您的挑战通常需要更多的经验而不是专业知识。

机器学习在广泛的应用程序中的普及导致对非专家可以立即使用的机器学习系统的需求不断增长✔。 AutoML 倾向于以最少的工作量自动化 ML 管道中最重要的阶段,并且不会危及模型的性能💯。

AutoML 工作流.png

AutoML的好处总结如下:

  1. 通过自动化重复流程,提高生产力💯。因此,数据科学家可以专注于更有效地实现最终目标。

  2. 机器学习过程的自动化还有助于防止手动发生的错误,例如错误配置参数和错误解释数据。

  3. 最后,AutoML 通过让每个人都可以使用机器学习的能力,朝着全球化 🌎 机器学习迈出了一步。

🚩 一些著名的 AutoML 框架是:

1.自动学习:

Auto-sklearn 是一个基于 Scikit-learn 的免费开源 AutoML 库。 Auto-sklearn 将机器学习用户从算法选择和超参数调整的负担中解脱出来。它为提供的数据集 📚 确定性能最佳的模型 💯 和超参数的最佳集合。它包括用于特征工程的方法,例如 One-Hot 编码🔢、特征归一化、降维等。此包中使用 Sklearn 估计器来解决分类和回归问题。

autosklearn.png

看看官方的文档和论文!

2.机器学习盒

MLBoxpng

MLBox 是一个强大的自动化机器学习 python 库。根据 MLBox 的官方文档,它提供了以下功能:

  • 快速读取和分布式数据预处理/清理/格式化。

  • 高度稳健的特征选择和泄漏检测。

  • 高维空间中的精确超参数优化。

  • 用于分类和回归的最先进的预测模型(深度学习、堆叠、LightGBM......)。

  • 带有模型解释的预测。

如果你正在寻找一个彻底的挖掘,这里是官方文档!

3. TPOT

tpot.png

TPOT 是一个开源的 Python AutoML 应用程序,它使用基因编程来增强机器学习管道。 TPOT 架构的数据流如下图所示。 TPOT 需要在特征处理、模型选择和超参数优化之前清理数据集,以提供性能最佳的模型。 TPOT 通过添加回归器和分类器技术扩展了 Scikit-learn 框架。它通过搜索数千个替代管道来确定最适合您的数据的管道。

tpot pipeline.png机器学习管道示例(来源 - TPOT 文档)

想要深入了解,请看官方文档!

4.自动 Keras

autokeras.png

Auto-Keras 是一个用于自动机器学习的开源库。作为使用 Keras 的深度学习框架,它提供了用于自动搜索适合深度学习模型的架构和超参数的实用程序。 API 的架构基于 Scikit-Learn API 设计,使用起来非常简单。

通过自动神经架构搜索 (NAS) 技术,Auto-Keras 试图简化 ML 过程。深度学习工程师/从业者主要被神经架构搜索所取代,它会自动优化模型。

有兴趣了解更多吗?你可以在这里阅读官方文档!

H2O

H2O.png

H2O 的 AutoML 是 H2O 创建的用于自动化机器学习工作流的框架。 H2O 支持最常用的统计和机器学习方法,例如梯度提升机、广义线性模型、深度学习模型等。

H2O 有一个自动化机器学习模块,可以使用其方法构建管道。为了优化其管道,它使用其特征工程方法和模型超参数进行了彻底的搜索。

H2O 自动化了一些最具挑战性的数据科学和机器学习活动,包括特征工程、模型验证、模型调整、模型选择和模型部署。

看官方文档!

窥探 AutoML 的未来! 🔮

最初,AutoML 的目标 🎯 是自动化重复操作,如管道开发和超参数调整,以便数据科学家可以更多地关注手头的业务问题。

AutoML 还打算让所有人都能使用这项技术,而不仅仅是少数人。 AutoML 和数据科学家可以合作加速 🚀 ML 过程,从而实现机器学习的真正功效 💯。

AutoML 的成功主要取决于它的接受度和在该领域取得的进步。然而,很明显 AutoML 将在机器学习的未来发挥重要作用。

我们希望您喜欢这个博客并发现它很有用!查看我们关于的精彩博客文章如何使用 Tensorflow创建一个简单的神经网络。

此外,请查看我们的YouTube 频道,了解更多精彩视频和项目⭐。

Logo

Python社区为您提供最前沿的新闻资讯和知识内容

更多推荐