根据维基百科,数据科学被定义为

“数据科学是一个跨学科领域,它使用科学的方法、过程、算法和系统从许多结构化和非结构化数据中提取知识和见解。数据科学与数据挖掘、机器学习和大数据有关。”

[Alt](https://res.cloudinary.com/practicaldev/image/fetch/s--1OOfhSJG--/c_limit%2Cf_auto%2Cfl_progressive%2Cq_auto%2Cw_880/https://dev- to-uploads.s3.amazonaws.com/i/wxjyel3fdff2k2r9ohnj.png)


许多人认为数据科学只是意味着训练机器学习模型,但它是各个领域的融合。一个人必须具备统计、云技术、编码和数据库知识才能成为数据科学家。随着机器学习的 DevOps(称为 MLOps)和 AutoML 技术知识的不断变化,也很有必要。

最大的数据科学家社区 Kaggle 进行了一项调查,基于该调查,我列出了广泛用于不同数据科学领域的不同工具和技术。随意添加一些您知道的其他流行且未在此列表中提及的工具。

机器学习框架

[Alt](https://res.cloudinary.com/practicaldev/image/fetch/s--aXNSrcUg--/c_limit%2Cf_auto%2Cfl_progressive%2Cq_auto%2Cw_880/https://dev- to-uploads.s3.amazonaws.com/i/pf8gegxks0tzyngn83ky.png)


机器学习是与数据科学相关的核心技术之一。 Python 和 R 是机器学习中广泛使用的语言。最流行的框架是基于 Python 的,即 scikit-learn、Tensorflow 和 PyTorch。

  • Scikit-learn

  • 张量流

  • Xgboost

  • 火炬

  • 光GBM

  • 插入符号

  • 猫增压

  • 先知

  • Fast.ai

  • Tidymodels

  • H2O 3

  • MXNet

  • JAX

企业机器学习工具

[Alt](https://res.cloudinary.com/practicaldev/image/fetch/s--y5acxU3z--/c_limit%2Cf_auto%2Cfl_progressive%2Cq_auto%2Cw_880/https://dev- to-uploads.s3.amazonaws.com/i/ze4rkvayqj4tm5u6fj2x.png)


大多数初学者不了解云端 ML 工具,这些是 Google、Amazon 和 Azure 等软件巨头提供的一些最好的企业 ML 工具。

  • 亚马逊 SageMaker

  • 谷歌云顶点 AI

  • Azure 机器学习工作室

  • 谷歌云视觉 AI

  • 谷歌云自然语言

  • Azure 认知服务

  • Amazon Rekognition

  • 谷歌云视频Ai

  • 亚马逊预测

商业智能工具

[Alt](https://res.cloudinary.com/practicaldev/image/fetch/s--u1rJUj7h--/c_limit%2Cf_auto%2Cfl_progressive%2Cq_auto%2Cw_880/https://dev- to-uploads.s3.amazonaws.com/i/1gx0ze0fhq8qej1n88rx.png)


商业智能意味着分析公司的数据并提供报告和预测销售和市场。它是数据科学最流行的用例之一,主要处理统计和数据可视化。下面给出了业内使用的一些最流行的商业智能工具。

  • 画面

  • 微软 Power BI

  • 谷歌数据工作室

  • Qlik

  • 亚马逊 QuickSight

  • 销售人员

  • 观察者

  • Alteryx

  • SAP 分析云

  • TIBCO Spotfire

  • 思信

  • 爱因斯坦分析

  • 多摩

使用的数据库

[Alt](https://res.cloudinary.com/practicaldev/image/fetch/s--Yq5Pd_-w--/c_limit%2Cf_auto%2Cfl_progressive%2Cq_auto%2Cw_880/https:// dev-to-uploads.s3.amazonaws.com/i/qxddel45h0yt3oiuobxk.png)


数据库是数据科学的重要组成部分,因为没有数据就没有数据科学。世界各地的数据科学家使用的不同数据库如下。

  • MySQL

  • PostgreSQL

  • 微软 SQL 服务器

  • MongoDB

  • SQLite

  • 谷歌云 BigQuery

  • 甲骨文数据库

  • 亚马逊红移

  • 微软 Azure Datalake 存储

  • 亚马逊雅典娜

  • 雪花

  • 亚马逊 DynamoDB

  • 微软访问

  • IBM DB2

  • 谷歌云 Firestore

自动化机器学习 (AutoML)

[Alt](https://res.cloudinary.com/practicaldev/image/fetch/s--Ot2ShqBs--/c_limit%2Cf_auto%2Cfl_progressive%2Cq_auto%2Cw_880/https://dev- to-uploads.s3.amazonaws.com/i/v4m7zh88jspuhdj1hvbx.png)


AutoML 是现代最有前途的技术之一,并且正在以惊人的速度增长。一些著名的 AutoML 工具是 -

  • 谷歌云 AutoML

  • H2O 无人驾驶AI

  • 数据机器人 AutoML

  • Databricks AutoML

封面图片 卡通矢量由 vectorjuice 创建 -www.freepik.com
Logo

华为、百度、京东云现已入驻,来创建你的专属开发者社区吧!

更多推荐