种数据科学家使用的流行数据科学工具🧠
根据维基百科,数据科学被定义为 “数据科学是一个跨学科领域,它使用科学的方法、过程、算法和系统从许多结构化和非结构化数据中提取知识和见解。数据科学与数据挖掘、机器学习和大数据有关。” [](https://res.cloudinary.com/practicaldev/image/fetch/s--1OOfhSJG--/c_limit%2Cf_auto%2Cfl_progressive%2Cq_a
根据维基百科,数据科学被定义为
“数据科学是一个跨学科领域,它使用科学的方法、过程、算法和系统从许多结构化和非结构化数据中提取知识和见解。数据科学与数据挖掘、机器学习和大数据有关。”
[](https://res.cloudinary.com/practicaldev/image/fetch/s--1OOfhSJG--/c_limit%2Cf_auto%2Cfl_progressive%2Cq_auto%2Cw_880/https://dev- to-uploads.s3.amazonaws.com/i/wxjyel3fdff2k2r9ohnj.png)
许多人认为数据科学只是意味着训练机器学习模型,但它是各个领域的融合。一个人必须具备统计、云技术、编码和数据库知识才能成为数据科学家。随着机器学习的 DevOps(称为 MLOps)和 AutoML 技术知识的不断变化,也很有必要。
最大的数据科学家社区 Kaggle 进行了一项调查,基于该调查,我列出了广泛用于不同数据科学领域的不同工具和技术。随意添加一些您知道的其他流行且未在此列表中提及的工具。
机器学习框架
[](https://res.cloudinary.com/practicaldev/image/fetch/s--aXNSrcUg--/c_limit%2Cf_auto%2Cfl_progressive%2Cq_auto%2Cw_880/https://dev- to-uploads.s3.amazonaws.com/i/pf8gegxks0tzyngn83ky.png)
机器学习是与数据科学相关的核心技术之一。 Python 和 R 是机器学习中广泛使用的语言。最流行的框架是基于 Python 的,即 scikit-learn、Tensorflow 和 PyTorch。
-
Scikit-learn
-
张量流
-
硬
-
Xgboost
-
火炬
-
光GBM
-
插入符号
-
猫增压
-
先知
-
Fast.ai
-
Tidymodels
-
H2O 3
-
MXNet
-
JAX
企业机器学习工具
[](https://res.cloudinary.com/practicaldev/image/fetch/s--y5acxU3z--/c_limit%2Cf_auto%2Cfl_progressive%2Cq_auto%2Cw_880/https://dev- to-uploads.s3.amazonaws.com/i/ze4rkvayqj4tm5u6fj2x.png)
大多数初学者不了解云端 ML 工具,这些是 Google、Amazon 和 Azure 等软件巨头提供的一些最好的企业 ML 工具。
-
亚马逊 SageMaker
-
谷歌云顶点 AI
-
Azure 机器学习工作室
-
谷歌云视觉 AI
-
谷歌云自然语言
-
Azure 认知服务
-
Amazon Rekognition
-
谷歌云视频Ai
-
亚马逊预测
商业智能工具
[](https://res.cloudinary.com/practicaldev/image/fetch/s--u1rJUj7h--/c_limit%2Cf_auto%2Cfl_progressive%2Cq_auto%2Cw_880/https://dev- to-uploads.s3.amazonaws.com/i/1gx0ze0fhq8qej1n88rx.png)
商业智能意味着分析公司的数据并提供报告和预测销售和市场。它是数据科学最流行的用例之一,主要处理统计和数据可视化。下面给出了业内使用的一些最流行的商业智能工具。
-
画面
-
微软 Power BI
-
谷歌数据工作室
-
Qlik
-
亚马逊 QuickSight
-
销售人员
-
观察者
-
Alteryx
-
SAP 分析云
-
TIBCO Spotfire
-
思信
-
爱因斯坦分析
-
多摩
使用的数据库
[](https://res.cloudinary.com/practicaldev/image/fetch/s--Yq5Pd_-w--/c_limit%2Cf_auto%2Cfl_progressive%2Cq_auto%2Cw_880/https:// dev-to-uploads.s3.amazonaws.com/i/qxddel45h0yt3oiuobxk.png)
数据库是数据科学的重要组成部分,因为没有数据就没有数据科学。世界各地的数据科学家使用的不同数据库如下。
-
MySQL
-
PostgreSQL
-
微软 SQL 服务器
-
MongoDB
-
SQLite
-
谷歌云 BigQuery
-
甲骨文数据库
-
亚马逊红移
-
微软 Azure Datalake 存储
-
亚马逊雅典娜
-
雪花
-
亚马逊 DynamoDB
-
微软访问
-
IBM DB2
-
谷歌云 Firestore
自动化机器学习 (AutoML)
[](https://res.cloudinary.com/practicaldev/image/fetch/s--Ot2ShqBs--/c_limit%2Cf_auto%2Cfl_progressive%2Cq_auto%2Cw_880/https://dev- to-uploads.s3.amazonaws.com/i/v4m7zh88jspuhdj1hvbx.png)
AutoML 是现代最有前途的技术之一,并且正在以惊人的速度增长。一些著名的 AutoML 工具是 -
-
谷歌云 AutoML
-
H2O 无人驾驶AI
-
数据机器人 AutoML
-
Databricks AutoML
封面图片 卡通矢量由 vectorjuice 创建 -www.freepik.com
更多推荐
所有评论(0)