学习数据科学和机器学习的最佳方式是动手实验室、教程和实验。不幸的是,有一些常见的痛点会增加一层摩擦,让有抱负的数据科学家开始。

这些斗争包括:

  • 在个人笔记本电脑上设置 GPU 或框架等硬件

  • 云托管 ML 环境易于设置但价格昂贵

  • 免费选项缺少持久存储(即会话到期后您的数据和环境将重置)

简介

在最新的 AWSre:Invent 2021中,AWS 团队宣布推出 SageMaker Studio Lab(目前为预览版)以应对这些挑战并消除设置麻烦。

Amazon Sagemaker Studio 是一项免费的无配置服务,允许开发人员、学者和数据科学家学习和试验机器学习。

与 SageMaker Notebook Instances 或 SageMaker Studio 不同,您需要设置 AWS 账户(并且需要信用卡),您现在只需要一个有效的电子邮件地址来注册账户并开始实验。

概述

AWS SageMaker Studio Lab 是免费的(是的,免费!)。您甚至可以根据项目需要在 CPU 或 GPU 之间进行选择。

为您的帐户分配了 15 GB 的永久存储空间和 16GB 的 RAM。这意味着您可以将项目和数据集保存在云中(无需每次都从头开始)

对于熟悉AWS的人,底层资源如下——GPU实例G4dn.xlarge和CPU实例T3.xlarge(可能会有变化)

账户注册和创建

  1. 访问https://studiolab.sagemaker.aws/申请账号。

  2. 填写您的详细信息

[申请表(作者截图)](https://res.cloudinary.com/practicaldev/image/fetch/s--BZSi7tOq--/c_limit%2Cf_auto%2Cfl_progressive%2Cq_auto%2Cw_880/https:// /dev-to-uploads.s3.amazonaws.com/uploads/articles/aano9abth0npn69xxpeo.png)

  1. 等待请求批准(AWS 声称该过程是_在 1 到 5 个工作日内_。我的帐户在我请求后的第二天获得批准)

  2. 收到您的批准电子邮件后,您可以按照帐户创建说明,从电子邮件中的注册链接继续。

[帐户创建(作者截图)](https://res.cloudinary.com/practicaldev/image/fetch/s--cuGbOivX--/c_limit%2Cf_auto%2Cfl_progressive%2Cq_auto%2Cw_880/https:/ /dev-to-uploads.s3.amazonaws.com/uploads/articles/xzen1944a62mmij6mvd6.png)

探索界面

到达登录页面后,您将需要启动项目运行时。您需要在 CPU 和 GPU 运行时之间进行选择,会话持续时间分别为 12 (CPU) 和 4 (GPU)。

[SageMaker Studio Lab 主页/欢迎页面(作者截图)](https://res.cloudinary.com/practicaldev/image/fetch/s--TSMKYC1s--/c_limit%2Cf_auto%2Cfl_progressive%2Cq_auto %2Cw_880/https://dev-to-uploads.s3.amazonaws.com/uploads/articles/cql1mahupp0w9jafof17.png)

一旦会话超时,您将不得不再次重新启动项目运行时。不用担心,您的所有文件都将保存在持久项目存储中。

[检查你的会话剩余时间](https://res.cloudinary.com/practicaldev/image/fetch/s--at_hQylM--/c_limit%2Cf_auto%2Cfl_progressive%2Cq_auto%2Cw_880/https:/ /dev-to-uploads.s3.amazonaws.com/uploads/articles/sl7yv7opwul8ccwyxnlr.png)

学习和实验

AWS 机器学习大学 (MLU)

MLU 笔记本包含用于培训亚马逊自己的开发人员进行机器学习的材料。课程包括

  • 自然语言处理

  • 表格数据

  • 计算机视觉

  • 决策树和集成方法

深入学习深度学习 (D2L)

交互式笔记本(超过 150 个 Jupyter 笔记本)教授机器学习的基础知识,被 300 所大学采用,包括斯坦福、麻省理工、哈佛和剑桥。

拥抱脸

Hugging Face是 Transformers 库和最新的 NLP、语音和计算机视觉模型的所在地。在这里,您可以探索和学习此存储库中的笔记本。

Jupyter 实验室界面

由于它基于开源 JupyterLab,因此您可以利用开源 Jupyter 扩展来运行您的 Jupyter 笔记本。

您还可以完全控制您的(虚拟)环境,以利用 PyTorch、TensorFlow、MxNet、Hugging Face 等框架和 Scikit Learn、Pandas 和 NumPy 等库。

[SageMaker Studio Lab 上的典型 Jupyter Lab 界面(作者截图)](https://res.cloudinary.com/practicaldev/image/fetch/s--P3h_dnvF--/c_limit%2Cf_auto%2Cfl_progressive% 2Cq_auto%2Cw_880/https://dev-to-uploads.s3.amazonaws.com/uploads/articles/u63mn37csihreeej7s74.png)

您可以克隆自己的 Github 存储库并在 SageMaker Studio Lab 上工作,因为它已集成到 Github 和 Git 以进行版本控制。

[克隆您自己的存储库以在 SageMaker Studio Lab 上工作(作者截图)](https://res.cloudinary.com/practicaldev/image/fetch/s--QreIeI4s--/c_limit%2Cf_auto%2Cfl_progressive %2Cq_auto%2Cw_880/https://dev-to-uploads.s3.amazonaws.com/uploads/articles/dolf0eil9anop0anui8m.png)

此外,如果您有一个带有 Jupyter Notebook 的公共 Github 存储库,您可以让其他人轻松地在 SageMaker Studio Lab 中打开您的笔记本。

您需要做的就是将Open in Studio Lab链接(徽章)添加到您的README.md文件或笔记本中。要包含的降价如下:

[![Open In Studio Lab]
(https://studiolab.sagemaker.aws/studiolab.svg)]
(https://studiolab.sagemaker.aws/import/github/org/repo/blob/master/path/to/notebook.ipynb)

进入全屏模式 退出全屏模式

创建的徽章将如下所示。

[“Open in Studio Lab”徽章](https://res.cloudinary.com/practicaldev/image/fetch/s--YXrcA5XF--/c_limit%2Cf_auto%2Cfl_progressive%2Cq_auto%2Cw_880/https:// /dev-to-uploads.s3.amazonaws.com/uploads/articles/5zrabcn4z56pw5l374h7.png)

奖励:黑客马拉松

[AWS 灾难响应黑客马拉松](https://res.cloudinary.com/practicaldev/image/fetch/s--aE42rvYU--/c_limit%2Cf_auto%2Cfl_progressive%2Cq_auto%2Cw_880/https://dev- to-uploads.s3.amazonaws.com/uploads/articles/s0865upbqzyoocpye2yt.png)

在撰写本文时(2021 年 12 月),正在进行黑客马拉松 (AWS Disaster Response Hackathon),您可以在 SageMaker Studio Lab 中探索和训练您的模型。截止日期为 2022 年 2 月 7 日,美国东部标准时间下午 5:00。

阅读更多:

https://awsdisasterresponse.devpost.com

感谢您阅读这篇文章,我希望您会发现它很有见地。在等待名单变长之前获取您的 SageMaker Studio Lab。

祝大家学习愉快。

Logo

学AI,认准AI Studio!GPU算力,限时免费领,邀请好友解锁更多惊喜福利 >>>

更多推荐