一、详细步骤:创建 GPU 云实例

在 DAMODEL 上创建 GPU 云实例时,用户需要完成几个关键选择步骤,包括选择 GPU 规格、配置实例、扩容数据盘以及选择镜像。以下是详细步骤:

1.1 选择计费方式

DAMODEL 提供了多种计费方式,灵活满足用户的需求:

  • 按量计费:用户根据实际使用的计算时长支付费用,适合短期任务和试验性开发。
  • 包日/包月:适合需要长时间使用 GPU 算力的用户,通过包日或包月支付,用户可以以较低的成本锁定计算资源。

1.2 选择配置与主机

用户可以根据实际开发需求选择合适的 GPU 规格,平台提供了从性价比高的入门级配置(如 RTX 4090)到顶级专业配置(如 H800)的多种选择。用户还可以选择 GPU 的数量,以及是否需要多卡并行加速。

1.3 扩容数据盘

根据项目需求,用户可以为实例扩展数据盘的容量,默认情况下,实例提供 50 GB 的数据盘,用户可以选择扩容至更大的存储容量。数据盘用于存储高读写 I/O 要求的数据,尤其适合需要频繁进行数据存储和读取的模型训练任务。

1.4 选择镜像

DAMODEL 提供了多种预配置的操作系统镜像和 AI 框架镜像,用户可以根据自己的开发环境需求选择合适的镜像。对于大部分 AI 开发任务,选择包含常用框架(如 TensorFlow、PyTorch)的镜像可以节省大量配置环境的时间。

1.5 选择密钥对

为了访问实例,用户需要选择密钥对或在此处生成新的密钥对。密钥对用于通过 SSH 远程连接实例,确保实例的安全访问。

1.6 完成支付并创建实例

当用户完成所有配置选择后,点击「创建实例」,并完成支付操作,即可开始创建 GPU 云实例。创建完成后,用户可以在控制台的「GPU 云实例」页面中查看已创建的实例,并进行相应的操作和管理。

二、存储方式与路径规划

在 DAMODEL 中,存储资源分为系统盘、数据盘、文件存储和云磁盘,用户应根据实际需求合理规划存储路径,以优化存储性能和数据安全性。以下是存储资源的详细介绍:

2.1 系统盘

  • 路径:根目录 /
  • 大小:100 GB
  • 是否可扩容:否
  • 性能:高性能

系统盘与实例生命周期一致,通常用于存储操作系统依赖项和小容量的数据,如代码文件、Python 包等。需要注意的是,系统盘不能扩容,并且与实例镜像保持一致。

2.2 数据盘

  • 路径/root/workspace
  • 大小:50 GB(可扩容)
  • 性能:高性能

数据盘是存储读写 I/O 要求高的数据的主要存储空间,用户可以扩展数据盘容量,并在模型训练任务中使用该空间存放中间结果或训练数据。

2.3 文件存储

  • 路径/root/shared-storage
  • 大小:不限制

文件存储用于持久化数据,并且能够跨实例共享数据,适合团队协作和多个实例同时使用的场景。

2.4 云磁盘

  • 路径/root/workspace/<云磁盘id>
  • 大小:20 GB - 2048 GB(可扩容)

云磁盘可以独立于实例的生命周期存储数据,即使实例释放后,数据依然保留,适合存储需要长期保存的训练数据或结果。

三、注意事项

在使用 DAMODEL 创建和管理 GPU 云实例时,有几个关键事项需要特别注意:

  1. 密钥对安全性:用户应妥善保存生成的密钥对,以便能够安全地访问实例。
  2. 存储容量规划:根据项目需求合理分配系统盘、数据盘和云磁盘

的容量,确保存储性能能够满足任务需求。
3. 实例释放与数据保留:实例释放后,系统盘和数据盘的数据会被清除,用户需要提前备份重要数据到云磁盘或文件存储中。

Logo

尧米是由西云算力与CSDN联合运营的AI算力和模型开源社区品牌,为基于DaModel智算平台的AI应用企业和泛AI开发者提供技术交流与成果转化平台。

更多推荐