基于丹摩智算平台-手把手拿下经典目标检测模型 Faster-Rcnn

立志变强的学生

5人浏览 · 2024-09-23 15:34:35

立志变强的学生 · 2024-09-23 15:34:35 发布

1. 前言
1. 1 丹摩智算平台
1.2 经典目标检测模型 Faster-Rcnn
2. 前置准备
2.1 WindTerm（远程连接服务器）
2.2 项目源码
3. 服务器平台配置
3.1 创建实例
3.2 远程链接
4. Faster-rcnn 的环境配置
4.1 上传文件，解压
4.2 安装所需环境
5. 数据集简介
6. 开始训练
7. 测试数据保存
8. 训练结果导出
9. 结语

1. 前言

1. 1 丹摩智算平台

DAMODEL（丹摩智算）是专为 AI 打造的智算云，致力于提供丰富的算力资源与基础设施助力 AI 应用的开发、训练、部署。

平台特点：

💡 超友好！配备 124G 大内存和 100G 大空间系统盘，一键部署，三秒启动，让 AI 开发从未如此简单！
💡 资源多！从入门级到专业级 GPU 全覆盖，无论初级开发还是高阶应用，你的需求，我们统统 Cover！
💡 性能强！自建 IDC，全新 GPU，每一位开发者都能体验到顶级的计算性能和专属服务，大平台值得信赖！
💡 超实惠！超低价格体验优质算力服务，注册即送优惠券！还有各类社区优惠活动，羊毛薅不停！

1.2 经典目标检测模型 Faster-Rcnn

Faster RCNN是two-stage目标检测模型中的典型代表，已经是多年的老模型

Fast R-CNN的工作流程是先通过选择性搜索（Selective Search）算法等方法生成候选框，这些候选框作为可能包含目标的区域。接着，整个图像与其对应的候选框一起输入到CNN中。CNN在前向传播过程中同时完成了特征提取、边界框分类和边界框回归三个任务。通过将这三个任务融合到同一个CNN中，Fast R-CNN大大提高了目标检测的效率和准确性，不再需要对每个候选框单独进行特征提取和分类，从而加快了检测速度。

fast-RCNN算法的3个步骤：

1.一张图像生成1K~2K个候选区域(使用Selective Search方法)

2.将图像输入网络得到相应的特征图，将SS算法生成的候选框投影到特征图上获得相应的特征矩阵

3.将每个特征矩阵通过ROI pooling层缩放到7x7大小的特征图，接着将特征图展平通过一系列全连接层得到预测结果

2. 前置准备

2.1 WindTerm（远程连接服务器）

WindTerm SSH工具,服务器管理,远程桌面加速软件,支持Windows,macOS,Linux - WindTerm官网

2.2 项目源码

下载地址：点击下载源码

3. 服务器平台配置

这里服务器平台我选择的是丹摩智算的平台，大家可以注册使用体验一下丹摩智算平台

3.1 创建实例

创建实例，选择 4090 显卡，并且下载私钥

选择4090显卡，24g显存，124g内存，磁盘150g即可

镜像选择：pytorch 2.1.2，python 3.10

创建密钥对

密钥对创建后记得保存文件，用于后续免密链接登录，也可以不记录

完成创建

完善相关配置后，点击创建，等待创建完成

3.2 远程链接

复制访问链接

ssh -p 42894 root@cn-north-b.ssh.damodel.com
HFyoNrTei9

WindTerm链接

回话-新建回话-根据链接完善主机，端口-输入密码

连接成功

显示如下界面我们就成功了！

4. Faster-rcnn 的环境配置

4.1 上传文件，解压

将我们的代码文件拖入/root/workspace/目录下，然后解压

解压文件

unzip mmdetection-3.3.0.zip

4.2 安装所需环境

# 安装mmcv包
pip install mmcv==2.1.0 -f https://download.openmmlab.com/mmcv/dist/cu121/torch2.1/index.html -i https://mirrors.aliyun.com/pypi/simple/

# 从源码安装mmdetection-3.3.0
cd mmdetection-3.3.0
pip install -r requirements/build.txt -i https://pypi.tuna.tsinghua.edu.cn/simple/
pip install -v -e ./ -i https://pypi.tuna.tsinghua.edu.cn/simple/

# 安装必要包
pip install numpy==1.24.4 -i https://pypi.tuna.tsinghua.edu.cn/simple/
pip install setuptools==69.5.1 -i https://pypi.tuna.tsinghua.edu.cn/simple/
pip install instaboostfast -i https://pypi.tuna.tsinghua.edu.cn/simple/

# 安装全景分割依赖panopticapi
cd panopticapi
pip install -e . -i https://pypi.tuna.tsinghua.edu.cn/simple/
cd ..

# 安装 LVIS 数据集依赖
cd lvis-api
pip install -e . -i https://pypi.tuna.tsinghua.edu.cn/simple/
cd ..

# 安装 albumentations 依赖
pip install -r requirements/albu.txt -i https://pypi.tuna.tsinghua.edu.cn/simple/
pip install mmengine -i https://pypi.tuna.tsinghua.edu.cn/simple/

逐个处理，保证环境配置正确

环境安装完成，简单测试

python 1.py

5. 数据集简介

COCOmini 数据集是一个用于各种计算机视觉任务的数据集，包括但不限于目标检测、实例分割、关键点检测、和图像分类。

特点与组成部分：

多标签：不同于单一标签的数据集，COCO 中的图像通常包含多个不同的对象类别，这使得它非常适合上下文理解的研究。
多样性和复杂性：图像涵盖了广泛的生活场景，从室内到室外，从城市到自然环境，提供了丰富的视觉多样性。
详尽的注释：每个对象实例都有精确的边界框和分割掩码，以及关键点注释对于人体类别的对象。
80 个对象类别：COCO 包含了 80 种常见的物体类别，如人、动物、交通工具、家具等。

000000009590

6. 开始训练

# 为了方便上手，因此我们的代码都是调试好的，因此可以直接输入命令进行训练

python ./tools/train.py ./checkpoints/faster-rcnn_r50_fpn_1x_coco.py

# 他会自动下载权重，并开始训练，耐心等待即可~~~

输入命令，开始程序

自行下载，数据准备

数据训练中

7. 测试数据保存

# 经过训练，我们得到pth权重，通过pth权重预测我们的数据集，左侧为真实物体的位置，右侧为预测结果。
# 我们这里直接使用训练好的权重进行预测

python tools/test.py ./checkpoints/faster-rcnn_r50_fpn_1x_coco.py ./checkpoints/faster_rcnn_r50_fpn_1x_coco_20200130-047c8118.pth --show-dir /root/workspace/mmdetection-3.3.0/result/

训练完成，数据保存result文件夹

8. 训练结果导出

选择result文件夹，导出本地文件

下载传输速度也是非常可观的

训练结果展示：

9. 结语

前往控制台-GPU云实例，保存镜像，这样我们可以下次使用时省去配置环境的过程。

整体体验下来，我的使用感受还是很好的，有以下个人感受

收费较低，目前优惠力度很大，学生福利够给力
性能强劲，训练速度很快，响应快捷
官方界面整洁OK，感官不错
售后保证，有问题联系官方及时反馈

大家想做科研训练，需要算力可以考虑一下：丹摩智算

尧米AI

尧米是由西云算力与CSDN联合运营的AI算力和模型开源社区品牌，为基于DaModel智算平台的AI应用企业和泛AI开发者提供技术交流与成果转化平台。

更多推荐

丹摩征文活动｜FLUX.1 & ComfyUI：双重力量，快速完成部署与使用！

丹摩征文活动 | FLUX.1 & ComfyUI：双重力量，快速完成部署与使用！ FLUX.1进化史黑森林实验室最新推出的图像生成模型FLUX.1，为不同用户群体量身定制了三款版本，满足多样化的图像创作需求。 FLUX.1-pro版本，专为企业级用户打造，以其卓越的性能和图像生成能力，成为行业领先之选。它在提示词识别、视觉质量提升、细节展现和输出多样性方面均表现卓越，尤其适合追求高效率

尧米AI

丹摩征文活动|萌新的教学使用与操作指南

一、丹摩平台的核心特色 1.友好便捷的操作体验：（1）一键部署：使开发者能够在极短的时间内启动开发环境，快速进入到算法和模型的开发工作中，无需花费大量时间在复杂的配置上。（2）丰富的资源配置：多样化的 GPU 选择、灵活的付费模式、充足的数据存储 2.高性能的计算能力：（1）自建 IDC 与全新设备：平台采用自建 IDC 和全新的 GPU 设备，能够为用户提供高效、稳定的计算能力，保证模型训

尧米AI

丹摩征文活动|丹摩的介绍

引言：介绍该平台的背景及功能概述。首先丹摩平台是一个在云计算云计算、GPU实例管理和大数据存储非常优秀的平台，它提供了稳定高效的云计算服务，让用户可以更好的体验其强大的计算资源，下面我们就进入平台页面进去看看一、页面初介绍首先，我们进入其网址，进入网页我们可以看到平台的是其主页，页面设计整洁干净，直接就能看到“立即开始”的按钮，点击后就可以注册，马上体验平台的功能新用户注册还有50元的优