logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

verl - verl核心代码详解(与令人纠结的batch size)

在RL训练中,我们会遇到各种各样的batch, 眼花缭乱。在这里,我们细致梳理一下这些batch 代表了什么,和它们之间的关系。

文章图片
#batch#算法#开发语言
verl - vllm_rollout_spmd.py 详解

rollout 是强化学习中非常重要的环节。我们这里研究对于多模态VQA任务,rollout 过程中究竟发生了什么。

文章图片
#python
使用pycocoeval进行ImageCaption任务评测

ImageCaption任务是CV以及mllm研究中的基础任务。在这个blog中,我们介绍如何使用pycocoevalcap这个package评测模型的captioning能力。

文章图片
#计算机视觉#python
使用tensorboard可视化训练日志

使用tensorboard可视化训练日志

到底了