
简介
该用户还未填写简介
擅长的技术栈
未填写擅长的技术栈
可提供的服务
暂无可提供的服务
verl - verl核心代码详解(与令人纠结的batch size)
在RL训练中,我们会遇到各种各样的batch, 眼花缭乱。在这里,我们细致梳理一下这些batch 代表了什么,和它们之间的关系。

verl - vllm_rollout_spmd.py 详解
rollout 是强化学习中非常重要的环节。我们这里研究对于多模态VQA任务,rollout 过程中究竟发生了什么。

使用pycocoeval进行ImageCaption任务评测
ImageCaption任务是CV以及mllm研究中的基础任务。在这个blog中,我们介绍如何使用pycocoevalcap这个package评测模型的captioning能力。

Linux上快速压缩与解压缩(zip, tag.gz)
linux 多线程快速压缩与解压缩

使用tensorboard可视化训练日志
使用tensorboard可视化训练日志
到底了