
简介
该用户还未填写简介
擅长的技术栈
未填写擅长的技术栈
可提供的服务
暂无可提供的服务
EasyR1 GRPO训练vlm模型尝试
注意:数据集在huggingface上存储为parquet格式,但是数据加载和处理的底层格式是arrow(arrow和parquet格式数据:https://blog.csdn.net/shizheng_Li/article/details/144132714)然而本地的.arrow格式数据集会报错,因此还是推送数据集到huggingface。最近要使用GRPO训一个vlm模型,听说easy R1
到底了







