logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

EasyR1 GRPO训练vlm模型尝试

注意:数据集在huggingface上存储为parquet格式,但是数据加载和处理的底层格式是arrow(arrow和parquet格式数据:https://blog.csdn.net/shizheng_Li/article/details/144132714)然而本地的.arrow格式数据集会报错,因此还是推送数据集到huggingface。最近要使用GRPO训一个vlm模型,听说easy R1

#人工智能
到底了