叶汐个人主页

@weixin_53023457

叶汐

2024-09-02 16:59:48 加入 DevPress

简介

该用户还未填写简介

擅长的技术栈

未填写擅长的技术栈

可提供的服务

暂无可提供的服务

EasyR1 GRPO训练vlm模型尝试

注意：数据集在huggingface上存储为parquet格式，但是数据加载和处理的底层格式是arrow（arrow和parquet格式数据：https://blog.csdn.net/shizheng_Li/article/details/144132714）然而本地的.arrow格式数据集会报错，因此还是推送数据集到huggingface。最近要使用GRPO训一个vlm模型，听说easy R1

#人工智能

到底了