logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

Ubuntu 24.04 配置 NVIDIA 官方 docker 镜像

【代码】Ubuntu 24.04 配置 NVIDIA 官方镜像。

#ubuntu#docker
Ubuntu 24.04 配置 NVIDIA 官方 docker 镜像

【代码】Ubuntu 24.04 配置 NVIDIA 官方镜像。

#ubuntu#docker
[Infra] 高性能强化学习训练框架 - verl(HybridFlow)调研

文章摘要:verl 是一个专为 LLM 设计的强化学习训练库,由字节跳动 Seed 团队开发。其核心创新 HybridFlow 框架通过混合单控制器与多控制器范式,解决了传统 RLHF 训练框架灵活性不足和效率低下的问题。主要技术包括:1) 分层 API 实现计算与数据依赖解耦;2) 3D-HybridEngine 实现零内存冗余的模型重分片;3) 自动设备映射算法优化硬件部署。实验表明,Hybr

#人工智能#语言模型
到底了