logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

【大模型LLM】大模型训练加速 - 深度混合精度训练(Mixed Precision Training)原理详解

大模型训练加速 - 深度混合精度训练(Mixed Precision Training)原理详解

文章图片
#人工智能
【论文精读】 PVPO: PRE-ESTIMATED VALUE-BASED POLICY OPTIMIZATION FOR AGENTIC REASONING

【论文精读】 PVPO: PRE-ESTIMATED VALUE-BASED POLICY OPTIMIZATION FOR AGENTIC REASONING

文章图片
#人工智能#深度学习
【大模型LLM】大模型微调 应对显存限制和训练加速 常用的优化策略

大模型微调 应对显存限制和训练加速 常用的优化策略

文章图片
#人工智能
    共 100 条
  • 1
  • 2
  • 3
  • 10
  • 请选择