不重复之名个人主页

@2401_82505265

不重复之名

2024-08-15 11:15:51 加入 DevPress

简介

该用户还未填写简介

擅长的技术栈

未填写擅长的技术栈

可提供的服务

暂无可提供的服务

DeepSeek-V4技术报告解读，全适配国产算力

训练流程大体沿用 DeepSeek-V3.2的方案，但在关键方法上做了替换：混合强化学习（RL）阶段被完全替换为 On-Policy Distillation（OPD）。，支持1M上下文，同时在知识、推理、代码、Agent、中文写作上全面登顶开源 SOTA，逼近 GPT-5.4 / Gemini-3.1-Pro 闭源顶级水平。DeepSeek-V3.2-Base、DeepSeek-V4-Flash

#人工智能 #自然语言处理 #python

DeepSeek-V4技术报告解读，全适配国产算力

#人工智能 #自然语言处理 #python

到底了