logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

DeepSeek-V4 解读

DeepSeek-V4 的目标,就是让百万 token 上下文从“理论支持”变成“工程上可以日常使用”。报告中给出的两个预览模型分别是 DeepSeek-V4-Pro 和 DeepSeek-V4-Flash:前者总参数约 1.6T、每 token 激活 49B;后者总参数 284B、每 token 激活 13B,二者都支持 100 万 token 上下文。

#语言模型
DeepSeek-V4 解读

DeepSeek-V4 的目标,就是让百万 token 上下文从“理论支持”变成“工程上可以日常使用”。报告中给出的两个预览模型分别是 DeepSeek-V4-Pro 和 DeepSeek-V4-Flash:前者总参数约 1.6T、每 token 激活 49B;后者总参数 284B、每 token 激活 13B,二者都支持 100 万 token 上下文。

#语言模型
到底了