
简介
该用户还未填写简介
擅长的技术栈
未填写擅长的技术栈
可提供的服务
暂无可提供的服务
deepseep的发展背景与前景
幻方量化凭借在量化投资领域积累的算法优化经验和A100万卡集群算力优势,敏锐捕捉到MoE(混合专家)架构的潜力,通过动态路由技术实现“参数规模与推理成本的解耦”,为DeepSeek的技术突破奠定基础。DeepSeek通过构建包含2万亿token的中英文混合数据集,结合领域专家标注的专业语料(如200万份中文裁判文书、3.6万份病例数据),打造出在数学推理、代码生成等任务上超越同规模Llama 2的
到底了







