百川智能开发者中心个人主页

@Baichuan_AI

百川智能开发者中心

2024-11-26 14:56:40 加入 DevPress

简介

该用户还未填写简介

擅长的技术栈

未填写擅长的技术栈

可提供的服务

暂无可提供的服务

深度学习大模型推理性能优化策略

1. 量化；2. 投机采样；3. TTFT 与 TPOT 的优化；4. 通信优化。

文章图片

#深度学习 #性能优化 #人工智能

深度学习大模型推理性能优化策略

1. 量化；2. 投机采样；3. TTFT 与 TPOT 的优化；4. 通信优化。

文章图片

#深度学习 #性能优化 #人工智能

深度学习大模型推理性能优化策略

1. 量化；2. 投机采样；3. TTFT 与 TPOT 的优化；4. 通信优化。

文章图片

#深度学习 #性能优化 #人工智能

深度学习大模型推理性能优化策略

1. 量化；2. 投机采样；3. TTFT 与 TPOT 的优化；4. 通信优化。

文章图片

#深度学习 #性能优化 #人工智能

MuseD——提升大模型多步演绎推理能力

今年9月，OpenAI 在“o1”的技术报告中提出了train-time compute和test-time compute，。复杂的多步推理任务是大语言模型应用的一个重要挑战。多步推理即从初始条件出发，通过多步逻辑推导逐步得出结论的过程，对于解决现实中复杂的任务至关重要，数学题解、法律推理、科学论证等应用场景都需要模型具备这一能力。，医疗、法律等领域的专家期望 AI 系统能完成从信息提取到推理分

到底了