logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

深度学习大模型推理性能优化策略

1. 量化;2. 投机采样;3. TTFT 与 TPOT 的优化;4. 通信优化。

文章图片
#深度学习#性能优化#人工智能
深度学习大模型推理性能优化策略

1. 量化;2. 投机采样;3. TTFT 与 TPOT 的优化;4. 通信优化。

文章图片
#深度学习#性能优化#人工智能
MuseD——提升大模型多步演绎推理能力

今年9月,OpenAI 在“o1”的技术报告中提出了train-time compute和test-time compute,。复杂的多步推理任务是大语言模型应用的一个重要挑战。多步推理即从初始条件出发,通过多步逻辑推导逐步得出结论的过程,对于解决现实中复杂的任务至关重要,数学题解、法律推理、科学论证等应用场景都需要模型具备这一能力。,医疗、法律等领域的专家期望 AI 系统能完成从信息提取到推理分

#人工智能
到底了