asvadgacsacasc 个人主页

@asvadgacsacasc

asvadgacsacasc

2025-10-03 00:32:15 加入 DevPress

简介

该用户还未填写简介

擅长的技术栈

未填写擅长的技术栈

可提供的服务

暂无可提供的服务

华为云Flexus+DeepSeek征文 | 从零到一：用Flexus云服务打造低延迟联网搜索Agent

需要注意的是，由于chat_template和tokenize算法的影响，生成的prompt的token数量可能有些误差，不是精确的指定token数量。在继续尝试了多种vLLM提供的各类参数后（例如--max-num-batched-tokens、--max-num-seqs等），我们仍然无法达到比第一次表现更好的测试。可以看到，关闭async-scheduling后，无论是RPS、Latency

到底了