2501_94072966 个人主页

@2501_94072966

2501_94072966

2025-11-02 14:22:54 加入 DevPress

简介

该用户还未填写简介

擅长的技术栈

未填写擅长的技术栈

可提供的服务

暂无可提供的服务

DeepSeek-R1 模型部署指南：结合 TensorRT-LLM 实现推理加速

DeepSeek-R1 是一个高性能的大型语言模型，而 TensorRT-LLM 是 NVIDIA 开发的优化库，可显著提升推理速度（例如，减少延迟并提高吞吐量）。首先，下载 DeepSeek-R1 模型（例如，从 Hugging Face Hub），并将其转换为 ONNX 格式，以便 TensorRT-LLM 处理。模型大小 $n$（参数数量）会影响转换时间，DeepSeek-R1 的典型值在

#beautifulsoup #httpx

到底了