
简介
该用户还未填写简介
擅长的技术栈
未填写擅长的技术栈
可提供的服务
暂无可提供的服务
华为昇腾显卡部署向量化模型(Embedding)和重排序模型(Rerank)
将向量化模型和重排序模型部署在昇腾卡上(800I A2-910b),以接口的形式以供调用。

华为显卡部署DeepSeek-R1-Distill-Qwen-32B记录
DeepSeek 蒸馏模型 Qwen32B 在华为昇腾 Atlas 300I DUO上的部署记录(踩坑过程)

华为显卡部署DeepSeek-R1-Distill-Qwen-32B记录
DeepSeek 蒸馏模型 Qwen32B 在华为昇腾 Atlas 300I DUO上的部署记录(踩坑过程)

华为显卡部署DeepSeek-R1-Distill-Qwen-32B记录
DeepSeek 蒸馏模型 Qwen32B 在华为昇腾 Atlas 300I DUO上的部署记录(踩坑过程)

到底了







