logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

华为昇腾显卡部署向量化模型(Embedding)和重排序模型(Rerank)

将向量化模型和重排序模型部署在昇腾卡上(800I A2-910b),以接口的形式以供调用。

文章图片
#语言模型#人工智能#华为
华为显卡部署DeepSeek-R1-Distill-Qwen-32B记录

DeepSeek 蒸馏模型 Qwen32B 在华为昇腾 Atlas 300I DUO上的部署记录(踩坑过程)

文章图片
#语言模型#人工智能#华为
华为显卡部署DeepSeek-R1-Distill-Qwen-32B记录

DeepSeek 蒸馏模型 Qwen32B 在华为昇腾 Atlas 300I DUO上的部署记录(踩坑过程)

文章图片
#语言模型#人工智能#华为
华为显卡部署DeepSeek-R1-Distill-Qwen-32B记录

DeepSeek 蒸馏模型 Qwen32B 在华为昇腾 Atlas 300I DUO上的部署记录(踩坑过程)

文章图片
#语言模型#人工智能#华为
到底了