logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

【人工智能】华为昇腾NPU-Vllm Ascend部署及镜像制作

本文介绍了两种在华为昇腾NPU上部署vLLM推理服务的方法:1)通过源码构建npu版vllm镜像,详细说明了vllm-ascend的安装步骤、模型测试方法及服务启动命令;2)使用官方预构建的vllm-ascend镜像,提供完整的容器启动脚本和API测试示例。文章包含LLM和Embedding模型的完整部署方案,涉及Dockerfile编写、启动脚本配置、一键部署脚本以及Python API调用代码

#人工智能#华为#语言模型 +2
【人工智能】langchain + qwen2.5 使用示例

实现本地知识库向量化后保存,然后langchain进行qa数据流。

文章图片
#python
【人工智能】华为昇腾NPU-Vllm Ascend部署及镜像制作

本文介绍了两种在华为昇腾NPU上部署vLLM推理服务的方法:1)通过源码构建npu版vllm镜像,详细说明了vllm-ascend的安装步骤、模型测试方法及服务启动命令;2)使用官方预构建的vllm-ascend镜像,提供完整的容器启动脚本和API测试示例。文章包含LLM和Embedding模型的完整部署方案,涉及Dockerfile编写、启动脚本配置、一键部署脚本以及Python API调用代码

#人工智能#华为#语言模型 +2
在华为910B GPU服务器上运行DeepSeek-R1-0528模型

本文记录了在两台Atlas800IA2服务器(配备910B4显卡)上运行W8A8量化的DeepSeek-R1-0528模型的完整过程。主要内容包括:1) 环境准备,需MindIE≥2.1.RC1版本和≥24.1.01.1驱动;2) 多机推理配置,通过rank_table文件定义16张卡的分布;3) 容器化部署,挂载660G模型文件并修改MindIE配置;4) 性能测试,使用EvalScope工具测

#华为#人工智能#python +1
【人工智能】华为昇腾NPU-MindIE镜像制作

本文介绍了MindIE 1.0.0的完整安装部署流程:1)安装必备资源包(ATBModels、torch_npu、MindIE);2)配置环境变量;3)修改权限和配置文件,包括模型路径、卡数等关键参数;4)启动服务和测试接口。提供了详细的参数说明文档链接和config.json配置示例。

#人工智能#华为
【人工智能】QWEN + RAG系统

结合qwen2.5-7b + bge-reranker-base + stella-base-zh-v2 组合成的rag系统。其中测试数据和模型需要自行下载,modelscope就可以。

文章图片
#人工智能
【人工智能】华为昇腾NPU-MindIE镜像制作

本文介绍了MindIE 1.0.0的完整安装部署流程:1)安装必备资源包(ATBModels、torch_npu、MindIE);2)配置环境变量;3)修改权限和配置文件,包括模型路径、卡数等关键参数;4)启动服务和测试接口。提供了详细的参数说明文档链接和config.json配置示例。

#人工智能#华为
【人工智能】华为昇腾NPU-Vllm Ascend部署及镜像制作

本文介绍了两种在华为昇腾NPU上部署vLLM推理服务的方法:1)通过源码构建npu版vllm镜像,详细说明了vllm-ascend的安装步骤、模型测试方法及服务启动命令;2)使用官方预构建的vllm-ascend镜像,提供完整的容器启动脚本和API测试示例。文章包含LLM和Embedding模型的完整部署方案,涉及Dockerfile编写、启动脚本配置、一键部署脚本以及Python API调用代码

#人工智能#华为#语言模型 +2
    共 30 条
  • 1
  • 2
  • 3
  • 请选择