logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

基于昇腾适配肽性质预测模型PeptideBERT

预训练模型为ProtBERT,有12个注意力头和12个隐藏层,通过针对三个下游任务对预训练模型进行微调,PeptideBERT模型通过深度学习模型快速预测肽的功能,大幅缩短研发周期,降低实验成本,在预测溶血方面可以达到先进水平,对于确定肽诱导红细胞溶解的潜力以及非污染特性至关重要。PeptideBERT这篇工作通过前沿AI技术突破科学研究的效率瓶颈,其意义不仅在于提升肽研究的智能化水平,更在于为生

#云计算#昇腾
GRIN-MOE模型适配昇腾NPU(一):模型结构适配、权重转换

可以看出GRIN-MOE和Mixtral-8x7B模型结构基本相同,区别只是在attention部分一个带bias一个不到bias,因此后续流程可以参考MindSpeed-LLM里Mixtral-8x7B的实现。注:从打印出的模型结构可以看到GRIN-MOE的layernorm用的是LayerNorm而不是RMSNorm,解决方法:修改convert_ckpt.py文件,–model-type-h

#昇腾
MindSpeed-LLM关键参数关系说明

原文链接:https://blog.csdn.net/wy746801669wy/article/details/149118056。GA:梯度累积,表示每个DP并行组内处理多少个MBS后更新梯度;GBS:全局批次大小,表示分布式训练中跨设备的总训练样本量;注意:EP不影响DP的计算,EP只影响MOE部分的专家分布。MBS:微批次大小,表示每个DP并行组内单次训练的样本量;注意:TP、PP、CP需

#云计算#昇腾
MindSpeed-LLM模型部署案例:DeepSeek-R1-Distill-Qwen-1.5B微调

mcore:为当前主要演进分支,推荐使用。ckpt_convert_distill_qwen_mcore2hf.sh: mcore到huggingface权重格式转换脚本。ckpt_convert_distill_qwen_hf2mcore.sh:huggingface到mcore权重格式转换脚本。修改data_convert_distill_qwen_instruction.sh中的参数。tun

#人工智能#昇腾#DeepSeek
MindIE 服务化部署实现监控功能

在 MindIE 服务化运行过程中,为了及时掌握服务的运行状态、性能表现以及发现潜在问题,提供了服务监控指标查询接口(普罗(Prometheus)格式)。点击 Prometheus 安装目录下的 promethrus.exe 和 Grafana 安装目录下的bin/grafana-server.exe 启动 Prometheus 和 Grafana。修改 prometheus 安装目录下的 pro

#人工智能#大数据#MindIE +2
DeepSeek在昇腾上的模型部署 - 优秀实践

2024年12月26日,DeepSeek-V3横空出世,以其卓越性能备受瞩目。该模型发布即支持昇腾,用户可在昇腾硬件和MindIE推理引擎上实现高效推理,但在实际操作中,部署流程与常见问题困扰着不少开发者。本文将为你详细阐述昇腾 DeepSeek 模型部署的优秀实践。昇腾DeepSeek模型部署的常见问题及解决方案见。

#云计算#昇腾#DeepSeek
SGLang全面支持昇腾,使能大EP高性能推理

2025年8月,经过SGLang社区与昇腾的共同努力,将SGLang的灵活编程框架与昇腾强大的异构算力深度融合,使能SGLang在昇腾平台上无缝运行大模型推理,并正式面向用户推出基于SGLang的大EP集群推理解决方案。当前用户可获取最新release版本的SGLang以体验低延迟、高吞吐的推理系统。

#云计算#昇腾
vLLM & vLLM-ascend源码走读

的主要作用是在导入 vllm 模块时,对一些关键的环境变量和 PyTorch 配置进行设置和调整,以确保 vLLM 在不同的环境中能够正常运行,并避免一些潜在的问题。方法,当用户尝试访问该模块中未直接导入的属性时,会调用这个方法。解释了env_override的作用:设置一些通用的配置和环境变量,这些变量应该为 vllm 创建的所有进程以及与 vllm 工作进程交互的所有进程设置。定义了一个字典

#云计算#人工智能#昇腾
SGLang全面支持昇腾,使能大EP高性能推理

2025年8月,经过SGLang社区与昇腾的共同努力,将SGLang的灵活编程框架与昇腾强大的异构算力深度融合,使能SGLang在昇腾平台上无缝运行大模型推理,并正式面向用户推出基于SGLang的大EP集群推理解决方案。当前用户可获取最新release版本的SGLang以体验低延迟、高吞吐的推理系统。

#云计算#昇腾
DeepSeek在昇腾上的模型部署 - 优秀实践

2024年12月26日,DeepSeek-V3横空出世,以其卓越性能备受瞩目。该模型发布即支持昇腾,用户可在昇腾硬件和MindIE推理引擎上实现高效推理,但在实际操作中,部署流程与常见问题困扰着不少开发者。本文将为你详细阐述昇腾 DeepSeek 模型部署的优秀实践。昇腾DeepSeek模型部署的常见问题及解决方案见。

#云计算#昇腾#DeepSeek
    共 20 条
  • 1
  • 2
  • 请选择