
简介
该用户还未填写简介
擅长的技术栈
可提供的服务
暂无可提供的服务
B站直播间链接:点击跳转 视频号、B站搜索: 【昇腾CANN】

以开源仓样例代码为依托,详解Cube类算子开发的设计逻辑、代码架构及关键代码功能,帮助开发者扫清入门障碍,高效上手Cube算子开发

vLLM-Ascend是一个完全开源的项目,致力于让大模型推理在昇腾芯片上运行得更高效、更经济。vLLM-Ascend开源项目目前已经达成如下能力并且在多个商用场景实现大模型的高效部署与商用上线:1.vLLM原生特性支持:除inductor外社区特性全部支持,如PD分离、chunk prefill、Prefix cache、并行配置、multi lora、function call、MTP、图模式
本次直播聚焦CANNBot Harness工程建设,主要分享如何以Harness设计为核心基座,全面承载与串联算子需求分析、算子设计、算子开发、测试设计、测试执行、结果分析以及性能调优全流程。辅以严格的门禁与自动化检查机制,全面解析如何构建高效、完备、全自动化的算子Harness工程系统。

B站预约链接:点击预约

欢迎化工、材料、能源领域的开发者下载代码、运行测试用例(详情见https://gitcode.com/cann/mat-chem-sim-pred/tree/master/simulation/AI4MD),并通过Issue或社区渠道反馈问题与改进建议。本算子实现了GAFF2的五项势能——键伸缩、键角弯曲、二面角扭转、Lennard-Jones 12-6、库仑静电,力约定与GROMACS一致。分子
欢迎化工、材料、能源领域的开发者下载代码、运行测试用例(详情见https://gitcode.com/cann/mat-chem-sim-pred/tree/master/simulation/AI4MD),并通过Issue或社区渠道反馈问题与改进建议。本算子实现了GAFF2的五项势能——键伸缩、键角弯曲、二面角扭转、Lennard-Jones 12-6、库仑静电,力约定与GROMACS一致。分子
1. 引言 CANN开源社区Material Chemical Engineering SIG(材料化学工程特别兴趣小组,以下简称"MCE SIG")发布4款分子动力学(MD)核心算子——GAFF2力场算子、PME长程静电算子、SHAKE键长约束算子、Velocity Verlet时间积分算子。4款算子分别对应MD主循环中的力场计算、长程静电处理、键长约束与时间积分环节,与此前
在处理不同规格输入时,划分的基本块无法均匀分配到所有核上,导致分核不均。需要针对最后一轮基本块进行二次切分(支持切分M和N轴),使其尽量均匀分配到多核中,充分发挥完整算力。Figure 6. 最后一个group尾轮负载均衡原理图:对最后一轮基本块进行二次切分(支持切分M和N轴)当前实验环境为Ascend950PR, GM带宽1.6T/s,32核。E=2,M轴分组,group_list={256,2

在处理不同规格输入时,划分的基本块无法均匀分配到所有核上,导致分核不均。需要针对最后一轮基本块进行二次切分(支持切分M和N轴),使其尽量均匀分配到多核中,充分发挥完整算力。Figure 6. 最后一个group尾轮负载均衡原理图:对最后一轮基本块进行二次切分(支持切分M和N轴)当前实验环境为Ascend950PR, GM带宽1.6T/s,32核。E=2,M轴分组,group_list={256,2








