logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

6月23日-6月29日,CANN NEXT系列直播等你参与~

B站直播间链接:点击跳转 视频号、B站搜索: 【昇腾CANN】

文章图片
#昇腾#CANN#人工智能 +1
码力全开特辑直播预告|6月22日19:00,告别无从下手:拆解开源Cube算子,快速掌握开发要领

以开源仓样例代码为依托,详解Cube类算子开发的设计逻辑、代码架构及关键代码功能,帮助开发者扫清入门障碍,高效上手Cube算子开发

文章图片
#CANN#昇腾#人工智能 +1
vLLM-Ascend:大模型推理的优化实践

vLLM-Ascend是一个完全开源的项目,致力于让大模型推理在昇腾芯片上运行得更高效、更经济。vLLM-Ascend开源项目目前已经达成如下能力并且在多个商用场景实现大模型的高效部署与商用上线:1.vLLM原生特性支持:除inductor外社区特性全部支持,如PD分离、chunk prefill、Prefix cache、并行配置、multi lora、function call、MTP、图模式

#CANN#开源
CANNBot算子Harness工程建设

本次直播聚焦CANNBot Harness工程建设,主要分享如何以Harness设计为核心基座,全面承载与串联算子需求分析、算子设计、算子开发、测试设计、测试执行、结果分析以及性能调优全流程。辅以严格的门禁与自动化检查机制,全面解析如何构建高效、完备、全自动化的算子Harness工程系统。

文章图片
#CANN#昇腾
MCE SIG发布4款MD模拟流程核心算子,补齐分子动力学模拟主循环

欢迎化工、材料、能源领域的开发者下载代码、运行测试用例(详情见https://gitcode.com/cann/mat-chem-sim-pred/tree/master/simulation/AI4MD),并通过Issue或社区渠道反馈问题与改进建议。本算子实现了GAFF2的五项势能——键伸缩、键角弯曲、二面角扭转、Lennard-Jones 12-6、库仑静电,力约定与GROMACS一致。分子

#CANN
MCE SIG发布4款MD模拟流程核心算子,补齐分子动力学模拟主循环

欢迎化工、材料、能源领域的开发者下载代码、运行测试用例(详情见https://gitcode.com/cann/mat-chem-sim-pred/tree/master/simulation/AI4MD),并通过Issue或社区渠道反馈问题与改进建议。本算子实现了GAFF2的五项势能——键伸缩、键角弯曲、二面角扭转、Lennard-Jones 12-6、库仑静电,力约定与GROMACS一致。分子

#CANN
MCE SIG发布4款MD模拟流程核心算子,补齐分子动力学模拟主循环

1. 引言 CANN开源社区Material Chemical Engineering SIG(材料化学工程特别兴趣小组,以下简称"MCE SIG")发布4款分子动力学(MD)核心算子——GAFF2力场算子、PME长程静电算子、SHAKE键长约束算子、Velocity Verlet时间积分算子。4款算子分别对应MD主循环中的力场计算、长程静电处理、键长约束与时间积分环节,与此前

#CANN
【cann-samples系列】GroupedMatmul MX量化矩阵乘的深度性能优化实践

在处理不同规格输入时,划分的基本块无法均匀分配到所有核上,导致分核不均。需要针对最后一轮基本块进行二次切分(支持切分M和N轴),使其尽量均匀分配到多核中,充分发挥完整算力。Figure 6. 最后一个group尾轮负载均衡原理图:对最后一轮基本块进行二次切分(支持切分M和N轴)当前实验环境为Ascend950PR, GM带宽1.6T/s,32核。E=2,M轴分组,group_list={256,2

文章图片
#矩阵#性能优化#线性代数 +2
【cann-samples系列】GroupedMatmul MX量化矩阵乘的深度性能优化实践

在处理不同规格输入时,划分的基本块无法均匀分配到所有核上,导致分核不均。需要针对最后一轮基本块进行二次切分(支持切分M和N轴),使其尽量均匀分配到多核中,充分发挥完整算力。Figure 6. 最后一个group尾轮负载均衡原理图:对最后一轮基本块进行二次切分(支持切分M和N轴)当前实验环境为Ascend950PR, GM带宽1.6T/s,32核。E=2,M轴分组,group_list={256,2

文章图片
#矩阵#性能优化#线性代数 +2
    共 763 条
  • 1
  • 2
  • 3
  • 77
  • 请选择