logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

c#asp.netjavascript界面设计架构设计

可提供的服务

人才测评产品、考试命题服务、随机组卷在线考试、PPT培训课件制作、代理招聘服务

CANN 8 性能实测与优化:通信算子变化带来了什么?

模型并行训练调度(支持 PP、TP、DP 并行组合);训练作业统一启动与监控;性能 profile 采集与分析;cluster 模式下的多节点同步日志聚合。在性能分析环节中,它通过profiling模块自动记录各算子的运行耗时、通信时长、内存占用与下发延迟。CANN 8 的性能表现变化,并非简单的“好”或“坏”, 而是一种系统在重构后,寻找新平衡点的过程。升级带来的不确定性,正是我们理解系统、掌握

#CANN
GMM NZ 全流程详解实战:FSDP MOE 训练加速

我们发现,算子级性能提升的瓶颈往往不在算子本身,而在框架与算子之间的“接口层”。NZ 格式在推理阶段表现优异,是因为数据格式在编译前已固化;而训练中,动态反向路径和多进程通信导致格式频繁切换。提前转置、格式冻结、算子融合,正是我们将推理优化思路迁移到训练端的重点。整个 GMM NZ 训练使能过程,从框架底层到算子适配,经历了多次性能权衡与调试。一次搬运,双重优化:sliceNZ 的核心价值在于合并

#pytorch#人工智能#python
在openEuler操作系统基础上实现机器学习开发以及openEuler优势分析

我们都知道,openEuler 作为华为开源的企业级 Linux 操作系统,凭借对鲲鹏架构的深度定制优化、经过工业级验证的稳定内核性能以及持续扩容的开源生态支持,已成为机器学习开发领域的优选底座。其内核层面针对异构计算场景设计的智能算力调度机制,能够动态分配 CPU、GPU 及 NPU 等硬件资源,精准匹配机器学习任务中数据预处理、模型训练与推理部署的差异化资源需求,显著提升算力利用率;

文章图片
#机器学习#人工智能
C# 解决“因为算法不同,客户端和服务器无法通信”的问题

实现微信退款功能,我们需要在微信支付商户后台申请安全证书,并调用退款API URL。在调试过程中为增添返回调试信息属性,重新对.net FrameWorkd 类库进行编译并部署,调试一切正常,但再次覆盖的时候,调用显示为 “ 因为算法不同,客户端和服务器无法通信。”

文章图片
#c##服务器#开发语言 +2
C#实现导出Word图表通用方法之散点图

本文介绍了C#实现数据导出生成Word图表的通用方法,重点解决了散点图等特殊图表的处理问题。

文章图片
#c##开发语言#.net
文心一言4.5开源模型测评:ERNIE-4.5-0.3B超轻量模型部署指南

2024年,大模型部署领域正经历一场静默革命:这时,ERNIE-4.5在GitCode社区发布了发布地址是:http://gitCode社区ERNIE4.5模型列表是一个专门的栏目,有整个的ERNIE4.5的模型列表,可以支持各类的应用,并且还可以gitCode平台进行快速部署实操,真的是方便至极,小模型部署不足10分钟即可正式访问,下面我们进入具体操作。ERNIE-4.5-0.3B的破局价值:在

文章图片
#开源#dubbo
文心一言4.5开源模型测评:ERNIE-4.5-0.3B超轻量模型部署指南

2024年,大模型部署领域正经历一场静默革命:这时,ERNIE-4.5在GitCode社区发布了发布地址是:http://gitCode社区ERNIE4.5模型列表是一个专门的栏目,有整个的ERNIE4.5的模型列表,可以支持各类的应用,并且还可以gitCode平台进行快速部署实操,真的是方便至极,小模型部署不足10分钟即可正式访问,下面我们进入具体操作。ERNIE-4.5-0.3B的破局价值:在

文章图片
#开源#dubbo
GMM NZ 全流程详解实战:FSDP MOE 训练加速

我们发现,算子级性能提升的瓶颈往往不在算子本身,而在框架与算子之间的“接口层”。NZ 格式在推理阶段表现优异,是因为数据格式在编译前已固化;而训练中,动态反向路径和多进程通信导致格式频繁切换。提前转置、格式冻结、算子融合,正是我们将推理优化思路迁移到训练端的重点。整个 GMM NZ 训练使能过程,从框架底层到算子适配,经历了多次性能权衡与调试。一次搬运,双重优化:sliceNZ 的核心价值在于合并

#pytorch#人工智能#python
CANN 8 性能实测与优化:通信算子变化带来了什么?

模型并行训练调度(支持 PP、TP、DP 并行组合);训练作业统一启动与监控;性能 profile 采集与分析;cluster 模式下的多节点同步日志聚合。在性能分析环节中,它通过profiling模块自动记录各算子的运行耗时、通信时长、内存占用与下发延迟。CANN 8 的性能表现变化,并非简单的“好”或“坏”, 而是一种系统在重构后,寻找新平衡点的过程。升级带来的不确定性,正是我们理解系统、掌握

#CANN
聚合顶尖模型+知识库功能,定制私人科研编程AI专家

在科研探索与代码编写的道路上,AI 工具早已成为不可或缺的伙伴。然而,当前 AI 工具市场却存在诸多痛点:科研人员常常需要在 GPT、Claude、DeepSeek 等多个模型间反复注册、切换,不仅操作繁琐,还耗费大量时间;部分强大的 AI 工具仅支持桌面端,或是使用时需要翻墙,限制了使用场景;此外,单一工具功能相对局限,难以满足文本处理、绘图、文档解析等多模态需求。ChatboxAI 的出现,为

文章图片
#人工智能
    共 80 条
  • 1
  • 2
  • 3
  • 8
  • 请选择