2302_81115588 个人主页

@2302_81115588

2302_81115588

2024-05-09 20:16:06 加入 DevPress

简介

该用户还未填写简介

擅长的技术栈

未填写擅长的技术栈

可提供的服务

暂无可提供的服务

OpenClaw实战教程:Windows本地部署+公网访问，AI接管电脑全流程

你是否曾被这样的场景困扰：想让 AI 帮忙写一份工作汇报，却要在 ChatGPT 网页、飞书机器人、钉钉助手之间反复切换；出门在外想调取家里电脑的资料，却被局域网限制束手无策；尝试接入不同的 AI 大模型，却被复杂的 API 配置劝退…… 我们对智能助手的期待，从来不是 “只能在单一平台聊聊天”，而是 “能跨场景、跨设备，像真人一样替我们解决实际问题”。

#windows #人工智能

OpenClaw实战教程:Windows本地部署+公网访问，AI接管电脑全流程

#windows #人工智能

搭载cpolar让Tldraw 内网白板秒变公网协作神器

tldraw 是一款开源免费的在线白板工具，它以其简洁易用的界面、强大的实时协作功能和无限扩展的画布空间，支持用户轻松进行图表绘制、头脑风暴及创意分享。无论是在跨平台兼容性、数据持久性和可导出性方面，还是在提供高性能表现上，tldraw 都表现出色，适用于个人创作到团队合作等多种场景，是一个灵活而强大的视觉沟通解决方案。Tldraw 的易用性让可视化协作更高效，cpolar 则打破了其内网使用的局

#深度学习 #人工智能

CANN ops-nn 深度解析：基于 Tiling 与融合的异构算子极致性能工程实践

在 CANN 异构计算架构中，算子库是实现神经网络核心运算性能的基石。它代表了将上层数学逻辑转化为 NPU 硬件高效执行指令的关键工程能力。要实现算子性能的突破，必须超越简单的功能实现，深入到硬件微架构的每一个细节，构建从性能量化、内核诊断、基准对标到自动化部署的完整优化闭环。

#c语言 #开发语言

HCOMM 集合通信库深度工程解析：从 Ring 算法到 RDMA 内核旁路的高效异构数据同步策略

作为 CANN 架构中的高性能集合通信库，HCOMM（High Performance Communication）不仅仅是一个简单的传输层封装，它承载了从逻辑算法映射、硬件指令驱动到多级同步协同的核心职责。HCOMM 必须通过严格的同步机制，防止读后写（Read-After-Write）等数据竞争问题，同时掩盖通信延迟。通过对上述五大维度的深入优化，HCOMM 成功屏蔽了底层硬件的复杂性，为上层

#算法 #网络协议 #网络

HCOMM 集合通信库深度工程解析：从 Ring 算法到 RDMA 内核旁路的高效异构数据同步策略

#算法 #网络协议 #网络

CANN 算子生态的构建闭环：从 ops-nn 理解到自定义工具链的维护

这种模式利用了硬件的多执行单元特性，使得当前块的计算、下一块的数据载入以及前一块的结果写回能够重叠执行。在多核环境下，图引擎会根据算子依赖关系，通过智能调度算法，将计算任务均衡地分配到各个核心，避免出现计算瓶颈或核心空转，实现系统级的能效最大化。这种闭环机制确保了计算栈始终能跑在算法创新的最前沿，通过不断进化的算子集合，最大化释放硬件的计算潜能。在算子开发周期内，必须建立严苛的精度验证流程，通过与

#算法 #网络协议 #网络 +2

高性能算子库 ops-nn 的底层架构：从调度到指令的极致优化

在云原生环境下部署高性能算子，必须解决容器对物理硬件的访问权限问题。Docker 方案通过设备直通（Device Passthrough）技术，实现了容器内算子与物理 NPU 的零损耗通信。开发者通过--device参数挂载物理节点，并利用驱动直连技术（Driver Direct-Link）将宿主机的运行库映射到容器内。这种机制确保了在隔离的环境中，自定义算子依然能够调用最底层的固件指令，实现了算

#开发语言

高性能算子库 ops-nn 的底层架构：从调度到指令的极致优化

#开发语言

ops-math 算子库：原子数学运算的指令级深度工程与混合精度容错机制全景解析

Tiling 函数是自定义算子在编译阶段的逻辑大脑，承担着将全局张量数据映射到硬件核心局部内存的重要职责。它通过解析输入张量的几何属性，预先计算出每一块数据在物理内存中的偏移量与规模，实现了计算逻辑与数据排布的深度解耦。这一过程并非在核函数运行时即时发生，而是在图准备阶段完成参数固化，从而极大地降低了硬件在任务启动时的逻辑计算负载，为后续的高速并发处理奠定了坚实的逻辑基础。通过接口获取张量的多维几

#c语言 #开发语言

共 24 条

请选择