logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

OpenClaw实战教程:Windows本地部署+公网访问,AI接管电脑全流程

你是否曾被这样的场景困扰:想让 AI 帮忙写一份工作汇报,却要在 ChatGPT 网页、飞书机器人、钉钉助手之间反复切换;出门在外想调取家里电脑的资料,却被局域网限制束手无策;尝试接入不同的 AI 大模型,却被复杂的 API 配置劝退…… 我们对智能助手的期待,从来不是 “只能在单一平台聊聊天”,而是 “能跨场景、跨设备,像真人一样替我们解决实际问题”。

文章图片
#windows#人工智能
OpenClaw实战教程:Windows本地部署+公网访问,AI接管电脑全流程

你是否曾被这样的场景困扰:想让 AI 帮忙写一份工作汇报,却要在 ChatGPT 网页、飞书机器人、钉钉助手之间反复切换;出门在外想调取家里电脑的资料,却被局域网限制束手无策;尝试接入不同的 AI 大模型,却被复杂的 API 配置劝退…… 我们对智能助手的期待,从来不是 “只能在单一平台聊聊天”,而是 “能跨场景、跨设备,像真人一样替我们解决实际问题”。

文章图片
#windows#人工智能
搭载cpolar让Tldraw 内网白板秒变公网协作神器

tldraw 是一款开源免费的在线白板工具,它以其简洁易用的界面、强大的实时协作功能和无限扩展的画布空间,支持用户轻松进行图表绘制、头脑风暴及创意分享。无论是在跨平台兼容性、数据持久性和可导出性方面,还是在提供高性能表现上,tldraw 都表现出色,适用于个人创作到团队合作等多种场景,是一个灵活而强大的视觉沟通解决方案。Tldraw 的易用性让可视化协作更高效,cpolar 则打破了其内网使用的局

文章图片
#深度学习#人工智能
CANN ops-nn 深度解析:基于 Tiling 与融合的异构算子极致性能工程实践

在 CANN 异构计算架构中,算子库是实现神经网络核心运算性能的基石。它代表了将上层数学逻辑转化为 NPU 硬件高效执行指令的关键工程能力。要实现算子性能的突破,必须超越简单的功能实现,深入到硬件微架构的每一个细节,构建从性能量化、内核诊断、基准对标到自动化部署的完整优化闭环。

#c语言#开发语言
HCOMM 集合通信库深度工程解析:从 Ring 算法到 RDMA 内核旁路的高效异构数据同步策略

作为 CANN 架构中的高性能集合通信库,HCOMM(High Performance Communication)不仅仅是一个简单的传输层封装,它承载了从逻辑算法映射、硬件指令驱动到多级同步协同的核心职责。HCOMM 必须通过严格的同步机制,防止读后写(Read-After-Write)等数据竞争问题,同时掩盖通信延迟。通过对上述五大维度的深入优化,HCOMM 成功屏蔽了底层硬件的复杂性,为上层

#算法#网络协议#网络
HCOMM 集合通信库深度工程解析:从 Ring 算法到 RDMA 内核旁路的高效异构数据同步策略

作为 CANN 架构中的高性能集合通信库,HCOMM(High Performance Communication)不仅仅是一个简单的传输层封装,它承载了从逻辑算法映射、硬件指令驱动到多级同步协同的核心职责。HCOMM 必须通过严格的同步机制,防止读后写(Read-After-Write)等数据竞争问题,同时掩盖通信延迟。通过对上述五大维度的深入优化,HCOMM 成功屏蔽了底层硬件的复杂性,为上层

#算法#网络协议#网络
CANN 算子生态的构建闭环:从 ops-nn 理解到自定义工具链的维护

这种模式利用了硬件的多执行单元特性,使得当前块的计算、下一块的数据载入以及前一块的结果写回能够重叠执行。在多核环境下,图引擎会根据算子依赖关系,通过智能调度算法,将计算任务均衡地分配到各个核心,避免出现计算瓶颈或核心空转,实现系统级的能效最大化。这种闭环机制确保了计算栈始终能跑在算法创新的最前沿,通过不断进化的算子集合,最大化释放硬件的计算潜能。在算子开发周期内,必须建立严苛的精度验证流程,通过与

#算法#网络协议#网络 +2
高性能算子库 ops-nn 的底层架构:从调度到指令的极致优化

在云原生环境下部署高性能算子,必须解决容器对物理硬件的访问权限问题。Docker 方案通过设备直通(Device Passthrough)技术,实现了容器内算子与物理 NPU 的零损耗通信。开发者通过--device参数挂载物理节点,并利用驱动直连技术(Driver Direct-Link)将宿主机的运行库映射到容器内。这种机制确保了在隔离的环境中,自定义算子依然能够调用最底层的固件指令,实现了算

#开发语言
高性能算子库 ops-nn 的底层架构:从调度到指令的极致优化

在云原生环境下部署高性能算子,必须解决容器对物理硬件的访问权限问题。Docker 方案通过设备直通(Device Passthrough)技术,实现了容器内算子与物理 NPU 的零损耗通信。开发者通过--device参数挂载物理节点,并利用驱动直连技术(Driver Direct-Link)将宿主机的运行库映射到容器内。这种机制确保了在隔离的环境中,自定义算子依然能够调用最底层的固件指令,实现了算

#开发语言
ops-math 算子库:原子数学运算的指令级深度工程与混合精度容错机制全景解析

Tiling 函数是自定义算子在编译阶段的逻辑大脑,承担着将全局张量数据映射到硬件核心局部内存的重要职责。它通过解析输入张量的几何属性,预先计算出每一块数据在物理内存中的偏移量与规模,实现了计算逻辑与数据排布的深度解耦。这一过程并非在核函数运行时即时发生,而是在图准备阶段完成参数固化,从而极大地降低了硬件在任务启动时的逻辑计算负载,为后续的高速并发处理奠定了坚实的逻辑基础。通过接口获取张量的多维几

#c语言#开发语言
    共 24 条
  • 1
  • 2
  • 3
  • 请选择