
简介
该用户还未填写简介
擅长的技术栈
可提供的服务
暂无可提供的服务
摘要: 本文介绍了如何在openJiuwen中将常用在线工具本地化为插件,实现智能体自动调用。首先需确认平台启动正常,创建基础智能体后,重点讲解了插件的开发标准:输入明确、输出稳定、失败可解释,并提供了JSON转换等具体示例。适用场景包括高频使用的固定输入输出工具,而不适合一次性脚本或敏感数据处理。最后强调插件命名应直观可搜索,输出需结构化以便智能体准确识别。通过这种方法可减少网页切换,提高工作效

本文提出了一种轻量化部署Agentic AI平台openJiuwen的方案,采用SQLite+ChromaDB组合替代传统复杂架构。作者指出,在开发初期应聚焦核心功能而非基础设施维护,SQLite能满足配置与状态存储需求,ChromaDB则可简化向量检索流程。文章详细分析了该方案的适用场景,并提供了具体部署步骤,包括SQLite文件准备、ChromaDB集成配置及前后端启动流程。这种最小可用部署方

以下代码片段展示了 HComm 典型的 C 风格 API 定义。这种设计简洁、高效,易于被上层框架通过 FFI(Foreign Function Interface)调用,体现了其作为高性能基础库的设计哲学。#endif// 定义返回状态码// ... 其他错误码// 定义数据类型// ... 其他数据类型// 定义规约操作类型// 通信域句柄,一个不透明指针// 设备流句柄,同样为不透明指针/*
在计算机视觉(CV)的落地应用中,图像预处理往往占据了整个推理流程 30% 甚至 50% 的端到端耗时。如果说矩阵乘法是深度学习的引擎,那么图像编解码、缩放、裁剪与色彩转换则是为其输送燃料的管道。任何一环的堵塞,都会让强大的计算核心陷入“无米之炊”的窘境。ops-cv仓库正是为了解决这一瓶颈而生。它不是通用的数学算子库,而是专门针对像素级操作进行了极致优化的垂直领域库。它通过深度挖掘硬件潜力,实现
除了标准的 Causal Mask(因果掩码),该仓库还支持用户传入自定义的 Attention Mask 矩阵,以支持复杂的稀疏注意力(Sparse Attention)模式或特定的长上下文处理策略。
是 CANN 生态的“基石”与“粘合剂”。它虽不直接面向最终用户,却为所有上层创新提供了坚实、高效、可靠的执行基础。抽象硬件复杂性,暴露可控并行性,保障系统稳定性。对于希望深入理解 NPU 软件栈或进行底层优化的工程师而言,掌握的原理与使用,是通往高性能 AI 系统的必经之路。
是 CANN 生态的“基石”与“粘合剂”。它虽不直接面向最终用户,却为所有上层创新提供了坚实、高效、可靠的执行基础。抽象硬件复杂性,暴露可控并行性,保障系统稳定性。对于希望深入理解 NPU 软件栈或进行底层优化的工程师而言,掌握的原理与使用,是通往高性能 AI 系统的必经之路。
在大模型(LLM)统治的时代,Transformer 架构已成为 AI 的通用语言。然而,原生 PyTorch 实现的 Transformer 算子(如 Multi-Head Attention, LayerNorm, GELU)在面对千亿参数规模时,往往面临着严重的显存墙(Memory Wall)和计算利用率低下的问题。不仅仅是一个算子库,它是针对 NPU 硬件架构深度定制的。
在计算机视觉(CV)的落地应用中,图像预处理往往占据了整个推理流程 30% 甚至 50% 的端到端耗时。如果说矩阵乘法是深度学习的引擎,那么图像编解码、缩放、裁剪与色彩转换则是为其输送燃料的管道。ops-cv仓库正是为了解决这一瓶颈而生。它不是通用的数学算子库,而是专门针对像素级操作进行了极致优化的垂直领域库。它利用专用硬件单元(如 VPC, VDEC)和通用计算单元(AI Core)的异构能力,
为了展示 Catlass 是如何通过类型系统来描述算子配置的,以下代码片段展示了一个 GEMM 配置结构的定义。这并非可执行的业务代码,而是用于指导编译器生成 Kernel 的元数据描述。/*** @brief GEMM 算子核心配置 Traits* 通过模板特化,定义了算子在不同数据类型和架构下的行为策略。* 这种结构体在编译期被解析,不占用运行时的内存空间。*/template <typena







