logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

在 openJiuwen 里把在线小工具搬回本地

摘要: 本文介绍了如何在openJiuwen中将常用在线工具本地化为插件,实现智能体自动调用。首先需确认平台启动正常,创建基础智能体后,重点讲解了插件的开发标准:输入明确、输出稳定、失败可解释,并提供了JSON转换等具体示例。适用场景包括高频使用的固定输入输出工具,而不适合一次性脚本或敏感数据处理。最后强调插件命名应直观可搜索,输出需结构化以便智能体准确识别。通过这种方法可减少网页切换,提高工作效

文章图片
#windows#人工智能
Agentic AI最小可用部署方案:基于 SQLite + ChromaDB 构建 openJiuwen 本地轻量化智能体平台

本文提出了一种轻量化部署Agentic AI平台openJiuwen的方案,采用SQLite+ChromaDB组合替代传统复杂架构。作者指出,在开发初期应聚焦核心功能而非基础设施维护,SQLite能满足配置与状态存储需求,ChromaDB则可简化向量检索流程。文章详细分析了该方案的适用场景,并提供了具体部署步骤,包括SQLite文件准备、ChromaDB集成配置及前后端启动流程。这种最小可用部署方

文章图片
#人工智能#sqlite#数据库
揭秘大模型训练的神经网络:深入解析 HComm 集合通信库的架构

以下代码片段展示了 HComm 典型的 C 风格 API 定义。这种设计简洁、高效,易于被上层框架通过 FFI(Foreign Function Interface)调用,体现了其作为高性能基础库的设计哲学。#endif// 定义返回状态码// ... 其他错误码// 定义数据类型// ... 其他数据类型// 定义规约操作类型// 通信域句柄,一个不透明指针// 设备流句柄,同样为不透明指针/*

#分布式
深度解析 ops-cv:构建高性能计算机视觉算子库的内核之道

在计算机视觉(CV)的落地应用中,图像预处理往往占据了整个推理流程 30% 甚至 50% 的端到端耗时。如果说矩阵乘法是深度学习的引擎,那么图像编解码、缩放、裁剪与色彩转换则是为其输送燃料的管道。任何一环的堵塞,都会让强大的计算核心陷入“无米之炊”的窘境。ops-cv仓库正是为了解决这一瓶颈而生。它不是通用的数学算子库,而是专门针对像素级操作进行了极致优化的垂直领域库。它通过深度挖掘硬件潜力,实现

#transformer
大模型加速核心:Ops-Transformer 算子库技术内幕

除了标准的 Causal Mask(因果掩码),该仓库还支持用户传入自定义的 Attention Mask 矩阵,以支持复杂的稀疏注意力(Sparse Attention)模式或特定的长上下文处理策略。

#人工智能
图引擎 GE 深度剖析:从前端图到硬件执行的“总工程师”

是 CANN 生态的“基石”与“粘合剂”。它虽不直接面向最终用户,却为所有上层创新提供了坚实、高效、可靠的执行基础。抽象硬件复杂性,暴露可控并行性,保障系统稳定性。对于希望深入理解 NPU 软件栈或进行底层优化的工程师而言,掌握的原理与使用,是通往高性能 AI 系统的必经之路。

#分布式
图引擎 GE 深度剖析:从前端图到硬件执行的“总工程师”

是 CANN 生态的“基石”与“粘合剂”。它虽不直接面向最终用户,却为所有上层创新提供了坚实、高效、可靠的执行基础。抽象硬件复杂性,暴露可控并行性,保障系统稳定性。对于希望深入理解 NPU 软件栈或进行底层优化的工程师而言,掌握的原理与使用,是通往高性能 AI 系统的必经之路。

#分布式
极致算力:ops-transformer 加速库的核心架构与算子深度融合解析

在大模型(LLM)统治的时代,Transformer 架构已成为 AI 的通用语言。然而,原生 PyTorch 实现的 Transformer 算子(如 Multi-Head Attention, LayerNorm, GELU)在面对千亿参数规模时,往往面临着严重的显存墙(Memory Wall)和计算利用率低下的问题。不仅仅是一个算子库,它是针对 NPU 硬件架构深度定制的。

#分布式
深度解析 ops-cv:构建高性能计算机视觉算子库的内核之道

在计算机视觉(CV)的落地应用中,图像预处理往往占据了整个推理流程 30% 甚至 50% 的端到端耗时。如果说矩阵乘法是深度学习的引擎,那么图像编解码、缩放、裁剪与色彩转换则是为其输送燃料的管道。ops-cv仓库正是为了解决这一瓶颈而生。它不是通用的数学算子库,而是专门针对像素级操作进行了极致优化的垂直领域库。它利用专用硬件单元(如 VPC, VDEC)和通用计算单元(AI Core)的异构能力,

#人工智能
矩阵计算的极致艺术:深度解构 Catlass 高性能算子模板库

为了展示 Catlass 是如何通过类型系统来描述算子配置的,以下代码片段展示了一个 GEMM 配置结构的定义。这并非可执行的业务代码,而是用于指导编译器生成 Kernel 的元数据描述。/*** @brief GEMM 算子核心配置 Traits* 通过模板特化,定义了算子在不同数据类型和架构下的行为策略。* 这种结构体在编译期被解析,不占用运行时的内存空间。*/template <typena

#人工智能
    共 138 条
  • 1
  • 2
  • 3
  • 14
  • 请选择