logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

第一篇:初识 nanobot —— 一个微型 AI Agent 的诞生

nanobot具备生产级Agent核心模块:推理循环、工具调用、记忆管理、定时任务及多渠道接入(Telegram/飞书/钉钉等)。通过LiteLLM统一路由,兼容OpenAI、DeepSeek、Claude等20+种主流大模型,并适配MCP协议。其极简架构清晰呈现"思考→行动→观察"核心逻辑,极大降低了学习门槛。

文章图片
#人工智能
Agent Team设计模式与思维:从单体智能到群体智慧

本文提出Agent团队的七大核心设计模式:1)工作流模式,将任务分解为有序步骤;2)路由模式,智能分类输入;3)并行化模式,同时处理多个任务;4)编排者-工作者模式,动态分解任务;5)指挥官-调度官模式,解耦规划与执行;6)共识模式,通过投票提高决策质量;7)制作者-检查者模式,建立生成与评估闭环。这些模式遵循专业化分工、关注点分离和渐进式复杂度三大原则,并需要六层架构支撑,包括表示层、智能体层、

文章图片
#设计模式
AI生成PPT的技术演进:从智能填充到认知增强

AI生成PPT技术正快速演进,通过大语言模型、多模态融合和智能体架构实现从内容生成到视觉设计的全流程自动化。目前主流技术路线包括NLP+模板引擎、多模态生成、HTML渲染和OOXML原生输出,各有优势与局限。典型系统已构建全链路工作流,实现分层精细控制和垂直场景适配。创新方向涵盖语音驱动、思维导图转换及对话式生成等多样化输入方式。未来,AI PPT将进一步提升语义理解深度和跨模态整合能力,向更智能

文章图片
#人工智能
AI Agent记忆模块进化史:从临时缓存到认知架构的设计范式

Agent的记忆技术经历了三个阶段:工程化集成期(2023-2024)通过向量存储实现基础记忆;结构化图谱期(2024-2025)引入时序知识图谱提升可解释性;认知架构期(2025至今)发展为仿生多模态记忆系统,支持主动回忆与知识内化。当前前沿框架(如MemVerse)采用“海马体-皮层”协同设计,通过参数化记忆与周期性蒸馏显著提升性能。未来趋势包括记忆自动化、强化学习集成及多智能体协同记忆。记忆

文章图片
#人工智能#缓存#架构
告别“全能 Agent”:多智能体团队(Agent Team)的设计哲学与实战指南

多智能体系统的核心在于社会化分工,通过关注点分离、认知多样性和容错制衡提升效率。三大经典设计模式包括:主管-工人模式(任务拆解与分配)、顺序流水线模式(线性流程)和圆桌讨论模式(多视角决策)。落地时需明确角色职责、设计通信协议(如JSON消息传递),并规避Token爆炸、死循环等风险。多智能体架构适用于复杂任务,其本质是管理思维的AI化,需遵循"主管管脑、工人动手"原则,通过标准化协作实现高效输出

文章图片
智能体的“死亡”与重生:从显性崩溃到隐性漂移的恢复艺术

LLM Agent(智能体)的脆弱性体现在显性和隐性两类失败模式中。显性失败(如工具执行错误、格式解析失败)可通过自愈循环和分级降级策略恢复,将错误转化为反馈。隐性失败(如逻辑死循环、目标漂移)更危险,需引入监督机制(如死循环检测、Validator Agent验证)和干预层。终极方案是构建“检查点-回滚”机制,支持状态快照、人类介入和记忆分离。健壮的Agent系统需将90%的代码用于处理失败路径

文章图片
#人工智能#大数据#网络
深入解析 nanobot-agent 核心引擎:AgentLoop 代码详解

AgentLoop 作为消息处理中枢,具备以下关键功能:1)从消息总线接收消息;2)构建提示上下文;3)调用 LLM 推理并执行工具调用;4)管理会话状态和记忆。文章详细介绍了其初始化过程、默认工具注册、MCP 动态扩展机制、主循环设计以及核心消息处理流程。通过精巧的架构设计,AgentLoop 在几百行代码内实现了完整的 Agent 能力,支持会话管理、工具调用、记忆整合等核心功能,展现了高度可

文章图片
深入解析nanobot的原理与架构

用户输入 → 构建上下文 → LLM 推理 → 决定调用工具 / 直接回答 → 执行工具 → 把结果当作新观察 → 再次推理,直到任务完成。对于想学习 Agent 原理、搭建个人/团队 AI 助手的开发者来说,nanobot 是一个非常好的“教材级项目”。一个功能完整的 AI Agent,不需要几十万行代码,也不需要复杂的“平台化”设计。,按官方文档填写 Telegram / 飞书 / Disco

文章图片
从自然语言到爬虫工作流:深入解析 ScrapeGraphAI 的原理与架构思维

ScrapeGraphAI 通过自然语言交互和图计算引擎,革新了传统爬虫开发模式。其核心设计基于有向无环图(DAG),将爬虫流程分解为可组合的智能节点(如 FetchNode、ParseNode 等),支持动态内容抓取、多模态数据处理和自动化工作流生成。用户只需用自然语言描述需求,系统即可自动构建爬虫图配置,无需手动编写选择器或处理反爬机制。该工具支持多模型适配(云端/本地LLM),并通过Grap

文章图片
#爬虫#架构
告别预设脚本:深入解析 Browser Use Skill 的原理与应用

摘要: Browser Use Skill 是一种基于大模型的浏览器自动化框架,通过AI(如GPT-4、DeepSeek V3)控制浏览器,实现智能决策与自适应操作。其核心架构包括底层交互(如Playwright/Selenium)、AI代理层(理解任务并规划动作)和上下文记忆层(维护多步骤任务状态)。相比传统自动化工具,它具备自然语言交互、视觉理解、自我修正等优势,适用于数据采集、RPA、自动化

    共 11 条
  • 1
  • 2
  • 请选择