
简介
该用户还未填写简介
擅长的技术栈
可提供的服务
暂无可提供的服务
Banana Slides 采用创新性的"AI生成+逆向工程"混合技术路径,通过"Render-Deconstruct-Reconstruct"范式实现高质量PPT生成。系统首先利用LLM生成幻灯片图片,然后通过图像处理流水线进行逆向解析:OCR提取文本结构、Inpainting实现图层分离、Vision LLM还原视觉样式。这种方案既保留了AI的视觉创造力
本文深入分析了Banana Slides项目中AI核心模块的设计与实践。文章重点介绍了AIService的策略模式架构设计,通过TextProvider和ImageProvider实现模型解耦,确保业务逻辑稳定性。系统采用Few-Shot Prompting策略、JSON处理管道和上下文注入等工程化手段,有效解决了LLM输出格式不稳定等问题。关键设计包括:正则清洗和重试机制处理JSON格式错误,P
在 AI 生成内容 (AIGC) 爆发的今天,PPT 生成工具如雨后春笋。。(基于 nano banana pro) 的出现,试图用的哲学解决这个问题。它不仅仅是一个“生成器”,更是一个支持自然语言交互、具有高度上下文感知的 PPT 编排引擎。—— 像写代码时 “Vibe” (跟着感觉走/快速迭代) 一样制作 PPT。
作为多智能体框架的典型代表,AgentScope 以其"透明、模块化、高度可定制"的设计理念吸引了众多开发者。本文将带你从框架入口开始,深入理解 AgentScope 的整体架构、模块划分和核心设计理念。我们会从这个入口函数出发,逐步揭示框架的初始化流程、模块组织方式,以及"乐高式"组件设计的精髓。无论你是想要深入源码学习,还是计划基于 AgentScope 进行二次开发,这篇文章都会为你提供一个

ReActAgent 是 AgentScope 框架中最核心的智能体实现,它完美诠释了"推理-行动"(Reasoning-Acting)循环的精髓。本文将深入分析 ReActAgent 的类继承关系、核心执行流程,以及状态管理、钩子机制、实时介入等关键技术点。通过阅读本文,你会理解智能体如何与模型交互、如何执行工具、如何处理中断,以及这些机制背后的设计考量。模块化:通过组合不同的组件(模型、格式化

摘要:AgentScope框架通过模型、工具和MCP协议构建智能体能力系统。模型系统采用ChatModelBase接口实现模型无关设计,支持不同模型提供商的无缝切换;工具系统由Toolkit统一管理,支持同步/异步工具调用和流式处理;MCP协议集成外部服务扩展智能体能力边界。三个系统均采用模块化设计,支持统一接口调用、错误处理和分组管理,使智能体具备灵活的外部交互能力。关键技术包括异步流式处理、无

摘要: AgentScope 提供了一套完整的智能体记忆与知识管理系统,包含短期记忆(Memory)、长期记忆(RAG)和状态管理三大核心模块。短期记忆直接存储对话历史,RAG 则通过向量化检索从知识库获取专业信息。系统采用分层设计:MemoryBase 定义基础接口,InMemoryMemory 实现内存存储;RAG 通过 EmbeddingModel 向量化文档,在向量数据库中进行相似度检索。

DataAgent核心架构解析 DataAgent是一款基于Spring AI Alibaba Graph构建的企业级智能数据分析Agent,其架构围绕四大核心模型设计: 智能体(Agent) - 系统执行核心,管理数据源配置和知识库关联 数据源(DataSource) - 支持多数据库连接,包含连接凭证和表筛选策略 语义模型(Semantic Model) - 实现数据结构向量化,支持自然语言检

摘要: LangGraph是一个用于构建长期运行、有状态智能体的低级编排框架,采用Monorepo架构,核心库包括langgraph(框架功能)、checkpoint(检查点)和prebuilt(预构建组件)。其优势在于低级别控制、持久化执行和人机交互支持,但学习曲线较陡。应用场景涵盖多轮对话、复杂工作流等。学习路径分为三级:入门(StateGraph API)、进阶(Pregel引擎/Chann
本文分析了LangChain4j中的RAG(检索增强生成)实现流程。RAG分为离线文档处理和在线查询两阶段:文档处理包括加载、解析、分割、生成嵌入和存储;查询流程包含检索相关片段并增强提示后发送给LLM。文章详细介绍了各环节实现细节,包括多种文档加载源、解析器、分割策略,以及核心的检索增强流程组件(查询转换、路由、内容检索与聚合)。关键点在于文档分割大小、嵌入模型选择、检索策略优化和内容注入格式设







