logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

4.5万 Star 的AI Agent“黄埔军校“教程:Hello-Agents 从零构建多智能体系统的全栈学习路径深度拆解

摘要: Datawhale社区2025年开源的Hello-Agents项目填补了AI Agent领域系统化教育的空白,截至2026年5月获得45,000+ GitHub Star。该项目聚焦AI原生Agent开发,通过五阶段教学体系(基础理论→单Agent构建→高级技术→综合案例→毕业设计)培养开发者从原理到落地的全栈能力。核心技术亮点包括:源码级复现ReAct等经典范式、分层解耦的自研框架设计、

文章图片
#人工智能#开源#学习
字节跳动开源多模态AI Agent终极形态:Agent TARS 深度技术解读

摘要: 2025年,字节跳动开源的Agent TARS项目推动AI Agent进入“视觉行动”时代,整合GUI视觉感知与终端、浏览器操作,构建多模态Agent Stack。其核心架构包括CLI/Web UI双入口、Event Stream驱动的上下文工程、MCP工具生态及混合浏览器控制策略,支持本地-远程双模操作。通过UI-TARS模型,Agent TARS实现“看、思、行”闭环,完成从订机票到修

文章图片
#开源#人工智能
PaddleOCR 3.6 深度解析:0.9B 参数如何跑出 96.3% 准确率,登顶文档解析 SOTA?

2025年末至2026年初,开源OCR领域迎来技术爆发,PaddleOCR凭借70K+ GitHub Stars和广泛生态集成稳居领先地位。其3.6.0版本搭载的PaddleOCR-VL-1.6模型在OmniDocBench上实现96.3%准确率,刷新文档解析SOTA记录。该文深度解析了PaddleOCR 3.x的多层次架构,包括轻量级PP-OCRv5、结构化PP-StructureV3和旗舰产品

文章图片
#开源#github#人工智能
DeepSeek-TUI:当终端成为 AI 编程代理的终极栖息地

摘要: DeepSeek-TUI 是一款终端原生的 AI 编程代理工具,基于 Rust 和 DeepSeek V4 模型构建,支持 100 万 token 上下文窗口和并行推理。其核心优势包括: 终端原生交互:通过键盘驱动的 TUI 实现全自主编码代理,支持文件修改、shell 命令执行和 git 管理; 工程化设计:集成 LSP 诊断、side-git 回滚和 MCP 扩展协议,确保可靠性和灵活

文章图片
#人工智能
40+kStar 的多智能体编排引擎 Ruflo 深度技术解析:Claude Code 如何从单兵作战进化为 AI 蜂群指挥系统

Ruflo(原 Claude Flow)是一款 40k Star 的开源多智能体编排平台,专为 Claude Code打造。它采用五层架构设计,支持 100+ 专业化 Agent 协同工作,内置 Queen-led、Mesh、Adaptive 三种蜂群拓扑及 Raft、BFT等五种分布式共识协议。核心亮点包括:基于 HNSW 向量索引的记忆系统与 SONA 自学习闭环、零信任联邦通信实现跨组织安全

文章图片
#人工智能#开源
给 AI 编程助手装上“谷歌工程纪律“:30+K Star 项目 Agent Skills 深度技术解读

摘要 Google Chrome工程总监Addy Osmani创建的Agent Skills项目(30K GitHub Stars)通过将Google工程规范编码为AI可执行的工作流,解决了AI编程助手"能跑就行"的核心缺陷。该项目包含20个Markdown格式的"技能",每个技能定义明确的工作流步骤、验证标准和反借口机制,覆盖从需求定义到代码发布的完整开发

文章图片
#人工智能
Claude for Financial Services 深度技术解读:Anthropic 如何用10个Agent、41项技能和11个数据连接器重新定义华尔街工作流

2026年5月5日,Anthropic 正式开源了 Claude for Financial Services——一套包含10个专业AI Agent、41项领域技能和11个金融数据连接器的完整技术栈,覆盖投资银行、股权研究、私募股权、财富管理、基金管理和运营合规六大核心场景。发布当日,FactSet股价盘中一度暴跌超8%,晨星跌近3%,标普全球和穆迪同步波动,而高盛和摩根大通的股价却没有同步下跌—

文章图片
#人工智能#开源
一键给 AI Agent 装上「互联网眼睛」:Agent Reach 深度解析与实战指南

2026 年,AI 编程 Agent 已经从「代码补全工具」进化为「自主代理」。Claude Code 能帮你重构整个项目,OpenClaw 能管理你的日常事务,Cursor 能在 IDE 里完成复杂的全栈开发。但有一个问题始终没被优雅地解决——场景结果“帮我看看这个 YouTube 教程讲了什么”❌ 拿不到字幕“搜一下推特上大家怎么评价这个产品”❌ Twitter API 要付费“去 Reddi

文章图片
#人工智能#开源#github
一键给 AI Agent 装上「互联网眼睛」:Agent Reach 深度解析与实战指南

2026 年,AI 编程 Agent 已经从「代码补全工具」进化为「自主代理」。Claude Code 能帮你重构整个项目,OpenClaw 能管理你的日常事务,Cursor 能在 IDE 里完成复杂的全栈开发。但有一个问题始终没被优雅地解决——场景结果“帮我看看这个 YouTube 教程讲了什么”❌ 拿不到字幕“搜一下推特上大家怎么评价这个产品”❌ Twitter API 要付费“去 Reddi

文章图片
#人工智能#开源#github
一键给 AI Agent 装上「互联网眼睛」:Agent Reach 深度解析与实战指南

2026 年,AI 编程 Agent 已经从「代码补全工具」进化为「自主代理」。Claude Code 能帮你重构整个项目,OpenClaw 能管理你的日常事务,Cursor 能在 IDE 里完成复杂的全栈开发。但有一个问题始终没被优雅地解决——场景结果“帮我看看这个 YouTube 教程讲了什么”❌ 拿不到字幕“搜一下推特上大家怎么评价这个产品”❌ Twitter API 要付费“去 Reddi

文章图片
#人工智能#开源#github
    共 70 条
  • 1
  • 2
  • 3
  • 7
  • 请选择