logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

DeepSeek-TUI:当终端成为 AI 编程代理的终极栖息地

摘要: DeepSeek-TUI 是一款终端原生的 AI 编程代理工具,基于 Rust 和 DeepSeek V4 模型构建,支持 100 万 token 上下文窗口和并行推理。其核心优势包括: 终端原生交互:通过键盘驱动的 TUI 实现全自主编码代理,支持文件修改、shell 命令执行和 git 管理; 工程化设计:集成 LSP 诊断、side-git 回滚和 MCP 扩展协议,确保可靠性和灵活

文章图片
#人工智能
Pixelle-Video深度解构:零门槛AI短视频引擎的技术哲学与落地实践

Pixelle-Video是一款开源的AI全自动短视频引擎,通过重构视频生产流程,将创作核心从技术操作转向创意表达。其基于ComfyUI的四阶段生成管线(智能文案、配图生成、语音合成、视频渲染)支持模块化定制,满足不同用户需求。项目提供多路径部署方案,支持免费运行或按需付费,覆盖从文案到成片的完整自动化闭环。实测显示,该工具能将传统1-2小时的制作流程压缩至3-5分钟,显著提升效率。随着数字人口播

文章图片
#人工智能#音视频
40+kStar 的多智能体编排引擎 Ruflo 深度技术解析:Claude Code 如何从单兵作战进化为 AI 蜂群指挥系统

Ruflo(原 Claude Flow)是一款 40k Star 的开源多智能体编排平台,专为 Claude Code打造。它采用五层架构设计,支持 100+ 专业化 Agent 协同工作,内置 Queen-led、Mesh、Adaptive 三种蜂群拓扑及 Raft、BFT等五种分布式共识协议。核心亮点包括:基于 HNSW 向量索引的记忆系统与 SONA 自学习闭环、零信任联邦通信实现跨组织安全

文章图片
#人工智能#开源
Claude for Financial Services 深度技术解读:Anthropic 如何用10个Agent、41项技能和11个数据连接器重新定义华尔街工作流

2026年5月5日,Anthropic 正式开源了 Claude for Financial Services——一套包含10个专业AI Agent、41项领域技能和11个金融数据连接器的完整技术栈,覆盖投资银行、股权研究、私募股权、财富管理、基金管理和运营合规六大核心场景。发布当日,FactSet股价盘中一度暴跌超8%,晨星跌近3%,标普全球和穆迪同步波动,而高盛和摩根大通的股价却没有同步下跌—

文章图片
#人工智能#开源
Claude for Financial Services 深度技术解读:Anthropic 如何用10个Agent、41项技能和11个数据连接器重新定义华尔街工作流

2026年5月5日,Anthropic 正式开源了 Claude for Financial Services——一套包含10个专业AI Agent、41项领域技能和11个金融数据连接器的完整技术栈,覆盖投资银行、股权研究、私募股权、财富管理、基金管理和运营合规六大核心场景。发布当日,FactSet股价盘中一度暴跌超8%,晨星跌近3%,标普全球和穆迪同步波动,而高盛和摩根大通的股价却没有同步下跌—

文章图片
#人工智能#开源
4.5万 Star 的AI Agent“黄埔军校“教程:Hello-Agents 从零构建多智能体系统的全栈学习路径深度拆解

摘要: Datawhale社区2025年开源的Hello-Agents项目填补了AI Agent领域系统化教育的空白,截至2026年5月获得45,000+ GitHub Star。该项目聚焦AI原生Agent开发,通过五阶段教学体系(基础理论→单Agent构建→高级技术→综合案例→毕业设计)培养开发者从原理到落地的全栈能力。核心技术亮点包括:源码级复现ReAct等经典范式、分层解耦的自研框架设计、

文章图片
#人工智能#开源#学习
字节跳动开源多模态AI Agent终极形态:Agent TARS 深度技术解读

摘要: 2025年,字节跳动开源的Agent TARS项目推动AI Agent进入“视觉行动”时代,整合GUI视觉感知与终端、浏览器操作,构建多模态Agent Stack。其核心架构包括CLI/Web UI双入口、Event Stream驱动的上下文工程、MCP工具生态及混合浏览器控制策略,支持本地-远程双模操作。通过UI-TARS模型,Agent TARS实现“看、思、行”闭环,完成从订机票到修

文章图片
#开源#人工智能
从原型到生产:深度拆解 GitHub 爆火的 AI Agent 全栈实战手册

摘要: 2026年被视为"Agent元年",但多数团队仍面临从Demo到生产的工程化挑战。开源项目Agents Towards Production (ATP) 提供22个生产级教程,覆盖Agent全生命周期,包括编排、记忆、安全、部署等7大核心模块。项目由Nir Diamant主导,多家企业赞助支持,重点解决记忆管理、安全防线、可观测性等痛点。亮点包括多智能体协同、记忆系统演进、安全架构升级等趋

文章图片
#github#人工智能#开源 +1
CLI-Anything 深度拆解:一行命令,让任意软件成为 AI Agent 的原生工具

AI Agent 能写代码、能推理,但操控真实专业软件时却频频"翻车"——截屏猜坐标、RPA 模拟点击、API 覆盖不全……香港大学 HKUDS 开源的 CLI-Anything,用一条命令把任意软件自动转成 Agent 可调用的 CLI,覆盖 18 款专业软件,1,774 项测试全部通过。本文从原理到实战,带你彻底搞懂这个项目。

文章图片
#人工智能#开源#学习
Google 官方出手了!Chrome DevTools MCP 让 AI Agent 直接操控浏览器,前端调试迎来范式革命

摘要: Google推出的chrome-devtools-mcp通过MCP协议将Chrome DevTools能力标准化开放给AI编码助手,解决了AI与浏览器间的信息断层问题。该项目基于Puppeteer和CDP协议,提供45个工具覆盖前端调试全场景,包括性能分析、网络监控等核心功能。通过5分钟配置即可实现AI自动完成性能优化闭环,显著提升前端自动化效率。该工具支持主流IDE,标志着前端自动化进入

文章图片
#前端#chrome devtools#人工智能 +2
    共 86 条
  • 1
  • 2
  • 3
  • 9
  • 请选择