logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

CLI-Anything:一条命令把任意软件变成 AI Agent 原生工具,到底怎么做到的?

CLI-Anything 是香港大学数据科学实验室(HKUDS)开源的一个项目,核心做的事情只有一件:把那些只有图形界面的专业软件(GIMP、Blender、LibreOffice、OBS 等),自动生成一套完整的命令行接口(CLI),让 AI Agent 能像操作终端命令一样直接调用这些软件的全部功能。 它以 Claude Code 插件的形式分发,整个过程分为 7 个阶段全自动完成,已在 9

文章图片
#人工智能
实测GPT-5.4 mini:速度翻倍成本砍2/3,小模型凭什么逼近满血旗舰版?

2026年3月17日,OpenAI 发布了 GPT-5.4 mini 和 GPT-5.4 nano 两款轻量级模型。其中 mini 在编码基准 SWE-Bench Pro 上拿到 54.4%(旗舰版 57.7%),计算机操控基准 OSWorld-Verified 上达到 72.1%(旗舰版 75.0%),运行速度是上一代 GPT-5 mini 的两倍以上,API 输出价格仅为旗舰版的三分之一。na

文章图片
#搜索引擎
GPT-5.5 震撼登场:首次完整重训基座,终端编程得分 82.7% 碾压 Opus 4.7,还顺手证了一个数学定理

核心结论(30秒版):GPT-5.5(代号 Spud)于 2026 年 4 月 23 日正式发布,是 OpenAI 自 GPT-4.5 以来首次完整重训的基座模型。它在终端智能体编程基准 Terminal-Bench 2.0 上以 82.7% 的成绩创下新纪录,大幅领先 Claude Opus 4.7(69.4%);在知识型工作测试 GDPval(涵盖 44 个职业场景)中以 84.9% 位居第一

文章图片
AI 写代码写到一半就“失忆“?这个开源工具给它装上了永不丢失的项目经理大脑

Beads 是一个专为 AI 编程助手(如 Claude Code、Codex)设计的开源任务追踪系统,底层由版本控制 SQL 数据库 Dolt 驱动,能让多个 AI Agent 协同处理复杂项目时不丢失上下文、不产生任务冲突。它的 GitHub 地址为,官方文档见,目前 Star 数已超过 22,000。关键信息速览:它解决了什么问题?多 Agent 并行工作时,任务上下文频繁丢失、优先级混乱、

文章图片
#人工智能#开源
Ruflo:把 100 个 AI Agent 变成一支协作团队,GitHub 已超 4 万星

本文核心结论:Ruflo(前身为 Claude Flow)是目前多智能体协作领域架构最完整、工程化程度最高的开源项目之一。它的核心不是让一个 AI 变得更强,而是把几十乃至上百个专业化 Agent 组织成一支可以自我协作、自我学习、跨机器安全通信的「AI 团队」。

文章图片
#人工智能#github
谷歌 Gemini Omni 深度解析:原生视频模型的技术突破与行业影响

另一个演示同样令人印象深刻:原始视频中的主体是意大利面,用户只需说一句"把意大利面换成奶油浓汤",Omni 便能完成替换,并且自动适配替换物体所需的光影关系、遮挡层次,以及与周围场景的融合——这不是简单的抠图或滤镜,而是对整个场景语义的重新理解和局部生成。在泄露的演示中,用户将一段带有 Sora 水印的视频上传至 Gemini 对话框,然后用一句话告诉模型"去掉水印",Omni 就能在几乎毫无破绽

文章图片
#音视频#人工智能
一个大学生十天做出的AI预测引擎,为什么能两次冲上GitHub全球第一?

一位 00 后大学生开发者,先后在十天内用 Vibe Coding 方式完成了两个开源项目——多智能体舆情分析系统 BettaFish 和群体智能预测引擎 MiroFish,两个项目均登上 GitHub 全球趋势榜第一。 BettaFish 实现了"数据采集→多模态分析→智能报告"的闭环,MiroFish 则在此基础上构建出可交互的平行数字世界,用成千上万个 AI 智能体模拟群体行为来推演未来走向

文章图片
#人工智能#github
AI 编剧+AI 导演+AI 评审,腾讯开源了一整支“虚拟剧组“,输入对话就能出片!

腾讯混元多模态团队联合西安电子科技大学,开源了一套名为 ScriptAgent 的"对话到电影视频"智能体框架。它的核心思路是用三个专职 AI Agent——编剧(ScripterAgent)、导演(DirectorAgent)、评审(CriticAgent)——模拟真实影视制作流水线,把几句简单的角色对话自动扩写成专业分镜剧本,再由 AI 导演拆分场景、锚定帧画面,最终生成一段连贯的长视频。实测

文章图片
#人工智能
Hermes Agent 深度解析:一个能自我进化的开源 AI 智能体,到底强在哪?

Hermes Agent 内建了一套完整的学习闭环(Learning Loop),官方将其定位为"唯一一个拥有内建学习循环的 Agent"。具体来说,它的工作方式是这样的:当 Hermes 完成一个相对复杂的任务时,它会自动把整个执行过程抽象成一份 Skill 文件。这份文件里不仅记录了"怎么做",还记录了"踩了哪些坑""下次该注意什么"。Skill 文件存储在目录下,每个 Skill 本质上是一

文章图片
#开源#人工智能
AI 写代码写到一半就“失忆“?这个开源工具给它装上了永不丢失的项目经理大脑

Beads 是一个专为 AI 编程助手(如 Claude Code、Codex)设计的开源任务追踪系统,底层由版本控制 SQL 数据库 Dolt 驱动,能让多个 AI Agent 协同处理复杂项目时不丢失上下文、不产生任务冲突。它的 GitHub 地址为,官方文档见,目前 Star 数已超过 22,000。关键信息速览:它解决了什么问题?多 Agent 并行工作时,任务上下文频繁丢失、优先级混乱、

文章图片
#人工智能#开源
    共 52 条
  • 1
  • 2
  • 3
  • 6
  • 请选择