2026年03月28日 AI 科技日报 (Koog: 面向 JVM 的 AI Agent 框架发布)

共收录条资讯。

qq_41862844

700人浏览 · 2026-03-28 17:28:58

qq_41862844 · 2026-03-28 17:28:58 发布

2026年03月28日 AI 科技日报 (Koog: 面向 JVM 的 AI Agent 框架发布)

共收录 35 条资讯

AI模型

英伟达开源 Nemotron-Cascade-2 模型

英伟达开源了 Nemotron-Cascade-2 模型，总参数约 30B，激活参数约 3B，采用稀疏专家结构。据称在国际数学奥赛、智力竞赛和计算机竞赛中都拿到金牌，在代码任务上的表现优于 Qwen3.5-35B-A3B，其他综合能力略弱一些。相比同样能拿金牌的大体量模型 DeepSeek-V3.2-Speciale-671B-A37B，Nemotron-Cascade-2 体量小很多，更适合算力有限但对代码能力要求高的场景。

关键词： 英伟达 Nemotron-Cascade-2 MoE 模型 代码能力 开源
来源： @Gorden_Sun
链接： https://x.com/Gorden_Sun/status/2035274882280308881

本地 Qwen 3.5 工具使用能力提升

开发者分享称，一个月前本地部署的 Qwen 模型几乎不会用工具，如今升级到 V3.5 后，模型可以自主规划调用工具完成调查任务，给出的分析质量甚至优于 Claude。该反馈说明开源或可本地部署模型在工具调用和代理能力上进步明显，对希望摆脱云端闭源大模型依赖的开发者而言，本地智能体方案的可行性正在增强。

关键词： Qwen 3.5 工具调用 本地模型 Agent 能力
来源： @tom_doerr
链接： https://x.com/tom_doerr/status/2035256705022329183

谷歌发布 Gemini 3.1 Flash Live 实时语音模型

谷歌推出 Gemini 3.1 Flash Live 模型，主打低延迟实时语音交互能力，适用于语音助手、实时翻译、语音控制等场景。相比传统语音识别加文本模型的级联方案，Flash Live 更强调端到端和响应速度，有利于构建自然对话体验。该模型将成为谷歌语音产品线的重要一环，也会推动各类实时语音应用升级。

关键词： 谷歌 Gemini 3.1 Flash Live 实时语音 语音助手
来源： ai-bot.cn
链接： https://mp.weixin.qq.com/s/c5vp_7bB3Hm2MH5veyaGng?click_id=55

Suno 发布 AI 音乐生成模型 V5.5

音乐生成平台 Suno 上线新版本模型 Suno V5.5，继续提升音乐生成质量和风格控制能力。新版本预计在音色细节、节奏稳定性以及文案到音乐的一致性方面有改进，有助于创作者更快产出可用的 Demo 或背景音乐。随着此类模型成熟，短视频、游戏、播客等领域的定制音乐制作门槛将进一步降低。

关键词： Suno V5.5 音乐生成 音频AI 内容创作
来源： ai-bot.cn
链接： https://ai-bot.cn/suno-v5-5/

产品发布

Unswitch 原型尝试类人方式用软件

matvelloso 介绍其正在开发的原型项目 Unswitch，最初是一个实验性原型，现已逐步演化。Unswitch 的目标是让软件被使用的方式更接近人类操作，而不是简单替换现有应用，本质是为用户提供一层智能代理，自动调用电脑上已有工具和软件。若研发顺利，这类桌面代理有望以更平滑的方式嵌入现有工作流。

关键词： Unswitch 软件代理 桌面自动化 工作流
来源： @matvelloso
链接： https://x.com/matvelloso/status/2035253798168396195

商汤推出音频输入法与语音开放平台

商汤科技发布商汤输入法 AudioClaw 和 SenseAudio AI 语音开放平台，前者面向普通用户，提供语音输入和多模态交互能力，后者面向开发者，提供语音识别、合成、声音克隆等能力。通过输入法产品收集真实使用场景，同时用平台吸引开发者生态，有助于在语音交互领域形成数据和应用闭环。

关键词： 商汤科技 AudioClaw SenseAudio 语音输入 语音平台
来源： ai-bot.cn
链接： https://mp.weixin.qq.com/s/LSCFIaMjqxTT2–3Jy8Odg

研究论文

记忆稀疏注意力 MSA 项目聚焦 Agent 长期记忆

有投资人提到，一支名为 EverMind 的团队在做专门解决 Agent 记忆问题的 MSA（Memory Sparse Attention）项目，关注长序列和长期记忆。该方向试图在不显著增加计算成本的情况下，让智能体更好保留和检索历史交互与经验。对于需要持续对话、复杂工作流和多轮决策的 Agent 系统，这是一个关键基础能力。

关键词： MSA 长序列 记忆机制 EverMind Agent
来源： @yanhua1010
链接： https://x.com/yanhua1010/status/2035273878713593947

大模型学习资料：文档智能从 OCR 到智能抽取

DeepLearning.AI 推出文档智能相关学习路径，重点讲解如何用 AI 处理发票、合同等文档场景，从基础 OCR 到基于 Agent 的结构化信息抽取。课程强调企业真实需求，如数据跨系统打通和工作流自动化，而非只做对话演示。对希望在财务、法务、运营等场景落地 AI 的从业者有一定学习价值。

关键词： 文档智能 OCR 信息抽取 工作流自动化 企业应用
来源： @DeepLearningAI
链接： https://x.com/DeepLearningAI/status/2035189679322980500

工具推荐

vLLM 发布 0.18.0 版本

大模型推理引擎 vLLM 发布 0.18.0 版本，本次更新包含 445 次提交、213 位贡献者参与。新特性包括支持 gRPC 服务部署、无 GPU 的多模态渲染、在 GPU 上进行 NGram 约束解码、Elastic EP 里程碑 2、集成 FlashInfer 0.6.6，以及 Responses API 的流式工具调用等，整体提升了服务部署能力和推理性能，适合大规模落地大模型应用的团队升级使用。

关键词： vLLM 大模型推理 gRPC 服务 多模态 开源
来源： @vllm_project
链接： https://x.com/vllm_project/status/2035234758515728759

Zero 云智能终端集成 27 个数据源

Zero 被介绍为一款雲端智能終端工具，当前已支持接入 27 个数据源。它更像是一个统一的交互终端，将多种线上服务和信息源聚合在一起，可能配合 AI 能力进行检索和操作。对于经常在多个平台间切换的开发者和分析人员，这类终端有望简化日常查询和运维工作，提升信息整合和自动化程度。

关键词： Zero 云智能终端 数据源集成 开发工具
来源： @tom_doerr
链接： https://x.com/tom_doerr/status/2035271245093089345

大规模 Webhook 网关开源项目

有开发者推荐了一款面向大规模场景的 Webhook 网关，用于高并发接收和转发各类 Webhook 事件。此类组件通常提供队列、重试、限流和监控能力，帮助上游服务与下游微服务、AI 模型服务解耦。对需要和众多第三方服务集成回调的 SaaS 产品、AI 平台和自动化平台来说，可以显著降低自建事件分发系统的复杂度。

关键词： Webhook 网关 可扩展性 事件驱动
来源： @tom_doerr
链接： https://x.com/tom_doerr/status/2035267395028173299

基于 JVM 的 AI Agent 框架

一款基于 JVM 的 AI Agent 框架被分享出来，定位是帮助开发者在 Java、生態下快速构建智能体应用。此类框架通常封装大模型调用、工具调用、记忆和多步任务编排等能力，让企业能够在现有的 JVM 技术栈上平滑接入智能代理，而无需迁移到其他语言，对金融、电信等重度使用 Java 的行业尤其有价值。

关键词： JVM AI Agent 框架 Java
来源： @tom_doerr
链接： https://x.com/tom_doerr/status/2035255921660613003

Claude Code 实时用量监控工具

有开发者推出了针对 Claude Code 的实时用量监控工具，可统计调用次数、用量趋势等指标，帮助团队掌握使用情况和成本。对于在企业内部大规模集成 Claude Code 的研发团队，这类监控面板有利于及时发现异常流量、优化调用策略，并为成本预估和预算控制提供数据基础。

关键词： Claude Code 用量监控 成本控制 开发工具
来源： @tom_doerr
链接： https://x.com/tom_doerr/status/2035252099013878025

AntV 图表生成 MCP 服务器

一款基于 AntV 的图表生成 MCP 服务器被发布，可作为 Claude 等支持 MCP 协议的智能体后端工具。借助该服务器，智能体可以在对话中直接调用 AntV 能力生成可视化图表，将数据分析结果以图形方式返回用户。对需要报告自动化、运营分析和 BI 看板生成的场景，这是将大模型和前端可视化体系打通的一种实用方案。

关键词： AntV 图表生成 MCP 可视化 Agent
来源： @tom_doerr
链接： https://x.com/tom_doerr/status/2035248272172794277

基于 OpenStreetMap 的地图技术栈

有开发者推荐了一个基于 OpenStreetMap 的地图技术栈方案，涵盖地图数据处理、渲染和服务接口等能力。相较直接依赖商业地图 API，自建技术栈可以在隐私、成本和功能定制上获得更大空间。对于需要在 AI 应用中深度整合地理信息、路径规划或地理可视化的团队，这类方案提供了更开放的基础设施选项。

关键词： OpenStreetMap 地图栈 自建地图 开源
来源： @tom_doerr
链接： https://x.com/tom_doerr/status/2035259747352326396

T3 Code 主打可靠高性能且开源

T3 Code 作者表示，在着手构建该工具前几乎试遍了所有替代方案，希望找到既好用又可靠、高性能且开源的解决方案，但现有产品最多满足四项中的两项。T3 Code 目标是在质量、可靠性、性能和开源四个维度都做到较好，为前端和全栈团队提供一套可自托管的开发环境和工具链，对重视可控性和成本的团队有吸引力。

关键词： T3 Code 开发工具链 开源 性能
来源： @theo
链接： https://x.com/theo/status/2035240707016073466

基于 Hermes 的 CAD Builder 项目获奖

Teknium 在黑客松活动中重点介绍了获奖项目 CAD Builder for Hermes。该项目利用 Hermes 大模型，将 CAD 建模与自然语言描述结合，工程师可以通过对话触发模型生成或修改设计草图，减少手工操作。此类结合专业设计软件和大模型的方案，对制造业、硬件初创和工业设计团队具有参考价值。

关键词： Hermes 模型 CAD Builder 黑客松 工程设计
来源： @Teknium
链接： https://x.com/Teknium/status/2035243035257385004

Parsec 发布 Windows 虚拟显示驱动

远程桌面方案 Parsec 推出适用于 Windows 的虚拟显示驱动，可在无物理显示器或多显示器场景下创建虚拟屏幕，用于远程渲染、云游戏、远程开发等场景。虚拟显示驱动有助于充分利用本地或云端 GPU 资源，减少物理显示器依赖，对远程工作室、云渲染和多人协作开发者比较实用。

关键词： Parsec 虚拟显示器 远程桌面 Windows 云渲染
来源： @tom_doerr
链接： https://x.com/tom_doerr/status/2035263571139960879

面向 JVM 的 AI Agent 框架发布

一款运行在 JVM 生态的 AI Agent 框架公开，支持在 Java、Kotlin 等语言环境中构建智能体应用。通过统一接口封装大模型调用、工具调用和多步任务编排，方便传统企业 Java 技术栈接入 AI 能力。对以 Spring 等为主的企业后端系统来说，可以更平滑地将现有业务与智能代理集成。

关键词： JVM AI Agent Java 智能体框架 企业应用
来源： @tom_doerr
链接： https://x.com/tom_doerr/status/2035255921660613003

Claude Code 实时使用监控工具推出

社区开发者发布了一个用于 Claude Code 的实时使用监控工具，可跟踪请求次数、延迟、错误率等指标。该工具帮助团队了解 AI 编码助手在项目中的实际使用情况，便于做限流、成本控制和性能优化。对于已经将 Claude Code 集成到开发流程的团队，这是一个运维层面的重要补充。

关键词： Claude Code 监控 可观测性 开发工具 运维
来源： @tom_doerr
链接： https://x.com/tom_doerr/status/2035252099013878025

AntV 图表生成 MCP 服务上线

有开发者基于阿里 AntV 可视化库，构建了一个符合 MCP 标准的图表生成服务，使大模型可以通过协议自动生成可视化图表。通过自然语言描述数据和需求，Agent 即可调用服务生成图表配置与渲染结果。该方案有利于在数据分析、BI 报表和交互式问答中加入自动化可视化能力。

关键词： AntV MCP 图表生成 可视化 Agent
来源： @tom_doerr
链接： https://x.com/tom_doerr/status/2035248272172794277

Rust 单文件本地优先 AI Agent 项目

一位开发者推出用 Rust 编写的单二进制、本地优先 AI Agent 项目，强调隐私和离线可用。该项目将模型调用、工具调用和逻辑封装在一个可执行文件中，方便在桌面端或边缘设备部署。对追求高性能、低依赖和数据本地化的开发者特别是系统级、嵌入式场景具有吸引力。

关键词： Rust 本地优先 AI Agent 隐私 单二进制
来源： @tom_doerr
链接： https://x.com/tom_doerr/status/2035275072752001235

行业动态

Codex 规划面向开源和学生计划

Codex 团队成员提出了 Codex for Open Source、Codex for Students、Codex Ambassadors、Codex Security 等多个方向，并向社区征询下一步应优先推进哪些。这表明 Codex 正在设计围绕开源项目支持、学生教育、社区推广和安全能力的系列计划，未来可能通过额度、工具或项目协作等方式扶持不同类型开发者。

关键词： Codex 开发者计划 开源支持 学生项目
来源： @reach_vb
链接： https://x.com/reach_vb/status/2035251992767975792

Codex 向北美大学生提供使用额度

gdb 宣布，美国和加拿大在读大学生可以申请获得 100 美元的 Codex 平台使用额度。Codex 面向开发者提供云端算力和工具服务，此举将降低学生尝试 AI 编程和相关基础设施的门槛，也有助于 Codex 在早期吸引更多校园开发者，形成未来的用户和生态基础。

关键词： Codex 学生额度 云服务 开发者生态
来源： @gdb
链接： https://x.com/gdb/status/2035242532507115944

EverMind 推出面向 Agent 的 MSA 方案

有观点指出，陈天桥旗下团队 EverMind 正在推进名为 MSA 的 Memory Sparse Attention 项目，针对 AI Agent 在长期记忆上的瓶颈进行优化。MSA 通过稀疏注意力机制在保持计算成本可控的前提下扩展可用记忆范围，有望改善多轮对话、长期任务管理等复杂场景下的表现。随着智能体逐渐走向实用化，专门为记忆设计的架构值得持续关注。

关键词： EverMind MSA 稀疏注意力 Agent 记忆
来源： @yanhua1010
链接： https://x.com/yanhua1010/status/2035273878713593947

基于系统提示词的 Agent 技能变现

dontbesilent 表示，自己在凌晨发布的一个用于对话的 Agent 技能已经开始有人使用，并计划将其整理成很长的 system prompt 分发到豆包和腾讯元器等平台，预计可在 24 小时内实现盈利。此事例显示，在国内大模型平台上，基于提示词封装的轻量级 Agent 技能开始出现简单的变现实验，为个体开发者提供了新的尝试路径。

关键词： Agent 技能 系统提示词 豆包 腾讯元器 商业化
来源： @dontbesilent
链接： https://x.com/dontbesilent/status/2035250846196547895

AI 带动数据中心自建燃气电厂趋势

DeepLearning.AI 转述报道称，包括 Meta、OpenAI 在内的一些公司正建设直接接入数据中心的自备燃气电厂，以满足 AI 训练和推理带来的巨大用电需求。这种模式绕过公共电网扩容的周期和不确定性，但也引发成本上升和温室气体排放增加的担忧。随着 AI 基础设施扩张，算力与能源的约束将成为产业长期议题。

关键词： 数据中心 燃气电厂 能源消耗 AI基础设施 碳排放
来源： @DeepLearningAI
链接： https://x.com/DeepLearningAI/status/2035099078145528300