9月15号 AI 资讯

官网➡阿里巴巴推出FunAudio-ASR语音识别大模型，专为解决企业落地难题。模型通过创新的Context增强模块，有效优化了“幻觉”“串语种”等关键问题。在高噪声等复杂场景下，其识别准确率显著提升，幻觉率从78.5%降至10.7%。来源：通义大模型。

qq_33002279

715人浏览 · 2025-09-17 11:07:33

qq_33002279 · 2025-09-17 11:07:33 发布

FunAudio-ASR：解决语音大模型企业落地的“最后一公里”

官网➡ 阿里巴巴推出FunAudio-ASR语音识别大模型，专为解决企业落地难题。模型通过创新的Context增强模块，有效优化了“幻觉”“串语种”等关键问题。在高噪声等复杂场景下，其识别准确率显著提升，幻觉率从78.5%降至10.7%。

来源：通义大模型

Mureka上线「Agent Studio」新功能，让每个人都拥有私人音乐工作室！

官网➡ 昆仑万维旗下AI音乐创作平台Mureka上线新功能“Agent Studio”，让音乐创作变得轻松。用户只需说出想法，如一句话、情绪或梗，Agent可自动生成歌词、匹配风格并输出完整歌曲。目前有六个场景，如创作专辑、热点写歌、以歌致礼等，覆盖多种生活场景。

来源：昆仑万维集团

火山引擎veCLI发布，开启智能开发新模式

官网➡ 火山引擎发布命令行AI Agent：veCLI，无缝集成豆包大模型1.6，助力开发者在终端直接访问火山方舟大模型及火山云产品。veCLI采用“思考-行动”循环机制，集成多种模型，降低技术门槛，提升开发效率。

来源：火山引擎

金山办公与华为联合发布 WPS 365 一体化 AI 办公解决方案

官网➡ 金山办公与华为在珠海联合发布WPS 365一体化AI办公解决方案。方案整合WPS 365的协同办公优势与华为的全栈技术能力，通过AI、软件与云计算、硬件的协同创新，解决组织在知识资产管理、协同办公、安全合规等方面的核心需求。

来源：IT之家

小米AI团队发布ZipVoice：高效零样本语音合成模型

官网➡ 小米集团AI实验室发布ZipVoice系列语音合成模型，包括零样本单说话人语音合成模型ZipVoice和零样本对话语音合成模型ZipVoice-Dialog。ZipVoice通过技术创新，解决了现有模型参数大、速度慢的问题，实现轻量化建模和推理加速。ZipVoice-Dialog则突破对话语音合成的稳定性和速度瓶颈，提供又快又稳又自然的语音对话合成。

来源：小米技术

腾讯开源Youtu-GraphRAG：让图检索增强生成更准确、更省钱！

官网➡ 腾讯优图实验室开源图检索增强生成框架Youtu-GraphRAG。框架主打大语言模型+RAG模式，将知识组织成图谱，帮助大模型在处理复杂问答任务时更精准、可追溯，适用于知识密集型场景。其创新点包括四层知识树、社区检测升级和智能迭代检索，可减少“胡言乱语”。

来源：腾讯云

北京朝阳AI社区

更多推荐

什么是模型上下文协议（MCP）？

在深入MCP之前，我们需要先了解一个背景概念——工具调用。简单而言，工具调用指的是AI模型主动调用外部工具或API，以自动执行特定任务的过程。例如，你向一个智能助手提出：“帮我预订10月15日从纽约飞往旧金山的航班。模型识别：AI模型首先确定该任务需要调用外部的航班预订工具。工具调用：AI通过调用相关的API（例如航空公司接口）提供所需的信息。数据交互：AI获取航班信息，例如当天有9点和下午3点两