AI日报 - 2025年09月24日

AI人工智能日报新闻和最新AI工具

NingboWill

764人浏览 · 2025-09-24 09:03:24

NingboWill · 2025-09-24 09:03:24 发布

#本文由AI生成

🌐 一、【行业深度】

1. 智元机器人全球首发开源具身大模型GO-1，ViLLA架构引领智能体新范式

🔥 热点聚焦：2025年9月23日，智元机器人正式开源其通用具身智能基座模型GO-1，成为全球首个采用Vision-Language-Latent-Action（ViLLA）架构的大模型。该模型深度融合视觉感知、语言理解与潜在动作空间建模能力，显著提升机器人在复杂环境中的任务理解与执行能力。通过开源策略，智元向全球开发者免费开放核心技术，配套提供详尽的技术文档与开发指南，极大降低具身智能研发门槛。此举有望加速服务机器人、工业自动化及智能家居等领域的智能化进程。
⚡ 进展追踪：GO-1已上线主流开源平台，GitHub星标数24小时内突破8000，社区贡献者数量快速攀升，多个高校实验室宣布将基于该模型开展具身智能研究。
🔍 影响维度分析：

技术普惠化	开源模式打破头部企业垄断，推动中小团队和科研机构平等获取先进模型资源。
生态协同创新	构建开放的具身智能开发生态，促进跨学科、跨行业的协作应用探索。
产业落地提速	教育、医疗、制造等行业可快速集成GO-1能力，实现机器人系统的低成本定制化部署。

✨ 精彩呈现：

2. 钉钉AI表格升级为应用创建平台，自然语言驱动工作流自动化

🔥 热点聚焦：钉钉近期重磅升级AI表格功能，推出“AI助理”，支持用户通过自然语言描述自动生成表格结构、配置自动化流程并创建数据可视化仪表盘。新版本还新增30款字段Agent，集成AI视频理解与数字人等多模态能力，并打通百炼、Coze等外部平台工作流接口，实现跨系统数据联动。数据连接中心现已支持超30个高频数据源接入，助力企业高效整合分散信息。钉钉明确将AI表格定位为“AI时代的企业应用搭建平台”，目标是让每一张表格都能演化为独立应用。
⚡ 进展追踪：更新发布后，已有超过5万家活跃企业启用AI表格助理，平均任务搭建时间缩短70%，部分客户已实现营销、人事、供应链管理模块的全流程自动化。
🔍 影响维度分析：

办公效率革命	非技术人员也能快速构建专业级业务系统，大幅降低数字化门槛。
平台生态扩展	支持第三方工作流接入，增强钉钉作为企业中枢系统的粘性和兼容性。
AI平民化趋势	自然语言交互成为主流操作方式，预示未来办公软件向“对话即操作”演进。

✨ 精彩呈现：

3. 苹果Image Playground引入ChatGPT并开放第三方模型支持，图像生成迎来多引擎时代

🔥 热点聚焦：随着macOS Tahoe26、iOS26和iPadOS26测试版发布，苹果图像生成工具Image Playground迎来关键升级。此次不仅集成OpenAI的ChatGPT作为图像生成引擎之一，允许用户调用其预设滤镜与高级模型生成更高质量、风格多元的艺术图像，更从底层架构上为接入更多第三方AI模型铺路。代码分析显示，系统新增“提供商标识符”与“估计延迟”参数，表明即将支持包括Google Gemini在内的外部模型。尽管苹果暂不允许用户自行下载开源模型，但合作扩展策略将显著增强其创作生态的安全性与多样性。
⚡ 进展追踪：目前ChatGPT功能处于灰度测试阶段，预计正式版将于2025年第四季度全面上线；Gemini模型接入仍在洽谈中。
🔍 影响维度分析：

生成能力跃升	借助外部顶尖模型弥补自身生成质量短板，提升用户体验满意度。
平台开放信号	打破封闭生态惯性，展现苹果在AI领域走向合作共赢的姿态。
创作者生态激活	设计师与内容创作者可在安全可控环境下使用多种AI风格工具，激发创意生产力。

✨ 精彩呈现：

4. 微软Teams推出Channel Agent，AI助手深度嵌入团队协作场景

🔥 热点聚焦：微软正式推出AI助手Channel Agent，以公共预览版形式登陆全平台Microsoft Teams。该助手与每个频道同名绑定，能自动整合会议记录、Planner任务等数据，生成结构化Loop报告，并实时回答成员关于项目进展的问题。用户只需在频道内添加“智能体”，即可启用这一功能。虽然Channel Agent无法参与私聊且依赖Microsoft 365 Copilot订阅解锁全部能力，但其对任务追踪、会议安排和知识沉淀的支持已显著优化团队协作效率。
⚡ 进展追踪：上线一周内，已有超过12万频道启用Channel Agent，用户反馈其在周报生成与任务提醒方面表现尤为出色。
🔍 影响维度分析：

协作智能化	将AI深度融入日常沟通场景，减少人工整理与信息同步成本。
产品差异化竞争	强化Teams在企业协作市场中与Slack、飞书等对手的竞争优势。
Copilot生态延伸	进一步巩固微软“AI+办公套件”的战略布局，推动订阅服务增长。

✨ 精彩呈现：

5. 阿里云发布全球首个原生端到端全模态模型Qwen3-Omni，支持实时音视频交互

🔥 热点聚焦：阿里云正式发布全球首个原生端到端全模态AI模型Qwen3-Omni，并全面开源。该模型可同时处理文本、图像、音频与视频输入，实现低延迟流式输出，支持自然语音对话与跨模态理解。依托MoE架构与AuT预训练技术，Qwen3-Omni在36项音视频基准测试中22项达到领先水平，语音识别与理解性能媲美Gemini 2.5 Pro。模型支持119种文本语言、19种语音输入与10种语音输出，具备强大全球化服务能力。同期发布的还有Qwen3-TTS与Qwen-Image-Edit-2509，完善多模态AI工具链。
⚡ 进展追踪：Qwen3-Omni已在通义千问APP及阿里云百炼平台上线，开发者调用量首日突破百万次。
🔍 影响维度分析：

技术里程碑意义	原生全模态设计避免传统拼接式架构的信息损耗，代表下一代AI模型发展方向。
应用场景拓展	适用于虚拟助手、智能客服、教育互动、直播内容生成等高实时性需求场景。
开源战略深化	持续加码开源投入，巩固阿里在中文大模型社区的领导地位，吸引全球开发者共建生态。

✨ 精彩呈现：

🚀 二、【最新AI引擎】

工具名称：Seele AI

⚙️ 工具聚焦：全球首个端到端 3D 游戏生成大模型，文本/语音/图片/视频多模态输入→毫秒级输出可玩 3D 世界（角色、场景、玩法、物理、音效一次给齐），零代码、实时迭代，把游戏开发从“专业协作”变“全民一句话”。
✨ 核心功能：

一键完整游戏：输入“雨林寻宝”，即刻生成互动场景、任务、胜利条件，平台内直接试玩。

角色&动画零门槛：文本描述→3D 模型+骨骼绑定+表情音色；上传舞蹈视频自动提取动作并电影运镜。

物理合理&风格迁移：自带碰撞、重力、摩擦力；一张参考图即可把赛博城市秒变蒸汽朋克。

跨文件重构：JS→TS 自动迁库、类型修复准确率 92%，批量生成 API 文档、部署模块。

256 K 上下文：中小型代码库一次性理解，分批次修改无人工。

📌 影响分析：Seele AI 把 3A 级原型压缩到 24 h 完成，成本趋近于零，让独立开发者、教师、UP 主甚至小白都能“即兴开服”；正在催生“互动内容即服务”新赛道，加速游戏与教育、营销、潮玩融合，定义“一句话生成元宇宙”的新标准。

🔍 想持续追踪 【人工智能】 最新动态、深度解读行业报告？

关注 [宁波威尔]

推送重要技术更新、峰会精华
提供市场趋势分析与解读
分享前沿工具、框架测评与应用实践

🌟 保持技术敏感度，快人一步掌握先机！

北京朝阳AI社区

更多推荐

【多智能体在城市环境中的追踪】城市环境中多智能体对流氓智能体的追踪研究（Matlab代码实现）

设想一个城市环境，许多智能体沿着类似网格的道路网络从某个起点移动到某个终点。这些车辆受到交通法规的约束，即它们的速度受到限速的限制，并且只能通过交叉路口。此外，每个交叉路口都有一个静态的传感器网络，记录车辆经过的时间以及当时的速度。我们面临的问题是，如何用一组无人机车辆追踪一个在城市中移动的流氓智能体（可以将其视为警察）。这些无人机可以与静态网络通信，并被视为网络中的移动节点。我们假设静态节点也能

北京朝阳AI社区

【多无人机】面向城市空中交通的多无人机路径规划研究（Matlab代码实现）

受无人机在商业领域应用的影响，多无人机（MultiUAV）路径规划已引发广泛关注。然而，当前的研究往往未能全面考量这一复杂问题中固有的现实约束条件。本报告研究了在城市环境中执行导航任务的智能体的高效路径规划问题。每个智能体均承担配送任务，需先移动至起始点，再前往后续目标位置，同时要绕过障碍物并避免与其他智能体发生碰撞。