
简介
ModelScope旨在打造下一代开源的模型即服务共享平台,为泛AI开发者提供灵活、易用、低成本的一站式模型服务产品,让模型应用更简单!
擅长的技术栈
可提供的服务
开源模型社区
01 引言 上海交通大学、上海创智学院、南洋理工大学、腾讯混元团队、天津大学、数搭国际数据开源社区、北京大学、复旦大学等机构联合发布 MMAE(Massive Multitask Audio Editing Benchmark),首个面向通用指令式音频编辑的综合评测基准。MMAE 包含 2,000 条真实场景音频编辑任务与 17,741 条细粒度 rubric 评测项,系统覆盖 7 种模态、6 级

00 引 言 MiniMax 刚刚开源了 MiniMax M3,国内首个同时具备原生多模态、超长上下文、Agent 操作 三大能力的模型。 M3 采用全新稀疏注意力架构 MSA(MiniMax Sparse Attention),最高支持 1M 上下文——在 100 万上下文下每 token 计算量仅为上代的 1/20,prefilling 加速超 9 倍、decoding 加速超 15 倍。 在

百度飞桨 PaddleOCR 团队正式开源 PP-OCRv6,PP-OCR 系列第六代文本检测识别模型。本次首次推出 Tiny(1.5M)、Small(7.7M)、Medium(34.5M)三档模型,覆盖浏览器端、嵌入式设备到服务器的全算力平台。相比 PP-OCRv5 同级别模型,文字检测精度提升 4.9%、识别精度提升 5.1%;其中 Medium 档在 Intel Xeon CPU 上端到端时

引言 Cohere 开源了 North Mini Code,一个总参数 30B、激活参数仅 3B 的混合专家(MoE)编程模型,以 Apache 2.0 许可证发布。这是 Cohere 全新模型家族的首个模型,专为智能体软件工程(agentic coding)设计,覆盖复杂软件工程工作流、基于终端的智能体任务和高质量代码生成。研究团队采用多脚手架训练以保证模型跨智能体框架(harness)的稳健性

引言 Google Magenta 团队发布并开源了 Magenta RealTime 2(MRT2),一个 24 亿参数的实时音乐模型——你可以像演奏乐器一样使用它,并直接在 MacBook(Apple Silicon)本地运行。与”把提示词离线渲染成一段音轨”的生成式音乐模型不同,MRT2 是实时、可交互的,除文本外还支持 MIDI 与音频控制,帧大小 40 毫秒、控制延迟约 200 毫秒,较

Mind Lab 正式发布 Macaron-V1-Preview ,一款基于 GLM5.1 后训练的 749B 智能体模型(744B 基座 + 5×1B LoRA),采用全新的 Mixture-of-LoRA(MoL)架构。MoL 将参数空间正交化,让每种智能体能力在各自独立的适配器空间中优化,在隔离冲突目标、避免多能力联合训练时常见优化干扰的同时,实现协同能力的共同提升。在四项智能体基准上,Ma

Nex-AGI 是由上海创智学院发起的创新联盟,旨在建设一个可持续的能动性闭环开源生态。近日,Nex-AGI 正式开源下一代模型 Nex-N2 —— 一款具备“智能体思维”的智能体模型,凭借一流的代码能力和智能体能力,能在真实环境中持续推进复杂、长周期的任务,稳定地交付端到端的结果。在多项权威基准上,Nex-N2-Pro 整体紧追 GPT-5.5、Claude Opus 4.7 等顶尖闭源模型,并

Google DeepMind 开源了 Gemma 4 12B,一款约 11.95B 参数的统一多模态模型。它最特别的地方,是去掉了传统多模态模型里的视觉和音频编码器,让图像、音频信号直接进入 LLM 主干处理,也是 Gemma 4 家族里第一个原生支持音频输入的中尺寸模型。性能上,它逼近体积大一倍的 26B MoE,显存却只要不到一半:GPQA Diamond 78.8%、AIME 2026(无

问题背景 公交路线规划是城市出行的基础能力。但你可能没想过,每天你用的「公交导航」背后,是一套极其复杂的工程体系。 图1: 传统方案(上)流程冗长;通用LLM(左下)产出断裂路线与幻觉站点;TransitLM(右下)通过隐式空间定位,端到端生成结构完整的连通路线。 传统方案:重依赖、长链路 传统公交规划依赖完整的地图基础设施——站点拓扑图、实

过去几个月,PaddleOCR相继发布了PaddleOCR-VL和PaddleOCR-VL-1.5,凭借强大而稳定的文档解析能力,已经被业界广泛用于大模型训练数据和应用数据构建。PaddleOCR-VL-1.5更是创新性地支持了异形框定位,在真实文档场景中表现优异。 最近,PaddleOCR正式推出PaddleOCR-VL-1.6,PaddleOCR-VL-1.6是在PaddleOCR-VL-1.








