logo
publist
写文章

简介

ModelScope旨在打造下一代开源的模型即服务共享平台,为泛AI开发者提供灵活、易用、低成本的一站式模型服务产品,让模型应用更简单!

擅长的技术栈

可提供的服务

开源模型社区

蚂蚁百灵全模态 Ming-flash-omni-2.0 开源!视觉百科+可控语音生成+全能型图像编辑,打破全模态“博而不精”

2月11日,蚂蚁百灵团队开源发布了百灵全模态大模型 Ming-flash-omni-2.0,基于 Ling-2.0(MoE 架构,100B-A6B)架构训练。相比之前发布的 Preview 版本,Ming-flash-omni-2.0 实现了全模态能力的代际跃迁,无论是在复杂的视觉理解、充满情感的语音交互,还是极具创意的图像编辑上,Ming-flash-omni-2.0 的实测表现均已跻身开源领先

文章图片
LLaDA2.1 正式开源,可纠错编辑机制让 100B 扩散模型突破 892 TPS 速度极限

在大语言模型的技术版图中,自回归(AR)架构长期占据主导地位,而扩散模型则被视作一条充满挑战的“非共识”路线。LLaDA2.0 已经成功证明了扩散语言模型(dLLM)规模化至 100B 参数的可行性,但生成速度与生成质量的平衡始终是横亘在扩散模型面前的核心难题。 今天,蚂蚁研究院正式发布 LLaDA2.1,通过可纠错编辑机制,首次让扩散语言模型在保持高质量的同时,将推理速度推至 892 TPS的新

文章图片
ModelScope魔搭社区发布月报 -- 26年2月

临近年关,本着“ 每逢佳节必更新 ”的原则,开源模型预计又将拉开春节炸场的大幕。从“小道消息”来看,GLM,Qwen,MiniMax,DeepSeek……都在跃跃欲试 。虽然我们也想说“今年的班是就上到这里了”,这里也先行奉上ModelScope年前的发布月报,但不出意外的话,还有更多的优秀开源模型,会赶在春节期间在ModelScope上与大家见面 樂。 ✨【模型年货集体上新】 MiniMax2

文章图片
达摩院开源RynnBrain:首个支持移动操作的具身大脑基础模型

具身智能蓬勃发展的当下,具有泛化性的具身能力至关重要。为了追求这个终极目标,业界发展出了两条技术路线。一条路线从机器人末端动作输出入手,发展出可以直接操作物理世界的VLA模型。但是VLA模型由于其数据稀缺性无法实现泛化。因此有了第二条路线,从本身拥有泛化能力的VLM入手,加速VLM从数字世界迈向物理世界。团队将在此路线上探索的模型称之为具身基础模型。 诚然,已经有一些研究开始了对具身基础模型的初步

文章图片
开源开放被集成:魔搭OpenAPI上新,广泛链接社区生态

作为开放的 AI 开源社区,ModelScope 希望能建成中国乃至全球 AI 模型开源的底层基础设施,从而去服务最广泛的AI开发者生态。我们也始终鼓励开发者以各种形式,灵活地接入和融合到ModelScope及其周边的生态。随着平台在服务,开源框架等多个方面能力的持续完善,我们也听到了来自社区日益高涨的呼声:希望以更低门槛、更高自动化的方式,集成ModelScope的生态能力,从而快速地构建更加多

文章图片
美团开源 LongCat-Flash-Lite:实现轻量化 MoE 高效推理

近日,美团LongCat团队开源了 LongCat-Flash-Lite —— 一款采用创新 N-gram Embedding 架构的68.5B MoE大模型。每次推理仅激活约2.9B-4.5B参数,却在Agent工具调用、代码生成等关键场景和同规模现有模型的对比中展现出卓越的竞争力,更关键的是:推理延迟大幅降低。基于嵌入扩展的应用与系统级优化,让模型推理效率大幅提升,在输入 4K,输出 1k 的

文章图片
Ultralytics YOLO26来啦!5种尺寸全家桶,速度与精度兼顾

Ultralytics 近期推出了最新的 YOLO26 模型,作为该系列迄今为止最先进、同时也是最易于部署的迭代版本,重新定义了跨行业计算机视觉应用的新范式,为边缘计算、低功耗设备场景提供了尖端解决方案。   与此前的 Ultralytics YOLO 系列一样,YOLO26 依然采用统一的模型家族设计,能够支持多种计算机视觉任务。模型提供五种尺寸选择:Nano(n)、Small(s)、

文章图片
投稿 | Zvec: 开箱即用、高性能的嵌入式向量数据库

Zvec 是一款类 SQLite 的轻量级嵌入式向量数据库,专为终端侧设计,具备开箱即用、资源可配置、极致性能以及多样化向量能力四大核心优势。基于Apache 2.0协议开源,Zvec 旨在为开发者提供从原型验证到端侧生产部署的一站式解决方案。欢迎体验 Zvec,期待你的使用、反馈与贡献!   背景 过去几年,向量检索已从搜索与推荐系统的后台组件,演变为智能应用的通用数据基础设施。尤其在

文章图片
迈向AI4S 2.0,上海AI实验室开源书生1T Moe 科学大模型Intern-S1-Pro!

2月4日,上海人工智能实验室开源基于“通专融合”技术架构SAGE打造的万亿参数科学多模态大模型 Intern-S1-Pro,为AI4S从“工具革命”的1.0阶段迈向以“革命的工具”驱动科学发现的2.0时代,提供创新的系统性开源基座。 作为当前全球开源社区中参数规模最大的科学多模态模型,Intern-S1-Pro的核心科学能力实现了质的跃升,高难度综合学科评测稳居AI4S领域国际领先水平,复杂数理逻

文章图片
Qwen3-Coder-Next开源!推动小型混合模型在智能体编程上的边界

近日,Qwen团队开源发布了 Qwen3-Coder-Next,一款专为编程智能体与本地开发设计的开源权重语言模型。该模型基于 Qwen3-Next-80B-A3B-Base 构建,采用混合注意力与 MoE 的新架构;通过大规模可执行任务合成、环境交互与强化学习进行智能体训练,在显著降低推理成本的同时,获得了强大的编程与智能体能力。 Github:https://github.com/QwenLM

文章图片
    共 886 条
  • 1
  • 2
  • 3
  • 89
  • 请选择