
简介
ModelScope旨在打造下一代开源的模型即服务共享平台,为泛AI开发者提供灵活、易用、低成本的一站式模型服务产品,让模型应用更简单!
擅长的技术栈
可提供的服务
开源模型社区
超长序列的训练一直在大模型训练中是一个重要的方向。在实际推理过程中,尤其是Agent链路中,模型对长序列、复杂场景的泛化性代表着模型在实际应用时的可信度。长序列的场景,对于大模型训练也提出了更高的需求。由于Attention计算的O(N²)复杂度特性,使实际输入序列在增长时,显存使用会呈现指数型爆炸。这对于显存不宽裕的卡型,在长序列训练练场景中的可用性,提出了巨大的挑战。 序列并行(Sequen

近日,Soul App AI团队(Soul AI Lab)联合西北工业大学ASLP@NPU团队和上海交通大学X-LANCE Lab正式开源语音播客生成模型SoulX-Podcast。该模型是一款专为多人、多轮对话场景打造的语音生成模型,支持中、英、川、粤等多语种/方言与副语言风格,能稳定输出超60分钟、自然流畅、角色切换准确、韵律起伏丰富的多轮语音对话。 除了播客场景以外,SoulX-Podca

随着大模型能力的持续突破,其参数规模不断攀升,训练成本也日益高昂。如何让轻量级的小模型掌握大模型的"真本事"?Thinking Machines Lab(TML)最新提出的 On-Policy Distillation 技术为此提供了全新答案——训练效率提升一个数量级,所需成本仅为传统强化学习方法的十分之一。 在AI领域,有一个经典话题:如何让小模型具备接近大模型的能力? 为

低成本、高精度、强泛化——通义实验室联合中国人民大学发布全新 GUI Grounding模型 UI-Ins,首次将指令视为动态推理路径,实现 SOTA 性能与涌现推理能力。 01GUI Grounding模型为何“看不懂”用户? 在迈向通用人工智能(AGI)的道路上,图形用户界面(GUI)智能体正成为关键一环。无论是自动操作手机 App、控制桌面软件,还是辅助残障人士使用电脑,GUI 智能体的核心

要让人工智能真正理解、预测甚至重构真实世界,“世界模型”(World Model)已成为通往下一代智能的核心引擎。作为能够建模物理规律、时空演化与场景逻辑的智能系统,世界模型赋予AI“看见”世界运行本质的能力。而视频生成模型有望成为构建世界模型的关键路径——通过视频生成任务压缩几何、语义、物理等多种形式的知识,AI得以在数字空间中模拟、推演乃至预演真实世界的运行。 基于这一关键目标,美团 Long

低成本、高效率、不依赖更大显存——这或许是你一直在等的长上下文新思路。 当前大语言模型(LLM)在处理超长文本(如整本小说、长代码库、法律文书)时面临一个核心瓶颈:计算与显存成本爆炸式增长。 扩展到 128K、1M token?训练和推理动辄需要数十张 H100。即便使用稀疏注意力、位置插值等技巧,token 数量没变,总开销依然巨大。检索增强(RAG)虽能缩短输入,但可能漏掉关键信息。 有没有

今天,Minimax正式发布并开源 MiniMax-M2,一款专为Max级编码与智能体打造的模型。 MiniMax-M2 是一款轻量、快速且极具成本效益的 MoE 模型(230B 总参数,10B 激活参数)。它在保持强大通用智能的同时,专为编码和智能体任务进行了深度优化。凭借仅 10B 的激活参数,它提供了开发者期待的端到端工具使用性能,同时其小巧的“身材”也更易于部署和扩展。 01核心亮点 卓越

在上海的一间小工作室里,两位从未碰过硬件的搭友,决定用胶带蒙住双眼,戴上自己手搓的 AI 眼镜,走上街头,当一天“盲人”。 这不是行为艺术,而是一场关于“AI能否真正帮助视障群体”的校验。 https://www.bilibili.com/video/BV1THstzuEZ9/?spm_id_from=333.337.search-card.all.click 从一条评论开始的公益之旅 20

今天是 10 月 24 日「程序员节」。在这个属于开发者的日子里,魔搭社区联合知乎发布首份聚焦AI时代开发者的重磅报告——《THE NEXT WAVE:AI时代开发者生态白皮书》。 这份报告尝试回答一个问题——在AI时代,我们应如何更完整地理解「开发者」? 报告告诉我们:AI 把“会写代码”的门槛拉低,却把一个更稀缺的角色推上前台——能定义问题、选技术、闭环商业的「超级个体」开发者。 他们长

近日,混元世界模型1.1版本(WorldMirror)正式发布并开源,新增支持多视图及视频输入,单卡即可部署,秒级创造3D世界。 它让3D重建从专业工具变为人人可用的技术——任何人都能在秒级内从视频或图片创造出专业级3D场景。 今年 7 月,混元团队推出了混元世界模型1.0,这是业界首个开源并兼容传统CG管线的可漫游世界生成模型,其 lite 版本在消费级显卡就可以部署。作为一个统一(any-to








