
简介
ModelScope旨在打造下一代开源的模型即服务共享平台,为泛AI开发者提供灵活、易用、低成本的一站式模型服务产品,让模型应用更简单!
擅长的技术栈
可提供的服务
开源模型社区
actAVA.ai 联合 Johns Hopkins、Wellstar、Yale、斯坦福、CMU、牛津、USC、UCSD 等 20 余家医疗机构与高校(Eric Xing、Sanmi Koyejo、Caiming Xiong、Philip S. Yu等)发布 CHI(χ)-Bench(Clinical Healthcare In-SituBenchmark),全球首个面向医疗长程工作流的 Agen

开发一个能“跑通 Demo 演示”的智能体并不难。 难的是,让它在真实场景里稳定地完成任务。 长链路任务中途断裂、工具调用缺乏安全边界、上下文越跑越臃肿、本地脚本难以接入生产环境……这些才是智能体走向落地时,开发者每天面对的硬骨头。 过去,AgentScope 1.0 以“透明开发”为核心,让开发者能清晰可见智能体的消息流转、工具调用和协作过程,从而降低理解与调试门槛。如今,面对更复杂的真实场景,

面壁智能联合清华大学、OpenBMB开源社区,在端侧大模型开源周中连续发布两款模型。MiniCPM5-1B仅1B参数,在AA-Index上超越所有2B以下模型(包括Qwen3.5-2B),INT4量化后权重仅0.5GB,可跑在手机、浏览器甚至纯CPU环境上。BitCPM-CANN是完全基于华为昇腾端到端训练的1.58-bit三值大模型,覆盖0.5B/1B/3B/8B四个规格,相比BF16释放约6倍

长上下文推理的瓶颈正在从计算量转向显存。每生成一个新token,系统都要反复访问越来越长的历史Key和Value,上下文拉长、batch放大后,KV Cache同时吞掉显存容量和带宽。Together AI开源了OSCAR(Offline Spectral Covariance-Aware Rotation),一套面向长上下文serving的近2-bit KV Cache量化方案,核心思路是:不只

在扩散模型(Diffusion Models)横扫图像与视频生成的今天,ControlNet、LoRA、IP-Adapter 等工具,早已成了创作者和开发者工作流里的标配。但繁荣背后,一个越来越让人头疼的问题浮出水面:模型生态,太“碎”了。 相信不少开发者都踩过这样的坑:好不容易跑通一个新模型,想加个控制功能,一看代码结构——完全不兼容;想一次性叠加多个控制条件,结果插件之间在底层“打架”,特征层

近日,LongCat-Video-Avatar 1.5正式开源 ,作为一款从开源 SOTA 迈向商业级应用的数字人视频模型。在唇形同步、物理合理性、长视频稳定性、多人互动和高效推理上实现了全面跃升。LongCat-Video-Avatar 1.5 即便在复杂商业场景里,也能稳定、自然地输出高质量内容,让数字人视频生成从彩排室的完美演练,走向千人千面的真实舞台。 为了让数字人“更稳定、更自然”地动起

随着大模型从"回答问题"走向"执行任务",Agent评测正在成为能力评估的关键方向。一个Agent可能给出看似合理的结果,却在执行过程中遗漏关键步骤、调用错误接口甚至违反任务约束——只看最终答案已经不够。Claw-Eval是一个面向自主Agent的端到端评测框架,关注的不只是任务有没有完成,更关注任务是如何被完成的:过程是否可追溯,行为是否合规,异常发生后能

5月21日,腾讯混元宣布开源全新翻译模型Hy-MT2,并上线翻译小程序「腾讯Hy翻译」。 Hy-MT2 是支持 33 种语言互译的多语言模型,其中7B 和 30B-A3B模型在各类翻译任务上达到了开源模型SoTA,超越了几十倍参数量的模型,轻量级的 1.8B 模型也超越了微软等主流商业 API,且得益于 AngelSlim 1.25-bit 极端量化,仅需 440MB 存储空间,可以轻松部署在主流

引言 HiDream.ai开源了HiDream-O1-Image,一个8B参数的像素级统一生成基础模型。彻底抛弃传统的VAE和分离式文本编码器,将原始图像像素、文本token和任务条件映射到单一共享token空间,通过Unified Transformer(UiT)架构实现端到端的上下文视觉生成。仅8B参数即在GenEval、DPG、CVTG-2K等多项基准上进一步刷新SOTA。本次开源包括未蒸馏

2026年4月24日,DeepSeek V4发布。284B到1.6T参数的MoE 模型,混合注意力 CSA/HCA、流形约束超连接 mHC、Hash-MoE 静态路由——V4不是一个渐进式升级,而是一次架构重构。主流推理框架在数天内完成了适配,但训练支持的跟进要慢得多。原因很明晰,训练对精度要求更高,且流程更复杂,涉及到前向反向等多个环节,而训练涉及到的算力资源更多,资源调度与通信操作复杂性提升,








