
简介
ModelScope旨在打造下一代开源的模型即服务共享平台,为泛AI开发者提供灵活、易用、低成本的一站式模型服务产品,让模型应用更简单!
擅长的技术栈
可提供的服务
开源模型社区
来自小红书超级智能团队的 FireRed-OCR,以仅 20 亿参数的轻量模型,在权威文档解析基准 OmniDocBench v1.5 上拿下端到端方案第一,综合得分 92.94%,超越 Gemini 3.0 Pro、DeepSeek-OCR 2 和 Qwen3-VL-235B。 模型已在ModelScope 开源,感兴趣可以直接体验 Demo 或下载权重本地部署,采用Apache 2.0协议,代

大模型推理太慢、显存不够用?腾讯混元团队开源的 AngelSlim,一套工具解决量化、加速、剪枝三大难题。 为什么需要模型压缩? 近年来,大语言模型(LLM)和多模态大模型(MLM)的能力发展速度很快——复杂推理、零样本泛化、跨模态理解,样样精通。但这些能力的背后,是一道绕不过去的"推理墙"(Inference Wall): 自注意力机制的计算复杂度是 O(n²),序列越长,消

在代码大模型(Code LLMs)的持续演进中,竞赛级编程(Competitive Programming)是考验其极限算法思维与长逻辑推理的核心高地。然而,当前在该领域性能领先的模型,往往高度依赖有限的真实世界竞赛数据,这不仅带来了真实数据枯竭问题,也引发了严重的数据污染担忧。 能否仅依靠纯合成数据,将大模型的代码推理能力提升至专家水平? 近日,来自微软和清华大学的研究团队联合发表了一项最新研究

本地运行、零 API 成本、结构化输出 100% 准确 —— LocoOperator-4B 是一个专为代码库探索设计的蒸馏模型,或许会改变你使用 AI 辅助编程的方式。 背景:Code Agent的"贵"从哪来? Code Agent 是目前最受开发者欢迎的Vibe Coding方式,很多Code Agent核心工作模式是主智能体 + 子智能体的两层架构:主模型负责决策和代码

更好的架构、更高质量的数据、更大规模的强化学习,才是推动智能进步的真正引擎。 一句话读懂 Qwen3.5 今天,Qwen团队正式发布 Qwen3.5 中等规模模型系列,包含四款各有侧重的模型: 模型定位Qwen3.5-Flash生产级托管版,对应 35B-A3B,默认 100 万上下文Qwen3.5-35B-A3B小体积,超强能力,已超越 Qwen3-235B-A22BQwen3.5-122B

近日,中科天机与中国最大的AI开源社区魔搭社区(ModelScope)达成合作,“中科天机高质量气象数据集”正式上线魔搭平台,提供给广大开发者和气象爱好者下载和使用。这是中科天机自2025年9月启动“高分辨率气象数据共享计划”以来,首次将自主生成的高精度气象数据集接入外部AI开发者社区,也标志着双方在科学智能领域的生态合作正式开启。 数据集下载链接:https://www.modelscope.c

春节前,AI界迎来一场中国OCR小模型的开源爆发:DeepSeek、智谱、百度飞桨、腾讯优图四大团队相继发布新一代OCR模型。 四款模型全部采用视觉语言模型(VLM)架构,彻底抛弃了沿用数十年的“检测→矫正→识别→结构化”流水线设计。OCR技术,正从“字符数字化”迈入“语义结构化”的新纪元。 范式革命:从光栅扫描到视觉因果流 传统OCR像一条僵化的装配线:先框出文字区域,再矫正倾斜,接着逐字识别,

继 魔搭社区+OpenVINO™ 加速部署 Qwen3-TTS 实战 后,紧锣密鼓安排上Qwen3-ASR 的实战教程。 Qwen3-ASR 系列模型也是通义千问团队在春节前发布的音频理解方向最新成果 ,包含 1.7B 和 0.6B 两个版本。作为 Qwen 语音家族的最新成员,它在多语言识别和处理复杂声学环境方面展现了卓越的性能。 开源资源: Qwen3-ASR官方仓库: http

日前,通义千问Qwen 推出了 Qwen3-TTS 系列模型。这不仅是一个高质量的文本转语音工具,更是一个支持 10 种全球语言、具备“声音克隆”与“情感适配”能力的声学引擎。 开源信息 github: https://github.com/QwenLM/Qwen3-TTSmodel:https://modelscope.cn/collections/Qwen/Qwen3-TTS &

日前,智谱开源发布了专为复杂文档理解设计的多模态 OCR 模型 GLM-OCR。该模型基于 GLM-V 编码器 - 解码器架构,集成了在大规模图文数据上预训练的 CogViT 视觉编码器、具有高效令牌下采样机制的轻量级跨模态连接器,以及 GLM-0.5B 语言解码器。为进一步提升性能,GLM-OCR 引入了多令牌预测(MTP)损失函数和稳定的全任务强化学习机制,并结合基于 PP-DocLayout








