
简介
ModelScope旨在打造下一代开源的模型即服务共享平台,为泛AI开发者提供灵活、易用、低成本的一站式模型服务产品,让模型应用更简单!
擅长的技术栈
可提供的服务
开源模型社区
Jina AI正式推出第三代重排器 Jina Reranker v3。它在多项多语言检索基准上刷新了当前最佳表现(SOTA)。 模型链接: https://modelscope.cn/models/jinaai/jina-reranker-v3 论文链接: https://arxiv.org/abs/2509.25085 这是一款仅有 6 亿参数的多语言重排模型。官方为其设计了名为 “l

今天,我们正式发布Ling 2.0系列的第一款旗舰非思考模型 - 拥有万亿参数的Ling-1T。 推理,是智能的核心表达,更是通用智能体的认知基石。因此,我们持续扩展Ling 2.0 系列模型的自然语言推理能力。Ling-1T沿用Ling 2.0 架构,如其模型代号所示,我们将其扩展至1T(Trillion,万亿)总参数,每个token激活其中约50B参数。Ling-1T-base在20T+ to

GLM,也来啦!就在今天,智谱AI开源发布了GLM-4.6。 作为GLM系列的最新版本,GLM-4.6是系列最强的代码Coding模型(较GLM-4.5提升27%)。在真实编程、长上下文处理、推理能力、信息搜索、写作能力与智能体应用等多个方面实现全面提升。如下: 高级编码能力:在公开基准与真实编程任务中,GLM-4.6的代码能力对齐Claude Sonnet 4,是国内已知的最好的Coding

引言 阿里通义实验室悄悄(其实动静不小)发布了一个叫 Tongyi DeepResearch 的 Agent 项目。它没有开发布会,没请明星站台,甚至没发通稿——但它在 GitHub 上架当天,就登顶了“每日趋势榜”。这速度,比人类发现“咖啡因无效”后换第三杯咖啡还快。 圈内讨论随之而来。有人兴奋地复制粘贴,有人皱眉点开论文附录,还有人默默关掉网页——因为文档里出现了“后训练”、“工具调用”、“

今天,我们正式发布 DeepSeek-V3.2-Exp 模型,这是一个实验性(Experimental)的版本。作为迈向新一代架构的中间步骤,V3.2-Exp 在 V3.1-Terminus 的基础上引入了 DeepSeek Sparse Attention(一种稀疏注意力机制),针对长文本的训练和推理效率进行了探索性的优化和验证。 目前,官方 App、网页端、小程序均已同步更新为 DeepSee

腾讯混元图像3.0,真的来了——开源,免费开放使用。 正式介绍一下:混元图像3.0(HunyuanImage 3.0),是首个工业级原生多模态生图模型,参数规模80B,也是目前测评效果最好、参数量最大的开源生图模型,效果可对标业界头部闭源模型。 体验 :访问电脑端腾讯混元官网(https://hunyuan.tencent.com/image%EF%BC%89%E5%8D%B3%E5%8F%AF%

前言 9月24日云栖大会现场,由阿里巴巴爱橙科技数据技术及产品团队自主研发的PDF解析神器正式亮相并同步开源模型。这款基于Logics-Parsing模型构建的AI工具直指当前PDF解析领域的技术痛点,显著提升复杂文档的结构化处理能力。 PDF 文档作为各行业信息存储与传播的主要载体,通常包含丰富的多模态内容,如文本、图像、表格、数学公式等。不论是为了支持大语言模型(LLM)的训练、构建结构化知

今天,混元3D生成模型家族迎新——混元3D-Omni、混元3D-Part发布并开源。 这是腾讯混元在可控3D生成上的新突破,让AI 3D建模更具实用性,加速3D生成模型在游戏、打印和AR/VR等实际生产流程中的落地应用。 作为业界首个统一支持多条件控制的3D生成框架,混元3D-Omni突破传统图像输入的局限性,支持多种模态输入,实现对物体几何结构、拓扑和姿态的精细控制。混元3D-Part则实现了

近期,科大讯飞在魔搭社区(ModelScope)和Gitcode上开源两款模型:讯飞星火化学大模型Spark Chemistry-X1-13B、讯飞文生音频模型AudioFly,助力前沿化学技术研究,以及声音生成技术和应用的探索。 开源项目地址: Spark Chemistry-X1-13B 魔搭社区:https://modelscope.cn/models/iflytek/Spark-Chem

00.前言 大语言模型在我们生活中越来越常用,如今我们用LLM做对话、写代码、解数学题的时候,不知道大家有没有过这样的困扰:明明模型思路很对,但生成内容要等半天——比如写一段复杂代码,要看着光标一个字符一个字符跳,做数学推理时,每一步推导都要卡一下?这背后其实是LLM“自回归生成”的天生局限:每次只能输出一个token,生成时间跟着文本长度线性增加。 腾讯 PCG 内服内容算法中心团队在投机解码
