logo
publist
写文章

简介

ModelScope旨在打造下一代开源的模型即服务共享平台,为泛AI开发者提供灵活、易用、低成本的一站式模型服务产品,让模型应用更简单!

擅长的技术栈

可提供的服务

开源模型社区

只靠国产算力与开源数据,端侧模型预训练行不行?我们做到了全流程开源

当算力受限、数据参差,如何训练出高效可用的端侧模型?鹏城实验室联合清华不仅给出了答案,更将每一步都开源共享。 如果实验室只有国产算力、有限资源与开源数据,能否玩转端侧模型的预训练?鹏城实验室与清华大学 PACMAN 实验室联合发布了鹏城脑海‑2.1‑开元‑2B(PCMind‑2.1‑Kaiyuan‑2B,简称"开元‑2B")模型,并以全流程开源的方式回应了这一挑战——从训练数

文章图片
告别“扁平思维”:Qwen-Image-Layered 开启 AI 图片的图层革命

你是否有过这样的挫败感:想让 AI 把合照里的路人移开,结果路人消失了,背景却像被抹了一层浆糊;想改一下海报里的字体,结果 AI 把整张图的画风都重绘了。 这种“牵一发而动全身”的翻车现场,本质上是因为 AI 一直在用「扁平图片」思考世界。对模型而言,图片只是像素的堆砌,而非物体的组合。 近日, Qwen 团队发布的最新研究 Qwen-Image-Layered 正式宣告:AI 图像编辑的“图层

文章图片
VTP:MiniMax海螺视频团队,首次开源!

转自 MiniMax稀宇科技 今天,MiniMax视频团队推出其首个开源工作——VTP (Visual Tokenizer Pre-training);这个工作讨论的是视觉生成模型中的关键组件——tokenizer,对于整个生成系统的scaling性质。 这个说法可能会让大家感到有点陌生:什么时候tokenizer也有scaling性质了?Scaling作为大模型时代的核心纲领,其讨论的对象一般是

文章图片
BOSS直聘3B超越Qwen3-32B,更多训练数据刷新小模型极限

一款仅有30亿参数的小模型,在数学和推理能力上超越了320亿参数的大模型。 BOSS直聘Nanbeige大语言模型实验室,开源了他们的Nanbeige4-3B模型。 模型 https://www.modelscope.cn/organization/nanbeige 23万亿Token重塑小模型潜能 对于一个3B级别的模型,通常的训练量可能在几万亿token,但Nanbeige4-3B直接将

文章图片
一张图秒生 LoRA ? Qwen-Image-i2L 诞生记

我们发布了一个 Qwen-Image 的“图生 LoRA”模型。 是的,输入一张图,输出一个 LoRA 模型的权重,端到端直出的那种。 本文,我们将介绍我们是如何设计并训练出 Qwen-Image-i2L(Image to LoRA)模型的,我们记录了实验过程中走的弯路,希望本文能够启发更多有价值的研究。 技术路线 可行性分析 给定一张或几张图,用 GPU 花费几个小时训练一个 LoRA,这

文章图片
ModelScope魔搭社区发布月报 -- 25年12月

 2025年末,DeepSeek 3.2强化推理与Agent能力,Mistral-3系列回归,智谱开源周连发GLM-4.6V、AutoGLM-Phone、RealVideo等多模态重磅模型~  文生图赛道卷出新高度:Flux2登场,Z-Image-Turbo 在6B规格上凭「10步内高质量出图+超强中英理解」引爆社区,生态迅猛崛起,魔搭Day 0全链路支持!  开源基建持续深耕:DiffSy

文章图片
Z-Image Turbo LoRA训练魔法:如何保持加速生图能力

相信尝试过训练Z-Image LoRA的开发者会发现,直接基于 Z-Image Turbo 训练出的 LoRA 会失去加速能力,在加速配置(steps=8,cfg=1)下生成的图像变得模糊,在非加速配置(steps=30,cfg=2)下生成的图像正常。 为能够在 LoRA 中保留"Turbo"加速能力,ModelScope DiffSynth团队提出一种训练 Z-Image-

文章图片
魔珐星云:免费体验企业级3D AI数字人智能客服!告别枯燥对话框!

随着大语言模型技术的快速发展,人工智能交互正在从纯文本对话向多模态、具身化方向演进。今天,魔珐科技(XMOV) 携手 魔搭社区(ModelScope),在创空间正式上线了 「魔珐星云智能客服 Demo」!这是一个基于超写实3D数字人技术的具身智能交互平台。该平台实现了AI从"语言理解"到"具身表达"的能力升级,用户无需复杂部署,即可通过网页体验集视觉形象、智

文章图片
送给GLM Coding Plan用户和开源社区的“AI手机”

今天,智谱送给开源社区以及 GLM Coding Plan 用户,人手一台“AI手机”。 现在,只需在 Claude Code 里输入一句提示词,AI 就会自动为你装好 AutoGLM,然后,你就有了—台“AI手机”。 智谱 Agent 模型 AutoGLM 开源后,受到开发者喜爱,对于这样一个开源“新物种”,部署过程确实有点麻烦。在不断尝试寻找更简单的解决方案后,惊喜地发现,这些工作完全可以交给

文章图片
智谱开源GLM-ASR:动动嘴,活就干了

智谱正式发布并开源了GLM-ASR系列语音识别模型,并推出基于该系列模型打造的桌面端智谱AI输入法。 本次发布模型与产品包括: GLM-ASR-2512:全球领先的云端语音识别模型;GLM-ASR-Nano-2512:参数量仅1.5B的开源SOTA端侧语音模型;智谱AI输入法:将语音识别与大模型深度融合的桌面端效率工具。 实现让用户真正做到“动动嘴,活就干了”,从“把话变成字”走向“直接用语音

文章图片
    共 839 条
  • 1
  • 2
  • 3
  • 84
  • 请选择