logo
publist
写文章

简介

ModelScope旨在打造下一代开源的模型即服务共享平台,为泛AI开发者提供灵活、易用、低成本的一站式模型服务产品,让模型应用更简单!

擅长的技术栈

可提供的服务

开源模型社区

BOSS直聘3B超越Qwen3-32B,更多训练数据刷新小模型极限

一款仅有30亿参数的小模型,在数学和推理能力上超越了320亿参数的大模型。 BOSS直聘Nanbeige大语言模型实验室,开源了他们的Nanbeige4-3B模型。 模型 https://www.modelscope.cn/organization/nanbeige 23万亿Token重塑小模型潜能 对于一个3B级别的模型,通常的训练量可能在几万亿token,但Nanbeige4-3B直接将

文章图片
一张图秒生 LoRA ? Qwen-Image-i2L 诞生记

我们发布了一个 Qwen-Image 的“图生 LoRA”模型。 是的,输入一张图,输出一个 LoRA 模型的权重,端到端直出的那种。 本文,我们将介绍我们是如何设计并训练出 Qwen-Image-i2L(Image to LoRA)模型的,我们记录了实验过程中走的弯路,希望本文能够启发更多有价值的研究。 技术路线 可行性分析 给定一张或几张图,用 GPU 花费几个小时训练一个 LoRA,这

文章图片
ModelScope魔搭社区发布月报 -- 25年12月

 2025年末,DeepSeek 3.2强化推理与Agent能力,Mistral-3系列回归,智谱开源周连发GLM-4.6V、AutoGLM-Phone、RealVideo等多模态重磅模型~  文生图赛道卷出新高度:Flux2登场,Z-Image-Turbo 在6B规格上凭「10步内高质量出图+超强中英理解」引爆社区,生态迅猛崛起,魔搭Day 0全链路支持!  开源基建持续深耕:DiffSy

文章图片
Z-Image Turbo LoRA训练魔法:如何保持加速生图能力

相信尝试过训练Z-Image LoRA的开发者会发现,直接基于 Z-Image Turbo 训练出的 LoRA 会失去加速能力,在加速配置(steps=8,cfg=1)下生成的图像变得模糊,在非加速配置(steps=30,cfg=2)下生成的图像正常。 为能够在 LoRA 中保留"Turbo"加速能力,ModelScope DiffSynth团队提出一种训练 Z-Image-

文章图片
魔珐星云:免费体验企业级3D AI数字人智能客服!告别枯燥对话框!

随着大语言模型技术的快速发展,人工智能交互正在从纯文本对话向多模态、具身化方向演进。今天,魔珐科技(XMOV) 携手 魔搭社区(ModelScope),在创空间正式上线了 「魔珐星云智能客服 Demo」!这是一个基于超写实3D数字人技术的具身智能交互平台。该平台实现了AI从"语言理解"到"具身表达"的能力升级,用户无需复杂部署,即可通过网页体验集视觉形象、智

文章图片
送给GLM Coding Plan用户和开源社区的“AI手机”

今天,智谱送给开源社区以及 GLM Coding Plan 用户,人手一台“AI手机”。 现在,只需在 Claude Code 里输入一句提示词,AI 就会自动为你装好 AutoGLM,然后,你就有了—台“AI手机”。 智谱 Agent 模型 AutoGLM 开源后,受到开发者喜爱,对于这样一个开源“新物种”,部署过程确实有点麻烦。在不断尝试寻找更简单的解决方案后,惊喜地发现,这些工作完全可以交给

文章图片
智谱开源GLM-ASR:动动嘴,活就干了

智谱正式发布并开源了GLM-ASR系列语音识别模型,并推出基于该系列模型打造的桌面端智谱AI输入法。 本次发布模型与产品包括: GLM-ASR-2512:全球领先的云端语音识别模型;GLM-ASR-Nano-2512:参数量仅1.5B的开源SOTA端侧语音模型;智谱AI输入法:将语音识别与大模型深度融合的桌面端效率工具。 实现让用户真正做到“动动嘴,活就干了”,从“把话变成字”走向“直接用语音

文章图片
SteadyDancer开源:首个实现首帧保留的I2V人像动画框架,告别身份漂移!

现有人像动画的主流Reference-to-Video范式因忽视时空错位,常导致身份漂移与视觉伪影。针对这一痛点,南京大学、腾讯PCG、上海人工智能实验室联合推出并开源SteadyDancer,这是首个基于Image-to-Video范式并稳健实现首帧保留的框架。通过引入条件协调机制、协同姿态调制模块及分阶段解耦目标训练流程,该模型成功攻克了外观保真度与运动控制难以兼得的难题,在显著降低训练资源消

文章图片
智谱 GLM-4.6V开源!能看、能想还能执行「百变」任务

今日,智谱新模型开源发布—— GLM-4.6V 系列多模态大模型,共包含两款模型: GLM-4.6V(106B-A12B):面向云端与高性能集群场景的基础版GLM-4.6V-Flash(9B):面向本地部署与低延迟应用的轻量版。 模型合集: https://www.modelscope.cn/collections/GLM-46V-37fabc27818446 作为 GLM 系列在多模态方向

文章图片
动漫党福音!3.5B 参数全新开源ACG底模来了:NewBie-image-Exp0.1

在AI绘画领域,模型的理解力与表现力一直是研发的核心,效果好的模型参数大,参数小的模型效果差一直是困扰二次元AI模型爱好者的难题。在文生图领域,基于Transformer的DiT架构正逐渐成为主流。 近日,社区开源模型研究团队NewBieAI-Lab公开了其首个实验性文生图模型——NewBie image Exp0.1,一个专为二次元而生的3.5B 参数 Next-DiT 底模。除了扎实的底

    共 836 条
  • 1
  • 2
  • 3
  • 84
  • 请选择