
简介
该用户还未填写简介
擅长的技术栈
可提供的服务
暂无可提供的服务
好部署:基于标准 Llama 架构,兼容 vLLM、SGLang、Ollama、llama.cpp、LM Studio 等主流工具,还有 GGUF、MLX 等量化版本,手机/电脑本地跑都很方便。MiniCPM5-1B 就是目前最强的小模型之一,专为“本地跑、不想依赖云端”的人设计,在体积和能力之间找到了很好的平衡,特别适合个人开发者、隐私场景和资源受限的环境。1B级别最强(SOTA):在同等大小的

参数 2B(20亿):基于 Qwen2.5 等大模型架构,结合了语义编码器、LLM(大语言模型)和流匹配(flow-matching)技术。零样本/少样本语音克隆:只需几秒钟的参考音频(甚至不需要对应文字),就能模仿出很像的说话人声音,支持“延续克隆”(带文字参考)和纯音色克隆。全连续、无离散 token:不像很多老模型那样把声音切成“碎片”处理,它全程用连续的音频信号处理,声音更自然、连贯,少了

因视频转写效率不如直接音频转写,故新增视频转音频功能,如果是视频文件,建议先将视频转换为音频,再进行转写操作。GLM-ASR 是智谱AI开源的一个语音识别模型,虽然体积小,只有1.5B的参数量,但识别速度快、准确率高,在中文和方言识别上表现非常突出,尤其擅长处理低音量、嘈杂环境下的语音,比很多同类模型更稳健。GLM-ASR 支持 17 种语言,包括日、英、法、德、俄、西等主流语言,甚至连加泰罗尼亚

支持最低4G显存显卡+16G运行内存设备流畅运行,基于ComfyUI-Nunchaku打包,模型使用的也是Nunchaku最新开源的 4-bit Z-Image-Turbo,独家新增Lora支持,集速度和生成质量于一身,可实现3-5秒快速生成图像,更快更轻巧的AI文生图。关于Rank,比如模型文件名开头的“svdq-int4_r128”,这里的 r就是rank的缩写,请根据自己的需求选择 (32=

因视频转写效率不如直接音频转写,故新增视频转音频功能,如果是视频文件,建议先将视频转换为音频,再进行转写操作。GLM-ASR 是智谱AI开源的一个语音识别模型,虽然体积小,只有1.5B的参数量,但识别速度快、准确率高,在中文和方言识别上表现非常突出,尤其擅长处理低音量、嘈杂环境下的语音,比很多同类模型更稳健。GLM-ASR 支持 17 种语言,包括日、英、法、德、俄、西等主流语言,甚至连加泰罗尼亚

Z-Image (又名Z-Image Base、Z-Image基础版)是Z-Image(造相)团队正式开源Z-Image标准版高性能图像生成模型,作为Z-Image系列的基础模型,标准版是非蒸馏的完整模型,在生成质量、风格灵活性和二次开发支持上更具优势,具备画质高、风格多样、对提示词理解精准等特点,相比加速版 Z-Image-Turbo,更注重创意自由和可扩展性。进入工作流后,输入提示词,设置生成

参数 2B(20亿):基于 Qwen2.5 等大模型架构,结合了语义编码器、LLM(大语言模型)和流匹配(flow-matching)技术。零样本/少样本语音克隆:只需几秒钟的参考音频(甚至不需要对应文字),就能模仿出很像的说话人声音,支持“延续克隆”(带文字参考)和纯音色克隆。全连续、无离散 token:不像很多老模型那样把声音切成“碎片”处理,它全程用连续的音频信号处理,声音更自然、连贯,少了

参数 2B(20亿):基于 Qwen2.5 等大模型架构,结合了语义编码器、LLM(大语言模型)和流匹配(flow-matching)技术。零样本/少样本语音克隆:只需几秒钟的参考音频(甚至不需要对应文字),就能模仿出很像的说话人声音,支持“延续克隆”(带文字参考)和纯音色克隆。全连续、无离散 token:不像很多老模型那样把声音切成“碎片”处理,它全程用连续的音频信号处理,声音更自然、连贯,少了

Ideogram 4 就像一个“懂设计”的AI 画师,特别擅长生成带文字、布局精美、颜色协调的专业级图片,适合设计师、创作者和开发者上手玩,降低了高品质图像生成的门槛。超强文字渲染:能在图片里直接生成清晰、美观的文字(如海报标题、logo、标牌、多行文字),效果目前在开源模型里最好,很多更大参数的模型都比不过它。进入页面后,点击左侧的 工作流程,选择对应的工作流,输入提示词,设置相关参数,运行即可

情感关键词包括 happy(开心)sad(悲伤)angry(愤怒)surprise(惊讶)fear(恐惧)disgust(厌恶)serious(严肃)concern(关切)blue(忧郁)disdain(轻蔑)neutral(中性/平静)psychology(心理活动)unknown(不指定情感)指令合成:上传参考音频,输入合成文本(支持在合成文本中插入副语言标签),支持情感关键词,支持方言(后期








