logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

UniAnimate模型部署教程

大量实验结果表明,UniAnimate 在定量和定性评估中都取得了优于现有最先进同类产品的合成结果。值得注意的是,UniAnimate 甚至可以通过迭代使用第一帧调节策略来生成高度一致的一分钟视频。本文将详细介绍如何实现该模型的本地部署。

文章图片
#视频生成#人工智能#AIGC
MimicMotion模型构建指南

(运动模仿)是具有置信感知姿势指导的高质量人体运动视频生成模型。它可以在任何运动引导下生成任意长度的高质量视频。目前它支持以 576x1024 分辨率生成最多 72 帧的视频。

文章图片
#AIGC
ChatGLM4部署教程

GLM-4-9B 是智谱 AI 推出的最新一代预训练模型 GLM-4 系列中的开源版本。在语义、数学、推理、代码和知识等多方面的数据集测评中,GLM-4-9B及其人类偏好对齐的版本均表现出超越 Llama-3-8B 的卓越性能。除了能进行多轮对话,GLM-4-9B-Chat 还具备网页浏览、代码执行、自定义工具调用(Function Call)和长文本推理(支持最大 128K 上下文)等高级功能。

文章图片
#AIGC#人工智能#图像处理
MiniCPM-V大模型部署教程

MiniCPM-V 是面向图文理解的端侧多模态大模型系列。该系列模型接受图像和文本输入,并提供高质量的文本输出,自 2024 年 2 月已发布 5 个版本模型。本文将详细介绍部署

文章图片
#人工智能#AIGC#开源 +3
【最新】Flux详细部署教程

Flux.1:当前地表最强开源AI画图模型flux.1由Black Forest Labs(黑森林实验室)推出,而Black Forest Labs是Robin Rombach带领研究团队(Stable Diffusion 的核心成员)离开 Stability AI 创立的,所以也可以说是SD的原班人马打造。由下图可以看出Flux.1模型表现出的效果已经超越了SD3、DALL·E3(HD)和Mid

文章图片
#人工智能#AIGC#AI作画 +1
EchoMimic模型部署教程

EchoMimic 是一个由阿里巴巴蚂蚁集团开发的开源 AI 数字人项目,通过可编辑地标调节实现逼真的音频驱动肖像动画,它能够将静态图像转化为具有动态语音和表情的数字人像 。本文将详细介绍该模型如何实现本地部署。

文章图片
#视频生成#conda#GPU +2
GPT-SOVIT模型部署指南

强大的小样本语音转换和文本转语音 WebUI,GPT-Sovits是一个热门的文本生成语音的大模型,只需要少量样本的声音数据源,就可以实现高度相似的仿真效果。本文将详细介绍如何实现该模型本地部署。

文章图片
#算力#人工智能
Qwen2:通义千问倾力巨献,领航语言新纪元

Qwen2 是由阿里云通义千问团队研发的新一代大型语言模型系列,它在多个方面实现了技术的飞跃和性能的显著提升。名称:Qwen2研发团队:阿里云通义千问团队类型:大型语言模型特点:多版本、多规模,满足不同计算需求;全面支持 PAI 平台;整体性能代际飞跃。

文章图片
#人工智能#AIGC
到底了