logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

部署视频生成模型-美团LongCat-Video

本文记录了部署美团LongCat-Video-Avatar-1.5视频生成模型的全过程。文章首先对比了视频模型与文本大模型的区别,指出视频模型需要处理视频帧、音频编码等专用任务。随后介绍了LongCat-Video系列三个版本的功能差异,重点说明1.5版本在音频编码、唇形同步等方面的改进。 部署过程包括:1)通过conda创建Python虚拟环境;2)安装CUDA工具链和PyTorch等基础依赖;

#音视频
到底了