logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

【univa】5:web网站及让用户通过**自然语言对话**驱动后端 AI 模型来完成视频创作

本工程的编辑能力几乎全部由 AI 生成/编辑模型驱动视频编辑 → WAN 2.1 VACE-1.3B (本地) / Runway Gen-4 (API) / WAN-2.1-14B (API)图片编辑 → Seedream V4 (API)FFmpeg → 仅做拼接、切割、提帧等文件操作,不参与创意编辑。

#前端#人工智能#音视频
【AutoMV】2:故事本的分类

标签作用核心技术最终效果sing歌手演唱Audio-Driven Portrait (音频驱动人像)只有一张脸在唱歌,对得上歌词story叙事/空镜Image-to-Video (图生视频)画面有运镜和动态,人物不说话/不唱歌最后,系统会将这两类生成好的视频片段,按照story.json的顺序拼接在一起,并覆盖上原始的高质量音频,生成最终的 MV。这是一个逻辑严密、画面感极强的剧本。它不仅仅是在“

#AIGC
【UniVA】1:统一的视频agent:智能体系统,专门用于处理复杂的视频生成、编辑和理解任务

UniVA(通用视频代理)是一个开源的下一代视频通用系统,它通过自然语言指令使您能够规划、编排和制作视频。UniVA 作为您的智能视频导演,通过主动的、代理式的工作流程与您迭代镜头和故事。fill:#333;important;important;fill:none;color:#333;color:#333;important;fill:none;fill:#333;height:1em;HTT

#音视频
【linux】tar [选项] 归档文件名 要打包的文件/目录..

你这个命令参数位置反了,直接改成上面那条就行。

#linux#elasticsearch#运维
3090 24G 与4070 12G 哪个ai算力强

👉3090 = 训练利器,大显存强项👉4070 = 部署利器,小模型推理优先。

#人工智能
在dll中使用spdlog并封装供其他dll exe用

How to use spdlog in DLLs最近想把spdlog放在common.dll里,给serverdll用,好像不行,一直报错,查了下,应该是spdlog 都是头文件,模板类必须把实现和头文件放一起1>------ 已启动生成: 项目: SfuServer, 配置: Debug Win32 ------1>SfuServer.cpp1>G:\RRRRR...

Radxa Rock 5B vs Rock 5B+ 、香橙派、鲁班猫、正点原子及RK3588 的AI/音视频任务的选择

650 买 8G 的 Rock 5B V1.42,价格不贵,但早期版本稳定性有坑,适合玩票/开发,不太。

文章图片
#人工智能#音视频
Radxa Rock 5B vs Rock 5B+ 、香橙派、鲁班猫、正点原子及RK3588 的AI/音视频任务的选择

650 买 8G 的 Rock 5B V1.42,价格不贵,但早期版本稳定性有坑,适合玩票/开发,不太。

文章图片
#人工智能#音视频
    共 60 条
  • 1
  • 2
  • 3
  • 6
  • 请选择