logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

WAN: OPEN AND ADVANCED LARGE-SCALE VIDEO GENERATIVE MODELS

无限长度视频生成:滑窗机制让视频生成突破长度上限,且显存/算力不会线性增长。高效注意力机制:仅对滑窗范围内token做attention,大幅节省内存和计算资源。无缝连续性:token缓存+重新引入机制保证长时序视频“无断帧、无闪烁”,时序感极强。Streamer极大提升了DiT类模型在流式、长内容、实时视频生成上的可用性,为AIGC落地带来新可能。本研究提出了基础性视频生成模型 Wan,并在多个

#人工智能
到底了