admin 管理员组

文章数量: 1184232

背景

        腾讯混元DiT模型是基于Diffusion Transformer(DiT)架构的视频生成模型,该模型在视频生成方面取得了显著的技术突破。它支持中英文双语输入,并具备“超写实”的视频生成能力,能够生成高度符合提示词的视频画面,画面质量高且流畅不易变形。 今天按照官方开源的说明本地部署试试。

硬件需求      

Model --load-4bit (DialogGen) GPU Peak Memory GPU
DialogGen + Hunyuan-DiT 32G A100
DialogGen + Hunyuan-DiT 22G A100
Hunyuan-DiT - 11G A100
Hunyuan-DiT - 14G RTX3090/RTX4090

说明文档中对于GPU的要求,最少需要一张14G的3090或4090才能运行。

下载代码

          进入到https://g

本文标签: 腾讯 模型 最强 文生图大 DiT