这是一个开源的高性能视频生成工具,支持最先进的模型,并显著提升推理速度!
核心技术:采用一致性蒸馏(Consistency Distillation, CD)技术,这是首次在视频扩散Transformer(DiT)上开源的完整CD方案。
FastVideo 目前提供:(未来将提供更多)
- FastHunyuan 和 FastMochi:一致性提炼视频扩散模型,可将推理速度提高 8 倍。
- 首次公开基于PCM的视频 DiT 蒸馏配方。
- 支持提取/微调/推理最先进的开放视频 DiT:1. Mochi 2. Hunyuan。
- 通过 FSDP、序列并行和选择性激活检查点进行可扩展训练,并接近线性扩展到 64 个 GPU。
- 使用 LoRA、预计算潜在和预计算文本嵌入进行内存高效微调。
项目:github.com/hao-ai-lab/FastVideo
上一篇:OpenAI重磅发布o3!再次突破AI极限,北大校友参与研发
下一篇:已经是最后一篇