Kohya 对 FLUX LoRA (B GPU) 和 DreamBooth / Fine-Tuning (B GPU) 训练带来了巨大改进

ID:21524 / 打印

您可以下载所有配置和完整说明

https://www.patreon.com/posts/112099700 - 微调帖子 https://www.patreon.com/posts/110879657 - LoRA 帖子

Kohya 对 FLUX LoRA 和 DreamBooth / Fine-Tuning(最低 6GB GPU)训练带来了巨大的改进。

现在低至 4GB GPU 就可以以良好的质量训练 FLUX LoRA,24GB 及以下 GPU 在进行 Full DreamBooth / Fine-Tuning 训练时获得了巨大的速度提升

您至少需要 4GB GPU 才能进行 FLUX LoRA 训练,至少需要 6GB GPU 才能进行 FLUX DreamBooth / Full Fine-Tuning 训练。真是令人兴奋。

您可以在 > 下载所有配置和完整说明 https://www.patreon.com/posts/112099700

上面的帖子还提供了适用于 Windows、RunPod 和 Massed Compute 的一键安装程序和下载程序

模型下载器脚本也已更新,在 Massed Compute 上下载 30+GB 模型总共需要 1 分钟

您可以在这里阅读最近的更新:https://github.com/kohya-ss/sd-scripts/tree/sd3?tab=readme-ov-file#recent-updates

这是 Kohya GUI 分支:https://github.com/bmaltais/kohya_ss/tree/sd3-flux.1

减少 VRAM 使用的关键是使用块交换

Kohya 实现了 OneTrainer 的逻辑,显着提高了块交换速度,现在也支持 LoRA

现在您可以在 24 GB 及以下 GPU 上使用 LoRA 进行 FP16 训练

现在您可以在 4 GB GPU 上训练 FLUX LoRA - 关键是 FP8、块交换和使用某些层训练(记住单层 LoRA 训练)

我花了 1 天多的时间来测试所有较新的配置、它们的 VRAM 需求、它们的相对步进速度并准备配置:)

Kohya 对 FLUX LoRA (B GPU) 和 DreamBooth / Fine-Tuning (B GPU) 训练带来了巨大改进

Kohya 对 FLUX LoRA (B GPU) 和 DreamBooth / Fine-Tuning (B GPU) 训练带来了巨大改进

上一篇: 批量、小批量和随机梯度下降
下一篇: Jieba分词效果不佳怎么办?如何提升中文分词的准确性和有效性?

作者:admin @ 24资源网   2025-01-14

本站所有软件、源码、文章均有网友提供,如有侵权联系308410122@qq.com

与本文相关文章

发表评论:

◎欢迎参与讨论,请在这里发表您的看法、交流您的观点。