未来会支持混合图文数据的多模态增量预训练吗？ #7581

windn0 · 2025-04-03T01:49:32Z

Reminder

I have read the above rules and searched the existing issues.

Description

感谢作者们为Llama-Factory的贡献！
我在阅读预训练的dataset格式的时候发现，增量预训练只支持text文本数据，阅读大量issue后感觉目前应该是不支持多模态增量预训练的。
所以想问：
1、多模态大模型是否需要通过增量预训练来学习某一个领域的知识？增量预训练是否需要图文混合？
2、假如我想增量预训练一个多模态大模型，目前的方法是否只能是先用纯文本数据增量预训练，然后再做图文混合的微调？
3、未来是否会支持混合图文的增量预训练呢？
4、目前的项目如果做修改以支持图文混合增量预训练，我自己修改麻烦吗？大概需要修改哪些地方？

Pull Request

No response

windn0 added enhancement New feature or request pending This problem is yet to be addressed labels Apr 3, 2025

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

未来会支持混合图文数据的多模态增量预训练吗？ #7581

未来会支持混合图文数据的多模态增量预训练吗？ #7581

windn0 commented Apr 3, 2025

未来会支持混合图文数据的多模态增量预训练吗？ #7581

未来会支持混合图文数据的多模态增量预训练吗？ #7581

Comments

windn0 commented Apr 3, 2025

Reminder

Description

Pull Request