微信扫码
添加专属顾问
我要投稿
Firefly[1]是一个开源的大模型训练项目,支持对主流的大模型进行预训练、指令微调和DPO,包括但不限于Qwen2、Yi-1.5、Llama3、Gemma、Qwen1.5、MiniCPM、MiniCPM3、Llama、InternLM、Baichuan、ChatGLM、Yi、Deepseek、Qwen、Orion、Ziya、Xverse、Mistral、Mixtral-8x7B、Zephyr、Vicuna、Bloom等。 本项目支持全量参数训练、LoRA、QLoRA高效训练,支持预训练、SFT、DPO。 如果你的训练资源有限,极力推荐使用QLoRA进行指令微调,因为我们在Open LLM Leaderboard上验证了该方法的有效性,并且取得了非常不错的成绩。
本项目主要内容如下:
Firefly官方基于该项目的训练代码,以及训练数据,训练并开源了以下模型权重。
如下模型是官方在Firefly代码上训练的,训练脚本可以源码目录找到:train_args[4]
中文模型:
| firefly-baichuan2-13b[5] | ||
| firefly-baichuan-13b[6] | ||
| firefly-qwen-7b[7] | ||
| firefly-chatglm2-6b[8] | ||
| firefly-internlm-7b[9] | ||
| firefly-baichuan-7b[10] | ||
| firefly-ziya-13b[11] | ||
| firefly-bloom-7b1[12] | ||
| firefly-bloom-2b6-v2[13] | ||
| firefly-bloom-2b6[14] | ||
| firefly-bloom-1b4[15] |
英文模型:
| firefly-mixtral-8x7b[16] | ||
| firefly-llama-30b[17] | ||
| firefly-llama-13-v1.2[18] | ||
| firefly-llama2-13b[19] | ||
| firefly-llama-13b-v1.2[20] | ||
| firefly-llama-13b[21] |
扩展项目:
Firefly整理了如下指令集,并整理成统一的数据集格式:
| firefly-train-1.1M[24] | |
| moss-003-sft-data[25] | |
| ultrachat[26] | |
| WizardLM_evol_instruct_V2_143k[27] | |
| school_math_0.25M[28] | |
| shareAI/CodeChat[29] | |
| shareAI/ShareGPT-Chinese-English-90k[30] | |
| ultrachat_200k[31] | |
| ultrafeedback_binarized[32] |
train_args目录下存储了不同模型使用不同训练方式的配置文件,主要参数说明如下:
以下几个参数,当使用QLoRA训练的时候,需要设置:
关于deepspeed的参数配置,可按需自行修改。
训练脚本
全量参数预训练,将{num_gpus}替换为显卡数量:
deepspeed --num_gpus={num_gpus} train.py --train_args_file train_args/pretrain/full/bloom-1b1-pretrain-full.json
全量参数指令微调,将{num_gpus}替换为显卡数量:
deepspeed --num_gpus={num_gpus} train.py --train_args_file train_args/sft/full/bloom-1b1-sft-full.json
单卡QLoRA预训练:
python train.py --train_args_file train_args/pretrain/qlora/yi-6b-pretrain-qlora.json
单卡QLoRA指令微调:
python train.py --train_args_file train_args/sft/qlora/yi-6b-sft-qlora.json
多卡QLoRA预训练:
torchrun --nproc_per_node={num_gpus} train.py --train_args_file train_args/pretrain/qlora/yi-6b-pretrain-qlora.json
多卡QLoRA指令微调:
torchrun --nproc_per_node={num_gpus} train.py --train_args_file train_args/sft/qlora/yi-6b-sft-qlora.json
单卡QLoRA进行DPO训练:
python train.py --train_args_file train_args/sft/qlora/minicpm-2b-dpo-qlora.json
❝更详细的训练及推理使用说明,可以查看官网。
预训练时,我们采用经典的自回归损失,即每个位置的token都会参与loss计算。
指令微调时,仅计算assistant回复部分的loss。
❝这点还是蛮重要的,在一些训练框架中,不会提及也不会如此设计。
我个人接触这个库比较早,之前也算是用过,但后面选型用的还是LLaMA-Factory;现在深入的再了解对比,其实个人玩LLM的话,还是可以考虑Firefly。首先,对比较于LLaMA-Factory,Firefly官方开发人员基于此项目训练了一批LLM,从数据集到训练脚本参数,都是慢慢的提供了,这在我看来是实实在在的开源了。对于学生或是个人了解LLM的训练过程来说,是一个很好的参考。其次的话,看过一些issue,包括我自己之前也写过几篇关于Firefly训练效率的文章,在训练效率和效果上的确是要比LLaMA-Factory要好一些。前段时间,Firefly官方发布了基于Firefly与QWen知识蒸馏的文章,但还没把代码放出来,如果能放出来的话,那更好了。不过最大的劣势则是对模型的支持没有LLaMA-Factory齐全,且维护更新、解决issue并没有那么活跃。
对于学生、业余爱好者来说,推荐从Firefly入手训练模型,再可以过渡到LLaMA-Factory那边去使用,在Firefly的训练中,可以接触到更多的训练细节与实践。
53AI,企业落地大模型首选服务商
产品:场景落地咨询+大模型应用平台+行业解决方案
承诺:免费POC验证,效果达标后再合作。零风险落地应用大模型,已交付160+中大型企业
2026-05-07
本地4B开源模型,把任何App当Skill用!告别token焦虑,私密性强~
2026-05-07
Browser Use 0.12 杀疯了!弃用 Playwright,token 用量减半
2026-05-07
本地部署这件事,终于被国产开源AI做明白了!
2026-05-07
多模型管理太麻烦?手把手教你本地搭建这个开源 AI 网关!
2026-05-06
Ollama 换引擎,苹果 M5 封神了
2026-05-06
DeepSeek V4 Pro桌面应用来了:1.6T参数,MIT协议开源
2026-05-04
开源!OpenClaw 桌面版 v0.4.0,对话、文件、模型与工具配置全面升级
2026-04-29
海外著名投资人的内部 AI 工具,才是真干货
2026-03-30
2026-04-03
2026-03-23
2026-04-09
2026-03-31
2026-02-14
2026-02-18
2026-03-03
2026-02-22
2026-04-01
2026-04-22
2026-04-21
2026-04-15
2026-04-09
2026-04-01
2026-03-17
2026-03-13
2026-03-02