我要投稿

飞桨 AI Studio：一步步微调你的大模型

发布日期：2025-07-28 10:21:08 浏览次数： 2621

作者：小数据不简单

微信搜一搜，关注“小数据不简单”

飞桨 (PaddlePaddle) 是百度自研的深度学习平台，集深度学习核心训练和推理框架、基础模型库、端到端开发套件和丰富的工具组件于一体，对标国外的 Pytorch 和 Tensorflow。

由于飞桨各个模块组件更偏底层，为了方便 AI 学习者和开发者在线使用、训练、部署各种模型，基于飞桨平台百度又推出了 AI Studio（https://aistudio.baidu.com/index）。AI Studio 是一个集教学资源、算力、开发工具和社区生态于一体的在线 AI 模型开发平台，对标国外的 HuggingFace，其实国内也有类似的社区平台 modelscope（https://www.modelscope.cn/home）。顺带一提，百度还有一个历史悠久的千帆平台，也可以满足大模型在线训练和使用。

进到 AI Studio 首页之后，最重要的是要点击右上角的小电脑图标，它显示了你拥有的算力信息，选择预训练模型时，也要注意算力和 Paddle 版本的对应关系，比如选用 Tesla V100 显卡，算力只有 7.0，支持不了最新版 Paddle 的一些底层函数，建议选择 A / H100 以上的显卡。

数据准备

ERNIE 支持 alpaca 和 erniekit 两种数据集格式。alpaca 格式是 HuggingFace 社区流行的一种对话式监督数据格式，采用 JSON 行格式，强调 instruction（指令）+ input + output。ERNIEKit 格式是百度 PaddlePaddle 社区用于训练 ERNIE 模型的格式，更注重内部结构化字段。

本次微调我们使用 erniekit 格式，源数据来自百度 2025LIC 赛事的示例数据（https://aistudio.baidu.com/datasetdetail/345031），经过清洗之后，格式如下图所示。

数据准备好之后，我们就可以开始下一步微调（finetune）大模型了，我们这次选用的预训练模型是文心大模型 4.5 开源系列中最小的大模型 ERNIE-4.5-0.3B，总大小 700M 左右。

如何微调一个模型

1.安装 PaddlePaddle GPU 版本

首先，安装适配 CUDA 12.6 的 PaddlePaddle GPU 版本（3.1.0），并使用中国镜像源以加速下载。如果你还不确定你电脑的 CUDA 版本，可以使用nvidia-smi查看。

!python -m pip install paddlepaddle-gpu==3.1.0 -i https://www.paddlepaddle.org.cn/packages/stable/cu126/

# 检验是否安装成功
!python -c "import paddle;paddle.utils.run_check()"

2.安装 ERNIE

ERNIE 是百度在 PaddlePaddle 上开发的一个中文为主的预训练语言模型，文心一言后面的大模型就是 ERNIE。

!git clone https://github.com/PaddlePaddle/ERNIE.git

%cd ERNIE-develop
!python -m pip install -r requirements/gpu/requirements.txt 
!python -m pip install -e .

3.安装 FastDeploy

FastDeploy 是百度开发的一个模型部署工具，可以快速启动一个带有大模型后端的 Web 服务。

!python -m pip install fastdeploy-gpu -i https://www.paddlepaddle.org.cn/packages/stable/fastdeploy-gpu-80_90/ --extra-index-url https://mirrors.tuna.tsinghua.edu.cn/pypi/web/simple

4.下载预训练模型

接着需要下载 ERNIE-4.5-0.3B 模型。这里需要额外安装 aistudio-sdk Python 包，这个下载服务并未集成在 ERNIE 的安装包中，这一点确实有些令人费解。

!pip install --upgrade aistudio-sdk
# 使用aistudio cli下载模型（推荐）
!aistudio download --model PaddlePaddle/ERNIE-4.5-0.3B-Paddle --local_dir baidu/ERNIE-4.5-0.3B-Paddle

5.修改配置文件

修改配置文件，使用官方的模版就行，改一下参数train_dataset_path和eval_dataset_path，其他保持不变。

### data
train_dataset_type:"erniekit"
eval_dataset_type:"erniekit"
train_dataset_path:"./examples/data/finetune_train_dataset.jsonl"
train_dataset_prob:"1.0"
eval_dataset_path:"./examples/data/finetune_eval_dataset.jsonl"
eval_dataset_prob:"1.0"
max_seq_len:8192
num_samples_each_epoch:6000000

### model
model_name_or_path:baidu/ERNIE-4.5-0.3B-Paddle
fine_tuning:LoRA
fuse_rope:True
use_sparse_head_and_loss_fn:True

### finetuning
# base
stage:SFT
seed:23
do_train:True
do_eval:True
distributed_dataloader:False
dataloader_num_workers:1
batch_size:1
num_train_epochs:1
max_steps:100
max_evaluate_steps:10000
eval_steps:10000
evaluation_strategy:steps
save_steps:10000000
save_total_limit:5
save_strategy:steps
logging_steps:1
release_grads:True
gradient_accumulation_steps:8
logging_dir:./vdl_log
output_dir:./output
disable_tqdm:True

# train
warmup_steps:20
learning_rate:1.0e-5
lr_scheduler_type:cosine
min_lr:1.0e-6
layerwise_lr_decay_bound:1.0

# optimizer
weight_decay:0.1
adam_epsilon:1.0e-8
adam_beta1:0.9
adam_beta2:0.95
offload_optim:True

# performance
tensor_parallel_degree:1
pipeline_parallel_degree:1
sharding_parallel_degree:1
sharding:stage1
sequence_parallel:True
pipeline_parallel_config:enable_delay_scale_lossenable_release_gradsdisable_partial_send_recv
recompute:False
recompute_use_reentrant:True
compute_type:bf16
fp16_opt_level:O2
disable_ckpt_quant:True
amp_master_grad:True
amp_custom_white_list:
-lookup_table
-lookup_table_v2
-flash_attn
-matmul
-matmul_v2
-fused_gemm_epilogue
amp_custom_black_list:
-reduce_sum
-softmax_with_cross_entropy
-c_softmax_with_cross_entropy
-elementwise_div
-sin
-cos
unified_checkpoint:True
unified_checkpoint_config:async_save

6.开始微调与模型导出

微调的方法有很多，这里我们使用 LoRA（低秩适配），主要因为这次训练使用的训练集比较少。

实际结果跑下来，一共 2629 条训练数据，花了大概 3 分钟就训练完了

!erniekit train examples/configs/ERNIE-4.5-0.3B/sft/run_sft_lora_8k.yaml
!erniekit export examples/configs/ERNIE-4.5-0.3B/run_export.yaml lora=True

7.部署模型

模型微调并导出后，即可进行部署。

!erniekit server examples/configs/ERNIE-4.5-0.3B/run_chat.yaml
!erniekit chat examples/configs/ERNIE-4.5-0.3B/run_chat.yaml

微调效果展示

微调前，模型在回答医疗相关问题时显得有些冗长。经过训练后，面对同样的问题，模型的回答风格变得更加简洁干脆。当然，也有一些问题的回答仍有待提升。

使用体验

在 AI Studio 平台进行开发时，建议选择在线VS Code开发模式。如果使用在线 Notebook，可能会频繁遇到文件找不到等服务不稳定的情况。

尽管平台提供了在线学习资源，但许多教程内容过于简化，甚至有些项目不兼容 macOS 系统（例如 PP - ASR），部分视频资源的音量也忽大忽小，整体使用体验不尽如人意。

不过，抛开这些产品体验，具体函数的执行效果上，还是不错的。百度似乎仍在坚持 “技术狂奔，产品拉胯” 的发展路径。

53AI，企业落地大模型首选服务商

产品：场景落地咨询+大模型应用平台+行业解决方案

承诺：免费POC验证，效果达标后再合作。零风险落地应用大模型，已交付160+中大型企业

相关资讯

2025-12-11

左脚踩右脚：大模型的有趣且简单的微调方式“SHADOW-FT”

2025-12-11

大模型训练的高效内存解决方案：流水线感知的细粒度激活卸载，实现显存开销与吞吐性能的联合最优

2025-12-08

一杯咖啡成本搞定多模态微调：FC DevPod + Llama-Factory 极速实战

2025-12-04

OpenAI公开新的模型训练方法：或许能解决模型撒谎问题，已在GPT-5 thiking验证

2025-11-23

微调Rerank模型完整指南

2025-11-22

大模型微调全流程实战指南：基于IPO框架的深度解析与优化

2025-11-21

AI基础 | Qwen3 0.6B 微调实现轻量级意图识别

2025-11-20

从零开始：手把手教你微调Embedding模型，让检索效果提升10倍！

了解更多

160+中大型企业正在使用53AI

立即咨询预约演示

把握AI发展的机遇，共同探索、共同进步

2025-01-22

如何打造基于GenAI的员工服务机器人

2025-01-22

热点资讯

微调已死？Google 和斯坦福论文指出AI 学习新范式

2025-10-12

用Macbook微调Qwen3！手把手教你用微调给Qwen起一个新名字

2025-10-14

从零教你微调一个专属领域大模型，看完小白也能学会炼丹!（完整版）

2025-10-21

一位淘宝工程同学的大模型LoRA微调尝试

2025-09-24

在Colab中微调Qwen3-4B模型实战指南

2025-09-20

如何将 AI 代码采纳率从30%提升到80%？

2025-09-25

基于昇腾NPU的Qwen3量化因子代码生成微调实战

2025-11-05

2张4090竟能本地微调万亿参数Kimi K2！趋境联合清华北航把算力门槛击穿了

2025-11-05

AI基础 | Qwen3 0.6B 微调实现轻量级意图识别

2025-11-21

OpenAI公开新的模型训练方法：或许能解决模型撒谎问题，已在GPT-5 thiking验证

2025-12-04

大家都在问

LoAR做Fine-Tuning微调原理到底是什么？

2025-11-19

如何将 AI 代码采纳率从30%提升到80%？

2025-09-25

大模型微调，为什么99%的企业都不应该碰这个坑？

2025-06-20

万不得已，不要对 LLM 进行微调？

2025-06-17

可以将任何符合OpenAPI规范的接口转 MCP Server吗？

2025-05-21

OpenAI发布GPT-4.1系列模型，对行业最大吸引力是什么？

2025-05-17

私有部署大模型需要多少显存？

2025-05-14

软件公司如何为AI的下半场做准备？

2025-05-10

热门标签

内容创作大模型技术个人提效 langchain llamaindex 多模态技术 RAG技术智能客服知识图谱模型微调 RAGFlow coze Dify Fastgpt Bisheng Qanything AI+汽车 AI+金融 AI+工业 AI+培训 AI+SaaS 提示词框架提示词技巧 AI+电商 AI面试数字员工 ChatBI AI知识库开源大模型智能营销智能硬件智能化改造 AI+医疗 MaxKB