- 预训练模型准备
- 模型加载与量化参数设置
- 加载模型与分词器
- 训练数据准备
- 数据预处理与特征工程
- 微调参数配置
- 训练参数设置
- 模型微调(训练)
- 确认模型架构,Transformers 或其它架构,不同模型架构,用于加载的库也不一样
- 配置模型加载参数(如4bit/8bit量化、float16等)。
- 加载预训练模型和对应的分词器。
- 数据集收集、格式转换为DataFrame/Dataset等。
- 数据清洗、格式化、prompt构建、tokenization等。
- 设置训练参数(如batch size、learning rate、epoch数、LoRA参数等)。
- 使用Trainer等工具进行模型微调。
- 评估与验证
- 在验证集/测试集上评估模型效果(可选但推荐)。
- 模型保存与导出
- 保存微调后的模型和分词器。
- 模型推理与部署
- 用新数据做推理,或部署到线上服务。