Skip to content

squarezw/finetune

Repository files navigation

Fine Tune

  1. 预训练模型准备
  2. 模型加载与量化参数设置
  3. 加载模型与分词器
  4. 训练数据准备
  5. 数据预处理与特征工程
  6. 微调参数配置
  7. 训练参数设置
  8. 模型微调(训练)

1. 预训练模型准备

  • 确认模型架构,Transformers 或其它架构,不同模型架构,用于加载的库也不一样

2. 模型加载与量化参数设置

  • 配置模型加载参数(如4bit/8bit量化、float16等)。

3. 加载模型与分词器

  • 加载预训练模型和对应的分词器。

4. 训练数据准备

  • 数据集收集、格式转换为DataFrame/Dataset等。

5. 数据预处理与特征工程

  • 数据清洗、格式化、prompt构建、tokenization等。

6. 微调参数配置

  • 设置训练参数(如batch size、learning rate、epoch数、LoRA参数等)。

7. 模型微调(训练)

  • 使用Trainer等工具进行模型微调。

Optional Steps

  1. 评估与验证
  • 在验证集/测试集上评估模型效果(可选但推荐)。
  1. 模型保存与导出
  • 保存微调后的模型和分词器。
  1. 模型推理与部署
  • 用新数据做推理,或部署到线上服务。

About

RAGent

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published