从零开始构建中学习 LLM 第 6 章读后感

힘센캥거루
2025년 12월 18일(수정됨)
2
challenge

第 6 章是为分类进行微调。

作为例子给出的任务是构建垃圾邮件分类器。

垃圾邮件分类器需要判断一封邮件是不是垃圾邮件,因此输出结果要是类似 0、1 这样的值。

1. 微调的顺序

从零开始构建中学习 LLM 第 6 章读后感-1

微调的过程和训练模型的过程很相似。

准备数据集,加载权重值,然后进行训练和评估。

稍微不同的一点是,会有一个把输出层映射到 0(非垃圾)和 1(垃圾)的过程。

在这样得到的张量中,基于包含信息最多的最后一个张量来输出是否为垃圾邮件。

最后使用交叉熵来计算损失。

2. 使用有监督学习数据对模型进行微调

从零开始构建中学习 LLM 第 6 章读后感-2

将数据划分为训练数据和验证数据,通过多次 epoch 进行学习。

训练精度和验证精度保持接近,说明在训练和验证过程中表现出相似的精度。

也就是说,没有出现过拟合迹象。

现在就可以利用这个模型来区分垃圾邮件了。

3. 后记

我的 Mac mini 连跑 1.2B 模型都很吃力,但如果可能的话,总觉得如果能训练 LLM,就可以做很多事情。

也在考虑明年写论文的时候要不要用这个试一试。

得赶紧把书看完,然后再开始好好学 PyTorch。

댓글을 불러오는 중...