从零开始构建中学习 LLM 第 6 章读后感

第 6 章是为分类进行微调。

作为例子给出的任务是构建垃圾邮件分类器。

垃圾邮件分类器需要判断一封邮件是不是垃圾邮件，因此输出结果要是类似 0、1 这样的值。

1. 微调的顺序

微调的过程和训练模型的过程很相似。

准备数据集，加载权重值，然后进行训练和评估。

稍微不同的一点是，会有一个把输出层映射到 0（非垃圾）和 1（垃圾）的过程。

在这样得到的张量中，基于包含信息最多的最后一个张量来输出是否为垃圾邮件。

最后使用交叉熵来计算损失。

将数据划分为训练数据和验证数据，通过多次 epoch 进行学习。

训练精度和验证精度保持接近，说明在训练和验证过程中表现出相似的精度。

也就是说，没有出现过拟合迹象。

现在就可以利用这个模型来区分垃圾邮件了。

我的 Mac mini 连跑 1.2B 模型都很吃力，但如果可能的话，总觉得如果能训练 LLM，就可以做很多事情。

也在考虑明年写论文的时候要不要用这个试一试。

得赶紧把书看完，然后再开始好好学 PyTorch。