Reseña de lectura del capítulo 6 de "Aprendiendo LLM desde cero"

힘센캥거루
2025년 12월 18일(수정됨)
1
9

El capítulo 6 trata sobre el fine-tuning para clasificación.

El ejemplo que aparece es la creación de un clasificador de spam.

Como el clasificador de spam debe determinar si algo es spam o no lo es, el resultado de la salida debe ser un valor como 0 o 1.

1. Orden del fine-tuning

Reseña de lectura del capítulo 6 de "Aprendiendo LLM desde cero"-1

El proceso de fine-tuning es similar al proceso de entrenamiento de un modelo.

Se prepara el conjunto de datos, se cargan los valores de los pesos, y luego se entrena y se evalúa.

La pequeña diferencia es que hay un proceso en el que la capa de salida se mapea a 0 (no es spam) y 1 (es spam).

Entre los tensores obtenidos, se utiliza el último tensor, que contiene la mayor cantidad de información, como base para producir la salida sobre si es spam o no.

Por último, la pérdida se calcula mediante entropía cruzada.

2. Fine-tuning del modelo con datos de aprendizaje supervisado

Reseña de lectura del capítulo 6 de "Aprendiendo LLM desde cero"-2

Se dividen los datos en datos de entrenamiento y datos de validación, y se entrenan a lo largo de varias épocas.

Que la exactitud de entrenamiento y la exactitud de validación se mantengan cercanas significa que muestran precisiones similares durante los procesos de entrenamiento y validación.

Esto implica que no hay señales de sobreajuste.

Ahora, usando esto, ya se puede distinguir el spam.

3. Reseña

Con mi Mac mini incluso ejecutar un modelo de 1.2B es bastante difícil, pero me hace pensar que, si fuera posible, podría entrenar un LLM y hacer muchas cosas con él.

También me planteo usarlo el año que viene cuando escriba un artículo.

Debería terminar de leer el libro pronto y, después de eso, empezar a aprender PyTorch.

관련 글

Reseña de lectura y experiencia del desafío del capítulo 7 de "밑바닥부터 만들면서 배우는 LLM"
Reseña de lectura y experiencia del desafío del capítulo 7 de "밑바닥부터 만들면서 배우는 LLM"
El contenido del capítulo 7 trata sobre el proceso de ajustar finamente el modelo para que siga instrucciones.Es hacer que responda como se espera ant...
Reseña de lectura del capítulo 5 de «Aprender LLM construyéndolo desde cero»
Reseña de lectura del capítulo 5 de «Aprender LLM construyéndolo desde cero»
Hoy es 14 de diciembre.En realidad, el período del desafío ya terminó hace 2 semanas, pero aun así no podía renunciar a escribir la reseña.Porque esto...
Aprendiendo a crear un LLM desde cero – Reseña del capítulo 4
Aprendiendo a crear un LLM desde cero – Reseña del capítulo 4
Hoy es 26 de noviembre, así que si leo un capítulo al día, habré completado el reto.No sé si será posible con las interrupciones del primero y del seg...
Reseña de la lectura del capítulo 3 de LLM aprendiendo desde cero
Reseña de la lectura del capítulo 3 de LLM aprendiendo desde cero
Después de derramar agua sobre mi MacBook, entré en crisis y perdí alrededor de 3 a 4 días. Ahora que lo pienso, debería haber hecho algo, pensando que mi MacBook ya estaba arruinada y que la mandaría a reparar de todas formas. Aunque estoy un poco atrasado, quiero dejar mi reseña del capítulo 3 porque creo que debo continuar hasta el final. 1. Mecanismo de atención Capítulo 3...
Reseña del capítulo 2 de LLM construyendo desde cero
Reseña del capítulo 2 de LLM construyendo desde cero
Ya es la segunda semana participando en el desafío. Hasta ayer no había terminado el capítulo 2, pero aprovechando un retiro de 1 noche y 2 días, logré avanzar hasta la medianoche codificando. 1. Contenido. El contenido del capítulo 2 se centró en la tokenización de palabras, codificación, decodificación y vectores de incrustación. Ya me había familiarizado con crear un codificador one-hot, pero el contenido de los vectores de incrustación era nuevo para mí...
Recomendación de OCR para MacBook
Recomendación de OCR para MacBook
Parece que he probado todos los OCR disponibles para reconocer informes médicos de estudiantes. Probé Tesseract, EasyOCR, PaddleOCR y otros, pero ninguno ofrecía un rendimiento satisfactorio con coreano. Sin embargo, recientemente encontré una biblioteca de Python que utiliza la función de Texto en Vivo de MacBook...

댓글을 불러오는 중...