Reseña de Lectura del Capítulo 1 sobre Aprender LLM desde Cero

힘센캥거루
2025년 10월 13일(수정됨)
1
15
Reseña de Lectura del Capítulo 1 sobre Aprender LLM desde Cero-1

Aunque he asistido a muchas clases, siento que aprender de forma autodidacta se recuerda más y se aprende más.

Por eso, cuando escuché que se abría un desafío de lectura completa de 'Aprender LLM desde Cero' en Inflearn, me inscribí de inmediato.

Como descubrí la importancia de los algoritmos en la última vez en Háng Lái 99, espero aprender muchas cosas esta vez también.

1. Resumen del contenido

Resumiendo lo esencial del capítulo 1, el inicio del LLM parte de la estructura Transformer.

En la estructura Transformer, se codifica el idioma y se decodifica el idioma objetivo para obtener el idioma traducido.

El codificador es el proceso de tokenización y vectorización del lenguaje, y la decodificación es el proceso de salida del lenguaje.

Si se toma solo la decodificación y se convierte en un programa, se obtiene un servicio como GPT. GPT ejecuta el decodificador repetidamente hasta que la oración se completa.

Para crear este tipo de modelo de lenguaje, se necesitan datos de entrenamiento.

Se puede utilizar datos de entrenamiento de código abierto para crear un modelo y afinarlo para desarrollar diversos servicios de LLM.

2. Impresiones

Al leer el libro, pude entender con precisión la estructura del LLM.

BERT, que surgió al aprender sobre vectorización, One-Hot Encoding que se utilizó para la codificación, todos eran técnicas de vectorización de palabras.

Solo con aprender esto ya valió la pena participar en el desafío.

También planeo escribir sobre el capítulo 2 después de leerlo en detalle.

관련 글

Automatización de tareas escolares: revisión del boletín de vida escolar con IA – Detalles de competencias por asignatura
Automatización de tareas escolares: revisión del boletín de vida escolar con IA – Detalles de competencias por asignatura
Si tuviera que escoger la tarea más insignificante, dura y aburrida en la escuela, elegiría la revisión del boletín de vida escolar.En secundaria el b...
Reseña de lectura y experiencia del desafío del capítulo 7 de "밑바닥부터 만들면서 배우는 LLM"
Reseña de lectura y experiencia del desafío del capítulo 7 de "밑바닥부터 만들면서 배우는 LLM"
El contenido del capítulo 7 trata sobre el proceso de ajustar finamente el modelo para que siga instrucciones.Es hacer que responda como se espera ant...
Reseña de lectura del capítulo 6 de "Aprendiendo LLM desde cero"
Reseña de lectura del capítulo 6 de "Aprendiendo LLM desde cero"
El capítulo 6 trata sobre el fine-tuning para clasificación.El ejemplo que aparece es la creación de un clasificador de spam.Como el clasificador de s...
Reseña de lectura del capítulo 5 de «Aprender LLM construyéndolo desde cero»
Reseña de lectura del capítulo 5 de «Aprender LLM construyéndolo desde cero»
Hoy es 14 de diciembre.En realidad, el período del desafío ya terminó hace 2 semanas, pero aun así no podía renunciar a escribir la reseña.Porque esto...
Aprendiendo a crear un LLM desde cero – Reseña del capítulo 4
Aprendiendo a crear un LLM desde cero – Reseña del capítulo 4
Hoy es 26 de noviembre, así que si leo un capítulo al día, habré completado el reto.No sé si será posible con las interrupciones del primero y del seg...
Reseña de la lectura del capítulo 3 de LLM aprendiendo desde cero
Reseña de la lectura del capítulo 3 de LLM aprendiendo desde cero
Después de derramar agua sobre mi MacBook, entré en crisis y perdí alrededor de 3 a 4 días. Ahora que lo pienso, debería haber hecho algo, pensando que mi MacBook ya estaba arruinada y que la mandaría a reparar de todas formas. Aunque estoy un poco atrasado, quiero dejar mi reseña del capítulo 3 porque creo que debo continuar hasta el final. 1. Mecanismo de atención Capítulo 3...

댓글을 불러오는 중...