1

Reseña del capítulo 2 de LLM construyendo desde cero

힘센캥거루
2025년 10월 19일(수정됨)
1
1
29
Reseña del capítulo 2 de LLM construyendo desde cero-1

Ya es la segunda semana participando en el desafío.

Hasta ayer no había terminado el capítulo 2, pero aprovechando un retiro de 1 noche y 2 días, logré avanzar hasta la medianoche codificando.

1. Contenido

El contenido del capítulo 2 se centró en la tokenización de palabras, codificación, decodificación y vectores de incrustación.

Ya me había familiarizado con crear un codificador one-hot, pero el contenido de los vectores de incrustación era nuevo para mí.

El codificador one-hot crea una matriz tridimensional para cada palabra y establece esa parte en 1, mientras que los vectores de incrustación se representan como vectores en un espacio tridimensional como x, y, z.

Reseña del capítulo 2 de LLM construyendo desde cero-2

2. Preguntas

Al trabajar con vectores de incrustación, surgieron varias preguntas.

  • ¿Por qué inicialmente los vectores de incrustación se crean como números aleatorios no sobrepuestos usando una seed?

  • ¿Por qué se dice que la matriz es tridimensional si parece bidimensional?

  • ¿Cuál es la razón para sumar la incrustación de tokens con la incrustación de posiciones?

Resolví estas preguntas usando Chat-GPT.

Reseña del capítulo 2 de LLM construyendo desde cero-3

El vector de incrustación actúa como un diccionario para encontrar palabras.

Inicialmente dar una seed al vector de incrustación asigna una función aleatoria para dispersar las ubicaciones de las palabras en el sistema de coordenadas.

Y si generas la incrustación con la misma seed, será igual a la incrustación inicial, haciendo que la posición de las palabras sea la misma.

Por lo tanto, al sumar la incrustación de tokens con la incrustación de posiciones, se muestran las características de la palabra junto con el contexto.

3. Reseña

Había visto vagamente sobre vectores de incrustación en el Vercel AI SDK, pero ahora lo entiendo claramente.

Si se intenta expresar matemáticamente puede ser bastante complicado, pero al comprender el significado, se puede abordar más fácilmente.

Tengo la intención de continuar consistentemente.

관련 글

Automatización de tareas escolares: revisión del boletín de vida escolar con IA – Detalles de competencias por asignatura
Automatización de tareas escolares: revisión del boletín de vida escolar con IA – Detalles de competencias por asignatura
Si tuviera que escoger la tarea más insignificante, dura y aburrida en la escuela, elegiría la revisión del boletín de vida escolar.En secundaria el b...
Reseña de lectura y experiencia del desafío del capítulo 7 de "밑바닥부터 만들면서 배우는 LLM"
Reseña de lectura y experiencia del desafío del capítulo 7 de "밑바닥부터 만들면서 배우는 LLM"
El contenido del capítulo 7 trata sobre el proceso de ajustar finamente el modelo para que siga instrucciones.Es hacer que responda como se espera ant...
Reseña de lectura del capítulo 6 de "Aprendiendo LLM desde cero"
Reseña de lectura del capítulo 6 de "Aprendiendo LLM desde cero"
El capítulo 6 trata sobre el fine-tuning para clasificación.El ejemplo que aparece es la creación de un clasificador de spam.Como el clasificador de s...
Reseña de lectura del capítulo 5 de «Aprender LLM construyéndolo desde cero»
Reseña de lectura del capítulo 5 de «Aprender LLM construyéndolo desde cero»
Hoy es 14 de diciembre.En realidad, el período del desafío ya terminó hace 2 semanas, pero aun así no podía renunciar a escribir la reseña.Porque esto...
Aprendiendo a crear un LLM desde cero – Reseña del capítulo 4
Aprendiendo a crear un LLM desde cero – Reseña del capítulo 4
Hoy es 26 de noviembre, así que si leo un capítulo al día, habré completado el reto.No sé si será posible con las interrupciones del primero y del seg...
Reseña de la lectura del capítulo 3 de LLM aprendiendo desde cero
Reseña de la lectura del capítulo 3 de LLM aprendiendo desde cero
Después de derramar agua sobre mi MacBook, entré en crisis y perdí alrededor de 3 a 4 días. Ahora que lo pienso, debería haber hecho algo, pensando que mi MacBook ya estaba arruinada y que la mandaría a reparar de todas formas. Aunque estoy un poco atrasado, quiero dejar mi reseña del capítulo 3 porque creo que debo continuar hasta el final. 1. Mecanismo de atención Capítulo 3...

댓글을 불러오는 중...