1

밑바닥부터 만들면서 배우는 LLM 2장 독서 후기

힘센캥거루
2025년 10월 21일(수정됨)
1
1
29
밑바닥부터 만들면서 배우는 LLM 2장 독서 후기-1

벌써 챌린지 참여 2주차.

어제 까지만 해도 2장을 못 끝냈는데, 1박 2일 연수를 온 김에 12시까지 코딩해보면서 겨우 진도를 맞췄다.

1. 내용

2장의 내용은 단어의 토큰화, 인코딩, 디코딩, 임베딩 벡터가 중심이었다.

원핫 인코더를 만들어봐서 다른건 익숙했지만, 임베딩 벡터 자체는 내용이 새로웠다.

원핫 인코더는 단어마다 3차원 행렬을 만들어 그 부분을 1로 만들어 주는데 임베딩 벡터는 x, y, z 와 같은 3차원 상의 벡터로 나타냈다.

밑바닥부터 만들면서 배우는 LLM 2장 독서 후기-2

2. 질문

임베딩 벡터를 할 때는 질문이 계속 생겼다.

  • 왜 임베딩을 초기에 seed를 이용해 겹치지 않는 난수로 만들지?

  • 행렬 자체는 2차원 같은데 왜 3차원이라고 하지?

  • 토큰 임베딩과 위치 임베딩을 더해주는 이유는 뭐지?

이런 질문들은 Chat-GPT로 해결했다.

밑바닥부터 만들면서 배우는 LLM 2장 독서 후기-3

임베딩 벡터가 단어를 찾는 딕셔너리 같은 역할을 한다.

초기에 임베딩에 seed를 주어 램던한 함수를 주는 것은 좌표계 상에서 단어들의 위치가 다르게 흩뿌려 주는 것이다.

그리고 같은 seed로 임베딩을 만들면, 그 임베딩은 초기에 있던 임베딩과 같으므로 단어의 위치와 동일하게 된다.

따라서 토큰 임베딩과 위치 임베딩을 더하면 해당 단어의 특징과 문맥이 함께 나타나는 것이다.

3. 후기

Vercel AI SDK에서 막연하게 임베딩 벡터에 대해 봤었는데 이제 확실하게 이해하게 되었다.

수학적으로 표현하고자 하면 상당히 어렵지만, 그 뜻을 이해한다면 더 쉽게 다가갈 수 있을 것 같다.

앞으로도 꾸준히 해볼 예정이다.

관련 글

밑바닥부터 만들면서 배우는 LLM 7장 독서 후기 및 챌린지 후기
밑바닥부터 만들면서 배우는 LLM 7장 독서 후기 및 챌린지 후기
7장 내용은 지시를 따르도록 미세 튜닝하는 과정이다.어떤 질문에 대해 기대하는 응답을 하도록 하는 것.역시나 필요한 것은 데이터이다.1. 지시 미세 튜닝 절차여기서의 핵심은 질문-응답 데이터 셋을 준비하여 입력-출력 쌍으로 훈련시키는 것.이걸 프롬프트 스타일이라고 한다...
밑바닥부터 만들면서 배우는 LLM 6장 독서 후기
밑바닥부터 만들면서 배우는 LLM 6장 독서 후기
6장은 분류를 위한 미세 튜닝하기이다.예제로 나오는 것은 스팸 분류기 만들기.스팸 분류기는 이것이 스팸인지, 스펨이 아닌지를 분류하는 것이므로 출력의 결과가 0, 1과 같은 값으로 나와야 한다.1. 미세튜닝의 순서미세 튜닝의 과정은 모델을 훈련시키는 과정과 비슷하다.데...
밑바닥부터 만들면서 배우는 LLM 5장 독서 후기
밑바닥부터 만들면서 배우는 LLM 5장 독서 후기
오늘은 12월 14일이다.사실 챌린지 기간은 이미 2주나 지나 버렸지만, 그렇다고 후기를 포기할 순 없었다.이렇게 남기는 TIL이 나중에 피와 살이 되기 때문.코드 자체보다는 의미에 집중해서 적어보려고 한다.1. 모델의 손실 계산GPT 모델을 만든 후에 어떤 방식으로 ...
밑바닥부터 만들면서 배우는 LLM 4장 독서 후기
밑바닥부터 만들면서 배우는 LLM 4장 독서 후기
오늘이 11월 26일이니, 매일 1장식 독파하면 챌린지 성공이다.첫째와 둘째의 방해 속에서 가능할지 모르겠다.1. 더미 트랜스포머GPT 모델을 만들면서 파이토치에서 트랜스포머 더미 블록을 가져오는 것을 봤다.찾아보니 pytorch의 nn 안에는 이미 여러 트랜스포머 모...
밑바닥부터 만들면서 배우는 LLM 3장 독서 후기
밑바닥부터 만들면서 배우는 LLM 3장 독서 후기
맥북에 물을 한바가지 쏟은 후, 멘붕이 와서 3~4일 정도를 허비했다.지금 생각해보니 그냥 어차피 맥북은 나간거고, 수리 맡긴다고 생각하고 뭐라도 할걸 그랬나 싶다.어쨌든 조금 늦었지만, 그래도 끝까지 달려봐야 한다는 생각에 3장 후기를 남긴다.1. 어텐션 메커니즘3장...
맥북 유저를 위한 파이썬 OCR 추천
맥북 유저를 위한 파이썬 OCR 추천
학생들 진료 확인서 인식을 위해 안써본 OCR이 없는 것 같다.Tesseract, EasyOCR, PaddleOCR 등 다양한 OCR들을 써보았는데, 한글에 대해 만족할만한 성능을 가진 OCR이 없었다.그런데 최근에 맥북에 있는 라이브 텍스트 기능을 래핑한 파이썬 라이...

댓글을 불러오는 중...