목차

1

밑바닥부터 만들면서 배우는 LLM 2장 독서 후기

힘센캥거루

2025년 10월 19일(수정됨)

1분

1

29

밑바닥부터 만들면서 배우는 LLM 2장 독서 후기-1

벌써 챌린지 참여 2주차.

어제 까지만 해도 2장을 못 끝냈는데, 1박 2일 연수를 온 김에 12시까지 코딩해보면서 겨우 진도를 맞췄다.

1. 내용

2장의 내용은 단어의 토큰화, 인코딩, 디코딩, 임베딩 벡터가 중심이었다.

원핫 인코더를 만들어봐서 다른건 익숙했지만, 임베딩 벡터 자체는 내용이 새로웠다.

원핫 인코더는 단어마다 3차원 행렬을 만들어 그 부분을 1로 만들어 주는데 임베딩 벡터는 x, y, z 와 같은 3차원 상의 벡터로 나타냈다.

밑바닥부터 만들면서 배우는 LLM 2장 독서 후기-2

2. 질문

임베딩 벡터를 할 때는 질문이 계속 생겼다.

왜 임베딩을 초기에 seed를 이용해 겹치지 않는 난수로 만들지?
행렬 자체는 2차원 같은데 왜 3차원이라고 하지?
토큰 임베딩과 위치 임베딩을 더해주는 이유는 뭐지?

이런 질문들은 Chat-GPT로 해결했다.

밑바닥부터 만들면서 배우는 LLM 2장 독서 후기-3

임베딩 벡터가 단어를 찾는 딕셔너리 같은 역할을 한다.

초기에 임베딩에 seed를 주어 램던한 함수를 주는 것은 좌표계 상에서 단어들의 위치가 다르게 흩뿌려 주는 것이다.

그리고 같은 seed로 임베딩을 만들면, 그 임베딩은 초기에 있던 임베딩과 같으므로 단어의 위치와 동일하게 된다.

따라서 토큰 임베딩과 위치 임베딩을 더하면 해당 단어의 특징과 문맥이 함께 나타나는 것이다.

3. 후기

Vercel AI SDK에서 막연하게 임베딩 벡터에 대해 봤었는데 이제 확실하게 이해하게 되었다.

수학적으로 표현하고자 하면 상당히 어렵지만, 그 뜻을 이해한다면 더 쉽게 다가갈 수 있을 것 같다.

앞으로도 꾸준히 해볼 예정이다.

관련 글

2026년 동국대학교 미래사회 교원역량 강화 포럼 오프라인 참여 후기

2026년 동국대학교 미래사회 교원역량 강화 포럼 오프라인 참여 후기

어느 선생님이 재미있어 보이는 연수를 하나 소개시켜 주셨다.동국대에서 진행하는 AI 관련 연수였다.AI인 것도 좋인데 연수가 호텔에서?이건 무조건 가야 한다 싶었다.해당일 연수가 열리자 마자 신청해서 오프라인으로 참석하게 되었다.1. 앰배서더 서울 풀만 호텔처음에는 접...

글로벌숙련기술진흥원 특수분야 교육연수 - 목공 연수 후기

글로벌숙련기술진흥원 특수분야 교육연수 - 목공 연수 후기

아는 선생님이 인천에서 하는 숙박형 목공 연수가 있다고 하셨다.그리고 그 중에서도 김장회 명장님 수업을 꼭 들어야 한다며...!그래서 다 같이 신청하게 되었다.1. 신청 방법, 그리고 위치한국산업인력공단 글로벌숙련기술진흥원 직업훈련플랫폼 STEP을 아래에 링크해 둔다....

화이트햇 해커를 꿈꾸는 이들을 위한 해킹 입문서 해킹 맛보기 독서 후기

화이트햇 해커를 꿈꾸는 이들을 위한 해킹 입문서 해킹 맛보기 독서 후기

홈서버를 운영하면서 가장 중요한 것은 보안이었다.아무리 웹 사이트 기능을 마음에 들게 구축해도, 사방에서 들어오는 해킹에 한번 당하고 나니 무용지물이었다.지난번에 해킹으로 3일 동안 털릴때는 정말 무서웠다.그래서 해킹에 대해 공부해보기로 했다.유튜브에서 해킹 맛보기라는...

교사를 위한 교육연구 및 통계분석 연수 - 21~30차시 정리, 그리고 후기 등

교사를 위한 교육연구 및 통계분석 연수 - 21~30차시 정리, 그리고 후기 등

오늘은 교사를 위한 교육연구 및 통계분석 연구의 21~30차시에서 기억나는 내용과 후기를 남겨보려고 한다.1. logit(로짓)과 로지틱스 회귀분석처음에 로지틱스 회귀분석이라길래 뭔가 대단한것인줄 알았는데, 알고보니 로짓을 따라가는 선형 회귀분석이었다.예전에 LLM을 ...

교사를 위한 교육연구 및 통계분석 연수 - 13~20차시 R 실습 모음

교사를 위한 교육연구 및 통계분석 연수 - 13~20차시 R 실습 모음

이전에는 파이썬을 할 줄 아는데 굳이 R을 배워야 하는가에 대한 의문이 있었다.이번 연수를 들으며, 연구할 때 굳이 파이썬을 쓸 필요가 없다는 것을 깨닫게 되었다.파이썬 같으면 numpy로 선형회귀하고, 그래프 그리고, P value 구하고 다 해야 하지만 R은 lm과...

교사를 위한 교육연구 및 통계분석 연수 - 10~12차시 결정계수, 중다회귀분석 등

교사를 위한 교육연구 및 통계분석 연수 - 10~12차시 결정계수, 중다회귀분석 등

매일 1차시마다 후기를 썼는데, 생활기록부도 쓰고 이것도 하고 하다보니 매일 밤잠을 줄여야 했다.이렇게 하다가는 몸이 남아나지 않겠다는 생각에 몰아서 쓰기로 했다.1. 단순회귀모형 - 결정계수단순회귀모형에서 단순히 선형회귀 곡선이나, 계수만으로는 데이터의 형태를 알 수...

댓글을 불러오는 중...