1

ゼロから作りながら学ぶLLM第2章読書レビュー

힘센캥거루
2025년 10월 19일(수정됨)
1
1
29
ゼロから作りながら学ぶLLM第2章読書レビュー-1

すでにチャレンジ参加2週目。

昨日まで2章を終えていなかったが、1泊2日の研修に来て、12時までコーディングしながらようやく進度を合わせた。

1. 内容

2章の内容は単語のトークン化、エンコーディング、デコーディング、埋め込みベクトルが中心だった。

ワンホットエンコーダーを作ったことがあるので他のことは慣れていたが、埋め込みベクトル自体は新しい内容だった。

ワンホットエンコーダーは単語ごとに3次元行列を作りその部分を1にするが、埋め込みベクトルはx, y, zのような3次元上のベクトルで表された。

ゼロから作りながら学ぶLLM第2章読書レビュー-2

2. 質問

埋め込みベクトルを作成する時、質問が次々と生まれた。

  • なぜ埋め込みを初期にシードを利用して、重ならない乱数で作るのか?

  • 行列自体は2次元のようなのに、なぜ3次元と表現するのか?

  • トークン埋め込みと位置埋め込みを足す理由は何か?

これらの質問はChat-GPTで解決した。

ゼロから作りながら学ぶLLM第2章読書レビュー-3

埋め込みベクトルは単語を探す辞書のような役割をする。

初期に埋め込みにシードを与えてランダムな関数を与えるのは、座標系上で単語の位置を異なるようにばらまくためだ。

そして同じシードで埋め込みを作ると、その埋め込みは初期にあった埋め込みと同じになるため、単語の位置と同じになる。

したがってトークン埋め込みと位置埋め込みを足すとその単語の特徴と文脈が一緒に現れる。

3. レビュー

Vercel AI SDKで漠然と埋め込みベクトルについて見ていたが、今は確実に理解することができるようになった。

数学的に表現しようとするとかなり難しいが、その意味を理解すればより簡単にアプローチできそうだ。

今後も引き続きやってみる予定だ。

관련 글

学校業務の自動化 - AIを利用した生活記録簿チェック 教科別・特別記述編
学校業務の自動化 - AIを利用した生活記録簿チェック 教科別・特別記述編
学校で最も意味がなく、きつくて退屈な業務を一つ挙げろと言われたら、自分は生活記録簿(生徒指導要録)チェックを選ぶだろう。中学校では生活記録簿がそれほど重要ではないが、高等学校では入試と関係しているため非常に重要である。問題は、このような生活記録簿の点検で探すものが、せいぜい単純な誤字脱字、記載禁止用...
ゼロから作りながら学ぶ LLM 第7章 読書レビューとチャレンジの感想
ゼロから作りながら学ぶ LLM 第7章 読書レビューとチャレンジの感想
第7章の内容は、指示に従うように微調整するプロセスだ。ある質問に対して、期待する応答を返すようにすること。やはり必要なのはデータである。1. 指示微調整の手順ここでの要点は、質問と応答のデータセットを用意し、入力-出力のペアとして学習させること。これをプロンプトスタイルと呼ぶ。その他は以前のプロセス...
ゼロから作りながら学ぶ LLM 第6章 読書レビュー
ゼロから作りながら学ぶ LLM 第6章 読書レビュー
第6章は、分類のためのファインチューニングについてである。例として出てくるのは、スパム分類器の作成。スパム分類器は、あるメールなどがスパムかスパムでないかを分類するものなので、出力結果は 0 や 1 のような値になる必要がある。1. ファインチューニングの手順ファインチューニングのプロセスは、モデル...
ゼロから作りながら学ぶ LLM 第5章 読書レビュー
ゼロから作りながら学ぶ LLM 第5章 読書レビュー
今日は12月14日だ。実はチャレンジ期間はすでに2週間も過ぎてしまったが、だからといってレビューを書くのをあきらめることはできなかった。こうして残しておくTILが、あとで自分の血となり肉となるからだ。コードそのものよりも、その意味に集中して書いてみようと思う。1. モデルの損失計算GPTモデルを作っ...
ゼロから作りながら学ぶ LLM 第4章 読書レビュー
ゼロから作りながら学ぶ LLM 第4章 読書レビュー
今日は11月26日なので、毎日1章ずつ読み切ればチャレンジ成功だ。長男と次男の妨害の中で、それが可能かどうかは分からない。1. ダミー・トランスフォーマーGPTモデルを作りながら、PyTorchからトランスフォーマーのダミーブロックを持ってくる箇所を見た。調べてみると、PyTorch の nn の中...
ゼロから作りながら学ぶLLM第3章読書感想
ゼロから作りながら学ぶLLM第3章読書感想
MacBookに大量の水をこぼしてパニックになり、3〜4日無駄にした。今考えてみると、どうせMacBookは駄目になったし、修理に出すと思って何かをすればよかったと思う。とにかく少し遅れたけど、最後までやるべきだと思い、第3章の感想を残す。1. アテンションメカニズム3章...

댓글을 불러오는 중...