ゼロから作りながら学ぶ LLM 第6章 読書レビュー

힘센캥거루
2025년 12월 18일(수정됨)
1
9

第6章は、分類のためのファインチューニングについてである。

例として出てくるのは、スパム分類器の作成。

スパム分類器は、あるメールなどがスパムかスパムでないかを分類するものなので、出力結果は 0 や 1 のような値になる必要がある。

1. ファインチューニングの手順

ゼロから作りながら学ぶ LLM 第6章 読書レビュー-1

ファインチューニングのプロセスは、モデルを訓練するプロセスとよく似ている。

データセットを準備し、重みをロードしてから訓練し、評価する。

少し違う点は、出力層を 0(スパムではない)と 1(スパム)にマッピングする過程があること。

このように得られたテンソルのうち、最も多くの情報を含んでいる最後のテンソルに基づいて、スパムかどうかを出力するようにする。

最後に、損失はクロスエントロピーで算出する。

2. 教師あり学習データでモデルをファインチューニングする

ゼロから作りながら学ぶ LLM 第6章 読書レビュー-2

データを訓練データと検証データに分け、これを複数エポックにわたって学習させる。

訓練精度と検証精度が近い状態で維持されているということは、訓練と検証の過程で似たような精度を示しているということだ。

これは過学習の兆候がないという意味である。

これで、これを使ってスパムを見分けることができるようになった。

3. 感想

自分のMac miniでは 1.2B を回すだけでもきついが、もし可能なら LLM を訓練していろいろなことができるのではないかと思う。

来年論文を書くときに、これを使ってみようかという気持ちにもなる。

早く本を読み終えて、そのあとは PyTorch を身につけていきたい。

관련 글

ゼロから作りながら学ぶ LLM 第7章 読書レビューとチャレンジの感想
ゼロから作りながら学ぶ LLM 第7章 読書レビューとチャレンジの感想
第7章の内容は、指示に従うように微調整するプロセスだ。ある質問に対して、期待する応答を返すようにすること。やはり必要なのはデータである。1. 指示微調整の手順ここでの要点は、質問と応答のデータセットを用意し、入力-出力のペアとして学習させること。これをプロンプトスタイルと呼ぶ。その他は以前のプロセス...
ゼロから作りながら学ぶ LLM 第5章 読書レビュー
ゼロから作りながら学ぶ LLM 第5章 読書レビュー
今日は12月14日だ。実はチャレンジ期間はすでに2週間も過ぎてしまったが、だからといってレビューを書くのをあきらめることはできなかった。こうして残しておくTILが、あとで自分の血となり肉となるからだ。コードそのものよりも、その意味に集中して書いてみようと思う。1. モデルの損失計算GPTモデルを作っ...
ゼロから作りながら学ぶ LLM 第4章 読書レビュー
ゼロから作りながら学ぶ LLM 第4章 読書レビュー
今日は11月26日なので、毎日1章ずつ読み切ればチャレンジ成功だ。長男と次男の妨害の中で、それが可能かどうかは分からない。1. ダミー・トランスフォーマーGPTモデルを作りながら、PyTorchからトランスフォーマーのダミーブロックを持ってくる箇所を見た。調べてみると、PyTorch の nn の中...
ゼロから作りながら学ぶLLM第3章読書感想
ゼロから作りながら学ぶLLM第3章読書感想
MacBookに大量の水をこぼしてパニックになり、3〜4日無駄にした。今考えてみると、どうせMacBookは駄目になったし、修理に出すと思って何かをすればよかったと思う。とにかく少し遅れたけど、最後までやるべきだと思い、第3章の感想を残す。1. アテンションメカニズム3章...
ゼロから作りながら学ぶLLM第2章読書レビュー
ゼロから作りながら学ぶLLM第2章読書レビュー
すでにチャレンジ参加2週目。昨日まで2章を終えていなかったが、1泊2日の研修に来て、12時までコーディングしながらようやく進度を合わせた。1. 内容2章の内容は単語のトークン化、エンコーディング、デコーディング、埋め込みベクトルが中心だった。ワンホットエンコーダーを作ったことがあるので他のことは慣れていたが、埋め込み...
MacBookユーザー向けPython OCRのおすすめ
MacBookユーザー向けPython OCRのおすすめ
学生の診療確認書を認識するために試していないOCRはないようだ。Tesseract、EasyOCR、PaddleOCRなどさまざまなOCRを試したが、韓国語に対する満足できる性能を持ったOCRはなかった。しかし最近、MacBookにあるライブテキスト機能をラッピングしたPythonライブラリを発見した。

댓글을 불러오는 중...