機械学習まとめ

学習パラダイム

🐥Glossary

過学習

学習しすぎて精度が劣化する. オーバーフィッティング

Out-of-Sample(OOS)

データ分析や機械学習において、モデルの作成・学習に使用しなかった新しいデータのこと. このデータを使ってモデルの予測性能を検証することで、過学習を防ぎ、未知のデータに対する真の予測能力を評価

汎化

既知の学習から未知を予測できるようになること. 機械学習の目標.

📊識別モデル

識別モデル/discriminative models, 条件付きモデル/conditional models.

  • ロジスティック回帰(LR)
  • 条件付き確率場(CRF)
  • 決定木
  • ランダムフォレスト

🤖教師あり学習

📝自己教師あり学習

🤖自己教師あり学習

テキスト内の消された単語を予測させることで、ほぼ無限に多様な訓練データを用意できるという発明!

2018, Google BERTが実装.

<2024-12-03 Tue 17:44> はじめてしった、これはすごい. 📚大規模言語モデルは新たな知能か - 岡野原大輔(2023)

🤖教師なし学習

📝Pre-training

事前学習.

転移学習/ファインチューニング

転移学習とファインチューニングも既存のモデルを再学習によって改良する. 内部の技術が異なるが目的は似ている.

📝転移学習

Transfer Learning.

📝Fine Tuning

ファインチューニング. 既存のモデルを元に機械学習モデルを改良する技術.

🤖レコメンドシステム

レコメンダシステム、レコメンドエンジン、recommender system. 推薦アルゴリズム… 呼び方がいろいろある.

📝機械学習プロダクト開発

MLOps.

📚パターン認識と機械学習/PRML

機械学習ガチ本としてよく言及されるやつ.