🔥虚無との戦い

❯

🤖小規模言語モデル(SLM)

🤖小規模言語モデル(SLM)

2025年1月02日4 min read

GenAI

SLM(小規模言語モデル). エッジコンピューティング、📝組み込みシステム用AI.

モデル

GPT-4o mini: オープンでないのでAPIでアクセス.
Gemma2: Google
Phi-3: Microsoft
QWen
Aya Expanse: Cohere. 多言語モデル. 8Bの評判がいい. 商業利用不可.

LLM量子化

LLMを軽量化するための技術. ローカルで動かすためには必須. 📝量子化

方式

モデルの訓練時から小さいビット数で訓練する（事前量子化）
モデルの訓練時には通常のビット数で訓練し、訓練し終わったモデルの重みを小さいビット数に変換して推論する（事後量子化）

形式

§1.3量子化｜Ollamaで体験する国産LLM入門

GGML
GGUF
GPTQ
AWQ

🤖ローカルLLM

ローカルで動作するオープンソースのSLM.

2023夏くらいから自宅のPCでできるようになって話題.

なぜローカルLLMなのか？

APIではないのでコスト削減
セキュリティ問題の解決
オープンなモデルをカスタマイズ可能

🤖Llama(Meta)

🌐Metaの開発したローカルLLMモデル.

業界スタンダード. MetaはAI競争でローカルLLMに戦略的に取り組んでいる.

https://www.llama.com/

Llama-3-ELYZA-JP-8B: 日本語特化の大規模言語モデル.
- https://huggingface.co/elyza/Llama-3-ELYZA-JP-8B-GGUF

Apps

🐄Ollama

CLI用. ローカルサーバを立ち上げてAPIからアクセスできる.

https://ollama.com/
https://github.com/ollama/ollama
対応model: https://ollama.com/library

最強ローカルLLM実行環境としてのEmacs | 日々、とんは語る。
ローカルLLMがゲーミングPCで活用できるか検討してみた(with Ollama) | Futurismo

Modelfile

Ollamaの設定ファイル.

https://github.com/ollama/ollama/blob/main/docs/modelfile.md

<2024-11-27 Wed 17:05> huggingfaceからダウンロードしたモデルだと無限に回答を生成してしまった.

Open WebUI

ブラウザでChatGPTをつかうようにLLMをつかえる.

【ローカルLLM】Ollama Open WebUI 完全解説【初級向け】｜Catapp-Art3D

LLMフレームワーク

いろんなローカルLLMを試せる. API keyを設定すればAPIをたたいてクラウドサービスもつかえる.

LM Studio: GUI向け、導入簡単なのはこれ.

llama.cpp

LlamaのC++IF

https://github.com/ggerganov/llama.cpp

Issues

ローカルLLMのパソコンスペックは？

パラメータ数とメモリの整理. GPUは推奨であるが不要.

7B: ローカルの限界、メモリ16GB.
13B
33B
65B

国産公開LLMは高性能非公開企業LLMに優れるか?

日本語公開モデルは、Claude/OpenAIのような企業型非公開大規模LLMと比べると劣る. しかし、公開モデルは追加学習によるカスタマイズ出来ることが利点.

API/Few-shot/instructin turningの費用対効果の検証

APIは2件Few-shortまでなら確かな性能向上がある.
Claude Intant/ChatGPT3.5相当は、7Bクラスのモデルを30-200程度で追加学習
Claude2.1/GPT-4相当は、13BクラスのOSSモデル or 7Bクラスのモデルを500件程度追加学習

ref. Prompt Tuning から Fine Tuning への移行時期推定 - Speaker Deck, 24/03

🔗References

いちばんやさしいローカル LLM｜ぬこぬこ

Refs

🤖大規模言語モデル(LLMs)
🖊テキスト生成AI
🤖AITuber

グラフビュー

モデル
LLM量子化
方式
形式
🤖ローカルLLM
なぜローカルLLMなのか？
🤖Llama(Meta)
Apps
🐄Ollama
Open WebUI
LLMフレームワーク
llama.cpp
Issues
ローカルLLMのパソコンスペックは？
国産公開LLMは高性能非公開企業LLMに優れるか?
🔗References
Refs

バックリンク

🗒Emacs
🌐Meta
🤖大規模言語モデル(LLMs)
📓2024-w48

Recents

🔖意思決定
2025年7月02日
👨マックス・ウェーバー
2025年7月02日
⛪キリスト教
2025年7月02日
🇺🇸アメリカ
2025年7月02日
🧘悟り
2025年7月02日
🐥キリスト教の基礎知識
2025年7月02日

作成 Quartz v4.4.0 © 2025