Reinforcement Learning, RL.
強化学習とは
ある環境内における知的エージェントが、現在の状態を観測し、得られる収益(累積報酬)を最大化するために、どのような行動をとるべきかを決定する機械学習の一分野.
🐥Glossary
エージェント/Agents
Agent. 行動を選択する主体(例:ロボット、AIキャラクター)
環境/Environemt
env.ironment. エージェントが行動を取る場で、エージェントの行動に応じてフィードバック(状態や報酬)を返します。
報酬/Reward
状態/State
行動/Action
方策/Policy
価値関数/value funtion
強化学習アルゴリズム
Topics
- 🤖RL Trading bot
- 📝OpenAI: もともとは強化学習からスタート.
Insights
- LEGO Mindstormsの crawler を強化学習で前に進むことを学習させた | Futurismo
- 実践的な強化学習のオンライン学習教材、Practical RL をはじめた | Futurismo
—