stable-baselinesとは
stable-baselinesとは様々な強化学習アルゴリズムが実装されていて、誰でも気軽に強化学習を試せるフレームワークのようなものです。今回はstable-baselinesを使うための準備・インストールをしていきます。
準備
Requirement
- python3 (>=3.5)
- tensorflow 1.8.0 ~ 1.14.0(tensorflow2系も準備中らしい?)
Ubuntu
$ sudo apt-get update && sudo apt-get install cmake libopenmpi-dev python3-dev zlib1g-dev
MacOS
$ brew install cmake openmpi
Windows
- Anaconda推奨
- MPIなしの場合はそのまま次のステップに進めます(全てのアルゴリズムを試せない)
- MPIありの場合はWindows用MPIをインストールしてください(全てのアルゴリズムを試せます)
インストール
MPIありの場合 全てのアルゴリズムを試せます。
$ pip install stable-baselines[mpi]
もしzsh: no matches found: stable_baselines[mpi]
のようなエラーが出てしまったら以下のようにクオーテーションで囲んでみてください。
$ pip install 'stable_baselines[mpi]'
MPIなしの場合 一部アルゴリズム試せません。(一部アルゴリズム : DDPG, GAIL, PPO1, TRPO)
$ pip install stable-baselines
最後に
今回はstable-baselinesを使うための準備をしていきました。別記事では実際に様々なアルゴリズムを試しているのでぜひご覧ください!
- A2C
- ACER
- ACKTR
- DDPG
- DDQN
- GAIL
- HER
- PPO
- SAC
- TD3
- TRPO