【準備】stable-baselinesで始める強化学習

Lastmod: 2023-10-09

stable-baselinesとは

stable-baselinesとは様々な強化学習アルゴリズムが実装されていて、誰でも気軽に強化学習を試せるフレームワークのようなものです。今回はstable-baselinesを使うための準備・インストールをしていきます。

Ubuntu

$ sudo apt-get update && sudo apt-get install cmake libopenmpi-dev python3-dev zlib1g-dev

MacOS

$ brew install cmake openmpi

Windows

MPIありの場合 全てのアルゴリズムを試せます。

$ pip install stable-baselines[mpi]

もしzsh: no matches found: stable_baselines[mpi]のようなエラーが出てしまったら以下のようにクオーテーションで囲んでみてください。

$ pip install 'stable_baselines[mpi]'

MPIなしの場合 一部アルゴリズム試せません。（一部アルゴリズム : DDPG, GAIL, PPO1, TRPO）

$ pip install stable-baselines

今回はstable-baselinesを使うための準備をしていきました。別記事では実際に様々なアルゴリズムを試しているのでぜひご覧ください！