強化学習

概要 自作方法 とりあえずこんな感じで書いていけばOK import gym class MyEnv(gym.Env): def __init__(self): ACTION_NUM=3 #アクションの数が3つの場合 self.action_space = gym.spaces.Discrete(ACTION_NUM) #状態が3つの時で上限と下限の設定と仮定 LOW=[0,0,0]
やること stable-baselinesを使ってDDQNを動かします。環境としてはGymのCartPoleを利用していきます。 stable-
stable-baselinesとは stable-baselinesとは様々な強化学習アルゴリズムが実装されていて、誰でも気軽に強化学習を試