2019-05-04から1日間の記事一覧

【強化学習入門】PolicyGradientでOpenAI GymのCartPoleをクリアする

こんにちは。nosukeruです。 今回は強化学習のアルゴリズムを実際に実装し、この分野で一般的なベンチマークとして用いられるOpenAI Gymを使って遊んでみました。 コードはここに置いています(今後も追加予定)。深層学習のライブラリにはPyTorchを使ってい…