僕のノート、見てってください

エンジニアリングや英語、趣味について徒然なるままに

強化学習

Python - 強化学習(マルコフ決定過程)のコードリーディング

強化学習のメモ このQiita記事に従って触っていたものの、コードを前にハテナがいくつか浮かんだので、解釈した結果をメモ。 qiita.com サンプルコード群 By UC Berkeley github.com 以下、掲題の通り、マルコフ決定過程のサンプルコードに関する解釈です。 …