自作オセロゲームとそれを実行するRL Agent.
「OtheroGameをAgent二人でPlayし続けてもらうと切磋琢磨して強くなるんか?」
Otheroってどういう戦略立てればいいのかわからないなぁ、そうだ、RLでAgentにプレイしてもらって、どういう戦略で動いているか学ばせてもらおう!(そんなこと出来るのかしら。。) と思ったのが、発端。
自分で「オセロの戦法」とか、指南書読めやって感じもある。
- WebAppで実装して対戦もできる様にする
- 学習させてその結果を保存していつでも対局見れる様にする。
- Stateどう持たせよう
$|S|$ が$3^{64}$(8*8それぞれのますで白黒空白)あると考えて、これは環境設定どうしよう...ってなってる。- 勉強がてらALphaGoの本読もうかなと思っている。
- tornado使うの初めて Django開発の記憶を呼び起こしつつ、icoxfigさんが作成したアプリの構造を真似て作成する方針。
-
最適性の原理を調べた
-
OpenAIgymを見て、Envsの作り方を学ぶ