2018-08-28(Tue)
ひたすら計算機を回して機械学習をごりごり進めている途中です。
とりあえず対リーチにそれなりに対応してくれたら他の副露とかはなんとかなる!…はずです。




なんか色がついてる(=従前方式との齟齬が大きい)ところが多いです。
/(^o^)\ナンテコッタイ
全体的にニューラルネットの方が現物や筋の出る率が低めに見積もってるように見えます。
リーチ者ありの学習があまりよろしくないように見えます。
それに他家攻撃ごとに学習データを完全に分けてるのがあまり理論的に美しくないです。
計算時間が各場合ごとに半日以上かかるのもめんどくさいし。
今までのニューラルネットがこんな感じ↓。いたって教科書通りのふつうのニューラルネット。

今考えてるのはこんな感じの設計にしようかなーとか思ってます。

狙いとしては、
・3層から4層へと階層を深くする。
・入力層から中間層1については、各プレイヤーごとに別個に考える。4人に対してノード10個を出力する。(どうせ他者との相互依存関係は限定的だろうという希望的観測のもと。)
・他家3人情報についての重みパラメータはCNNっぽくして同じ重みパラメータを使い回す。
・中間層1で4人×各10個のノードを入力値として、改めて普通の3層ニューラルネットを組んで最終的な「ある牌が切られる確率」を出力する。(2層パーセプトロンでなく、3層ニューラルネットにしたのは4者の相互依存関係を多少いれるために必要だろうと思ったから。)
問題になるのは全体が3層から4層になるので、複雑さが増して私のプログラムや計算式の組み立て能力が追い付くかどうか、というところです。
後は多層になると、勾配消失とかの問題が起こり得る…らしい。そのへん、まだあまり勉強してないのでよくわからないですが。
うまくいけばデータの場合分けとかなくて、理論的に美しいのであるが…。
とりあえず対リーチにそれなりに対応してくれたら他の副露とかはなんとかなる!…はずです。




なんか色がついてる(=従前方式との齟齬が大きい)ところが多いです。
/(^o^)\ナンテコッタイ
全体的にニューラルネットの方が現物や筋の出る率が低めに見積もってるように見えます。
リーチ者ありの学習があまりよろしくないように見えます。
それに他家攻撃ごとに学習データを完全に分けてるのがあまり理論的に美しくないです。
計算時間が各場合ごとに半日以上かかるのもめんどくさいし。
今までのニューラルネットがこんな感じ↓。いたって教科書通りのふつうのニューラルネット。

今考えてるのはこんな感じの設計にしようかなーとか思ってます。

狙いとしては、
・3層から4層へと階層を深くする。
・入力層から中間層1については、各プレイヤーごとに別個に考える。4人に対してノード10個を出力する。(どうせ他者との相互依存関係は限定的だろうという希望的観測のもと。)
・他家3人情報についての重みパラメータはCNNっぽくして同じ重みパラメータを使い回す。
・中間層1で4人×各10個のノードを入力値として、改めて普通の3層ニューラルネットを組んで最終的な「ある牌が切られる確率」を出力する。(2層パーセプトロンでなく、3層ニューラルネットにしたのは4者の相互依存関係を多少いれるために必要だろうと思ったから。)
問題になるのは全体が3層から4層になるので、複雑さが増して私のプログラムや計算式の組み立て能力が追い付くかどうか、というところです。
後は多層になると、勾配消失とかの問題が起こり得る…らしい。そのへん、まだあまり勉強してないのでよくわからないですが。
うまくいけばデータの場合分けとかなくて、理論的に美しいのであるが…。
スポンサーサイト