2017-08-12(Sat)
前回の続きです。
今度は鳴ける牌が出た時の評価値を同様に調べていきます。

出5m。
役が見込めないのでスルー。

出1m。
発対子。どうあがいても鳴くことになりそうなので、1mから仕掛けで問題なさそう。

出白。
8s対子落としでホンイツ一直線の手もあるけど、2pが苦しいのでまぁAIの回答通り、とりあえず打1pでよさそう。

出7s。
タンヤオ確定なので、たぶん鳴いた方がいいと思うのですが…。AIはスルーと言ってます。

まだあまり数はチェックできていませんが、ちょっと気になる点があるのでいったんチェック作業を止めました。
正答率自体はそこまで悪くないですが、ツモへの打牌時と比べて、致命的なミスがちょくちょく見受けられます。
誤答になってるとき、人間(私)が考える最善手とAIの最善手との評価値の開きがかなり大きめになってるケースが多いです。
従前の役なしなのに鳴いてしまってるケースはかなり減ったけれど、まだたまーに散見されます。
全体的に鳴きすぎな感じはあるので、もうちょっとスルー寄り(面前側に有利)に調整した方がいいかもしれません。
具体的には、副露役なしフラグを少し変えようかと思っています。
今だと、手役「あり」と「なし」の2択のみで、
以下の条件のいずれかにあてはまっているときはすべて手役「あり」と判定しています。
・役牌対子以上がある。
・タンヤオ限定シャンテン数が全シャンテン数+1以下
・一色限定シャンテン数が全シャンテン数+2以下
・トイトイ限定シャンテン数が3以下
・三色or一通の出来パーツが7以上
・チャンタ限定シャンテン数が全シャンテン数+1以下
これを手役「確定」、「不確定」、「なし」の3択に変えようかと思っています。
「不確定」の条件は、↑の条件を満たしていてかつ、
・役牌刻子なし役牌対子あり
・タンヤオ限定シャンテン数=全シャンテン数+1
・一色限定シャンテン数=全シャンテン数+2
・チャンタ限定シャンテン数=全シャンテン数+1
のいずれかを満たす場合。
手役「不確定」の場合、単純減算で評価値にマイナス補正をかける方向で考えています。
(手役「なし」なら「シャンテン数と一次有効牌枚数」・「牌エネルギー」・「ドラエネルギー」を完全に0にしているのは変わらず。)
これで鳴きすぎを是正できればいいかな…と。
なので、学習データの取り直しとパラメータの選定(準ニュートン法)からやり直しになります。
まぁ強くするためにはしょうがないですね。
プログラム的にはそこまで大きな変更にはならないですが、単に計算時間(待ち時間)がかかるのが少し気分が盛り下がります。
今度は鳴ける牌が出た時の評価値を同様に調べていきます。

出5m。
役が見込めないのでスルー。

出1m。
発対子。どうあがいても鳴くことになりそうなので、1mから仕掛けで問題なさそう。

出白。
8s対子落としでホンイツ一直線の手もあるけど、2pが苦しいのでまぁAIの回答通り、とりあえず打1pでよさそう。

出7s。
タンヤオ確定なので、たぶん鳴いた方がいいと思うのですが…。AIはスルーと言ってます。

まだあまり数はチェックできていませんが、ちょっと気になる点があるのでいったんチェック作業を止めました。
正答率自体はそこまで悪くないですが、ツモへの打牌時と比べて、致命的なミスがちょくちょく見受けられます。
誤答になってるとき、人間(私)が考える最善手とAIの最善手との評価値の開きがかなり大きめになってるケースが多いです。
従前の役なしなのに鳴いてしまってるケースはかなり減ったけれど、まだたまーに散見されます。
全体的に鳴きすぎな感じはあるので、もうちょっとスルー寄り(面前側に有利)に調整した方がいいかもしれません。
具体的には、副露役なしフラグを少し変えようかと思っています。
今だと、手役「あり」と「なし」の2択のみで、
以下の条件のいずれかにあてはまっているときはすべて手役「あり」と判定しています。
・役牌対子以上がある。
・タンヤオ限定シャンテン数が全シャンテン数+1以下
・一色限定シャンテン数が全シャンテン数+2以下
・トイトイ限定シャンテン数が3以下
・三色or一通の出来パーツが7以上
・チャンタ限定シャンテン数が全シャンテン数+1以下
これを手役「確定」、「不確定」、「なし」の3択に変えようかと思っています。
「不確定」の条件は、↑の条件を満たしていてかつ、
・役牌刻子なし役牌対子あり
・タンヤオ限定シャンテン数=全シャンテン数+1
・一色限定シャンテン数=全シャンテン数+2
・チャンタ限定シャンテン数=全シャンテン数+1
のいずれかを満たす場合。
手役「不確定」の場合、単純減算で評価値にマイナス補正をかける方向で考えています。
(手役「なし」なら「シャンテン数と一次有効牌枚数」・「牌エネルギー」・「ドラエネルギー」を完全に0にしているのは変わらず。)
これで鳴きすぎを是正できればいいかな…と。
なので、学習データの取り直しとパラメータの選定(準ニュートン法)からやり直しになります。
まぁ強くするためにはしょうがないですね。
プログラム的にはそこまで大きな変更にはならないですが、単に計算時間(待ち時間)がかかるのが少し気分が盛り下がります。
スポンサーサイト