麻雀AI開発その54・評価値関数をAIに搭載(鳴き判断)その2
2017-08-13(Sun)
前回の続きです。
手役不確定について評価値にペナルティを課そうと、いろいろいじくってたら、かなり重篤なバグ(副露時にタンヤオ限定シャンテン数と一色限定シャンテン数が過大評価されることがある)を見つけてしまいました。
そのバグを直した上で、手役不確定ペナルティを加味させた評価値で再度鳴き判断を確かめてみます。

バグを直した影響(パラメータがだいぶ変わった)で今度はかなりスルー寄りに傾きました。
誤答になってるのはすべて私は鳴いた方がいいと思うところ、AIがスルーと答えた状況です。
まぁ、役なしなどから鳴いてしまうよりは、慎重にスルーに寄りすぎる方がまだ実害は少ないような気がしますが、
私の考える最善と比較すると22個の鳴くべきと思われる手に対してAIは10回もスルーしてるので、副露率は相当下がりそうです。
鳴きすぎになったりスルーしすぎになったりと、なかなか思う通りに調整ができないですね。
というわけで、もうちょっと鳴き寄りに傾くように調整をがんばってみます。
今回は鳴き可能な手牌に対してボーナスを単純加算で付与する方向でやってみようと思います。
手役不確定について評価値にペナルティを課そうと、いろいろいじくってたら、かなり重篤なバグ(副露時にタンヤオ限定シャンテン数と一色限定シャンテン数が過大評価されることがある)を見つけてしまいました。
そのバグを直した上で、手役不確定ペナルティを加味させた評価値で再度鳴き判断を確かめてみます。

バグを直した影響(パラメータがだいぶ変わった)で今度はかなりスルー寄りに傾きました。
誤答になってるのはすべて私は鳴いた方がいいと思うところ、AIがスルーと答えた状況です。
まぁ、役なしなどから鳴いてしまうよりは、慎重にスルーに寄りすぎる方がまだ実害は少ないような気がしますが、
私の考える最善と比較すると22個の鳴くべきと思われる手に対してAIは10回もスルーしてるので、副露率は相当下がりそうです。
鳴きすぎになったりスルーしすぎになったりと、なかなか思う通りに調整ができないですね。
というわけで、もうちょっと鳴き寄りに傾くように調整をがんばってみます。
今回は鳴き可能な手牌に対してボーナスを単純加算で付与する方向でやってみようと思います。
スポンサーサイト