麻雀AI開発その60・評価値関数をAIに搭載(鳴き判断)その3
2017-08-23(Wed)
前回パラメータを出した評価値関数についてAIに搭載して実際の局面に当てはめてチェックしてみます。

前の時(麻雀AI開発その54・評価値関数をAIに搭載(鳴き判断)その2)より鳴きになる部分が多くなりました。
私の感覚とずれてるところについても、わりとAIの回答も打ち手の個性の範囲内で許容できる(そういう打ち手がいてもおかしくない)ところが多いです。
評価値の桁が2桁くらいまで増えたので、スルー補正の約3ptくらいなら鳴きの手牌価値のみ評価値がスルーよりも十分高ければ吸収できている感じです。
実戦譜で当てはめてみて数値の出方のくせがなんとなくわかってきました。
・巡目がかなり浅いと最終評価値が一けたになることが多くてスルー補正3ptを逆転できずにスルーが選ばれやすい。
・手役確定の鳴きになる場合(役牌ポンなど)がしばしばスルーされて、手役不確定の場合がしばしば鳴かれることがある。
・対リーチなのに危険度が高い牌を切ってしまう
超序盤と対リーチの問題についてはパラメータの問題なので、初期値を都合のいい方にいじって別の停留点を探しに行くのがいいかと思います。
手役確定・不確定については手牌価値のみの評価値の算出関数内でも考えていますが、危険度も加味するパートでも改めて最終評価値にプラスマイナスの補正を与えて調整しようかと思います。
ただ、この問題にばかりかかりきりになるのもそろそろ飽きてきたので、修正が無理そうならあきらめて今のままでもいいことにしましょうかね。

前の時(麻雀AI開発その54・評価値関数をAIに搭載(鳴き判断)その2)より鳴きになる部分が多くなりました。
私の感覚とずれてるところについても、わりとAIの回答も打ち手の個性の範囲内で許容できる(そういう打ち手がいてもおかしくない)ところが多いです。
評価値の桁が2桁くらいまで増えたので、スルー補正の約3ptくらいなら鳴きの手牌価値のみ評価値がスルーよりも十分高ければ吸収できている感じです。
実戦譜で当てはめてみて数値の出方のくせがなんとなくわかってきました。
・巡目がかなり浅いと最終評価値が一けたになることが多くてスルー補正3ptを逆転できずにスルーが選ばれやすい。
・手役確定の鳴きになる場合(役牌ポンなど)がしばしばスルーされて、手役不確定の場合がしばしば鳴かれることがある。
・対リーチなのに危険度が高い牌を切ってしまう
超序盤と対リーチの問題についてはパラメータの問題なので、初期値を都合のいい方にいじって別の停留点を探しに行くのがいいかと思います。
手役確定・不確定については手牌価値のみの評価値の算出関数内でも考えていますが、危険度も加味するパートでも改めて最終評価値にプラスマイナスの補正を与えて調整しようかと思います。
ただ、この問題にばかりかかりきりになるのもそろそろ飽きてきたので、修正が無理そうならあきらめて今のままでもいいことにしましょうかね。
スポンサーサイト