2017-08-11(Fri)
前回、評価値の正答率が66%はちょっとびみょう、と思ったのですが、
よく考えてみたら2シャンテン以上の手だと孤立字牌が複数とかあってどちらを切るかは指運によるところがある手牌もそれなりに多くありそうなので、正答率80%~90%を望むのはほぼ無理なような気がしてきました。
なので、この数値でまぁいいかと思いました。
ただ、改善した方がよさそうな部分もあったので、微調整を入れます。
・一次有効牌枚数の復活
シャンテン数ごとに係数を分ければ、異なるシャンテン数の有効牌枚数が混じらないからいけるんじゃない?と思いました。

いまいちよくわかんないけど、シャンテン数が多いほど評価値が下がりそうなのでこの部分はいいことにしておきます。
5シャンテン・6シャンテンはなんか係数がマイナスになってる(有効牌枚数が多いほど評価値が下がる)けど、まぁそんなに遠い手は出現頻度が多くないから放置でいいことにしておきましょうか。
・字牌の牌エネルギーについて
枚数とオタ風役牌を独立扱いにしていたけれど、それに見えてる枚数も加えて分類を増やした。
・晒し牌エネルギーについて
鳴きの種類で分類を増やした。

それで1000試合分で100回準ニュートン法をやった(約数時間かかる)のですが、まだ不審な点がありました。
一番やばそうなのが、孤立字牌の牌エネルギーの評価。

普通ならオタ風<役牌<ダブ風の順に手に残されやすいので、牌エネルギーもこの順に大きくなってくれるのが望ましいのですが、1枚見え孤立ダブ風の係数がオタ風の係数にすら負けてるというありさまです。2枚見えシングル役牌もオタ風に負けてます。
さすがにこれはちょっと…ねぇ。
一番比較することが多い孤立字牌どうしの比較なので、あんまりよろしくないですねぇ。
まぁでも、個別のパラメータをひっかき回すよりは、実際にこれらパラメータをAIに搭載して、実際の手牌で評価値を比較して確かめるのがよさそうですが。
1000試合でダメなら10000試合に増やしてみようか。準ニュートン法の繰り返し回数は20回とか50回くらいに抑えればたぶん一晩とかいうレベルで終わりそうなので。
計算時間さえ許せば試合数が多くなることは数値の安定性とかの面で正義でしょうから。
よく考えてみたら2シャンテン以上の手だと孤立字牌が複数とかあってどちらを切るかは指運によるところがある手牌もそれなりに多くありそうなので、正答率80%~90%を望むのはほぼ無理なような気がしてきました。
なので、この数値でまぁいいかと思いました。
ただ、改善した方がよさそうな部分もあったので、微調整を入れます。
・一次有効牌枚数の復活
シャンテン数ごとに係数を分ければ、異なるシャンテン数の有効牌枚数が混じらないからいけるんじゃない?と思いました。

いまいちよくわかんないけど、シャンテン数が多いほど評価値が下がりそうなのでこの部分はいいことにしておきます。
5シャンテン・6シャンテンはなんか係数がマイナスになってる(有効牌枚数が多いほど評価値が下がる)けど、まぁそんなに遠い手は出現頻度が多くないから放置でいいことにしておきましょうか。
・字牌の牌エネルギーについて
枚数とオタ風役牌を独立扱いにしていたけれど、それに見えてる枚数も加えて分類を増やした。
・晒し牌エネルギーについて
鳴きの種類で分類を増やした。

それで1000試合分で100回準ニュートン法をやった(約数時間かかる)のですが、まだ不審な点がありました。
一番やばそうなのが、孤立字牌の牌エネルギーの評価。

普通ならオタ風<役牌<ダブ風の順に手に残されやすいので、牌エネルギーもこの順に大きくなってくれるのが望ましいのですが、1枚見え孤立ダブ風の係数がオタ風の係数にすら負けてるというありさまです。2枚見えシングル役牌もオタ風に負けてます。
さすがにこれはちょっと…ねぇ。
一番比較することが多い孤立字牌どうしの比較なので、あんまりよろしくないですねぇ。
まぁでも、個別のパラメータをひっかき回すよりは、実際にこれらパラメータをAIに搭載して、実際の手牌で評価値を比較して確かめるのがよさそうですが。
1000試合でダメなら10000試合に増やしてみようか。準ニュートン法の繰り返し回数は20回とか50回くらいに抑えればたぶん一晩とかいうレベルで終わりそうなので。
計算時間さえ許せば試合数が多くなることは数値の安定性とかの面で正義でしょうから。
スポンサーサイト