2015-04-19(Sun)
今のシミュレーションではある局面から10000回模擬麻雀みたいなことをやらせて、
その10000回の平均の数値を出力しているわけです。
ただ、このようなモンテカルロ的なシミュレーションをやると、シミュレーションのたびに出てくる数値が異なるという問題が発生します。
今日はこのシミュレーションによる誤差がどの程度発生するかを分析してみます。
(パラメータ誤差とモデル誤差はまた別問題。)
そのために今回やったのは局面をひとつ指定して、現行のシミュレーション(10000回の試行)を1000回繰り返してどの程度数値がばらつくかということを見ていきます。
シミュレーション完了まで十分くらいかかった。いつもの10000回×18巡の試行で10秒~20秒くらいなのでその1000/18倍はかかる計算。とても長かった。
・今回の局面
自分西家、カン28待ち副露聴牌2ハン手。
親リーチの一発目、初手無筋2378。
南家北家動きなし。
7巡目全押し。
トンパツ(東南戦)、特上卓五段。ウマ10-20。
これをやってヒストグラム分析にかけると。(初めてやるからうまくいくかわからない。)

和了率。1000回の平均値は31.34%。
10000回の試行だと平均値から大体±1%くらいはずれることが多いと。

放銃率。1000回の平均値は26.61%。
これも10000回の試行では±1%くらいずれると。

局期待値。1000回の平均値は-2233点。
10000回の試行では100点くらいずれる。

半荘収支。1000回の平均値は-4.576.
10000回の試行では±0.5くらいずれる。

平均順位。1000回の平均値は2.623.
10000回の試行では±0.02くらいずれる。

段位pt。1000回の平均値は-7.314.
10000回の試行では±1くらいずれる。

トップ率。1000回の平均値は21.25%。
10000回の試行では±0.5%くらいずれる。
10000回の試行ではこの程度の誤差はどうしても発生してくるということですね。
この誤差の中に入ってしまうと両者に差があるとは言いにくいという結論になります。
これらの振れ幅は理論上、試行回数を100000回(10倍)に増やせば3.1分の1、
1000000回(100倍)に増やせば10分の1に軽減できるという計算です。
その分、計算時間も10倍、100倍と増えていくわけですが。
その10000回の平均の数値を出力しているわけです。
ただ、このようなモンテカルロ的なシミュレーションをやると、シミュレーションのたびに出てくる数値が異なるという問題が発生します。
今日はこのシミュレーションによる誤差がどの程度発生するかを分析してみます。
(パラメータ誤差とモデル誤差はまた別問題。)
そのために今回やったのは局面をひとつ指定して、現行のシミュレーション(10000回の試行)を1000回繰り返してどの程度数値がばらつくかということを見ていきます。
シミュレーション完了まで十分くらいかかった。いつもの10000回×18巡の試行で10秒~20秒くらいなのでその1000/18倍はかかる計算。とても長かった。
・今回の局面
自分西家、カン28待ち副露聴牌2ハン手。
親リーチの一発目、初手無筋2378。
南家北家動きなし。
7巡目全押し。
トンパツ(東南戦)、特上卓五段。ウマ10-20。
これをやってヒストグラム分析にかけると。(初めてやるからうまくいくかわからない。)

和了率。1000回の平均値は31.34%。
10000回の試行だと平均値から大体±1%くらいはずれることが多いと。

放銃率。1000回の平均値は26.61%。
これも10000回の試行では±1%くらいずれると。

局期待値。1000回の平均値は-2233点。
10000回の試行では100点くらいずれる。

半荘収支。1000回の平均値は-4.576.
10000回の試行では±0.5くらいずれる。

平均順位。1000回の平均値は2.623.
10000回の試行では±0.02くらいずれる。

段位pt。1000回の平均値は-7.314.
10000回の試行では±1くらいずれる。

トップ率。1000回の平均値は21.25%。
10000回の試行では±0.5%くらいずれる。
10000回の試行ではこの程度の誤差はどうしても発生してくるということですね。
この誤差の中に入ってしまうと両者に差があるとは言いにくいという結論になります。
これらの振れ幅は理論上、試行回数を100000回(10倍)に増やせば3.1分の1、
1000000回(100倍)に増やせば10分の1に軽減できるという計算です。
その分、計算時間も10倍、100倍と増えていくわけですが。
スポンサーサイト