2011-12-24(Sat)
誤差に関して数式で表してみます。
まず記号定義
・n…シミュレーションの回数
・S_i…i回目のシミュでの得点を表す確率変数。
・T…n回のシミュから出てきた平均得点
この定義より

であり、
誤差を標準偏差(または分散)で表すものとすると、それはVar(T)で表せます。

(2行目から3行目は各S_iが独立同分布より。)
以降S_iを単にSとおいてVar(S)について考えていきます。
記号定義続き
・A_1…1局がロン和了で終わる事象
・A_2…1局がツモ和了で終わる事象
・A_3…1局が放銃で終わる事象
・A_4…1局が被ツモで終わる事象
・A_5…1局が横移動で終わる事象
・A_6…1局が聴牌流局で終わる事象
・A_7…1局がノーテン流局で終わる事象
各A_iは排反事象です。
・K_1…1局がロン和了時の得点
・K_2…1局がツモ和了時の得点
・K_3…放銃時の得点
・K_4…被ツモ時の得点
・K_5…横移動時の得点
・K_6…聴牌流局時の得点
・K_7…ノーテン流局時の得点
Kについて、失点の場合は負の値をとります。
これらを使うと、

(1_{A_i}は事象A_iが起こったとき1、そうでないとき0となる確率変数)
・p_i=Pr(A_i)…各事象が起こる確率(真値)
すると、

(2行目から3行目は期待値を条件付き期待値に分割の公式?より、3行目から4行目はi≠jのとき1_{A_i}の部分が0になることから)
というわけで、
p_iとかE[K_j^2|A_j]とかE[S]とかがわかれば誤差が大体出ます。
このうち、p_iとE[S]についてはシミュで出てきたロン和了率等(p_i^~)、や得点期待値Tで代用します。
そのこころは、
・p_i(真値)とp_i^~(標本値)との誤差は10%以内ぐらいには収まってくれるであろうという希望的観測(十分なシミュレーション回数をとっていれば標本ロン和了率が20%なら18%~22%ぐらいに真値は入ってるであろう)
ということからこの部分で誤差の誤差が10%くらいの範囲に収まってくれるだろうということ(誤差の厳密な値はそれほど重要でなく、有効一桁くらいで求まってくれれば十分だろうという思想。)
・数値的にはE[S]^2よりE[K_j^2|A_j]たちの方が大きくなりやすいので、E[S]の部分の誤差は大したことない
というところです。
あとはE[K_j^2|A_j]のところですが、これはシチュエーションによって異なってきますが、
各事象に分割してる分、見積もるのは(データと集計用プログラムがあれば)比較的高精度かつ容易にできます。
具体的な計算は…
今日は飽きたのでまた次回ということで。(たぶん年末年始の休み中に。)
まず記号定義
・n…シミュレーションの回数
・S_i…i回目のシミュでの得点を表す確率変数。
・T…n回のシミュから出てきた平均得点
この定義より

であり、
誤差を標準偏差(または分散)で表すものとすると、それはVar(T)で表せます。

(2行目から3行目は各S_iが独立同分布より。)
以降S_iを単にSとおいてVar(S)について考えていきます。
記号定義続き
・A_1…1局がロン和了で終わる事象
・A_2…1局がツモ和了で終わる事象
・A_3…1局が放銃で終わる事象
・A_4…1局が被ツモで終わる事象
・A_5…1局が横移動で終わる事象
・A_6…1局が聴牌流局で終わる事象
・A_7…1局がノーテン流局で終わる事象
各A_iは排反事象です。
・K_1…1局がロン和了時の得点
・K_2…1局がツモ和了時の得点
・K_3…放銃時の得点
・K_4…被ツモ時の得点
・K_5…横移動時の得点
・K_6…聴牌流局時の得点
・K_7…ノーテン流局時の得点
Kについて、失点の場合は負の値をとります。
これらを使うと、

(1_{A_i}は事象A_iが起こったとき1、そうでないとき0となる確率変数)
・p_i=Pr(A_i)…各事象が起こる確率(真値)
すると、

(2行目から3行目は期待値を条件付き期待値に分割の公式?より、3行目から4行目はi≠jのとき1_{A_i}の部分が0になることから)
というわけで、
p_iとかE[K_j^2|A_j]とかE[S]とかがわかれば誤差が大体出ます。
このうち、p_iとE[S]についてはシミュで出てきたロン和了率等(p_i^~)、や得点期待値Tで代用します。
そのこころは、
・p_i(真値)とp_i^~(標本値)との誤差は10%以内ぐらいには収まってくれるであろうという希望的観測(十分なシミュレーション回数をとっていれば標本ロン和了率が20%なら18%~22%ぐらいに真値は入ってるであろう)
ということからこの部分で誤差の誤差が10%くらいの範囲に収まってくれるだろうということ(誤差の厳密な値はそれほど重要でなく、有効一桁くらいで求まってくれれば十分だろうという思想。)
・数値的にはE[S]^2よりE[K_j^2|A_j]たちの方が大きくなりやすいので、E[S]の部分の誤差は大したことない
というところです。
あとはE[K_j^2|A_j]のところですが、これはシチュエーションによって異なってきますが、
各事象に分割してる分、見積もるのは(データと集計用プログラムがあれば)比較的高精度かつ容易にできます。
具体的な計算は…
今日は飽きたのでまた次回ということで。(たぶん年末年始の休み中に。)
スポンサーサイト