巡目と残りスジ本数と和了率の関係その2・分析編
2015-04-25(Sat)
一昨日の記事の続き。
巡目と残りスジ本数別の良形リーチの実測和了率を出したので、
それを回帰分析して残りスジ本数から和了率を予測することを試みます。
いろいろと調べてみると、
巡目と残りスジ本数を説明変数とする重回帰分析しようとすると、多重共線性という問題、
つまり巡目と残りスジ本数の間の相関係数が大きすぎて、そのまま回帰分析するにはちょっと問題がありそうなことが発覚しました。
というわけでいろいろ悩んだ挙句、巡目を一つ固定して(今回は6巡目のリーチ)、そのデータに対して残りスジ本数を説明変数、和了率を被説明変数とする単回帰分析に切り替えることにします。
これならさほど難しくないか。
ただ和了するかどうかは0-1の2値データなので、ふつうの回帰分析ではなく、ロジスティック回帰分析をあてはめます。
つまりxが残りスジ本数、yが和了率に対して、

の式をもとに回帰分析します。

使う素データは↑。一昨日のやつの6巡目限定ver.です。

それで、各データ(計2546個)の和了or非和了の0-1データから回帰予測値を引いて2乗したものの総和が、最小になるようなb_0、b_1を求めます。(そこはExcelのソルバーのお仕事。)
…すると、b_1が正の値。ということは残りスジ本数が多いほど和了率は下がってしまうという、なんとも残念な結果です。
決定係数を見ると1.5×10のマイナス5乗。めっちゃ低い。
単回帰分析だと説明変数と被説明変数の相関係数の2乗が決定係数なので、
(巡目を固定した場合、)残りスジ本数と和了率の相関係数は-0.004くらい。
残りスジ本数と和了率の間には相関関係はほとんどなく、
残りスジ本数で和了率を説明することはほとんどできない、という結論です。
残念!
素データを見返してみると、
データ数の多い残りスジ13本~15本のところで、きちんとした相関関係(残りスジ大ほど和了率大)になってないのが原因でしょうね。
巡目と残りスジ本数別の良形リーチの実測和了率を出したので、
それを回帰分析して残りスジ本数から和了率を予測することを試みます。
いろいろと調べてみると、
巡目と残りスジ本数を説明変数とする重回帰分析しようとすると、多重共線性という問題、
つまり巡目と残りスジ本数の間の相関係数が大きすぎて、そのまま回帰分析するにはちょっと問題がありそうなことが発覚しました。
というわけでいろいろ悩んだ挙句、巡目を一つ固定して(今回は6巡目のリーチ)、そのデータに対して残りスジ本数を説明変数、和了率を被説明変数とする単回帰分析に切り替えることにします。
これならさほど難しくないか。
ただ和了するかどうかは0-1の2値データなので、ふつうの回帰分析ではなく、ロジスティック回帰分析をあてはめます。
つまりxが残りスジ本数、yが和了率に対して、

の式をもとに回帰分析します。

使う素データは↑。一昨日のやつの6巡目限定ver.です。

それで、各データ(計2546個)の和了or非和了の0-1データから回帰予測値を引いて2乗したものの総和が、最小になるようなb_0、b_1を求めます。(そこはExcelのソルバーのお仕事。)
…すると、b_1が正の値。ということは残りスジ本数が多いほど和了率は下がってしまうという、なんとも残念な結果です。
決定係数を見ると1.5×10のマイナス5乗。めっちゃ低い。
単回帰分析だと説明変数と被説明変数の相関係数の2乗が決定係数なので、
(巡目を固定した場合、)残りスジ本数と和了率の相関係数は-0.004くらい。
残りスジ本数と和了率の間には相関関係はほとんどなく、
残りスジ本数で和了率を説明することはほとんどできない、という結論です。
残念!
素データを見返してみると、
データ数の多い残りスジ13本~15本のところで、きちんとした相関関係(残りスジ大ほど和了率大)になってないのが原因でしょうね。
スポンサーサイト