*All archives* |  *Admin*

<<03  2009/03  1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31  04>>
レポート1「一向聴時対リーチ押し引き」その7 追記
レポートでウソ書いてたことが分かりました。ごめんなさい。

問題なのは下の式から条件付期待値を取るところa7a6f43f1ed57a0faa933e0a6a84776d_90_black.png
(↑のI(t+1)については後の都合上この時点で期待値をとってC(t+1)としておきたい。R(t+1)も確率変数の期待値だから同じように扱って問題なかろう。)
これを
24ea3a1ec4eaca29546c3ed4ce1d62b9_90_black.png
こう変形したわけですけど皆さん間違いに気づきましたか?

正しくは下のとおりです。(Eとmaxは交換できない!)
306b87b5cb70f5463ca837a3aceca225_90_black.png
これをさらに計算するために0b49373e03774d7474c0d10d89834e53_90_black.png
これの右辺をαとして、
p(t)の分布が離散のとき確率分布をf_t(x)とすると
8fd6b0ee314cf90cc7b6ab36fc66e8a7_90_black.png
p(t)の分布が連続のとき密度関数をf_t(x)とすると8c866bc9dd4dc591c29fd0c69a0be034_90_black.png
いずれの場合も一向聴の期待得失点は切る牌の放銃率がα以上のときベタ降りの期待得失点でα以下の時攻めた場合の期待得失点としたときの期待値となります。

どちらにしてもp(t)の分布が分からなければこれを計算することはできません。そしてp(t)の分布を求めるのは非常に困難です。(実はレポートを書いてる途中で、このままではまずそうなことには気づいてたのですけど、このことがあったので放置して議論を進めてしまいました。)

しかしいくつか(必ずしも正しいとは限らない)強力な仮定を置くことでそれらしいものを計算することができました。まだ今のところは「分布にある程度近いもの」程度のレベルだと思いますが、違う式のまま放置するよりはましだと思うのでここで書いておきます。ここで考えるのは分布が離散の場合です。

まずいくつかの記号の定義をしながら仮定を書いていきます。

・両無筋456の放銃率を1としたときのリーチ者に対するそれぞれのカテゴリに属する牌の放銃率をx_iとする(両無筋との放銃率の比。これが順目tによらないと仮定する。正しいかどうかは微妙。)
i=1→片無筋、i=2→スジ37、i=3→スジ28、i=4→スジ19両スジ456字牌
これらの値は「科学する麻雀」P199の値の比をとることで適当に推定する。
i=1→0.57、i=2→0.45、i=3→0.39、i=4→0.24

・t順目のリーチ者に対するそれぞれのカテゴリに属する牌の種類数の期待値をa_i(t)とする。(これを後で計算で求める)
i=1→両無筋46、2→片無筋46、3→両スジ46、4→両無筋5、5→片無筋5、6→両スジ5、7→無筋37、8→スジ37、9→無筋28、10→スジ28、11→無筋19、12→スジ19、13→字牌
これが求まれば、t順目にそれぞれのカテゴリのどれかの牌をツモる確率はa_i(t)/34と見積もることができる。

・t順目のリーチ者に対するそれぞれのカテゴリに属する牌の放銃率をp_i(t)とする。
i=0→両無筋456、i=1→片無筋、i=2→スジ37、i=3→スジ28、i=4→スジ19両スジ456字牌
上の二つからp_i(t)は下のように求めることができる。(ただし、x_0=1とするa95fc99639d6974fbae955bb74d6f438_90_black.png
分子は該当する牌の放銃率の比率、分母は全ての牌の放銃率の比率の合計である。
(訂正:上の式にリーチの待ち牌の平均種牌数2×65%+1×35%=1.65をさらにかけます)

・リーチ者がt順目にそれぞれのカテゴリに属する牌を切っている確率をk_iとする。(順目tによらず、独立と仮定。実際は早順ほど字牌が切られやすい。また、リーチ後はランダム打牌になる。さらに前の順目で切ってる牌は数が減って切られにくくなる、といった理由でこの仮定はほぼ成り立たない。でも計算を可能にするためにはやむをえない。ここが一番の課題。)
i=1→456、i=2→37、i=3→28、i=4→19、i=5→字牌
これはひいいさんのサイトの「牌分析」の項を参照して、推定する。
i=1→1.7%、i=2→2.0%、i=3→2.8%、i=4→3.9%、i=5→4.6%、


これからa_i(t)を求める。まず初期状態は以下である。78d499fd6dc41826e42e4422bd0c35fa_90_black.png

例えばa_1(1)は両無筋46で、2種×3色=6種である。

次に順目tの期待値を使ってt+1の期待値を立式する。2ea19dc3cec2610b995fd6d9ca814414_90_black.png

例えばa_2(片無筋46)は前順の種類数から両無筋1種当たり確率k_2+k_4で対応するスジ牌が切られて片無筋46が1種類増えるのと、片無筋1種当たり確率(k_2+k_4)/2で切れてないほうのスジ牌が切られて片無筋が1種減ることから上式が成り立つ。それ以外も同じように立式できるので確かめてみてください。

a_3とa_6以外は上の漸化式が解けるのでそれは下のようになる。79e9a2afcf6ece50fdc5e5ea143d12ef_90_black.png

というわけでp(t)の分布もどきを求めることができます。(例えば両無筋なら確率a_1(t)+a_4(t)/34でp(t)=p_0(t)となるなど。)下のようなグラフになります。(○の大きさは起こる確率の大きさ。)
rep01-15.png

これを使って次回押し引きを考えたいと思います。

その6のコメント欄でなめとんさんから見えてる枚数も関係するのでは?とのご意見をいただいたのでその点についても考慮に入れて考えてみます。

スポンサーサイト
レポート1「一向聴時の対リーチ押し引き」その6 計算例3
今回は両面確定より条件の悪い場合について考えます。

まず悪形追っかけリーチの和了率等についてはパラメータのうち、p=2/34⇒1/34(自分の1順当たりツモ率)に変えて同様に計算します。グラフは下のとおりです。

rep01-11.png
(うわぁ3つともほとんど一緒の確率やわ)

ただし、これは降り2人が全く振らないという仮定なので、スジ引っ掛けとかだったら当てはまらないでしょう。ここではそうではない場合を考えます。

考える状況は両面とカンチャン対子の一向聴。(例えば11668m23478p345sみたいな形)

とここまで書いて気づいたけど、悪形含みだと聴牌化以外に良形一向聴への変化もあるんですね。これも同様の議論でできるのでついでにモデルに組み込んじゃいましょう。

I(t)を現在の一向聴の価値、I´(t)を変化後の一向聴の価値、C(t)、C'(t)はp(t0)の条件付期待値、sは1順当たり良形一向聴への有効牌ツモ率とします。sとrは独立でないですけど、それ以外は独立とします。すると、Iに関する式は次のように追加要素が増えます。
40d68bfc55ca825a62fbecd650a156e7_90_black.png
次に自分のツモが回ってきたときはrの確率で聴牌化、sの確率で良形化、どっちでもないとき(確率1-r-s)変化なしということです。

Cについてはほぼ同様なんで省略して境界に関する不等式は下のとおり。a4594206e027c413d8afa94977b24295_90_black.png

さて、良形変化についてもモデルに組み込めたところで計算してみましょう。

両面とカンチャン対子の一向聴ということなので、1順当たり聴牌化率r=4/34でカンチャンが埋まればピンフがついて良形1ハン増し30符(確率1/4)、シャボが埋まれば良形40符(確率1/4)、両面が埋まれば悪形40符(確率1/2)

良形一向聴への変化は牌姿によっていろんな場合がありますけど・・・とりあえず上の例えばで書いたような形として確率1/34(5m)で完全一向聴への変化としときます。(4mのリャンカン変化は見なかったことにしてください。一応計算は可能ですけどめんどくさいんで。)

なお追っかけリーチの期待得失点について完全一向聴のときは得点が変わるだけだったんで、単純に和了点の平均をとって計算してたんですけど(R(t)を求める式がWについて線形であるため)、今回は和了率等も変わるのでちゃんと場合を分けて計算する必要があります。(めんどい)

同じく計算結果をグラフと「目安」で示します。
rep01-13.png
↑子対子の間違い
rep01-12.png
↑11600~12000じゃなくて12000~12000(4ハン40符or5ハン30符)
rep01-14.png

自分子対子のとき

1%→最終順目以外押す
3%→1300~2000は16,17順目だけ押せる。
    それより上は最終順目以外押す
5%→1300~2000は押せない
    2600~3900は3順目以前
    5200~7700は14順目以前
    それより上は16順目以前
7%→2600~3900以下は押せない
    5200~7700は12順目以前
    8000~8000は14順目以前
    8000~12000は15順目以前
12%→2600~3900は押せない
    5200~7700は7順目以前
    7700~8000は11順目以前
    8000~12000は12順目以前


自分親対子リーチのとき

1%、3%→最終順目以外押す
5%→2000~2900は6順目以前
    3900~5800は14順目以前
    それより上は16順目以前
7%→2000~2900は3順目以前
    3900~5800は12順目以前
    7700~11600は14順目以前
    それより上は15順目以前
12%→2000~2900は押せない
     3900~5800は9順目以前
     7700~11600は12順目以前
     12000~12000は13順目以前
     12000~18000は14順目以前

自分子対親のとき

1%→1300~2000は14~17順目
    それより上は最終順目以外押す
3%→2600~3900以下は押せない
    5200~7700は13順目以前
    8000~8000は15順目以前
    8000~12000は16順目以前
5%→2600~3900以下は押せない
    5200~7700は3順目以前
    8000~8000は9順目以前
    8000~12000は12順目以前
7%→5200~7700は押せない
    8000~8000は6順目以前
    8000~12000は10順目以前
12%→7700~8000以下は押せない
    8000~12000は6順目以前

完全一向聴と比べて押し引きの境界はおおざっぱに相手子のとき1ハン増、相手親のとき2ハン増ぐらいになってます。特に子対親のきつさがでかくなってます。悪形含みの中では比較的いい形のこの条件でこれなんで実戦ではもっときついでしょう。

なお平均をとったときは常に追っかけリーチの期待値>ベタ降りの期待値になってますけど、悪形限定でのみ手の序中順では逆転してるんでそこらへん考慮してないぶんこれよりはややましになるかもしれません。(悪形聴牌したらベタ降りすればいいから。)とはいえすでにのみ手で押せる状況がほとんどないので大して変わらないかもしれませんが。



このあたりでレポートを終わります。長文お疲れ様でした。
レポート1「一向聴時の対リーチ押し引き」その5 前提条件の検討
今回はその2の最初に立てた前提条件について検討します。具体的にはそうでないときどのくらい誤差が発生するかどうかを検証します。

・現在自分は一向聴で一人リーチをかけている。他の二人は降りている。

この仮定はかなり強いもので、一人でも他に攻めている人がいればかなり誤差は大きいだろうし、そうなる頻度もそこそこ高いといえます。(二人リーチだったり、役牌ポンしてるのが突っ張ってきたりというのは結構あるだろう。)

よってここでは、他に一人攻めている人がいる、という仮定に代えて、どのくらい変わるか調べてみます。

とはいっても攻めるのが一人増えるとやってらんないくらい式が複雑になるので(しんどいけど計算できないわけじゃない)、ここで書くのは一部省略します。

ベタ降りの場合、ツモ順を自分→攻1→攻2として(も一人の降りはどこでもいい)
式は下のとおり(記号はちゃんと定義しないけど、ほぼ前と一緒)

38d9d03e23dd1599e185908abb9eab8d_90_black.png

これを解くと、8fea6c9353a6cd09684cb5030c778350_90_black.png
ただし、
d6c7f3cb67ffd4effcc62b4bd02d1a9e_90_black.png

追っかけリーチについては結果だけ。
4ccec596e33ac7934e38cfd8f88aa8d9_90_black.png

ただし、
8129c6b96d59ae73bea583b95101a9eb_90_black.png

グラフは以下のとおり
rep01-09.png

二人がリーチで攻めてるとき、それぞれの期待得失点は次のように修正されます。
be06b9b6ec7367ec48618e2a49ad1b40_90_black.png
次に一向聴の価値に関する式は下のように変わります。
9eff54feab06bc4a1d906f4f1f2c6100_90_black.png
今回は押す牌の放銃率の境界について、2人分考えなければいけないので、簡単に不等式で表すことができません。

説明はほぼはしょりましたがとりあえず理論はこの辺にして、計算をしてみます。

考える状況は自分は両面確定一向聴、攻1はリーチとします。攻2はリーチの場合と安手っぽい仕掛けの場合を考えます。待ちの良さはともに不明(前回と同じ)とします。

安手っぽい仕掛け(役牌orタンヤオの仕掛けにドラが入ってるかも?みたいな感じ)の点数の見積もりは以下のとおり。60%で1ハン、25%で2ハン、10%で3ハン、5%で4ハンとして、全部30符。これはひいいさんのサイトのデータを参考に少しドラ枚数について小さめに見積もったものです(裏ドラがないので)。適当なんでもっといい見積もりがあったら教えてください。これだと、H≒1880、K≒470(子対子)と見積もれます。

切る牌の放銃率について二人分考えるといろいろ大変なのでいくつかの場合について列挙するにとどめます。

まず対二人リーチのときから

・自分子対子と親 おっそろしく分が悪いです。
両方に通ってない字牌(各3%)→6ハンの一向聴で序中順までなら・・・(ただし1順目でも微差)
親に通っている字牌(3%、0%)→3900や7700の序中順が微差でやや押せる。期待得失点で100点差もないから信用ならんが。
単騎字牌(1%1%)→3はんで微妙?

・自分親対子2人
片方に現物片方に片無筋(7%、0%)→4ハンの序中順ぐらい?
両方に通ってない字牌(各3%)→11600の中順、7700の序順?
片方に通っている字牌(3%、0%)→3900の序中順か
単騎字牌(1%1%)→2900が微妙?1%0%でのみ手微妙

ここまでやってみて、最も影響が強いのが切る牌の放銃率、次に点数。逆に序中順までなら順目差はほぼ関係なし。考える必要はなさそう。どっちにしても、無筋とかまず切れない。

次に攻2が安い?仕掛けのとき。

・自分子対子リーチ親仕掛け
リーチに現物親に片無筋(0%7%)5200以上欲しい
逆(7%0%)→ハネマン必要。無理っす。
両方にスジ(5%5%)→上と一緒
リーチにスジ親に現物(5%0%)→4ハン~5ハンらへんが境界?
字牌(3%3%)→7700ぐらいが境界?
単騎字牌→2000~2600ぐらいが境界?

リーチ怖いな。リーチの強さが二人降りのときより際立つ。

疲れたからこんなところにしておくけど前の結果と比べてもまったく別の判断になってる。和了率の低下が痛い。攻めている人数が重要であることが示されたと思います。役牌ポンも無視できません。


・18順まわったら流局する。ツモ順は自分→リーチ者である。(降りている人は任意)

実際は流局までのツモ回数は70回なので、鳴きがなければ18順目は2人しか回りません。この点に関して最も誤差がでるのはツモ順が、降り→降り→リーチ者→自分のときで1.5順相当早く上の前提より早く流局します。

この場合、一向聴の期待得失点と押す牌の放銃率の境界について、

低打点のとき、50点程度増加、ほぼ影響なし
中打点のとき、100点程度減少、終順で3~4%ぐらい減少、中順で2%程度減少
高打点のとき、200点超減少、終順で6%ぐらい減少、中順で4%程度減少

というような影響を受けます。


・鳴きは考えない。

この研究をやる中で副産物としてわかったのは聴牌料の影響がかなり大きいということ。(終順で一向聴のとき、形式聴牌のためだけに1~2%の放銃率を背負う価値がある。)
よって終順では形式聴牌とりのため、さらに期待値が上がることが予想されます。この点に関しては次のレポートでとりあげるつもりです。

もちろん鳴いて役ありの一向聴のときも影響はより大きいものになるでしょうけど、形式聴牌よりは考えるのが難しそうなのでとりあえず後回しで。


・総連荘ルール

一般的な聴牌連荘の場合、ベタ降りの期待得失点の式から流局時の連荘効果650zをはずせばいい。書き直したグラフは下のとおり(両面確定一向聴)

rep01-10.png

総連荘のときより境界が2~5%ぐらい上に上がってます。

「目安」も書き直してみよう。

(あっ、子の点数になってる!ごめん)
自分親対子リーチのとき

1% 3%→最終順目以外押せる⇒いっしょ
5%→2000点は8順目以前
    2900点は13順目以前
    5800点以上は16順目以前
⇒1,3%といっしょ
7%→2000点は6順目以前⇒13順
    2900点は10順目以前⇒15順
    5800点は14順目以前⇒16順
    11600点は15順目以前⇒16順
    5ハンは16順目以前
12%→2000点は1順目以前(要するに押せない)⇒8順
     2900点は6順目以前⇒12順
     5800点は12順目以前⇒14順
     11600点、5ハンは14順目以前⇒15順

押せるゾーンがかなり広がりましたね。ルールも攻め人数ほどではないけど影響はありました。



とりあえず誤差とかの議論はここまで。次回も一個計算例を書いてみてこのレポートを終わりにしようかな。
レポート1「一向聴時の対リーチ押し引き」その4 計算例2
さて、完全一向聴の場合です。
グラフは下のようになります。
rep01-07.png
rep01-08.png
rep01-06.png

同様にランクごとにどこまで押せるかの「目安」を書きます。(注意は前回と同様)

自分子対子のとき

1%、3%→最終順目以外押す
5%→1300~2000は押せない
    2600~3900は16順目以前
    それより上は最終順目以外
7%→1300~2000は押せない
    2600~3900は14順目以前
    5200~7700は15順目以前
    それより上は16順目以前
12%→1300~2000は押せない
    2600~3900は9順目以前
    5200~7700は13順目以前
    7700~8000は14順目以前
    8000~12000は15順目以前

自分親対子のとき

1%、3%→最終順目以外押す
5%→1300~2000は14順目以前
    2600~3900は16順目以前
    それより上は最終順目以外
7%→1300~2000は12順目以前
    2600~3900は15順目以前
    それより上は16順目以前
12%→1300~2000は8順目以前
    2600~3900は14順目以前
    5200~7700は15順目以前
    7700~8000以上は16順目以前

自分子対親のとき

1%→最終順目以外押す
3%→1300~2000は2順目以前
    2600~3900は15順目以前
    5200~7700は16順目以前
    それより上は最終順目以外
5%→1300~2000は押せない
    2600~3900は7順目以前
    5200~7700は13順目以前
    それより上は15順目以前
7%→1300~2000は押せない
    2600~3900は3順目以前
    5200~7700は11順目以前
    7700~8000は13順目以前
    8000~12000は14順目以前
12%→2600~3900以下押せない
    5200~7700は7順目以前
    7700~8000は10順目以前
    8000~12000は12順目以前


さて、その3で書いたただの両面確定一向聴のグラフや「目安」と比べると・・・

ありゃっ、大して変わらないではないか。大きく変わったのは自分親対子の2000(1300~2000)のときぐらいか。(5%が8順→14順、7%が6順→12順、12%が1順→8順)ちょっと期待はずれ。
これは先制リーチ入ってる状況だから一概には言えないだろうが、ピンフがつかないシャボが埋まるツモはうれしくないということかしら。まぁ確かにちょっとは良くなってはいるんですけどね。

まぁ期待はずれの結果があったりしたけどこれはなかなか面白い!その5で誤差とかの問題について言及した後、今度はもうちょい悪い条件でどうなるか計算してみたり♪今日はけっこう疲れたけど得られたものは大きかったぞ、イェイ。

その5に続く
レポート1「一向聴時対リーチ押し引き」その3 計算例
具体的な計算例としてまず両面確定の一向聴の時を考えます。(例えば1156m23478p345s西みたいな形)まずパラメータの設定から。

1順当たり聴牌確率rは有効牌4枚だから(鳴きは考えない)、r=4/34≒11.76%。

またリーチ者1順あたりツモ率qは両面か否かわからないとして、q=2/34×65%+1/34×35%≒4.85%。(65%はリーチの両面率)

一向聴維持のために切る牌の放銃率の期待値E[p(t)]は一向聴を維持するならほぼツモ切りになるだろうからqと同じとする。

追っかけリーチに持ち込んだときの自分の1順当たりツモ率pは両面確定ということでp=2/34≒5.88%

追っかけリーチのリーチ宣言牌の放銃率xは片無筋ぐらい想定して7%

相手リーチの放銃失点H、被ツモ失点Kはそれぞれ、
・自分子対子→H=4800、K=1600
・自分親対子→H=4800、K=3200
・自分子対親→H=7200、K=3200
とする。

まずその2の最後で議論したベタ降りや追っかけリーチの和了率等のグラフを下に示します。
rep01-01.png
追っかけリーチの方は「科学する麻雀」と大して違いはないのですが、ベタ降りの方は他二人も降りという仮定が大きく、被ツモ率、流局率ともにやや増加しています。

次にメインの話題となる「どの牌まで押せるか?」に関するグラフです。
rep01-04.png
rep01-02.png
rep01-05.png
ミスった。3つ目は自分子対親リーチです。


グラフではわかりづらいところもあるのでそれぞれの切る牌のランクについて「とりあえずの目安」を記しておきます。
※注意 ここまで誤差評価の話はまったくしていません。一応その4でその辺の話はするつもりですけど、ぜんぜん不足だと思います。(例えば牌の放銃率の順目依存の関係や終順の形テンねらいの無視など。)あくまで「目安」です。

ここでは
・単騎字牌 放銃率1%
・字牌、筋19、両筋456 放銃率3%
・筋2378 放銃率5%
・片無筋 放銃率7%
・両無筋 放銃率12%
ぐらいとしてこれらの数字と境界を比較します。

自分子対子リーチのとき

1%→最終順目以外押せる
順目遅く点数が低くても流局時収入にかけることができるためでしょう。
3%→1300点は16,17順目(和了よりも流局にかける終順の方がいいという悲惨な状況)
    2000点以上は最終順目以外押せる
5%→2000点以下は押せない
    3900点は14順目以前
    7700点以上は16順目以前
7%→2000点以下は押せない
    3900点以下は11順目以前
    7700点以下は14順目以前
    5ハンは15順目以前
12%→2000点以下は押せない
     3900点は6順目以前
     7700点は12順目以前
     5ハンは13順目以前
全体とすると2000点ではきつく、3900点で戦えなくはない、7700点でけっこう勝負になる印象。
 
自分親対子リーチのとき

1% 3%→最終順目以外押せる
5%→2000点は8順目以前
    2900点は13順目以前
    5800点以上は16順目以前
7%→2000点は6順目以前
    2900点は10順目以前
    5800点は14順目以前
    11600点は15順目以前
    5ハンは16順目以前
12%→2000点は1順目以前(要するに押せない)
     2900点は6順目以前
     5800点は12順目以前
     11600点、5ハンは14順目以前
親の2ハンは子の3ハンと同格。5800点あれば中順まで押せ押せモード。

自分子対親リーチのとき

1%→最終順目以外押す
3%→2000点以下は押せない
    3900点は13順目以前
    7700点以上は16順目以前
5%→2000点以下は押せない
    3900点は4順目以前
    7700点は12順目以前
    5ハンは14順目以前
7%→3900点以下は押せない
    7700点は9順目以前
    5ハンは12順目以前
12%→3900点以下は押せない
     7700点は4順目以前
     5ハンは8順目以前
対子リーチと比べて点数1ハン+α増ぐらいにしてようやく判断がつりあいます。実戦ではほとんど降りることになるんでしょう。ただこの場合でも単騎字牌は常に押せるというのは朗報だと思います。
このモデルだとテンパったら常にリーチが降りより有利になるので。(多分「科学する麻雀」では聴牌料を考慮してないためこうなるかと。聴牌料はでかいです。特に終順。この事実から両面の場合、その2で定義したTは常にT=18となる。)



やってて楽しくなってきたのでもう一例。今度は完全一向聴の場合。(例えば11556m23478p345sみたいな形)パラメータはrが5/34≒14.71%に変わるのと自分の和了点が変わるくらいです。

自分の和了点については先に両面が埋まればピンフがついて1ハン増し30符、シャボが埋まったとき
40符と仮定します。それぞれ起こる確率は80%、20%です。どっちにしても両面待ちです。

さて、同じようにグラフを示しましょう。
と思ったけどかなり長くなってきたんで、ここでとりあえず切っておきましょう。

その4に続く
レポート1「一向聴時の対リーチ押し引き」その2 理論
まずモデルの前提条件から

・現在自分は一向聴で一人リーチをかけている。他の二人は降りている。
・18順まわったら流局する。ツモ順は自分→リーチ者である。(降りている人は任意)
・鳴きは考えない。
・総連荘ルール

次に記号の定義を

・t0:現在時刻(ただし「現在」とは自分のツモ後、打牌前)
・B(t):t順目のべた降り時期待得失点、tの既知関数。
・R(t):t順目に追っかけリーチしたときの期待得失点、tの既知関数。
・p(t):t順目に切る牌の放銃率、tについて独立な確率変数。
・I(t):t順目に到達したときのt順目のイーシャンテン期待得失点、p(t)に依存する確率変数。
・C(t)=E[I(t)|p(t0)]
・H:放銃失点、K:被ツモ時失点
・T:B(t)>R(t)となる最小順目。そのようなtが存在しないときは最終18順目。(攻める意味がなくなる順目)
・r:自分の1順あたりテンパイ化率
・q:リーチ者の1順当たりツモ上がり率

ここでC(t)についてt>t0のとき、I(t)とp(t0)は独立なので(t0順目に切った牌が現物だろうが無筋だろうが、それが通ってt順目に達すればその時点の一向聴の価値は変わらないであろう。)、C(t)=E[I(t)]でp(t)によらず、ただのtの関数となることに注意する。

目標はC(t0)を求めることで、C(t0)>B(t0)なら攻めるべき、C(t0)=B(t0)なら降りるべきという判断ができる。

I(t)について次の漸化式が成り立つ。

a7a6f43f1ed57a0faa933e0a6a84776d_90_black.png

66782b98b630281f44b3f4807712d152_90_black.png

ここでmax内の第1項はベタ降りを選んだときの期待得失点、第2項は一向聴維持のため攻めたときの期待得失点である。また第2項の中で、第4項は切った牌で放銃、第3項はそうでないときツモられる、第2項はどちらでもないとき次順テンパって追っかけリーチ、第1項はどれでもなく次順を迎える、というそれぞれの場合に分けて期待得失点をとったものである。

p(t0)に関する条件付期待値をとって

d8224fdfd0b85ed3f15a514c688edafe_90_black.png
24ea3a1ec4eaca29546c3ed4ce1d62b9_90_black.png
65f0d7e2189cd58cb9c696b466d25002_90_black.png

ここでp(t0)とp(t)は独立、p(t)とI(t+1)は独立、を使った。
このCに関する漸化式からC(t0)を求めることができる。


次にC(t0)はp(t0)の関数であるのでp(t0)を変化させることを考える。(1)式の第2項をまとめてF(t)とおくと攻めるべき条件はB(t0)<F(t0)であり、F(t0)はp(t0)について一次式なので(C(t0+1)はp(t0)によらない)、p(t0)について簡単に解くことができて、次のようになる。

0b49373e03774d7474c0d10d89834e53_90_black.png

この式からすべてのパラメーターを決めれば、攻めと降りの境界となる切る牌の放銃率を求めることができる。


次にB(t),R(t)について、ひとつの考え方として、「科学する麻雀」のデータから求めることが考えられるが、ここでは強い前提条件を設けているので、先ほどと同様、漸化式をたてて求めることにする。
w(t)、h(t)、k(t)、r(t)をそれぞれt順目の和了率、放銃率、被ツモ率、流局率とする。またzを、自分が親のとき1、子のとき0となる数とする。まずB(t)について

80c36f1cffd6ac88ac0beb1472e1d062_90_black.png

第1式第1項は同順ツモられる確率、第2項は次順に持ち越しになったときの確率をあらわす。第2式の18順目被ツモ率は同順ツモられる分のqである。第3,4式は全員がベタ降りすることから成り立つ。この漸化式を解くと
10fe26894222d8171615577ff4345ca2_90_black.png

B(t)は「科学する麻雀」の式を少し変形して、

a06a30c031ceedbec8981babc5d7b237_90_black.png

第1項は被ツモ失点の期待値、第2項は流局したときについて、自分含む3人ノーテンの聴牌料-1000点と供託リーチ棒1本が25%の確率で回収できるとして+250点、そして親のときの連荘効果+650zが流局時の期待得失点となる。

またR(t)についてはまず追っかけリーチのときに切る牌が安牌のとき(言い換えれば、打牌して通った直後の状態)の漸化式を立てる。ここで
・p:1順あたり自分ツモ率、または相手が自分の和了牌をつかむ確率
・q:1順あたり相手ツモ率、または自分が相手の和了牌をつかむ確率
として上の4つの事象は独立であると仮定する。(自分の和了牌と相手の和了牌が独立であるとすればこの仮定は正しいであろう。)このとき和了率等に関する漸化式は次のようになる。

2adf23e1cee41674858997d7d0fdebc5_90_black.png

第1~4式について、まずリーチ者のツモでツモ上がりする確率がq(第3式第1項)、そうでないときそれが自分の和了牌である確率がp(1-q)(第1式第1項)、そうでないとき自分のツモ番になってツモ上がる確率がp(1-p)(1-q)(第1式第2項)、そうでないとき相手の和了牌を掴む確率がq(1-p)^2(1-q)(第2式第1項)、そうでないとき一巡して、確率は(1-p)^2(1-q)^2(各式最終項)。18順目は相手の打牌までなので上のようになる。これらの漸化式を解くと次のようになる。

dcff1c96ac0632e49ff440d337f78767_90_black.png
ただし、
93197063c73d7c9699097e521bf642af_90_black.png

この式からリーチ宣言牌の放銃率xのときの和了率等は次のようになる。

841ec96743df60c29b70a7db168f210f_90_black.png

これは即放銃の場合が放銃率に加算される代わり、その他の場合の確率が(1-x)倍になることによる。

R(t)の計算はB(t)のときと似たような感じで次のようになる。ただし自分の和了点をWとする。

f59a1f5034e43c34d5d090dd25db5b1c_90_black.png

ただしあがったとき相手のリーチ棒ゲット+連荘効果650z、上がられたときリーチ棒余計に失う、流局時については自分含む二人聴牌の聴牌料+1500点、リーチ棒支出-1000点、供託リーチ棒2本は25%の確率で回収できるとして+500点、連荘効果+650zを計算に入れている。


とりあえずおおまかなところの論点は以上です。次回は実際の状況に即して具体的に計算してみます。

その3へ続く
レポート1「一向聴時の対リーチ押し引き」その1 前書き
リーチをかけてるときはツモ切りしか選択肢がなく、ベタ降りのときも事実上攻めることが不可能となっている場合が多く、最も安全な牌を切ることになるので、選択肢は一つと考えることができる。

これに対し、一向聴のときはそれを維持する限り、一向聴を維持し続けるかベタ降りに転換するかの選択肢を常に選ぶことができる。言い換えると、一度ベタ降りに転換してしまえば攻める選択を放棄することとなる。(これは喰い仕掛けやダマの聴牌、形式聴牌にもあてはまる。これらについても今後レポートを書くかも。)

ここでは、一向聴のときの押し引きについて「科学する麻雀」では考慮されなかった、「選択権」を考えたモデルを組んで対リーチの押し引きを考える。考え方は「コールオプションの価格決定式の導出」に近い。

その2へ続く
研究方針とか
私の身分は大学院生、専門は数学。
よってブログを作るきっかけとなった最初の研究を含めて、他の麻雀研究家のみなさんの研究と比べ、やや数学的な視点から見ることが多くなるだろう。(具体的には、統計やシミュレーションといった手法より数式いじりをすることが多いと思う。)

ただ数学の論文みたいなのと違って、一般の人にも理解してもらえるような文章を書きたいと思うし、自分の理論が完全に正しいと思っていないので、間違っているところはツッコんでもらって直していきたいとも思う。だから、いっぱい数式が出てくると思うけど、新しく式を立てた場合はできるだけ式の意味や根拠を詳しく書いていきたいと思っている。(本文長くなること覚悟で。)

また、数式を使うということで、我打麻将さんからTeXを使えるツールを教えてもらったので、それを活用しようと思う。TeXは初心者なんで練習しておこっと。

55d798e185861e75135181f8df35281d_90_black.png

にっくきテイラー展開召還!(笑)
麻雀研究始めました
前々からとつげき東北さんの「科学する麻雀」を読んで、ちゃんと麻雀をそういう視点から考えたいなぁ、と思っていたんですけど、実際まぁなんか計算してみるということはなくのんびり東風荘で麻雀打って過ごしてたわけですね。(R1300らへんから2年くらいで保障安定R最小値スコア1885まで成長して楽しくなってきた)

この前あるテーマについてちょっと思い立って計算してみたところかなり面白い結果が得られたんで掲示板で報告したところ、なんたらかんたらしてるうちにブログを立ち上げることになってしまった!ろくにメールも使ってないようなパソコン音痴なのに。まぁこれから頑張ればいいんです。

とりあえず見てくれている人にははじめましてとよろしくです。
プロフィール

Author:nisi5028
FC2ブログへようこそ!

最新記事
最新コメント
最新トラックバック
月別アーカイブ
カテゴリ
FC2カウンター
フリーエリア
検索フォーム
RSSリンクの表示
リンク
ブロとも申請フォーム

この人とブロともになる

QRコード
QRコード