*All archives* |  *Admin*

<<10  2017/11  1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30  12>>
レポート1「一向聴時の対リーチ押し引き」その2 理論
まずモデルの前提条件から

・現在自分は一向聴で一人リーチをかけている。他の二人は降りている。
・18順まわったら流局する。ツモ順は自分→リーチ者である。(降りている人は任意)
・鳴きは考えない。
・総連荘ルール

次に記号の定義を

・t0:現在時刻(ただし「現在」とは自分のツモ後、打牌前)
・B(t):t順目のべた降り時期待得失点、tの既知関数。
・R(t):t順目に追っかけリーチしたときの期待得失点、tの既知関数。
・p(t):t順目に切る牌の放銃率、tについて独立な確率変数。
・I(t):t順目に到達したときのt順目のイーシャンテン期待得失点、p(t)に依存する確率変数。
・C(t)=E[I(t)|p(t0)]
・H:放銃失点、K:被ツモ時失点
・T:B(t)>R(t)となる最小順目。そのようなtが存在しないときは最終18順目。(攻める意味がなくなる順目)
・r:自分の1順あたりテンパイ化率
・q:リーチ者の1順当たりツモ上がり率

ここでC(t)についてt>t0のとき、I(t)とp(t0)は独立なので(t0順目に切った牌が現物だろうが無筋だろうが、それが通ってt順目に達すればその時点の一向聴の価値は変わらないであろう。)、C(t)=E[I(t)]でp(t)によらず、ただのtの関数となることに注意する。

目標はC(t0)を求めることで、C(t0)>B(t0)なら攻めるべき、C(t0)=B(t0)なら降りるべきという判断ができる。

I(t)について次の漸化式が成り立つ。

a7a6f43f1ed57a0faa933e0a6a84776d_90_black.png

66782b98b630281f44b3f4807712d152_90_black.png

ここでmax内の第1項はベタ降りを選んだときの期待得失点、第2項は一向聴維持のため攻めたときの期待得失点である。また第2項の中で、第4項は切った牌で放銃、第3項はそうでないときツモられる、第2項はどちらでもないとき次順テンパって追っかけリーチ、第1項はどれでもなく次順を迎える、というそれぞれの場合に分けて期待得失点をとったものである。

p(t0)に関する条件付期待値をとって

d8224fdfd0b85ed3f15a514c688edafe_90_black.png
24ea3a1ec4eaca29546c3ed4ce1d62b9_90_black.png
65f0d7e2189cd58cb9c696b466d25002_90_black.png

ここでp(t0)とp(t)は独立、p(t)とI(t+1)は独立、を使った。
このCに関する漸化式からC(t0)を求めることができる。


次にC(t0)はp(t0)の関数であるのでp(t0)を変化させることを考える。(1)式の第2項をまとめてF(t)とおくと攻めるべき条件はB(t0)<F(t0)であり、F(t0)はp(t0)について一次式なので(C(t0+1)はp(t0)によらない)、p(t0)について簡単に解くことができて、次のようになる。

0b49373e03774d7474c0d10d89834e53_90_black.png

この式からすべてのパラメーターを決めれば、攻めと降りの境界となる切る牌の放銃率を求めることができる。


次にB(t),R(t)について、ひとつの考え方として、「科学する麻雀」のデータから求めることが考えられるが、ここでは強い前提条件を設けているので、先ほどと同様、漸化式をたてて求めることにする。
w(t)、h(t)、k(t)、r(t)をそれぞれt順目の和了率、放銃率、被ツモ率、流局率とする。またzを、自分が親のとき1、子のとき0となる数とする。まずB(t)について

80c36f1cffd6ac88ac0beb1472e1d062_90_black.png

第1式第1項は同順ツモられる確率、第2項は次順に持ち越しになったときの確率をあらわす。第2式の18順目被ツモ率は同順ツモられる分のqである。第3,4式は全員がベタ降りすることから成り立つ。この漸化式を解くと
10fe26894222d8171615577ff4345ca2_90_black.png

B(t)は「科学する麻雀」の式を少し変形して、

a06a30c031ceedbec8981babc5d7b237_90_black.png

第1項は被ツモ失点の期待値、第2項は流局したときについて、自分含む3人ノーテンの聴牌料-1000点と供託リーチ棒1本が25%の確率で回収できるとして+250点、そして親のときの連荘効果+650zが流局時の期待得失点となる。

またR(t)についてはまず追っかけリーチのときに切る牌が安牌のとき(言い換えれば、打牌して通った直後の状態)の漸化式を立てる。ここで
・p:1順あたり自分ツモ率、または相手が自分の和了牌をつかむ確率
・q:1順あたり相手ツモ率、または自分が相手の和了牌をつかむ確率
として上の4つの事象は独立であると仮定する。(自分の和了牌と相手の和了牌が独立であるとすればこの仮定は正しいであろう。)このとき和了率等に関する漸化式は次のようになる。

2adf23e1cee41674858997d7d0fdebc5_90_black.png

第1~4式について、まずリーチ者のツモでツモ上がりする確率がq(第3式第1項)、そうでないときそれが自分の和了牌である確率がp(1-q)(第1式第1項)、そうでないとき自分のツモ番になってツモ上がる確率がp(1-p)(1-q)(第1式第2項)、そうでないとき相手の和了牌を掴む確率がq(1-p)^2(1-q)(第2式第1項)、そうでないとき一巡して、確率は(1-p)^2(1-q)^2(各式最終項)。18順目は相手の打牌までなので上のようになる。これらの漸化式を解くと次のようになる。

dcff1c96ac0632e49ff440d337f78767_90_black.png
ただし、
93197063c73d7c9699097e521bf642af_90_black.png

この式からリーチ宣言牌の放銃率xのときの和了率等は次のようになる。

841ec96743df60c29b70a7db168f210f_90_black.png

これは即放銃の場合が放銃率に加算される代わり、その他の場合の確率が(1-x)倍になることによる。

R(t)の計算はB(t)のときと似たような感じで次のようになる。ただし自分の和了点をWとする。

f59a1f5034e43c34d5d090dd25db5b1c_90_black.png

ただしあがったとき相手のリーチ棒ゲット+連荘効果650z、上がられたときリーチ棒余計に失う、流局時については自分含む二人聴牌の聴牌料+1500点、リーチ棒支出-1000点、供託リーチ棒2本は25%の確率で回収できるとして+500点、連荘効果+650zを計算に入れている。


とりあえずおおまかなところの論点は以上です。次回は実際の状況に即して具体的に計算してみます。

その3へ続く
スポンサーサイト

コメントの投稿

Secret
(非公開コメント受付中)

コメント

面白いブログ発見‼
まだ見たばっかですが感想を一言
素晴らしい!
の一言です。
僕も数学科の学生なので、牌効率極めて、イーシャンテン時押すか降りるかの評価関数とポンテンとるかどうかの評価関数作れれば、麻雀最強になれるんじゃないかと思っていたので、なんか作る手間省けたわって感じです。
プロフィール

nisi5028

Author:nisi5028
FC2ブログへようこそ!

最新記事
最新コメント
最新トラックバック
月別アーカイブ
カテゴリ
FC2カウンター
フリーエリア
検索フォーム
RSSリンクの表示
リンク
ブロとも申請フォーム

この人とブロともになる

QRコード
QRコード