FC2ブログ

*All archives* |  *Admin*

<<07  2019/08  1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31  09>>
はじめてのpython&Tensorflowその16・手役判定関数のPythonへの移植
今日は特に成果物があるわけではないですが、進捗報告だけ。

打点と四人麻雀への拡張のために、アガリ時メンツの切り分け関数と手役判定関数をVB.NET仕様からPythonで書き直すのをやってました。

おもったよりたいへんでしたが、無事にお引越しが終わりました。

今後の予定
・四人麻雀で自己対戦できるgym環境作り(牌譜出力機能を含む)
・従前作った教師ありポリシーニューラルネットと自己対戦用環境で牌譜を大量生成
・できた牌譜からバリューネットワーク用データ(仮)を作成し、ニューラルネットで教師あり学習
・教師ありポリシーネットワークを初期値、バリューネット(仮)をベースラインとしたReinforceアルゴリズムで強化学習
・強化学習で得たポリシーネットワークで牌譜を大量生成
・バリューネットワーク(真)を教師あり学習で得る。

という感じでいければ、アルファ碁風麻雀AIの完成なんですが、うまいことできるようにがんばりましょう。

多分一番の壁はいかに高速に自己対戦を回して、多くの牌譜をゲットするまでの時間を短縮できるかだと踏んでいます。
「アルファ碁解体新書」によると、バリューネット用データはデータ間の相関を小さくするために1試合に1サンプルしか取っちゃいけないらしいので、今手持ちの鳳凰卓の牌譜だけではだいぶ心もとないです。
1試合1サンプルの制限はさすがにきついので、1局に1サンプルでお茶を濁してなんとかならないかと考え中です。それなら10倍くらいはかさ上げはできそうなので大きい。
ベースライン用仮データだけなら鳳凰卓データだけでも対応できるかも。

四人麻雀自己対戦gym環境と牌譜出力プログラムをpythonで組む作業がとりあえずの目先の目標です。
スポンサーサイト



コメントの投稿

Secret
(非公開コメント受付中)

コメント

No title
初めまして。
麻雀AIで教師なし学習も取り入れることはお考えでしょうか。また、研究内容を学会などで発表する予定はありますか。
記事の内容にあまり関係のない質問で申し訳ございません。
Re: No title
> 初めまして。
> 麻雀AIで教師なし学習も取り入れることはお考えでしょうか。また、研究内容を学会などで発表する予定はありますか。
> 記事の内容にあまり関係のない質問で申し訳ございません。


麻雀AIの教師なし学習については、今後やることも考えてはいますが、別の予定との兼ね合いでまだ手がついていない状態です。

学会での発表の予定は今のところありません。
なお、今後の研究成果は麻雀数理研究会という団体名義で発表する予定になっています。
http://epsilon69399.blog20.fc2.com/blog-entry-1061.html

プロフィール

nisi5028

Author:nisi5028
FC2ブログへようこそ!

最新記事
最新コメント
最新トラックバック
月別アーカイブ
カテゴリ
FC2カウンター
フリーエリア
検索フォーム
RSSリンクの表示
リンク
ブロとも申請フォーム

この人とブロともになる

QRコード
QRコード