updated at 2020-12-4
「当たり馬券の予測で学ぶ競馬AIシステムの構築」の競艇版です。
監修は、お勧めAI書籍、競馬、に引き続き、
Md.Labです。
実証実験のページにココへのリンクも掲載されています。
通常、Md.Labは、こういったモデルの作成を請け負うことも予測結果を他所に提供することもしていないのであしからず
(普通に考えて、当たればお金になる予測を他人と共有することは無いのです。)
週末しかやらない競馬と違い、盆も正月も休まず、365日開催されている。
いち早くWeb投票の環境を整備し瀕死だった地方のボートレース場の売上をV字回復させただけあって、
半民半官な組織で有りながら民間企業よりITを駆使しているように見えます。
システム運用が内製なのか外注なのか知りませんが、投票サイトのUIもよく出来ていて、提供されているデータのフォーマットも整っています。
上記の2つの理由により、購入者は毎日ネットやアプリを通じ全国のボートレース場の舟券を買える。
特に、平日は下手な予測よりも、オッズ買いしていれば、そこそこ当たるぐらい固い。
競馬は1レースで走る数が5頭〜18頭までとバラバラで的中率はレースごとに変動します。
競艇は欠場等を除いて6挺で固定されています。
1着を予想する単勝が的中する確率は1/6通りで16.66%
1着と2着を予想する2連単の的中する確率は1/30通りで3.33%
1着と2着と3着を予想する3連単の的中する確率は1/120通りで0.83%
競艇は決まりすぎるので、競馬と違って、単勝を買う人はほとんどいません。
競艇の売上の約9割が3連単です。
的中する算確率が1%を切る3連単の購入者がダントツに多いということは競艇は予測しやすいゲームだと言えます。
下記は、異なる2つ区間から一定量のとある値を抜き出したものです。
この値は、1件ずつ見ると、規則性の無いランダムな数字に見えますが、極限に達すると、まったく同じデータを参照しているかのような分布に落ち着きます。
ヘビーな購入者はこういったパターンを感覚的に捉え、勘という言葉で表現しているのかもしれません。
現在の当方のボートレース予測AIシステムのレコードは、2連単の最高的中率が47%、3連単の最高的中率が28%です。(挑戦継続中)
バランス良く回収率を上げられるのは低オッズの3連単です。
この点でも舟券購入者の経験則に基づく購買行動と一致します。
ですが、決まりすぎて面白みが無いので、
2連単で10倍以上のオッズが付くレース結果の予測を課題とします。
(競艇の場合、2連単の半分以上は8倍以下のオッズしか付きません。)
競艇の的中率とオッズの関係は競馬以上に明確なトレードオフ関係を描くので、高オッズほど的中率が下がります。
低確率で起きる事象の再現を試みるオーバーフィッティング(過学習)との戦い。
この学習に使ったのは、tensorflowとxgboostでkaggleでよく見る感じのライブラリ
いきなり万舟券
いきなり万舟券
この翌日に100円しか賭けていないレースでも61倍が出ている。
高オッズを狙ってはいるが、短期間で再現できる精度ではないので、これは運が良かったとしか説明しようがない。
種銭が出来たので期間を定め、賭け続けることにする。
あぶく銭なので1レース1,000円とする。
しかし、シュミレーションしたら途中で予算が付きそうだったので、予測の信頼性の高さを別に算出し一定の閾値に達したレースのみを購入する。
11月28日~1月21日まで約2ヶ月続けた結果
(横軸が開始日を左側、終了日を右側とした期間)
■的中数 ■購入数 ■払戻金額
買っていないレースの方が的中率が高かったので、信頼性の計算に信頼性が無かったというオチ。
予測システムの心得
よく出来た予測モデルの必勝法は勝つまで買い続けること
あまりよく出来ていない予測モデルの必勝法は勝っているうちに止めること