updated at 2021-8-24
「当たり馬券の予測で学ぶ競馬AIシステムの構築」の競艇版です。
監修は、お勧めAI書籍、競馬、に引き続き、
Md.Labです。
実証実験のページにココへのリンクも掲載されています。
通常、Md.Labは、こういったモデルの作成を請け負うことも予測結果を他所に提供することもしていないのであしからず
(普通に考えて、当たればお金になる予測を他人と共有することは無いのです。)
競艇の3単の数学的確率は約0.3%です。
実際のデータを観測した結果である統計的確率で1-2-3になる率は7.2%と24倍になります。
しかし、1-2-3のオッズの中央値は全体の中央値の3分の1しかありません。
かたや、6-5-4になる率は0.1%ですが、1回当てるだけで1,000円が20万円になるような高配当ばかりが出ています。
競馬同様、数学的確率に重みを付け歪ませてる要因を探し、AIによって再現します。
尚、課題設定を「再現性(重要)が担保された収益モデルの構築」とした場合の難易度は、
株>>FX(外国為替)>競馬>>競艇 で、競艇がもっともハードな印象です。
投資じゃなくギャンブルなので当たり前ですが
週末しかやらない競馬と違い、盆も正月も休まず、365日開催されている。
いち早くWeb投票の環境を整備し瀕死だった地方のボートレース場の売上をV字回復させただけあって、
半民半官な組織で有りながら民間企業よりITを駆使しているように見えます。
システム運用が内製なのか外注なのか知りませんが、投票サイトのUIもよく出来ていて、提供されているデータのフォーマットも整っています。
上記の2つの理由により、購入者は毎日ネットやアプリを通じ全国のボートレース場の舟券を買えます。
特に、平日は下手な予測よりも、オッズ買いしていれば、そこそこ当たるぐらい固い。
進入コースの変更が投票の締め切り後に行われるレースが結構な頻度で存在します。
ボートレースファンにも不評なルールで「博打の駒が勝手に動いてんじゃねえよ」と野次られたりしています。
データ分析を武器に勝負する上で結果と非常に相関の高い重要変数のランダム要因を排除しきれないのは大きなハンデです。
競馬は1レースで走る数が5頭〜18頭までとバラバラで的中率はレースごとに変動します。
競艇は欠場等を除いて6挺で固定されています。
1着を予想する単勝が的中する確率は1/6通りで16.66%
1着と2着を予想する2連単の的中する確率は1/30通りで3.33%
1着と2着と3着を予想する3連単の的中する確率は1/120通りで0.83%
競艇は決まりすぎるので、競馬と違って、単勝を買う人はほとんどいません。
競艇の売上の約9割が3連単です。
的中する算確率が1%を切る3連単の購入者がダントツに多いということは競艇は予測しやすいゲームだと言えます。
下記は、異なる2つ区間から一定量のとある値を抜き出したものです。
この値は、1件ずつ見ると、規則性の無い数字に見えますが、極限に達すると、まったく同じデータを参照しているかのような分布に落ち着きます。
ヘビーな購入者はこういったパターンを感覚的に捉え、勘という言葉で表現しているのかもしれません。
現在の当方のボートレース予測AIシステムの再現性が有る最高的中率は、2連単が47%、3連単が28%です。
(挑戦継続中:2022年10月時で2連単が66.7%)
バランス良く回収率を上げられるのは低オッズの3連単です。
この点でも舟券購入者の経験則に基づく購買行動と一致します。
ですが、決まりすぎて面白みが無いので、
2連単で10倍以上のオッズが付くレース結果の予測を課題とします。
(競艇の場合、2連単の半分以上は8倍以下のオッズしか付きません。)
競艇の的中率とオッズの関係は競馬以上に明確なトレードオフ関係を描くので、高オッズほど的中率が下がります。
低確率で起きる事象の再現を試みるオーバーフィッティング(過学習)との戦い。
この学習に使ったのは、tensorflowとxgboostでkaggleでよく見る感じのライブラリ
そして、結果はいきなりの万舟券
この後、100円しか賭けていないレースでも61倍が出ている。
高オッズを狙ってはいるが、数回で再現できる確率ではないので、これは運が良かったとしか説明しようがない。
種銭が出来たので期間を定め、賭け続けることにする。
あぶく銭なので1レース1,000円とする。
しかし、シュミレーションしたら途中で予算が付きそうだったので、予測の信頼性の高さを別に算出し一定の閾値に達したレースのみを購入する。
11月28日~1月21日まで約2ヶ月続けた結果
(横軸が開始日を左側、終了日を右側とした期間)
■的中数 ■購入数 ■払戻金額
買っていないレースの方が的中率が高かったので、信頼性の計算に信頼性が無かったというオチ。
予測システムの心得
よく出来た予測モデルの必勝法は勝つまで買い続けること
あまりよく出来ていない予測モデルの必勝法は勝っているうちに止めること
オマケ
天気、波の高さ、風の強さ、がレースに与える影響をまとめたので、置いておきます。
フューチャーエンジニアリング(特徴量の抽出)のご参考に
https://sier-re.net/txt/boatr.html
3連単の予測公開中
好評につき、アップデート継続中
https://sier-re.net/boat-race/index.html