SSブログ

マイニングについて [競馬]

競馬ファンなら誰でも知ってるマイニング。
というのは言いすぎですが、ターゲット使いなら知らない人はいないでしょう。
そうです。ゼンノロブロイの母父です。

というお約束ネタが済んだところで
今回考えるのはJRA-VANが提供している、データマイニングについてです。
狙っている穴馬がマイニング1番手だとちょっと嬉しかったり
逆に芳しくなかったりすると金額を抑えたりしてしまうマイニング先生ですが
その仕組みを理解していればよりよい使い方ができるように思います。

といっても私は統計学にもコンピュータを介したデータ処理にも明るくないので
(できるのであれば自分で競馬ソフトを作りたいところですが)
サイトにある説明をもとに考えていきます。

かいつまんで言うと、マイニングさんはレースを
コース、大まかな距離、クラスに分けてモデルデータをつくり、
それを基にして分析しているようです。
データは「JRA発表の公式データのうち客観的なもの」を採用していて、
たとえばオッズのような、(全く相関関係がないわけではないけれど)実力とは
無関係なデータは採用していないそうです。
信頼できそうです。

ここで考慮するべき点は三点です。
重箱の隅をつつく、という感じかもしれませんが・・・

(1)JRAが発表していないデータを加味する
まあそりゃそうですよね。
道中の不利、通った場所、調教(坂路調教はデータとして採用されていますが)
トラックバイアス(枠番は考慮されていますが、開催日とリンクさせているわけではなさそうです)
これらを加味して考えることで、マイニング上位の馬に逆転できる可能性は探れるでしょう。

(2)JRA発表のデータを疑う
有名なものは馬場状態です。やたら重い良馬場や時計のでる重馬場と、
馬場状態の指標としては機能していないように思います。
もっともマイニングさんはあまり参考にしていないようですが。

(3)マイニングの仕組みのスキを突く
たとえば障害競走は、モデルが一つしかありません。
直線芝・ダート、直線の障害の有無、タスキの有無、なにより距離です。
4250mの中山GJも2880mの未勝利戦も一緒です。
騎手というファクターもありますが、直近100戦の成績を参照しているそうなので
目下連敗中のmyお気に入り騎手・ぶっしーの乗り馬は数値が低く出てしまうかもしれません。
また、レース中にアクシデントがあった場合にはそのデータは弾かれるそうなので
その中にレベルの高いレースがあることも考えられます。

以上、理解不足ながらマイニングさんがしていることを考えてみました。
やはり揚げ足取り的な考察になってしまいましたが
とりあえずは整理できたような気がします。

とはいえ、マイニングさんの回収率は85%~90%あるそうなので
マイニング予想からの上げ下げでもうひと押しすることはできそうです。
あとは使う人次第といったところでしょうか。

とりあえずジャンプは自力でやります。
nice!(0)  コメント(0)  トラックバック(0) 
共通テーマ:競馬

nice! 0

コメント 0

コメントを書く

お名前:
URL:
コメント:
画像認証:
下の画像に表示されている文字を入力してください。

トラックバック 0

8日目? はじめての北斗一人負け ブログトップ

この広告は前回の更新から一定期間経過したブログに表示されています。更新すると自動で解除されます。