2017年3月5日日曜日

Python競馬予想プログラミング【1】 ~他人の予想を信じられない~

【不確定要素を含み、かつ膨大なデータが蓄積されている競馬に着目し、競馬を予想しながらデータ収集方法や解析手法を学んでいきたい】
という非常に欲深いテーマを掲げて始めたいと思います。

これまでにも多くの人が挑戦し実践されてきたことですが、基本的に他人の予想って信じられないですよねw 回収率とかで一応の評価はできますが、そのときは運が良かったとか悪かったでなんとでも良い評価ができますし悪い評価もできます。

多くの人が同じ競馬新聞を買い、予想した場合だったとしても馬券の買い方は十人十色、結局は自分の信じる馬を買っているわけです。

ネット上に転がっている「統計的に」出した予想とかほんっと多いですが、どのように統計的に出されたのかは他人から見たら完全にブラックボックスです。中身がわからない。

やっぱり自分で作るしかないのです。

ないものは作るしかない!



ということでまずはデータの取得方法とかから段階的に進めていきます。

プログラミングしたコードも随時公開していきます。



データですが、本当はJRAの公式そのままのデータをガシガシ取得できればよいのですが、私にはまだネット上データからのスクレイピング技術はありません。とりあえずある程度の情報があるExcelなどのデータを扱う予定です
競馬インジケータよりダウンロード可能


馬ごとのデータは取りにくいかもしれませんが、コース適性などの俯瞰的な解析はできそうです




0 件のコメント:

コメントを投稿