- テストデータでシミュレーションできるようにする
- 馬券の買い方を表示する
- 騎手、調教師も特徴を計算できるようにする
- 過去の対戦馬の情報もいれたい→queryにすべての対戦馬の過去情報も入ってる
- レーティング
- ワイド
- 複勝
- 時系列データのクロスバリデーション
- 今-生年月日
- 親の戦績(リークしないように注意)
- 何歳(race_date-生年月日)のときにどのくらい戦績だったとか
- コーナー→過去脚質(7項目の和を100%としたときの割合)と今距離、今馬場、競馬場、枠
- スタッキングでrank, regを特徴にして再度rank
- catboost
- prizeでターゲットエンコーディング
- dbを軽くする
- 過去のレース情報をスクレイピングしてDBに保存
python netkeiba.py
- 特徴量などを前処理してDBに保存
python feature_extractor.py
- ランキングと回帰のモデルをtrainする
python train.py
- レースを予測する
python predict.py --raceid 202206010111
- レースを予測する(Webアプリ経由)
- Webアプリ立ち上げ
docker compose up
- ブラウザからアクセス
- Webアプリ立ち上げ
- netkeiba.comからスクレイピングしたデータ
- 2008年1月1日〜2022年12月18日(15年分=737,916レース分)