そろそろデータセットを作る必要がある、SQLを思い出す作業をしないといけない。
そして問題をどうするかという問題があってどうせ総当たりでやるので何からやるかだが
1,タイムによる回帰問題
2,上位・中位・下位の多クラス分類問題
1からやろうと思うんだけどラベル(タイム)が4着までしかないので間引くか適当にエンジニアリングする必要がある。
2はそのままやれそうなので先に2からやるのかなあ。
評価指数にオッズを絡めて払い戻し-掛け金を使いたいなあ。
ということでまずはデータセットからデータベクトル化と標準化するためには
データベースの構築が必須だなあ。