逃亡生活(ボート)part4
ゴミを入れたらゴミができる。
と言われてもなにがいるもんで何が捨てるもんかわかんねーよ状態。
無駄に悩んでみたもののよくわからないので関係ありそうなものをちょっとずつ試す。
年齢、rank(A1とか)、全国勝率、場ごとの枠の勝率、モーター勝率、ボート勝率。
年齢と勝率は単にノーマライズできるだろうけど
rankはカテゴリー変数かと思ったけどこれも普通にノーマライズしたほうがいいか。
年齢から始める、
kerasのutilsでやろうと思ってるので読む
どうやらnumpyをいちいち使って高速化してる
入れたら怒られた
.valuesを使うらしい。
いよいよノーマライズ
axis = -1の意味がいまいちわからねえと思った
なのでレーサー1から6までの年齢のndarryで試す
その前にpandasのカラム複数選択で躓く、リストで指定するのか。
axisがやっぱりよくわからない、1次元のテンソルだとあまり意味がなさそうだ。
とりあえず年齢のみでディープラーニングしてみる。
train_test_split()が便利そうなのでsklearn入れる
一部分で試そうと思ったがターゲットの部分つまり654がないとtargetのホットベクトルで躓くなあ、たまたま6-5-4があればいいがそんな都合のいいことはない気がするのでひとまず検索してなければくっつけてからドロップする関数かいとくか。
都合のいいことに今回はあったのでそのままいけそうだ。
けどよく考えたら正解のラベル作る関数まだ全然書いてなかった。
とりあえずこのpart4は閉じとこう