逃亡生活(ボート)part3
とりあえずスクレイピングして1年ぐらいとれて、ぼちぼちデータを形成しようかという重い腰をあげようか下げようかひたすらじりじりしている。
正解ラベルを6P3で123から654まで120個のラベルにhot-noeベクトル化まで。
多分そんな都合のいいライブラリないだろうから自作していく、
まず順列のリストを作成
itertoolsをインポートして順列を作成それを120の組み合わせパターン埋める
ラベルの形式がstrで'1-2-3'のような書式なので整形
それをインデックスにあてる
もともと文字列なので変換するのが無駄だったので
そもそもの順列の方を文字列で作ることにした
ようやくインデックスが返ってきたのでone-hot化する
ここは便利なKerasのユーティリティーを使う
最大値がそのままカテゴリー数なのでリストに119(6-5-4)を含めて試した。
ようやくラベルのベクトル化のめどが立ったところで今日は終わり。
次回は特徴量(データ)のベクトル化とか。