俺にも執筆活動させろボケ

逃亡生活(ボート)part3

とりあえずスクレイピングして1年ぐらいとれて、ぼちぼちデータを形成しようかという重い腰をあげようか下げようかひたすらじりじりしている。

f:id:nemui3900:20180926221544j:plain

f:id:nemui3900:20180926221841j:plain

正解ラベルを6P3で123から654まで120個のラベルにhot-noeベクトル化まで。

多分そんな都合のいいライブラリないだろうから自作していく、

まず順列のリストを作成

f:id:nemui3900:20180926222938j:plain

 

itertoolsをインポートして順列を作成それを120の組み合わせパターン埋める

 

f:id:nemui3900:20180926224048j:plain

 

ラベルの形式がstrで'1-2-3'のような書式なので整形

それをインデックスにあてる

f:id:nemui3900:20180926225747j:plain

もともと文字列なので変換するのが無駄だったので

そもそもの順列の方を文字列で作ることにした

f:id:nemui3900:20180926230337j:plain

ようやくインデックスが返ってきたのでone-hot化する

ここは便利なKerasのユーティリティーを使う

f:id:nemui3900:20180926231201j:plain

最大値がそのままカテゴリー数なのでリストに119(6-5-4)を含めて試した。

ようやくラベルのベクトル化のめどが立ったところで今日は終わり。

次回は特徴量(データ)のベクトル化とか。