俺にも執筆活動させろボケ

機械学習

LightGBMでバイナリ分類(label encod)まで

大事な部分は 欠損値は勝手にやってくれる。 カテゴリを数値にする必要がある。 いらない変数は削除。ひたすらDFをdropしていく、 今回はオッズは使わないのでそれも殺す。 ある程度やったら次はカテゴリを数値に変える。 qiita.com ここのLabelEncodrを使う…

ラベルが偏るので

https://alphaimpact.jp/downloads/pydata20181020.pdf 主に16ページ目、そうなんだよなあバイナリの目的変数だとインに偏りすぎる。 回帰の問題にするかランクの問題にしてうまく学習しろって感じか。 試す目的変数リスト 着順 タイム オッズ 1号艇のみ…

みずはのめの公式botに賭けてみた結果

デーン、課金したのが5日ですw 頂点が5日です本当にありがとうございました。 まあ別に文句言うつもりもないし払ったことに後悔はない。 しかしスクレイピングできない人々はあれに払っても乗っかれないので そこはどうにかしないと間口が狭くなっちゃう…

ボートデータのDataFrameの結合から分割まで

ミズハノメから持ってきたデータは1ヶ月ごとなので、 しゃらくせえので全部合体する。 そのときに(左端)ゴミを消してset_index("dataid")としておく。 またjoinで出走、直前、オッズを結合します。 そうするとなぜかリザルトのrowとずれがあるので index…

みずはのめのデータ提供サービスのapiを利用してラベルの作成まで。

みずはのめのデータ提供サービスが開始されたので使ってみる。これで月5万ぐらいって恐ろしくお買い得だと俺は思っているがお金は増えていないw1,データの保存。requestsで認証してのgetでapiを叩いてio.StringIOでオブジェクトに変換してpandasのdatafram…

ボートの自動売買のライブテスト

seleniumがあったのでどうにかなった。 かなりちゃっちく作ったけどまあいいや。 今の所単勝のみしかできないので 2連単のbotを追加してひとまず終わりかな。 一番最初のレースで5号艇がすごいまくり決めてマジ興奮したわ。 変数の名前をつけるのが下手過ぎ…

ディープラーニングを始めようと思う人達へ

ある程度ブームは過ぎてそろそろ冬の時代を感じるAIことディープラーニングですが。 そんなAIをやってみようという特異な人たちに送る僕からのアドバイス、 数学的要素は本当のところいらないので別に勉強しなくていいです。 しかし式の意味だけは理解してい…

逃亡生活(ボート)part8

取れたには取れたが当地勝率と実際問題かぶっていて、 これを入れるのはどうかという考えが出てきたのでスルーしておく。 年齢・体重まできたので平均STと全国と当地の勝率二連率三連率。 そしてモーターとボート、チルト。 FとLは一回入れずに回してみる。 …

逃亡生活(ボート)part6

いまやっと17万レコードまで取れた。 もっとリザルトがわかるように可視化を頑張っていかないといけないなあ。 つーことでここを読む コールバック - Keras Documentation Kerasで可視化いろいろ from Masakazu Muraoka www.slideshare.net なるほど、前回…

逃亡生活(ボート)part5

正解のラベル作るところから "1-2-3"というラベルのままではhot-oneにできないので pandasの機能で文字列を分割する。 前回は一つのラベルでやってしまったので一括でやっていく note.nkmk.me 馬鹿すぎてえらい時間かかったわ、なんで3回も4回もタプルにしよ…

逃亡生活(ボート)part4

ゴミを入れたらゴミができる。 と言われてもなにがいるもんで何が捨てるもんかわかんねーよ状態。 無駄に悩んでみたもののよくわからないので関係ありそうなものをちょっとずつ試す。 年齢、rank(A1とか)、全国勝率、場ごとの枠の勝率、モーター勝率、ボート…