俺にも執筆活動させろボケ

逃亡生活(ボート)part2

そろそろデータセットを作る必要がある、SQLを思い出す作業をしないといけない。

そして問題をどうするかという問題があってどうせ総当たりでやるので何からやるかだが

1,タイムによる回帰問題

2,上位・中位・下位の多クラス分類問題

1からやろうと思うんだけどラベル(タイム)が4着までしかないので間引くか適当にエンジニアリングする必要がある。

2はそのままやれそうなので先に2からやるのかなあ。

評価指数にオッズを絡めて払い戻し-掛け金を使いたいなあ。

ということでまずはデータセットからデータベクトル化と標準化するためには

データベースの構築が必須だなあ。

ボートより競馬

alphaimpact.jp

ボートで機械学習をぐぐっても触るだけでうまく行った具体的な手法を聞かないので競馬を調べる、初めて開いたホームページでここまでの内容なのでめっちゃ期待しちゃうよ。

ここの人もそうだしkerasの作者もそうだが文の節々にこれが好きなんだお前らもっとやれってのがすごい感じられてなんか俺もやらなきゃって気になる。

好奇心は人をぶっ飛ばす、重力を無視してそのまま宇宙までぶっ飛ばす。

ようやくやる気が出てきたわ。

俺も飛べ、俺も飛ぶ。

 

日記書こうと思ったけどただの決意表明だなこれ。まあいいや。

競馬の考えをボートに輸入するだけで競馬するつもりはないのであしからず。

逃亡生活(ボート)

逃げた先でスクレイピングでデータを集める羽目になったので、真面目に勉強していた。

f:id:nemui3900:20180911221911j:plain

CSSセレクタで派手に躓いて骨折しかけた、危なかった。

Beautiful Soup Documentation — Beautiful Soup 4.4.0 documentation

公式見るのが一番はええわ。

ということで日付を指定したら必要なデータをとってくるまでは気合でパースできたのだが例によってSQLを完全に忘れている俺ガイル。毎回毎回実装したら忘れている、いい加減アホすぎるな俺は。

SQLはまあおいといて、そもそも機械学習についてあまり詳しくないし実際実装を始めるべきだなと。

(MNISTとアヤメとワードベクトル化やったぐらい)

つまり自分のデータセットで問題を解決したことがないという問題があったので。

PythonとKerasによるディープラーニング

を勉強している、まだ2章だが基本的に今まで読んだ本の内容を復習している感

ただ作者がディープラーニング ラブなのが随所に見られていい感じだ。

億万長者への道も近いな、うん。

 

最後にこれは言っときたいんだが、ボートレース公式はAPIを用意せいよバーカ。

あまりに勝てないのでボートに逃げる。

僕の思い描いたコインは一日で100万幅で動く狂った世界だったのに

完全に初心者が轢き殺され、上級者ですらコインチェックされた。

ボラリティが今後クソみたいに高まる気配もないのでさようならして、

過去の記事のようにSFDで消耗するつもりもあんまりないのでもっと

楽しそうなフィールドに行くことにした。

 

競艇は下手くそが多そうなのとテレボートは自動化がクソめんどくさいので逆にチャンスなんじゃ。

AIで割と勝ってるぽい人がいるので俺でもできんだろっていうなめた態度で行こう。

 

まずはデータを集める

www.madopro.net

このへんかなあ。当地勝率とか使いたいけどそのへんの紐づけは自分でとってこないといけないんだろうなあ。

勝率とオッズの差が美味しいレースに賭けるだけとかから始めるとするとオッズが必要だなあ。

スクレイピングとその先のサイトをしばらくは探すことになりそう。

とりあえずはこのサンプル叩いてデータを集めようかの。

 

追記

ここがわかりやすかった

eejanaica.com

今後の勉強予定

blogのいらない広告をなるべく消してツイッター連携アプリを更新した。

ちょっとだけ軽くなったぜ。

botは順調すぎて暇になった、あとはJPYマイニングしてぶっこむだけ。

いままでのパラメーター選択ミスとサバが落ちてる分と3分足取りに行ってる分を

つまりbotの原資を回収した。

このまま俺の裁量の分も回収してほしい所。

 

botはmlもやりたいので今後の勉強方針。

まずはudemyでのデータサイエンティスト系3つと

kaggleを始めるためのnoteを消化したい。

せっかくGefo1070tiを買ったのを思い出せ、

nemuiよマイニングして1080tiをゴミのように扱ってる奴らを見返すのだ。

OCHLの取得先を移転

cyptowatchは流石に落ちすぎててやってられん。

cryptocompareを使うことにする。

1minの場合

https://min-api.cryptocompare.com/data/histominute?fsym=BTC&tsym=JPY&limit=60&aggregate=1&e=QUOINE

パースやり直すのだりいなあと言いつつやる

stackoverflow.com

なるほど、ほぼコピペで終わらせた。

2日も止まってるのでwatchはさようなら

 

1minといいつつ3minとってきてだいぶ損してから気づいたので差し替えた。

なかなかスペシャルなあほだなあ、ロット上げていくので気をつけよう。

俺もやりたいnote紹介

トレード手法のnoteが流行っていますね。

そこで私もおすすめのnoteを紹介しときます。

note.mu

でーん、トレード関係ない。

後追いで同じことしてもだめよ、儲かる儲からないじゃなくて

信念がないとbotは運用できないの。

つーかだらだらロジック書いてあるnote買い続けるぐらいなら

アルゴリズムトレーディング入門 (ウィザードブックシリーズ)

っていう最高の本があるのでそっち買いなさい。

pythonのpandasのおかげでMQLを書いてた時代よりも格段に敷居が下がって

簡単にヒストリカルデータを取得できるので間口が広がった今がはじめ時だよ。

 

PS

PHPのUdemyを買ったんだけど、妙に講師がキャラ立ててきててすげえ腹立つ。

Udemy系で初めての買い物失敗だったかもしれん。