俺にも執筆活動させろボケ

Flaskの勉強。

英語からgoogle翻訳を読むのに疲れたので、 paizaの方で進めることにしたが一部しか無料じゃない。 むしろ金払う事によって義務感を生むのはありかもしれないと思い まずは無料をやりきって良さそうなら会員になるか。

なぜだかwebサイトを作り出した。

boatは煮詰まって飽きたのでwebサイトを作り始めた。 やりながら勉強するのでまずは https://blog.miguelgrinberg.com/post/the-flask-mega-tutorial-part-i-hello-world これをやる。一回Chapter3まで読んだけどもう忘れたので1から初めて今2が終わった。 …

boatのbacktestにoptunaを使う。

モチベーション オッズの予想をLightGBMでかましてそれを確率とみなす(1/odds(行列)) 確率*締切前オッズ=期待値 期待値の高めの買っても全然儲からないのでインジケーターを作って フィルターを採用パラメーターを探るのにoptuna使ってみる。 backtestの…

LightGBMでバイナリ分類(label encod)まで

大事な部分は 欠損値は勝手にやってくれる。 カテゴリを数値にする必要がある。 いらない変数は削除。ひたすらDFをdropしていく、 今回はオッズは使わないのでそれも殺す。 ある程度やったら次はカテゴリを数値に変える。 qiita.com ここのLabelEncodrを使う…

ラベルが偏るので

https://alphaimpact.jp/downloads/pydata20181020.pdf 主に16ページ目、そうなんだよなあバイナリの目的変数だとインに偏りすぎる。 回帰の問題にするかランクの問題にしてうまく学習しろって感じか。 試す目的変数リスト 着順 タイム オッズ 1号艇のみ…

みずはのめの公式botに賭けてみた結果

デーン、課金したのが5日ですw 頂点が5日です本当にありがとうございました。 まあ別に文句言うつもりもないし払ったことに後悔はない。 しかしスクレイピングできない人々はあれに払っても乗っかれないので そこはどうにかしないと間口が狭くなっちゃう…

競艇にお金を賭けるスポーツと去年の振り返りと今年の目標

競艇のデータをいじっていて思う、これは計画と実行のタスク管理をするスポーツなんだ。 いかにGPUとCPUを止めずに動かし続けられるかが重要で見なければ(可視化)いけないデータは山ほどあるし、捨てていいのか悪いのかわからないデータもたくさんある。 …

ボートデータのDataFrameの結合から分割まで

ミズハノメから持ってきたデータは1ヶ月ごとなので、 しゃらくせえので全部合体する。 そのときに(左端)ゴミを消してset_index("dataid")としておく。 またjoinで出走、直前、オッズを結合します。 そうするとなぜかリザルトのrowとずれがあるので index…

みずはのめのデータ提供サービスのapiを利用してラベルの作成まで。

みずはのめのデータ提供サービスが開始されたので使ってみる。これで月5万ぐらいって恐ろしくお買い得だと俺は思っているがお金は増えていないw1,データの保存。requestsで認証してのgetでapiを叩いてio.StringIOでオブジェクトに変換してpandasのdatafram…

1番人気のバックテスト

www.youtube.com つーことで俺もやってみる。 結論良くも悪くもほぼ控除率に収まったので高くもなく低くもない。 一応オッズによるフィルタをかましてみる。 10倍以上を買う。 的中率と回収率が下がった、オッズにつられて一番人気を買うのは基本悪手!! と…

ボートレースでいかに機械学習するか。

一応一通り触ったので雑感を垂れ流す。 はじめに教師あり学習でDNNがいいと思う。 問題を何にするかというのは非常に興味深い問題で 3連複の予想ならone hotで20通りのラベルにするか 上位(3位まで)or下位の0or1の2通りにする。 競馬のようにタイムを予想す…

ボートの勝ち方考察。

いま完璧に予想できるAIがある、 これで100%当たるか?と言われたらそんなことはない、 その完璧な予想は一番強い人の勝率でしか正解率がない、未来は誰にもわからないので。 誰が一番強くてどのくらい勝ちそうなのかはわかる。 そうしたらあとは単純な控除…

直前オッズがいかにあてにならないか

2倍以上に賭け続ければ勝てる。 それが意味することは 直前のオッズが2倍以上に賭ける→☓ 確定オッズが2倍以上になるであろう直前オッズに賭ける もしくは 時系列データで確定オッズを予測 他の特徴量で確定オッズを予測 どれにしても結局予測するしかない、…

ボートの自動売買のライブテスト

seleniumがあったのでどうにかなった。 かなりちゃっちく作ったけどまあいいや。 今の所単勝のみしかできないので 2連単のbotを追加してひとまず終わりかな。 一番最初のレースで5号艇がすごいまくり決めてマジ興奮したわ。 変数の名前をつけるのが下手過ぎ…

何をすればいいかはわかっている、ただ時間が足りない。

大体の挙動は理解した、問題は実装する時間が足りない。 全部俺のもんだ!孤独も不安も後悔も苦痛も・・もったいなくてアイツなんかにやれるかよ!(プラネテス と強がって進む。 まだ細かいところは終わってない。 いつ入金するかという問題と 投票をいつす…

終わらない終わりの始まり

自動売買の部分で割ときつい状態に突入した。 結構大掛かりなプログラムを書く羽目に、 まずどこで何時に締め切りかをとってきてリスト化 まあここまではいい、問題はオッズとの兼ね合いとテレボートへの接続。 seleniumを使えばそこまで大変ではないのだが …

逃亡生活(ボート)part 終わりの始まり

逃亡生活もようやく佳境を迎えそうだ。 なぜならば、半分しか当たらねえのならオッズが2倍以上だけ買えばいいじゃねえかという単純なフィルターで。 これ(115%)である。 もっと激選したら200%超えるけど一回どんなもんか実行部分のデバッグを兼ねて2倍…

2連単でボート

単勝だと控除の壁の中に閉じ込められた。 2連単だとどうだろうと学習を回したところ1-2しか帰ってこなかった じゃあ単勝で学習した重みを使って上から順に買おうかと思ったけど。 よく考えるとその重み自体を特徴量として2連単の学習を回せばいいのでは? 21…

バックテストin Boat 単勝

Out[417]が損益150万負けてるね 平均92円つまり回収率92% 75%と言われている控除は超えたものの 負けているね。2%的中率を上げるとそこそこ戦えるというのはわかった。 やっぱり当てに行ってもしょうもないんだ、 ギャンブルの本質はACCじゃない。 と言い…

単勝を

1号艇のみ予想でだいたい半分あたる。 単純なNNで予想した ほぼ1を買うのと変わらないね、 ここから特徴量を工夫したり選んだりして精度をあげていく。 チルトを捨てて展示タイムを時速に変換して特徴量に 当地2連率の0の部分を27で埋める。 その後も取捨選…

次元の呪いを見てきた

カテゴリカル・データにすると簡単に呪われてすぐに汎化性能を失うなあ。 レーサークラスA1とかB2とか全然使えないね、 3日前に作った重みが一番うまく学習できてたかもしれない。 もうどういう説明変数とモデルだったか忘れたわけだけど。 思ったんだけど適…

見に行こうぜ次元の呪いってやつを

一応畳み込みできたけど6*6ぐらいじゃあんまり効果ないな、 場、モーター、選手の3チャンネルで試してもいいが表現力が足りなそうなので別の方法を考えよう。 真面目にカテゴリカル・データを処理しつつ今持ってるデータを一度全部ぶっこんでみることにした…

逃亡生活(ボート)de 畳み込み

ようやく学習データが作成できた これを学習させればほとんどの場と季節で1-2-3[1,0,0,0,0.....0]と返してくるはずだ。 さっそく畳み込みでやってみる。 コンピュータービジョンの項をまともに読んでなかったのでめでたくハングアップした。 今の所解決する…

ボートで畳み込み

あまりにもランダムの壁すら超えない、 というかまあ見た目の問題で超えてはいる。 左から123,124,125,126,132,134なので 予想がイン寄りに傾ければ自ずとACCも上がるのだ。 しかしきれいに落ちていくかというとそうでもなく多くの12より132のほうが強いとい…

ディープラーニングを始めようと思う人達へ

ある程度ブームは過ぎてそろそろ冬の時代を感じるAIことディープラーニングですが。 そんなAIをやってみようという特異な人たちに送る僕からのアドバイス、 数学的要素は本当のところいらないので別に勉強しなくていいです。 しかし式の意味だけは理解してい…

逃亡生活(ボート)part9

120のカテゴリに使うニューロンの数の目安はどんくらいかなあ。 まあいい まずは単純なホールドアウト法でいこう 12:4:2(バックテストで残しとく) やっぱり512にした epochs=3000で試す。 やってみないとよくわからないことが多すぎるのでよくわかってない間…

逃亡生活(ボート)part8

取れたには取れたが当地勝率と実際問題かぶっていて、 これを入れるのはどうかという考えが出てきたのでスルーしておく。 年齢・体重まできたので平均STと全国と当地の勝率二連率三連率。 そしてモーターとボート、チルト。 FとLは一回入れずに回してみる。 …

逃亡生活(ボート)part7

ようやくだらだら取得していたレコードが18万を超え、 そろそろビッグデータの扱いについて考えないといけない。 いちばん大事なのって実用性だと思う、 ということで一回.read_sqlで全部取得してみてどれくらいかかるか見てみる。 2分ぐらいで終わるわ、す…

逃亡生活(ボート)part6

いまやっと17万レコードまで取れた。 もっとリザルトがわかるように可視化を頑張っていかないといけないなあ。 つーことでここを読む コールバック - Keras Documentation Kerasで可視化いろいろ from Masakazu Muraoka www.slideshare.net なるほど、前回…

逃亡生活(ボート)part5

正解のラベル作るところから "1-2-3"というラベルのままではhot-oneにできないので pandasの機能で文字列を分割する。 前回は一つのラベルでやってしまったので一括でやっていく note.nkmk.me 馬鹿すぎてえらい時間かかったわ、なんで3回も4回もタプルにしよ…