regonn&curry.fm

regonnとcurrypurinがデータサイエンス・機械学習(主にKaggle)について話します。新しい働き方や量子コンピュータ、VR等寄り道もしていきます。

35. 機械学習プラットフォーム

2019年06月01日

MP3ファイルをダウンロード

内容紹介

れごんとカレーちゃんがデータサイエンス(主にKaggle)について話していきます。今回は、強化学習ロジック、AlpacaDB、KaggleをするのにGCPを使う方法、機械学習プラットフォーム調査のイベント報告、JuliaをWSLで動かす、最近の気になる機械学習本、今週のKaggleについて話しています。

出演者


regonn

currypurin

Scrapbox

お題

強化学習ロジックをDQNからRainbowに変更した

  • 価値ベースのアルゴリズム
    • 学習をしているけど、アルゴリズムが複雑になった分、レイヤーが増えたりしてGPUのメモリが足りなくなってトレーニング途中で失敗する状態で困っている。
    • 機械学習におけるGPU memory error の呪いを解く方法 with Chainer - Qiita 上手いことGPUのメモリを調整したい
    • カレーちゃんもGPU関連でこういう時どうしてる?
      • (currypurin)Kerasでしか学習したことがなくて、batch sizeを調整しています
      • 過学習しているだけっぽい?(とりあえず取引の勝率)
      • とりあえず愚直にデータ数増やす予定

リスナーからのコメント

AlpacaDB | TechCrunch Japan

  • Alpacaの人がChainer meetupで運営側にいたと思うけど、前回参加の時には自動売買ハマってなかったので特に話したりはしなかったのが悔やまれる
    • 現在の日本ではサービスが利用できないはず、米株とかだけ?
    • 以前読んだ内容だと自分で買いのタイミングをチャートから複数トリミングして、学習させるUIだった気がする
    • 画像認識で買いか売りかのシグナルだったので、自分としては、シグナルだけでなく、どれだけホールディングするかの学習も含めてやりたかったので、強化学習にしてみた。

今週のtips

  • KaggleをするのにGCP(Google Cloud Platform)を使う方法
    • わかりやすいqiitaの記事があり、使ってみたらとても簡単だった。
    • 現状特徴の作成にのみ、GCPを使っているの。
    • Anacondaを入れて、ストレージをマウントして、kaggle apiでデータをダウンロードするくらいで、特徴を作り始められる。
    • 大きなデータのコンペや画像コンペの場合は、今後も使っていきたい。
    • いつも使うdockerも整備しておくと更に捗りそう

今週と来週でプラットフォーム調査のイベントを開催

  • 新しくなったMicrosoftのブロックベースのサービスを実際にやってみる
  • ludwig
  • デモンストレーションでコードを書かずにKaggleへ挑戦
  • パワポのデザインアイデアという機能でスライド作ってる
    • 複数のデザイン候補を提供してくれる

JuliaをWSL上で動かしてGPUを使えるようにした

  • 前回PythonでGPU使えるようになったので、Juliaでも同じやり方でできるかなと試したらできた
  • Windows側にJuliaをインストールして、WSLで julia.exe を実行するようにする
  • GANはこれというフレームワークのようなものはなく自分でレイヤーを作っていくので、JuliaのFlux.jlでいいかも

量子コンピューターの本が出た

Pythonで機械学習入門: 深層学習から敵対的生成ネットワークまで | 大関真之

今週のkaggle

  • 地震コンペ
    • 50位近辺で停滞している
  • 新しいKernelコンペが始まった
    • Instant Gratification -A synchronous Kernels-only competition-
    • これまでのKernelコンペ・2ndstageがあるコンペの課題だった、コンペ終了後に結果が出るのが遅い、2nd stageでエラーがでてしまうとスコアなしになってしまうという課題に対応したという実験コンペ