regonn&curry.fm

regonnとcurrypurinがデータサイエンス・機械学習(主にKaggle)について話します。新しい働き方や量子コンピュータ、VR等寄り道もしていきます。

23. 台風コンペの入賞式

2019年02月25日

MP3ファイルをダウンロード

内容紹介

れごんとカレーちゃんがデータサイエンス(主にKaggle)について話していきます。今回は台風コンペの入賞式、kaggleもくもく会@麹町、機械学習のための特徴量エンジニアリング、polar_bearの成長について話しています。

出演者


regonn

currypurin

Scrapbox

お題

台風コンペの入賞式に行ってきました

  • 台風コンペの概要
    • 台風あり、台風なし画像の二値分類
    • 不均衡データ
      • 台風あり:71,779枚
      • 台風なし:2,172,444枚
    • 総参加者(規約への同意者)653名、総投稿者209名
    • 1位の方の手法
      • 2値化した画像と生画像を標準化した画像との2channelの入力
      • 110層のPyramidNet
      • ミニバッチ作成時、正例のうまく分類できていない画像が多くサンプリングされるようにし、その割合を変えてアンサンブル
  • 懇親会

kaggleもくもく会@麹町に行ってきました

今週のtips

  • ひと通り読みました
    • 知らないことが多くあり、網羅的に学べるのでとても良い本です
    • ただ、例えば勾配ブースティングを使う場合にどの特徴量エンジニアリングが必要かということは書いていないので、実務やKaggleなどで実践をつんだことがない人だと、どのエンジニアリングを使えば良いのかということになりそうです
    • 既にデータ分析をされている人が網羅的な知識を得るためとか、この本を読みながらデータ分析に取り組むなどの用途にとてもオススメです。

polar_bearが成長している

  • wakameさんがプルリク送ってくれて圧倒的な成長を実感する
  • v0.0.5 から optuna と sklearn を導入して、one_hot の閾値も勝手に良い値にして欲しかった
  • ちょっと、2月中は忙しいので、3月からちゃんとCIの設定とかやっていきたい
  • あと、julia版も作りたいけど、juliaだとpandas関係なくなるので、ライブラリ名考え中

先週紹介した Ludwig を触ってみた

  • ただ、データの情報を渡すだけで、titanic のスコアが 0.76
  • 新たな時代を感じた

Steam:Aim Lab

  • AI等がFPSのエイム力を鍛えてくれるらしい
  • お昼にテスト配信してたらカレーちゃんに練習風景を見られた
  • 機械学習つかったサービスで能力がつくようになると面白い
    • 語学学習とか絵の練習とか

今週のkaggle

  • カレー
    • Eloコンペ
      • 60位くらいになりました
      • 外れ値の影響をもろに受けるコンペなので、Shakeup、Shakedownがありそうですが、最後まで頑張りたい
      • 2/27(水)までのコンペでありもう少し
    • Malware
      • Eloが終わったらやっていきたい
  • れごん
    • polar_bearメンテしつつ、性能評価でタイタニックコンペとかにサブミットしたりしてた。