regonn&curry.fm

regonnとcurrypurinがデータサイエンス・機械学習(主にKaggle)について話します。新しい働き方や量子コンピュータ、VR等寄り道もしていきます。

19. 使ってるツール

2019年01月29日

MP3ファイルをダウンロード

内容紹介

れごんとカレーちゃんがデータサイエンス(主にKaggle)について話していきます。今回は、「KaggleでSilverを取るために」の続き、本を書くときのツール、グラフ描画ライブラリについて話しました。

出演者


regonn

currypurin

KaggleでSilver取るためにどういう段階を踏んでいけばよいですか?

  • もう少し詳しくという要望があったので、前回に続きもう一度
  • kaggleで銀メダルを取るのは難しいと思う
    • 「銀メダル安定までに4年かかった」というツイートがあった
    • 一方で、「全期間(約3ヵ月)公開カーネルをしっかり読んで真面目に参加すれば取れる」とのツイートも
    • 全期間、公開カーネルをしっかり読んで理解するのは、はじめのうちは時間がかかって難しいけれど、慣れてくるとやっていることがわかるようになるので時間がかからなくなる
  • テーブルデータのコンペと画像データのコンペは別物(一部共通点もある)
    • テーブルデータの場合は、kaggleのソリューションからほぼ全てを学ぶことができる
      • LightGBMなど、ツールのドキュメントは読む必要がある
      • 画像コンペの場合は論文を読むとか、強い人に教えてもらうとかする必要がある
    • 画像データのコンペはディープラーニングが必須だと思う
    • テーブルデータのコンペはLightGBMだけでも戦える。
      • 戦えるが、NN系とアンサンブルすると更に強くなる
  • チームマージは本当にお勧め
    • チームマージするデメリットはほとんどない
    • お互いのモデルのアンサンブルでスコアが改善する
    • テクニックを交換できる
    • チーム戦は楽しい

カレーちゃんは本を書く時にどんなツール使ってる?

  • Re:VIEW とか?
  • reviewは使わずにPages(appleのワープロソフト)で書いています
    • Pagesの良い所
      • 図や写真のレイアウトが簡単。好きな場所に挿入できる。
      • 簡単に他の人にレビューしてもらえる(共有できて、コメントもしてもらえる)
      • 共同作成も可能
    • reviewの使い勝手
      • gitで差分を管理できるので、複数人でインタラクティブに書くならreviewなどのツールは必須だと思う
      • 1人で書くとか、章ごとに分担して書くとかなら、PagesやWordの方が図や写真を自由にレイアウトできるなど使いやすい点もある

plotライブラリは何使ってる?

ストレングス・ファインダーの結果をJuliaで主成分分析して似た人を探す

初めて機械学習関連の仕事がもらえそう(れごん)

  • 詳しくは話せないけど、3月納品で納品物は公開されるのでそこで話せそう

kaggleの講師をすることになりました(カレー)

【初心者OK】AI・機械学習ハンズオン 〜実践Kaggle〜 - connpass

  • noteでお仕事依頼を書いていたら、声をかけてもらえた

東京でkaggleもくもく会の開催が告知されていた

今週のkaggle

  • れごん
    • 引き続き解析ノート更新
      • やっとグラフ表示ぐらい
      • コメントと up vote もらえてる
      • 読んでるカーネルの表記が間違ってるところをコメントで指摘したり
      • kernel と discussion で銅メダル1枚ずつもらえた
  • カレー
    • Eloコンペに主に取り組んでいる
      • あまり印象が良くないコンペだったが、取り組んでみて良いコンペかもしれないと思った
    • オレシカナイト用のコードの準備もした

今日の一句

  • 寒の内点滅続く赤信号 恋言