regonn&curry.fm

regonnとcurrypurinがデータサイエンス・機械学習(主にKaggle)について話します。新しい働き方や量子コンピュータ、VR等寄り道もしていきます。

22. Pythonライブラリを作ってみる

2019年02月18日

MP3ファイルをダウンロード

内容紹介

れごんとカレーちゃんがデータサイエンス(主にKaggle)について話していきます。今回は録音失敗して最初のほうが撮れていません。Uberが出してきたLudwigやPythonパッケージの公開、Googleポッドキャスト、Signateランキングについて話しています。

出演者


regonn

currypurin

Scrapbox

お題

fastai/fastprogress

  • fastaiのプログレスバー

特徴量エンジニアリングの書籍がでるっぽい

uber/ludwig

Pythonパッケージ作成中

  • とりあえず公開できた
    • regonn/polar_bear
    • Kaggleとかで、csvから読み取ったpandasのデータをそのまま渡すだけで、ワンホットとかnan値をいい感じで処理してくれるライブラリが欲しかった
    • 使用感 polar_bear.ipynb
      • とりあえずタイタニックで、そのまま csv_read した dataframe を渡せば、light_gbm とかで処理できる形にできる
      • 現状タイタニックで正答率6割ぐらいで低めだけど敷居は下がった感じ
      • 他のテーブルデータのコンテストでも試してみたい
      • 名前はpandasをクレンジングしてくれるので白熊(polar_bear)と名付けた
      • テストとかあんまりなくて、コードも汚いので特徴量エンジニアリング勉強しながらメンテしていきたい

Googleポッドキャストを使ってregonn&curry.fmを購読してみる - わかめの備忘録

  • Googleポッドキャストは3倍速で聴ける
  • iphoneのポッドキャストは最大2倍速なので、より早く聴けると思った
  • 自分もGoogleポッドキャスト使ってる。
    • そのまま記事部分も表示してくれるのでリンクも飛びやすい
    • “Trim silence” を使うと無音を飛ばしてくれるからより早く聞けるけど、小さい”っ”とかも無音とみなされるので、ツイッターがツイターって聞こえてしまう。

Signateのランキング

今週のkaggle

  • 新コンペ
  • カレー
    • Eloコンペ
      • Kernelをようやくこえることができた
  • れごん
    • Kaggle の勉強会開催とライブラリ作って終わってた。