regonn&curry.fm

regonnとcurrypurinがデータサイエンス・機械学習(主にKaggle)について話します。新しい働き方や量子コンピュータ、VR等寄り道もしていきます。

10. カレーちゃんの財務省時代の話

2018年11月18日

MP3ファイルをダウンロード

内容紹介

れごんとカレーちゃんがデータサイエンス(主にKaggle)について話していきます。今回はドローン、カレーちゃんの財務省時代の話、トリクル、Voicy、西野 亮廣の新著 新世界、pipenvについて話しています。

出演者


regonn

currypurin

リスナーからの質問

  • ネタは割とあるのですが、何を話して良いか難しい。自分のことなら話しやすいので、遅くに返ってゲームしていた話を。
    • 財務省ではタクシー代金の節約のために、深夜に宿舎へ向かうバスがある( 私が働いていた頃はあった、今はあるか不明。)
    • バスの発車時刻は、24:30、25:45、27:00 の 3 回
    • 財務省には仮眠スペースがあるので、バスで家に帰って寝るか、仮眠スペースで眠って財務省に泊まるか、大きな決断
    • 私はある意味でとっても勤勉なので、24:30 発のバスで帰って家に着いて 25:30 くらい、そこから桃鉄 2010 やスプラトゥーンをするという生活を送っていた時期があった。
    • 最後の1年は忙しすぎて仮眠室で泊まることも多かった。

kaggle の特徴量の管理の仕方

  • 特徴のファイルは feather 形式で管理する
  • csv ファイルは、読み込みがとても遅いので csv は使わないようにする
  • feather 又は npy 又は pickle
  • 特徴量をグループごとに feather のファイルを作って管理する

    • class をつくって、特徴量の作成と特徴量の読み込みは全てそこでやる

最近リリースされたトリクルを使ってみました。

  • トリクルでは、トピックごとにアクティビティ(ログ)を書けるサービス
  • トピックは自分で設定する
  • 私は、kaggle、サブミット、日記、掃除というアクテビティを作ってみた
  • トピックごとに、github でいう「草を生やす」ことができるので、毎日やろうという気になる
    • 習慣化のためには、毎日継続することが大事(続ける習慣より)
  • 基本的には個人でアクティビティを記録するだけで、他社との関わりは知り合いのアクティビティのうち気になるものをサブスクライブする程度だと思われる。
  • 収益化の仕組みが現状なさそうなので、心配。
  • Twitter から流入があるといいけど、mastodon と同じ様に追いかけたい人が Twitter のままだとなかなか移行に踏み込めない。
  • みんチャレ - 三日坊主防止アプリ
  • ちょっと話はずれるけど、複数のプラットフォームへ投稿するのが面倒問題

    • 特に Valu みたいな外部 API 公開してない場合なども面倒
    • ifttt みたいに自動化もできるけど、元の投稿をどこにするかも迷う

voicy のチャンネル開設申し込みしてみました(2回目)

  • たまに voicy のようなメディアで、思いっきり話したくなる
  • 過去の遺産が残っている れごん / Voicy(ボイシー)
  • れごんはコルクラボの 5 期生に応募

新世界読みました

  • 西野さんが良く書いている、貯信時代という信用の話やクラウドファウンディングの話は1度は読むと良い。
  • 日本最大のオンラインサロンの話も読める

Python 環境どうしてる?

  • 最近 pyenv + anaconda から Pipenv に乗り換えた
  • Ruby の Gemfile みたいにパッケージ管理ができるようになったので良さげ
  • 私は anaconda のみで、適当にインストールしちゃっています

今日の一句

  • 冬帽子朝の苦手な君を待つ 恋言