社内で機械学習ハッカソン(Kaggle編)を開催しました
社内で機械学習ハッカソン(Kaggle編)を開催しました : こんにちは、ウェブアプリケーションエンジニアの id:syou6162 です。今年の夏に社内機械学習ハッカソンを開催したので、その様子を紹介したいと思います。今回のハッカソンでは、機械学習のコンペサイトとして有名な Kaggle をテーマに取り組みました。 なぜKaggleをやるのか? 事前準備 取り組んだコンペ id:syou6162 (TalkingData AdTracking Fraud Detection Challenge) id:alpicola (Toxic Comment Classification Challenge) id:takuya-a (Titanic: Machine Learning from Disaster) id:tanishiking24 (Spooky Author Identification) id:miki_bene (Titanic: Machine Learning from Disaster) まとめ なぜKaggleをやるのか? はてなでは昨年の冬にも機械学習ハッカソンを開催しており、その際は主に社内データの活用をテーマにしていました。 今回のハッカソンではデータというより、普段試したことがない、あるいは業務で試してみたい手法をやってみようということでKaggleのデータを使いました。Kaggleは本来数ヶ月単位で行なわれるコンペが多いため1日の作業では上位に行くことは難しいですが、こういった自分が試してみたい手法を試す練習の場として活用することもできると思います。 個人や組織がKaggleに取り組むことについてのメリットについては以下のスライドがよくまとまっています。 Devsumi 2018summer from Harada Kei 事前準備 機械学習やKaggleに慣れていないメンバーもいたため、つまらないところではまらないようにハッカソン開催の前に事前準備を行ないました。機械学習に関して詳しいメンバーが集まっている機械学習サブ会という組織がはてなにはあるので、そのメンバーが中心になって準備しました。 初級編: サマーインターンで行なっている機械学習の講義の再演 そもそも機械学習とは、どうやって学...