kaggle初心者オススメ!まずはrankingに載ってみよう

kaggleに登録してみたけど何から始めたらいいかわからないという悩みは初心者の方の中に多いと思います。

ここでは初めてkaggleに挑戦する人に向けて、まず予測結果を提出して自分のrankingを獲得する手順を書いていきます。

コンペに参加してみよう

出典:kaggleホームページ

 まず一番始めにやることは何かしらのコンペに参加することです。

  1. kaggleに登録する
  2. competitionの種類をgetting startedにする
  3. 興味のあるコンペに参加する

初心者は比較的取り組みやすいgetting startedのコンペに参加することをオススメします。(私もここで勉強をしています。)現在開催されているコンペは3つで大きく分けると画像解析問題、分類問題、回帰問題となっています。

分類問題のTitanicのコンペは非常に人気でまず一番始めに取り組まれることが多いコンペです。私の場合は回帰問題のHouse Pricesのコンペを選択しました。

出典:kaggleホームページ

コンペを選ぶと上のようなページへと移ります。この画面の見方は下の通りです。

  • Overview:コンペの概要が記されています
  • Data:ここから分析するデータを取得できます
  • Kernels/Disccusion:他人の分析を見ることができます
  • Leaderboard:rankingを見ることができます

コンペでrankingを獲得するためには、データを取得し分析して結果を提出することが必要です。それでは一つ一つみていきましょう。

データを取得する

Dataタブを押すと上部にデータの説明が記載されています。データ分析、機械学習ではデータや課題の理解が大切なのでここはしっかりと目を通しましょう。

右下のDownload Allというボタンを押すと4つのファイルを取得することができます。

  • train.csv:訓練データ(正解の価格が与えられている)
  • test.csv:テストデータ(正解は与えられていない)
  • data_description.txt:データの詳細な説明
  • sample_submission.csv:提出ファイル例(形式を守ろう)

データを分析する

データを入手したらデータを分析します。分析の流れはここを参考にしてください。

そうはいっても何から手をつければいいかわからないというのが本音だと思います。なのでそういう時にKernelsタブをクリックします。

出典:kaggleホームページ

ここには様々な人が自身の分析結果を公開してくれています。なのでまずは取り組みやすそうなkernelを参考にして写経してください。参考にするkernelは得票数が多いものをまずは取り組んでみるのが良いと思います。

予測結果を提出する

分析を完了し予測結果を手に入れたら提出しましょう。青いボタンから提出することができます。この時、ファイルの形式が間違っていると受理されないので気をつけましょう。

提出し終えたらLeaderboardにあなたのrankingが掲載されます。晴れてkagglerの仲間入りです!

不安な人はUdemyの講座を受けよう

とはいえkernel内の記事は基本的事項は割と省略されがちでかつ解説も英語なのでいきなりコードを読むのはしんどいかもしれません。

そういった方はUdemyの講座を受講することをお勧めします!

コメント

タイトルとURLをコピーしました