かけだしデータサイエンティストの日報

最近勉強したデータサイエンティスト的な話題のブログです。

Kaggle スタートブック~1章

開始:1章(p1 ~ p37)

やったこと

アカウント作成
Titanic への登録
Notebook の作成

Kaggle のポイント

Kaggleでは企業がデータセットと賞金を提供しており、コンペで勝利するとお金がもらえる。
成績上位チームには金銀銅のメダルが贈呈される。メダルについて一定の条件を満たすと称号が与えられる。
基本的にコンペには2~3ヶ月程度の期限が設けられている。
チームとして参加することも可能
ブラウザ上であるていど環境が整ったNotebookが使えるのですぐに使える。GPUも使えるらしい。

教師あり学習教師なし学習強化学習

教師あり学習は学習用のデータに対して入力とそれに対応する正解が与えられている。
教師なし学習は入力に対応する正解データが与えられていない状況での学習である。一般にどのようなことが正解であるのかは定まっている。
強化学習は入力データしか与えられていないという点で教師なし学習と同じであるが、そもそも何が正解なのかすらよくわかっていない状況での学習である。

Notebook の使い方について

画面右側にある Input に格納されている全てのファイルを最初のセルで読み込んでいる。ディレクトリは

```dosbatch
./kaggle/input
```となる。
また作業ディレクトリは

!pwd

を実行することで、
```dosbatch
/kaggle/working
```
であることがわかる。


図表:

  • P14 図1.2, 1.3 メダル獲得条件と称号の条件
  • P23 コンペルール
  • P24 表1.1 コンペのページコンテンツ
  • P30 図1.18 ディレクトリ構成