かけだしデータサイエンティストの日報

最近勉強したデータサイエンティスト的な話題のブログです。

2023-01-04から1日間の記事一覧

Kaggle スタートブック~2章(2)

範囲:2.3章(p53)~2.5章(p88)やったこと Pandas Profiling によるデータ外観 各種の特徴量 VS 正解ラベルのヒストグラム作成 再現性を保つために、乱数を使う場面では seed を固定する. - seed を固定するための関数を定義 可視化→仮説→特徴量作成→submit →可…