Social Data Science Courseware

データサイエンスコース

Python と Google Colab を使って データの取得・収集 → 前処理 → 統計処理 → 可視化 → 解釈 までを通せるようになることを目標とした、全 18 単元のコースです。

このコースで身につく力

講座

入門講座 → 実践講座 の順で進める想定です。

入門講座(10 単元)

高校「情報1」相当の難易度。Python と Pandas を初めて触る学習者が、データを 取得・整形・可視化 できるところまで進む。

  1. データと前処理がなぜ必要か
  2. Google Colab を立ち上げる
  3. データを手に入れる(最小限)
  4. Pandas と DataFrame 入門
  5. CSV を読む・書く
  6. データを編集・加工する
  7. 欠損値とデータ型
  8. 重複・並べ替え
  9. 集計とクロス集計
  10. Python で可視化する
受講する

実践講座(8 単元)

高校「情報2」相当の難易度。入門講座で得た基礎を、結合・統計処理・機械学習・ストーリーテリングへ拡張。

  1. 実データの取得と結合
  2. 探索的データ分析 (EDA) の型
  3. 次元削減:PCA
  4. クラスタリング
  5. ネットワークデータ分析
  6. 統計的にデータを読む
  7. 解釈とストーリーテリング
  8. 総合ミニプロジェクト
受講する

必要な環境

ローカル PC への Python インストールは不要です。すべてブラウザ上で完結します。

学習の進め方

各単元は次の 5 セクションで構成されています。

  1. 学習目標 — その単元で「できるようになること」
  2. 本文 — 概念の説明
  3. サンプルコード — 題材データへのダウンロードリンク
  4. 演習 — 手を動かして試す課題
  5. 発展課題(オプション)— もう一歩進みたい人向け