第1章 イントロダクション

1.1 講義概要

  • 目的:本講義では,社会調査データの分析で用いる基礎的な多変量解析法について、その基本的な考え方と主要な計量モデルを解説する。重回帰分析を基本としながら、応用として一般化線形モデルのなかからロジスティック回帰分析を取り上げ解説する.あわせてRによる分析実習を行う.
  • 到達目標:多変量解析,とくに重回帰分析の原理を理解すること.Rを用いて基本的な分析ができるようになること.
  • 授業方式:講義方式.一部Rによる演習を行う.
  • キーワード:多変量解析,回帰分析,R言語

1.2 講義スケジュール

  1. イントロダクション:今後の学習の方向付けを行う.多変量解析の基本的アイデアといくつかの応用例を紹介し,分析手法のイメージを持つ.あわせて,各自の持ち込みPC上でR言語のセットアップを行う
  2. 記述統計の復習:基本統計量や相関係数など,記述統計に関する基本的な知識を振り返る
  3. 推測統計の復習:標本分布,母平均の推定・検定,t検定など基本的な推測統計の知識を振り返る
  4. 線形代数の基礎(1):多変量解析を理解する上で必要不可欠な線形代数を導入する.ベクトルの直交を理解することを目標とする.
  5. 線形代数の基礎(2):引き続き線形代数の知識を導入する.行列演算と逆行列を理解することを目標とする.
  6. 単回帰分析(1):まず,記述統計レベルで単回帰分析を導入する.最小二乗法を説明し,どのように回帰係数,決定係数を導くかを解説する.また,共分散・相関係数との関連を説明する.
  7. 単回帰分析(2):確率モデルとしての単回帰モデルの仮定を説明し,回帰係数の標本分布を導く.回帰分析における推定・検定について説明する.
  8. 重回帰分析(1):記述統計レベルで重回帰分析を導入する.重回帰における最小二乗法を説明し,偏回帰係数,決定係数を導き,その意味について説明する.
  9. 重回帰分析(2):確率モデルとしての重回帰分析について解説する.重回帰分析における推定・検定について説明するとともに,多重共線性について解説する.
  10. 重回帰分析(3):ダミー変数,交互作用項を導入したモデルについて解説する.
  11. ロジスティック回帰分析(1):線形回帰モデルを拡張した一般化線形モデルのアイデアを導入する.そのうえでベルヌイ分布(二項分布)を仮定するロジスティック回帰を導入する.
  12. ロジスティック回帰分析(2):引き続き,ロジスティック回帰分析について解説する.とくに係数とオッズ比の関連について説明する.
  13. レポート分析実習(1):最終レポートのための分析とレポート作りを各自が行う.
  14. レポート分析実習(2):最終レポートのための分析とレポート作りを各自が行う.

1.3 講義形式

  • 講義資料URL:https://aishidajt9.github.io/DataAnalysisApplication/
    • 随時更新中
  • 参考図書:
    • 永田靖・棟近雅彦,2001,『多変量解析法入門』サイエンス社,1~5章
    • その他の参考図書は授業中に適宜紹介する
  • 成績評価:
    • 講義中の小課題40
    • 最終レポート60
  • その他注意点
    • データ分析(入門),データ分析(基礎)の既修を前提とする
    • BYODを前提とする(最新のWindows, macOSについて対応する,自分で対応できる場合はLinuxも可)
    • 他の受講者の受講する権利を侵害する行為は厳禁.逸脱にはゼロトレランスで対応する.

1.4 デバイスのセットアップ

1.4.1 Terminal

  • コマンドラインでPC操作をするときに必要になる
  • mac: cmd+spaceでSpotlightを呼び出し”terminal”と検索
  • win: アプリ検索で”terminal”と検索
  • ショートカットですぐに呼び出せるようにしておこう

1.4.2 RとRStudioのセットアップ

1.4.3 RStudioの設定

  • デフォルト・エンコーディングをUTF-8にする
    • Tools → Global options → Code → Saving → Default text encoding
  • 日本語で書かれたファイルを読み込むと文字化けしている可能性がある.その場合以下を試してみる.
    • File reopen with encoding -> CP932 or SHIFT-JISを選択
    • File -> reopen with encoding -> UTF-8を選択
  • 見た目を変える
    • Tools → Global options → Appearance
  • General → Basic → Save workspace to .RData on exitをNeverに

1.4.4 プロジェクトファイルの作成

  • ローカルのわかりやすい場所に,R作業用フォルダを作成する(フォルダ名は半角)
  • RStudioを立ち上げ,Project → New Project → Existing Directory → つくったフォルダを選択
  • 以降は,”フォルダ名.Rproj”ファイルをクリックして,Rセッションを始める
    • 前回開いていたファイルが記憶される
    • ディレクトリの設定をいちいちしなくてよい

1.4.5 試しにやってみよう

  • “test.R”と名前をつけて保存
5 + 3
5 - 3
5 / 3
5 ^ 3
5 * (10 - 3)
sqrt(4)

a <- 10
a
a / 2

## 組み込みデータ
cars

## スピードの度数分布
table(cars$speed)

## スピードのヒストグラム
hist(cars$speed)

1.4.6 tidyverseのインストール

  • モダンRに必須のパッケージ群のバンドル.データ操作,ヴィジュアライゼーション
  • install.packages(‘tidyverse‘)
    • macの場合Xcode,winの場合Rtoolsを別にインストールする必要があるかもしれない
library(tidyverse)

iris %>% 
  select(Sepal.Length, Sepal.Width, Species) %>% 
  ggplot(aes(x = Sepal.Length, y = Sepal.Width, color = Species)) +
  geom_point() +
  geom_smooth(method="lm")

1.5 本日の課題

  • test.RをLUNA課題から提出