トップ 差分 一覧 ソース 検索 ヘルプ RSS ログイン

FDNP

講演録:福島第一原発事故と市民の健康 ――放射線疫学を読み解くためのデータ分析入門サポートページ

例題として使った外食のデータ

    • エクセル版ファイル こちらから
      • ファイルには3枚のシートがあります。
      • 「分析データ」 テキストの図表1 【図表 1: 外食についてのデータ】
      • 「分析データR用」 下記のRでの分析用のデータ
      • 「回帰分析の結果」データをエクセル(Mac版 16.51)で分析した結果です。テキストの分析は、この結果から必要な部分をとりだしてまとめたものです(グラフは古いバージョンで作成したので外見が異なります)。

自分でも分析してみたい方

    • エクセルで回帰分析できます。上記のエクセルファイルをダウンロードして、上記の「分析データR用」のデータを使って分析してみて下さい。
    • 【図表2-1: お小遣いと外食支出額の関係】の再現例
    • 「分析データR用」シートを開いた状態で
    • 以下、Mac版のエクセルを使って説明。
    • 散布図をプロット
      • 「生のデータ」の「お小遣い」「外食支出額」の部分を選択(セルD3:E15)。
      • メニューの「挿入>グラフ>散布図」で選ぶとグラフが描かれます。必要に応じてラベルなどを追加して下さい。
    • 回帰分析
      • メニューから   ツール>データ分析>回帰分析 を選択。
      • 入力X範囲  「分析データR用」シートの 「お小遣い」の部分(セルD3:D15)を選択
      • 入力Y範囲  「分析データR用」シートの 「外食支出額」の部分(セルE3:D15)を選択
      • 「ラベル」にチェック→選択した部分には変数ラベルが含まれているので。
      • 「有意水準」にチェック→検定結果を表示させる。
      • 「出力先」新規シートとすると
      • 「OK」とすると分析結果表示される(有効桁数などは無視されているので適宜、表示設定)。
    • 【図表2-2: 年齢と外食支出額の関係】
    • 【図表2-3: 性別と外食支出額の関係】
      • 上記でXをそれぞれ年齢、性別の範囲に変更すればok
    • 【図表4-1: 図表 2-1 のデータで連続量を3 区分したグラフ】
    • 【図表4-2: 図表 2-2 のデータで連続量を3 区分したグラフ】
    • 【図表4-3: 図表 2-3 のデータで連続量を3 区分したグラフ】
      • これらは「分析データR用」シートの「カテゴライズ」の横にある「計算用」にあるそれぞれの値を各カテゴリーの中央値としたものを使って同様に分析。
    • 【図表5: 3 グループに分けた分析】
    • お小遣いの小さい順に分けて分析するので、お小遣いの小さい順に並び替える必要がある。
    • 「分析データR用」シートの(ラベルを含む)データ部分(セルA3:K15)を選択。
    • メニューの データ>並び替え を選択。
    • 「並び替えるレベルを追加」で「お小遣い」を選択してoK。
    • 3000円以下の人たちについて
    • X範囲:お小遣い 3000円以下の部分(D3:D7)を選択。
    • Y範囲:お小遣い 3000円以下人たちの外食支出額の部分(E3:E7)を選択。
      • 有意確率
      • 「ラベル」にチェック→選択した部分には変数ラベルが含まれているので。
      • 「有意水準」にチェック→検定結果を表示させる。
      • 「出力先」新規シートとすると
      • 「OK」
    • 3001円-15000円以下の人たちについて
    • ラベルをつけることができないようなので、
    • X範囲:お小遣い 3001円以上、15000円以下の部分(D8:D11)を選択。
    • Y範囲:お小遣い 3001円以上、15000円以下の人たちの外食支出額の部分(E8:E11)を選択。
      • 「ラベル」はついていないので、「ラベル」のチェックをはずす。
      • 「有意水準」にチェック→検定結果を表示させる。
      • 「出力先」新規シートとすると
      • 「OK」
      • これまでとは違い、ラベルをつけていないので結果にはXと表示されます。
  • 変数の追加
    • テキストでは説明していませんが、複数の変数でYを説明することもできます。
    • 「年齢」「お小遣い」で説明する場合
    • Xの範囲として「年齢」「お小遣い」(セルC3:D15)を指定。同様にすると
    • 入力Y範囲  「分析データR用」シートの 「外食支出額」の部分(セルE3:D15)を選択
    • 以下、同様に指定すれば分析結果が出力されます。

さらに本格的に分析したい方。

  • 無料の統計ソフトR(もしくは、それを使いやすくしたRstudio)で読み込んで分析する例をこちらに用意しました
    • 参考までに、ソースコード(CR+LF改行、文字化けする場合は文字コードUTF8に)はこちら

統計ソフトRについての説明や使い方などを参照してインストール、実行してみて下さい。