講演録:福島第一原発事故と市民の健康 ――放射線疫学を読み解くためのデータ分析入門サポートページ
- エクセル版ファイル こちらから
- ファイルには3枚のシートがあります。
- 「分析データ」 テキストの図表1 【図表 1: 外食についてのデータ】
- 「分析データR用」 下記のRでの分析用のデータ
- 「回帰分析の結果」データをエクセル(Mac版 16.51)で分析した結果です。テキストの分析は、この結果から必要な部分をとりだしてまとめたものです(グラフは古いバージョンで作成したので外見が異なります)。
- エクセルで回帰分析できます。上記のエクセルファイルをダウンロードして、上記の「分析データR用」のデータを使って分析してみて下さい。
- 【図表2-1: お小遣いと外食支出額の関係】の再現例
- 「分析データR用」シートを開いた状態で
- 以下、Mac版のエクセルを使って説明。
- 散布図をプロット
- 「生のデータ」の「お小遣い」「外食支出額」の部分を選択(セルD3:E15)。
- メニューの「挿入>グラフ>散布図」で選ぶとグラフが描かれます。必要に応じてラベルなどを追加して下さい。
- 回帰分析
- メニューから ツール>データ分析>回帰分析 を選択。
- 入力X範囲 「分析データR用」シートの 「お小遣い」の部分(セルD3:D15)を選択
- 入力Y範囲 「分析データR用」シートの 「外食支出額」の部分(セルE3:D15)を選択
- 「ラベル」にチェック→選択した部分には変数ラベルが含まれているので。
- 「有意水準」にチェック→検定結果を表示させる。
- 「出力先」新規シートとすると
- 「OK」とすると分析結果表示される(有効桁数などは無視されているので適宜、表示設定)。
- 【図表2-2: 年齢と外食支出額の関係】
- 【図表2-3: 性別と外食支出額の関係】
- 上記でXをそれぞれ年齢、性別の範囲に変更すればok
- 【図表4-1: 図表 2-1 のデータで連続量を3 区分したグラフ】
- 【図表4-2: 図表 2-2 のデータで連続量を3 区分したグラフ】
- 【図表4-3: 図表 2-3 のデータで連続量を3 区分したグラフ】
- これらは「分析データR用」シートの「カテゴライズ」の横にある「計算用」にあるそれぞれの値を各カテゴリーの中央値としたものを使って同様に分析。
- 【図表5: 3 グループに分けた分析】
- お小遣いの小さい順に分けて分析するので、お小遣いの小さい順に並び替える必要がある。
- 「分析データR用」シートの(ラベルを含む)データ部分(セルA3:K15)を選択。
- メニューの データ>並び替え を選択。
- 「並び替えるレベルを追加」で「お小遣い」を選択してoK。
- 3000円以下の人たちについて
- X範囲:お小遣い 3000円以下の部分(D3:D7)を選択。
- Y範囲:お小遣い 3000円以下人たちの外食支出額の部分(E3:E7)を選択。
- 有意確率
- 「ラベル」にチェック→選択した部分には変数ラベルが含まれているので。
- 「有意水準」にチェック→検定結果を表示させる。
- 「出力先」新規シートとすると
- 「OK」
- 3001円-15000円以下の人たちについて
- ラベルをつけることができないようなので、
- X範囲:お小遣い 3001円以上、15000円以下の部分(D8:D11)を選択。
- Y範囲:お小遣い 3001円以上、15000円以下の人たちの外食支出額の部分(E8:E11)を選択。
- 「ラベル」はついていないので、「ラベル」のチェックをはずす。
- 「有意水準」にチェック→検定結果を表示させる。
- 「出力先」新規シートとすると
- 「OK」
- これまでとは違い、ラベルをつけていないので結果にはXと表示されます。
- 変数の追加
- テキストでは説明していませんが、複数の変数でYを説明することもできます。
- 「年齢」「お小遣い」で説明する場合
- Xの範囲として「年齢」「お小遣い」(セルC3:D15)を指定。同様にすると
- 入力Y範囲 「分析データR用」シートの 「外食支出額」の部分(セルE3:D15)を選択
- 以下、同様に指定すれば分析結果が出力されます。
- 無料の統計ソフトR(もしくは、それを使いやすくしたRstudio)で読み込んで分析する例をこちらに用意しました
- 参考までに、ソースコード(CR+LF改行、文字化けする場合は文字コードUTF8に)はこちら
統計ソフトRについての説明や使い方などを参照してインストール、実行してみて下さい。