ミクロマーケティング各論(市場調査論)
0523日分講義への意見・質問
ちなみに私も統計学は嫌いでした。必要になったので勉強しましたが、今でも自信はありません。
Q:「割合」の信頼区間の意味がよく分からない(「割合」という意味が特に)。また、
なぜ誤差の式が√[p(1-P)/n]なのかがわからない。
→あの表はメトリックな尺度(平均を出すことができる)とノンメトリックな尺度に分けたものです。割合というのは文字どおり、○をつけた人の割合です。
誤差の公式の導出などは統計学の本を参照して下さい。
参考までにサンプリングの考え方の一例を次に示します。
母集団は10人。そこからサンプリングして、母集団の視聴率を推定する。
図表 10人からなる母集団(視聴率=6/10=0.6)
1 みた 2 みない 3 みた 4 みた 5 みない |
6 みない
7 みない 8 みた 9 みた 10 みた |
サンプル数を3、5として、それぞれ5回づつサンプリングして、みた人の割合を計算したところ次のような結果となった。
標本集団の
番号 |
標本集団1 | 標本集団2 | 標本集団3 | 標本集団4 | 標本集団5 |
サンプリングされたサンプル | 1 みた
4 みた 7 みない |
3 みた
5 みない 9 みた |
7 みない
8 みた 10 みた |
8 みた
9 みた 10 みた |
1 みた
6 みない 7 みない |
みた人の割合 | 2/3=0.667 | 2/3=0.667 | 2/3=0.667 | 3/3=1.0 | 1/3=0.333 |
標本集団の
番号 |
標本集団1 | 標本集団2 | 標本集団3 | 標本集団4 | 標本集団5 |
サンプリングされたサンプル | 1 みた 2 みない 3 みた 4 みた 5 みない |
2 みない
3 みた 5 みない 7 みない 9 みた |
1 みた
3 みた 4 みた 6 みない 7 みない |
2 みない
3 みた 5 みない 6 みない 10 みた |
5 みない
6 みない 7 みない 8 みた 9 みた 10 みた |
みた人の割合 | 3/5=0.6 | 2/5=0.4 | 3/5=0.6 |
2/5=0.4 |
3/5=0.6 |
真値はともに0.6程度となっているが(中心極限定理)、サンプル数が小さいほど、「みた人の割合」のばらつきが大きくなっている(推定値の標準偏差(標準誤差)が大きい)。
図表 サンプリングした推定結果のまとめ
標本数3のとき |
標本数5のとき | |
5回分の「みた人の割合」の平均 | 0.6668 | 0.520 |
5回分の「みた人の割合」の標準偏差 | 0.2358 | 0.1095 |
Q:TVでしていた実験では300人が一番適しており、誤差もほんのわずかしかないという結果を出していた。その誤差とは標準偏差なのか?信頼区間と標準偏差の関係がいまいちよくわからなかった。
→プリントに出ている標準偏差のことです。厳密にいうと「推定値の標準誤差」になります。
信頼区間の公式にあるように、次の関係があります。
平均値-z×推定値の標準誤差(標準偏差)<真値<平均値+z×推定値の標準誤差(標準偏差)
私もそのような番組をみたように思います。私が見たのは、数千個の白い玉に数百個の赤い玉を一様に混ぜて、そこから例えば100個の玉を取り出して、そこに含まれている赤い玉の割合を数えるという内容です(上の例を参照して下さい)。これを一回だけでなく、何回も繰り返すと、その平均値が真の値に近づくというものでした。注意しなくてはならないのは、実際のある番組の視聴率は1度しか測定されないということです。
Q:実際のリサーチ機関では、どのようにサンプルサイズを決定しているのか?toleranceを考えているのか?経験則か?
→現実的には予算の制約でサンプル数の上限が決まることが多いのではないかと思います。
Q:n=z*z*p(1-p)/ [tolerance**2]=1.96*1.96*0.02*0.98/[0.02*0.02]のときp=0.02となっているが、pは許容度なのか?
→pは割合です。黒板には1.96*1.96*0.01*0.99/[0.02*0.02]と書いたように思いますが。
Q:黒板に書くときあちらこちらに書くので見難い。
→なるべくまとめて書くようにしましょう。