情報処理3(データとの対話)
05/30日分講義への意見・質問
Q: Standardized Estimateの出し方がよくわからなかった。
→ proc reg data=...;
model y1=x1 x2 x3 x4;/stb ;
sasで出力するように指定するためには、上のようにstbオプションを指定します。
計算方法はプリントを参照して下さい。
Q: モデルが増えていったときの分析の仕方として、たとえば自分がやる店の客の来店の予想を立てるときさまざまな要素の中からどうやって予想するのですか?
→プリントの例の場合、次の式をたてて、1〜15番目の店のデータを用いてβ0〜β3を推定することができます。
販売高=a1乗降客数+a2間口+a3品目数+b
推定結果はa1=0.51,a2=12.43,a3=0.288,b=7.66となります(プリントp.60参照)。
新しい16番目の店については、乗降客数、間口、品目数のデータはあるので、これらのデータを上の式に代入すると、
販売高の予測値=0.51*....+12.43*+ =という式から一応、予測できます。
ただし、そのモデルがどれくらいよく、データにあてはまっているかを、R2などで確認しておくことが必要です(この場合はR2=0.967なので非常にあてはまりがよい)。
また、そもそも販売高を何によって説明するか(説明変数を何にするか)ということを決めるためには、いろいろな要因のなかからどれが販売と関係ありそうかを考察しておかなければなりません。そのためには、販売という現象についての深い理解が前提となります。
実は、分析で一番手間取るのは、入力、読み込み、確認といったデータを用意することなのです。一度読み込まれれば、あとの分析はプログラムだけなのですから。その感触がわかってもらえてよかったですね。
Q: エクセル からデータを移行させて、SASでつかう時、 何人もの人が、うまくいっていないのに
後で、4年生に聞いて という感じで先に進んでいくのはやめてほしい。一度分からないと、その後は、もっと分からない。
→うまく行っていないのは、30人4人程度ですし、その後の回帰分析とは関係ないので先に進みました。
来週もするといいましたし。
>SASでエラーがでると勉強になる。改良しようと努力するその過程に価値があるのですかね。
という意見もあります。そのとおりですね。sasの使い方を講義で教えてもらえる皆さんがうらやましいですね。私の場合、独学ですから。
Q: もう少し説明を加えていただけるとありがたいです。(どの画面を今だしているのかなど。)
→そうしているつもりですが、わからなくなった場合には質問して下さい。
Q: 黒板に何を書いているのかわからなくなる時があります。できれば、もっと見やすく書いてください。
→ そうしようと思います。
Q: うちらの班が使う分析方法は重回帰分析でよいのでしょうか?あと、みんなの意見を聞いたのはいいのだけれど、どう変えたらよいのかわからないです。そして、やはりきちんとした結果(仮説を立てた通りの結果)が出ないとマズイのでしょうか?
→ある変数と別の変数との関係を分析したいのだったら、重回帰分析でよいでしょう。
意見をすべて取り入れる必要はないと思います。参考になる意見があれば取り入れるという程度でよいでしょう。
仮説が棄却されてもまずくはありません。ただし、その理由をきちんと考察して下さい。
3)その他
Q: 重回帰分析でもっとも重要なのはパラメータの推定結果である。パラメータ=0でないことを検定し、prob=1以下であれば、XとYの関係は統計的に有意であることがいえる。パラメータの値が大きくなっていても、その数字だけでは関係が強いかどうかはいえない。
→ prob=0.1以下ですので、間違えないように。
Q: データーの読み込みのところで先週のファイルが残ってたため、データの変更が難しかった。
回帰分析はなんとなくわかったようなきがします。自分でやればよりわかるきがします。
→自分でやってみて下さい。
Q: 久しぶりの受講で、かなり遅れてしまったなということを実感した授業だった。
先生がこの授業の後半でされた回帰分析は、先学期sfcの「モデルシュミレーション」の授業で出生率の低下を題にレポートを書いたこともあり(統計パッケージ:graf5)、マーケティングと結び付けてイメージすることができよく理解できたとおもう。
重回帰分析では、3次元4次元でのグラフでの出力結果が少し楽しみだが、 それよりもはやく遅れを取り戻したい。
→そうしてください。
Q: 共分散をサブゼミでやらないといけないみたいですが、共分散ってなんか分析ツールのなかでもエラソウにみえてしまうのは私だけでしょうか?
→ 重回帰分析、因子分析などを包含しているモデルなので、まあ多くのモデルの親玉だと考えても良いでしょう。ただし、数学的に洗練されているモデルを使っても、検証する仮説がしょうもないものだったり、データの測定の精度が低い場合には、いくら高尚なモデルで分析しても、出てくる結果はつまらないものになってしまいます。分析の前に、この点をよく考えておいて下さい。