情報処理3(データとの対話)
10/31日分講義への意見・質問
つくりたいのは次のような表でしょうか?(数字は○をつけた人の割合)
キオスク 自動販売機 一般小売店
男性 60.3 53.4 50.5
女性 40.3 23.3 43.3
私もこう言うのが簡単に一発でできればよいとは思うのですが、その方法はよく知りません。
一つ一つクロス集計表をつくって、その結果をエクセルなどで上記の表にしています。
SASには形を整えた表を作成するためのproc tabulateというのがありますので、勉強してみて下さい。
また、○がついたときに1、そうでないときには0となるようにコード化されたダミー変数の場合、それの平均値は1をつけた人の割合になります。proc meansを使い、性別毎にダミー変数群の記述統計を算出させるという方法もあります。
ある変数毎に処理を行わせるためには、データがその変数の順にならんでいる必要があります。そのために、まず、proc sort でデータを並び替えて、それを別のデータセットに出力しておきます(下を参照)。
proc sort data=ens.ensdat1 out=ensdats; ←入力データセットと、並び替えた後のデータを出力するデータセットを指定
by sex; ←性別によって並び替えることを指定。
proc means data=ensdats; ←並び替えた後のデータセットを処理する。
var bkiosk bbndng bshop; ←ダミー変数名。
by sex; ←性別毎に処理を行うことを指定する。
run;
Q: 僕は今日の授業で次のようなことを学びました。
よいプレゼンとは
・論点、構成がはっきりしていて
・発表姿勢もはっきりしていて
・五感に強くうったえるものがある プレゼンをいう。
よいプレゼンを行うためには
・ほかのひとのよいプレゼンを聞いて刺激をうけ
・積極的に改善にとりくむこと
・パワーポイントなどのプレゼンツールがつかいこなせれば、なおよい
でも、結局は
・研究を前もってしっかり行って準備をととのえることに尽きる のです。
→ 本質を理解しているようで頼もしい限りです。
Q: 色々な研究があり、興味深かったです。ただ、アンケートで大きなサンプルを目標にしている人が多かったですが、アンケートには素直に協力してくれるんでしょうか。良い方法があれば僕も参考にしたいと思います。
→ データの入力なども大変になりますから、過大な目標をたてないようにしてください。
Q: 先生が、消費者が小売タイプを選択する要因を明らかにする際には、どのように調査しますか?おしえてください。
→店舗選択を分析するのによく使われるのは次のような方法でしょう。
y:各小売タイプについての利用頻度や最も使うものを回答させる。
x:各小売タイプについていろんな側面(価格、品揃え、サービス)から評価させる。(必要があればそれらを因子分析する)。
y=a1x1+a2x2+...
のような(回帰)モデルで推定を行って、どのxが利用に影響を与えているかを把握する。
昨年度の市場調査論でした「クオリティアルファ」、この講義でする予定の「サンライフストア」ケースがある程度参考になるでしょう。
また、流通の教科書や中西「小売吸引力の理論」千倉書房などを参照して下さい。
Q: みんな凄く勉強していて、頑張らなきゃ行けないなと思いました。凄く面白かったです。私はしたくないですけど、もっとみんなの発表をじっくりと聞きたかったです。これから、授業とは別に自分で勉強して頑張ります。
Q: みんな大変興味深い研究を行っていて、最終報告が楽しみです。この講義受けててよかったと思います。講義アンケート、今日の内容では関係ない質問があるので、そこは無回答にしました。
→教員にあれこれいわれるより仲間の姿を見る方がよほど刺激になりますね。
Q: 前回、前々回とも小課題があったのですが、授業内容が難しく分析方法が分からなくなってしまいました。補習などできないでしょうか。
→ どこが分からないのか質問してくれれば対応します。
Q: 今まで休みが多かったが、この授業に出ると去年のことをいろいろと思い出し、懐かしいと思う。
この度からは、しっかり出ようと思う。 来週の回帰分析が楽しみである。
→ 楽しんで下さい。
Q: 見かけ上の相関を見極めるためにはどうすれば良いのでしょうか。
→ データ&分析のみで、これを見極めることはできないと考えて下さい。
それに先立つ理論(仮説)をきちんともつことです。
例)47都道府県の(人間の)赤ん坊の出生数(縦軸)と飼い犬の数(横軸)とをプロットしてみたところ右上がりの直線がみられた。
こういう事実があったとしても、飼い犬が赤ん坊を産んでいるのだと考える人はいないでしょう。
→赤ん坊が出生するプロセスを知っているからそう考えないわけです。
→分析の対象となる現象についてよく知るということが重要なのです。
上の場合、飼い犬の数が多いということは、そこに住んでいる人が多い→生まれてくる赤ん坊も多くなると考えるべきでしょう。
Q: ペーパーの資料をディスプレイに取り込む装置は、解像度が悪くて見にくかった。
→ 残念です。
Q: 次回はパワーポイントで発表を行おうと思いますが、ワード・エクセルのような下位互換問題は発生しないのでしょうか?
Q: 次回は、プレゼンテーション点において、もう少しアピールしていきたいと思う。
→データとの対話のプロセスの中に、「データを報告する」という章がある意味がわかったようで、よかったですね。
ただし、中身も充実させて下さい。互換性の問題については、97でつくっても95で保存しておけば問題ないとは思います。事前に自分でテストしておいてください。
html形式ならば、バージョンの問題は生じないでしょう(教材フォルダに入れても良いですし、自分でホームページをもっている場合には、そこに入れておけばよい)。
Q: 最終報告の準備の間に質問に伺いにいったりするかもしれませんが、よろしくお願いします。
先生は何曜日に三田にいらっしゃいますか?
→プリントに載せるのを忘れていましたが、オフィスアワー(アポなしで来てもらってもよい)は金曜の4〜5時ということにしています。