データとの対話 演習用データについて

 


1)演習用データ


2)データの内容

 データは96のオープンソース・ソフトウエア・プロジェクトについてのデータ。

 sourceforge.netからランダムに2000選んで、ある条件で絞り込んだもの。

 下記が変数名

 

変数名      内容

id       識別のための番号

groupunixnam グループ名

nofdl      グループが公開したソフトのダウンロード回数

oldestfiledate  最も古いソフトの公開日

devstage   開発段階を示す変数

     1:計画段階  2:α版以前 3:α版(試作版)のソフト公開 

     4:β版(正式版の一歩手前)のソフト公開 5:安定版のソフト公開 6:成熟

licgpl       GPLライセンスを利用=1。利用せず=0

nlngengl    そのプロジェクトの公用語が英語のとき1。そうでないとき0

 

OSダミー

oslinux   そのプロジェクトの開発しているソフトがLinux用だと1。そうでないとき0

osmicros  そのプロジェクトの開発しているソフトがMicrosoftのOS(MS-DOS, WINxx)用だと1。そうでないとき0

ososind   そのプロジェクトの開発しているソフトがOSに依存しない場合1。そうでないとき0

 

ソフトウエアのトピック、領域ダミー(複数選択)

tpcsyste   システム用ソフトのとき1。

tpcsoftw   ソフトウエア開発用のソフトのとき 1

tpccommu   インターネット、通信用のとき 1

tpcgames    ゲーム

 

nrelease  ソフトウエアの公開回数

npcntb      開発に寄与した人の数

ncntb      ソフトが変更された回数(厳密にはcontributionの回数)

 

nmsgfr   自由投稿フォーラムに投稿されたメッセージ数

 

npml        メーリングリストに投稿した人の数

nmsgml      メーリングリストに投稿されたメッセージ数

nmsgmlmax    メーリングリストに投稿したメッセージ数が最大の人が投稿したメッセージ数

 

npfrq    機能の追加要求フォーラムに投稿した人の数

nmsgfrq   機能の追加要求フォーラムに投稿されたメッセージの数

nmsgfrqmax  機能の追加要求フォーラムにに投稿したメッセージ数が最大の人が投稿したメッセージ数

 

npbug    バグ報告フォーラムに投稿した人の数

nmsgbug   バグ報告フォーラムに投稿されたメッセージの数

nmsgbugmax  バグ報告フォーラムにに投稿したメッセージ数が最大の人が投稿したメッセージ数

 


 

 

 

3)データの読み込み

 読み込みなどの参考プログラム

ossdata

 

ossdata$id

 とすると、ossdataの中の変数$idが出力される。

mean(ossdata$nofdl)

とすると変数nofdlの平均を計算。