1)演習用データ
変数名1 |
変数名2 |
変数名3 |
.... |
|
|
|
|
|
|
1番目のサンプル |
|
|
|
|
|
|
|
|
|
2番目のサンプル |
|
|
|
|
|
|
|
|
|
3番目のサンプル |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
データは96のオープンソース・ソフトウエア・プロジェクトについてのデータ。
sourceforge.netからランダムに2000選んで、ある条件で絞り込んだもの。
下記が変数名
変数名 内容 id 識別のための番号 groupunixnam グループ名 nofdl グループが公開したソフトのダウンロード回数 oldestfiledate 最も古いソフトの公開日 devstage 開発段階を示す変数 1:計画段階 2:α版以前 3:α版(試作版)のソフト公開 4:β版(正式版の一歩手前)のソフト公開 5:安定版のソフト公開 6:成熟 licgpl GPLライセンスを利用=1。利用せず=0 nlngengl そのプロジェクトの公用語が英語のとき1。そうでないとき0
OSダミー oslinux そのプロジェクトの開発しているソフトがLinux用だと1。そうでないとき0 osmicros そのプロジェクトの開発しているソフトがMicrosoftのOS(MS-DOS, WINxx)用だと1。そうでないとき0 ososind そのプロジェクトの開発しているソフトがOSに依存しない場合1。そうでないとき0
ソフトウエアのトピック、領域ダミー(複数選択) tpcsyste システム用ソフトのとき1。 tpcsoftw ソフトウエア開発用のソフトのとき 1 tpccommu インターネット、通信用のとき 1 tpcgames ゲーム
nrelease ソフトウエアの公開回数 npcntb 開発に寄与した人の数 ncntb ソフトが変更された回数(厳密にはcontributionの回数)
nmsgfr 自由投稿フォーラムに投稿されたメッセージ数
npml メーリングリストに投稿した人の数 nmsgml メーリングリストに投稿されたメッセージ数 nmsgmlmax メーリングリストに投稿したメッセージ数が最大の人が投稿したメッセージ数
npfrq 機能の追加要求フォーラムに投稿した人の数 nmsgfrq 機能の追加要求フォーラムに投稿されたメッセージの数 nmsgfrqmax 機能の追加要求フォーラムにに投稿したメッセージ数が最大の人が投稿したメッセージ数
npbug バグ報告フォーラムに投稿した人の数 nmsgbug バグ報告フォーラムに投稿されたメッセージの数 nmsgbugmax バグ報告フォーラムにに投稿したメッセージ数が最大の人が投稿したメッセージ数
|
3)データの読み込み
ossdata
ossdata$id
とすると、ossdataの中の変数$idが出力される。
mean(ossdata$nofdl)
とすると変数nofdlの平均を計算。