7
章
.
ー
読
込
ー
読
込
方
種類
ー 読 込 ,(1) Excel 直接読 込 方法 ,(2) Excel キ 変換 CSV や 区 キ 読 込 方法,
(3) コ ー&ペー 使う方法 3種類 大別 .
コ ー&ペー 方式 ,読 込 残 い ,後 ー い 解析 再現 う , く 可能性 あ .
Excel 直接読 込 ,専用 ッ ー 例え gdata ッ ー 使う
必要 あ 手間 ッ ー 読 込 操作自体 多少手間
. ,Excel2007以降 xlsx 対応 い ッ ー 少 い , キ 読 込 勧 .
ー
読
込
CSV
区
形式
良い
ー
集計法
ー 集計 ,縦方向 行 ,横方向 列 測定項目 並べ .
統計解析 う ー , う ソ 使う際 基本的 こ 形式 整え う.
読
込
準備:作業
設定
R ー 出 入 際 出入 口 作業 作業 言い .
R 読 込 ,作業 中 あ け . ,読
込 い 入 ,作業 指定 ニュー →
R や 取 ,作業 け . ,こ 作業 行 わ け
, 作業 ン 版 マ キュ ン 読 込 置く必要 あ .
読
込
方
1
:
区
キ
読
込
Excel 区 キ 拡張子 txt 変換 .こ ペー
種類 キ 区 (*.txt) 選ぶ ,自動的 拡張子 txt 変わ ,
demodata.txt .そ 際,注意 促 ボッ いく 現
読 込 ー 格納 変数 , 何 良い 例え data ,
> data=read.table(“demodata.txt”, header=TRUE, sep=”¥t”)
書 .こ ,demodata.txt ー べ 変数data 入 .こ 関数
read.table 中 あ sep , ー 間 区 separator 指定 ,こ 場
合 あ こ ”¥t” 指定 .
,”header” いう ,変数 書い demodata.txt 1行目 こ .1行目 変
数 書い あ 読 込 際 ,”header=TRUE” 指定 必要 あ .
,1行目 変数 く,い ー 書 い う 読 込 場合
,”header=FALSE” 指定 .read.table関数 , ”header=FALSE”
区 txt 場合 , 区 キ 読 込 専用
read.delim いう関数 使
> data =read.delim(“demodata.txt”, header=TRUE)
こ , こ .好 方 使 く い.
区
読
込
,
read.table( demodata.txt , sep= ¥t )
read.delim( demodata.txt )
使う
本当 読 込 確認 ,変数data 中身 見 う.
> data
実 ,read.delim関数 ”header=TRUE” , ッ ー あ ー 読 込 際 ,わ わ ”header=TRUE” 書 く ,
> data1=read.delim(“demodata.txt”)
け OK .
1行目 変数 い damodata1.txt
> data1=read.delim(“demodata1.txt”,header=FALSE)
読 こ ,R 勝手 V1, V2, V3,… いう列 け く .こ 場合
”header=FALSE” 省略 .
Excel コンマ区 キ 拡張子 csv 変換 .
demodata.xls 開 ,名前を付けて保存→その他の形式 選択 . 種類 CSV ンマ区 (*.csv) 選ぶ ,自動的 拡張子 csv 変わ ,
demodata.csv そ 際,注意 促 ボッ いく 現 ,
べ い 選択 良い .
読 込 ー 格納 変数 data2 ,
> data2=read.table(“demodata.csv”, sep=”,”, header=TRUE)
コンマ区 CSV 場合 ,sep=”,” 指定 ,コンマ区 あ こ
R 教え け .こ 面倒 ,CSV 読 込 専用 read.csv
いう関数 使
> data2=read.csv(“demodata.txt”, header=TRUE)
こ , こ .好 方 使 く い.こ read.csv関数
”header=TRUE” ,こ 省略 .
CSV
読
込
,
read.table(
“
demodata.txt
”
, sep=
”
,
”
)
read.csv(
“
demodata
.txt”
)
使う
本当 読 込 確認 ,
> data2
,全 ー 表示 .
読
込
方
3
:
Excel
拡張子
xls
読
込
TIPS
変数data2 入 全データを表示させ コンソール画面が
データ 埋め くさ ,そ を避け 関数 head( )
を使 , > head(data2)
Excel 読 込 ,特別 ッ ー 必要 .Excel 読 込
ッ ー いく あ ,ここ そ gdata ッ ー 使うこ こ 作業 行 う gdata ッ ー あ ン ー く必要 あ .
> library(gdata)
> data3=read.xls(“demodata.xls”)
read.xls関数 , ッ ー 指定 く 1行目 ッ ー 読 込 ,
読 込 1行目 変数 け う.
Excel 読 込 , 述 キ 読 込 勧
読
込
方
4:
コ
ー&ペー
方式
読
込
続い ,コンソー 画面 ,
> data4=read.table(“clipboard”,header=TRUE)
け .コ ー 種類 問い Excel キ
,こ 方法 使うこ .
コ ー&ペー 方式 , 読 込 いう事実 残 い ,正式 ー 解析 使う 勧 , 計算 ,わ わ 体裁 整え 面倒 場合 手軽 便利 .
損値
扱い
臨床 ー 損値 . 損値 コー ン 方法 概 ,1) NA ,
2) 例え -999 数字 ,3) 空白 3通 あ .わ わ ,
損値 自明 ,ソ 損値 あ こ 明示的 教え 必要 あ .
損値 NA 使う 一番 勧 .そ 理由 ,R 損値コー ン NA . 損値 NA 使え , ー 読 込 際 ,特別 こ
必要 何 あ .
損値
コー
ン
NA
勧
他 ー 紛 い,-999 数字 使う方法 , ー 読 込 際 , -999 損値 表 R 教え 必要 あ .そ ,na.strings いう ョン 使
,
> data =read.table(“demodata.txt”, sep=”¥t”, header=TRUE, na.strinsg=-999)
> data=read.delim(“demodata.txt”, na.strings=-999)
> data =read.table(“demodata.csv”, sep=”,”, header=TRUE, na.strinsg=-999)
> data=read.csv(“demodata.csv”, na.strings=-999)
demodata2.csv 読 込 , 損値NA 変換 自 や く い .
え ,以 う ー ,
損値 空白 方法 ,様々 問題 生 こ あ 勧 .例え , 区 demodata.txt 一部 空白 以 ー demodata2.txt ,
read.table関数 使 読 込 ー 生 .
> data =read.table(“demodata2.txt”, header=TRUE)
id sex ht wt fat sbp
1 f 159.1 58.1 32.1 -999
2 f 145.9 49 28.8 130
3 f -999 50.2 27.9 110
4 f 147.2 47.3 31.3 132
5 f 162.2 79.5 40.5 154
6 f 157.6 61.5 33.8 114
id sex ht wt fat sbp
1 f 159.1 58.1 32.1
2 f 145.9 49 28.8 130
3 f 50.2 27.9 110
4 f 147.2 47.3 31.3 132
5 f 162.2 79.5 40.5 154
こ sep=”¥t” 書 忘 .こういうこ 起 い う , 区 や
CSV 読 込 専用 関数 あ read.delimやread.csv 勧 .