Ref : R語言
存取dt 裡面的資料
dt$Science -> dt 裡面 Science 變數
dt[, 5] -> dt 裡面第五欄的資料
attach(dt) -> 可使dt裡面所有的資料傳到表層
dt[3,] -> 取得dt 裡面第三列的資料
dt[3(3,6),] -> 取得dt 裡面第三列和第六列的資料
subset(dt,Gender=="m") 取得 Gender 為 m 的資料
subset(dt,Science>=60) 取得 Science 大於等於60 的資料
讀取 excel 的檔案...使用 xlsx 的套件
排序資料 -> order() 和 sort()
描述性統計 :
length(變數) # 個數
mean (變數) # 平均數
sd(變數) # 標準差
quantile(變數) # 百分位數
例子:
mean(dt$Science) -> 70.77778
sd(dt$Literature) -> 19.7428
分組之描述性統計
tapply(變數, 分組因子, 運算函數,..)
tapply(dt$Science, dt$Gender, mean)
f m
64.40 78.75
或是用 subset 切出子集合
mean(subset(dt,Gender=="m")$Science)
mean(subset(dt,Gender=="f")$Science)
沒有留言:
張貼留言