8.1 直方图和密度图

8.1.1 问题

你想要绘制一个直方图或密度图。

8.1.2 方案

样例数据:两个分别包含200个数据点的向量:

  1. set.seed(1234)
  2. rating <- rnorm(200)
  3. head(rating)
  4. #> [1] -1.2071 0.2774 1.0844 -2.3457 0.4291 0.5061
  5. rating2 <- rnorm(200, mean = 0.8)
  6. head(rating2)
  7. #> [1] 1.2852 1.4968 0.9855 1.5007 1.1117 1.5605

当可视化含多个组别的数据时,一些绘图方法通常需要一个数据框:一列给分组变量,一列给测量值。

  1. # 创建一列用于显示数据的组别
  2. cond <- factor(rep(c("A", "B"), each = 200))
  3. data <- data.frame(cond, rating = c(rating, rating2))
  4. head(data)
  5. #> cond rating
  6. #> 1 A -1.2071
  7. #> 2 A 0.2774
  8. #> 3 A 1.0844
  9. #> 4 A -2.3457
  10. #> 5 A 0.4291
  11. #> 6 A 0.5061
  12. # 直方图
  13. hist(rating)

8.1 直方图和密度图 - 图1

  1. # 使用8个箱子(这仅仅是近似 -
  2. # 它会把边界放在一个比较好的近似值上) 让箱子呈现淡蓝色
  3. # #CCCCFF
  4. # 相比于计数,这里让面积为1,即显示比例(freq=FALSE)
  5. hist(rating, breaks = 8, col = "#CCCCFF", freq = FALSE)

8.1 直方图和密度图 - 图2

  1. # 每0.6一个刻度
  2. boundaries <- seq(-3, 3.6, by = 0.6)
  3. boundaries
  4. #> [1] -3.0 -2.4 -1.8 -1.2 -0.6 0.0 0.6 1.2 1.8 2.4
  5. #> [11] 3.0 3.6
  6. hist(rating, breaks = boundaries)

8.1 直方图和密度图 - 图3

  1. # 核密度图
  2. plot(density(rating))

8.1 直方图和密度图 - 图4

8.1.2.1 多个组别的核密度图

代码来自: http://onertipaday.blogspot.com/2007/09/plotting-two-or-more-overlapping.html

  1. plot.multi.dens <- function(s) {
  2. junk.x = NULL
  3. junk.y = NULL
  4. for (i in 1:length(s)) {
  5. junk.x = c(junk.x, density(s[[i]])$x)
  6. junk.y = c(junk.y, density(s[[i]])$y)
  7. }
  8. xr <- range(junk.x)
  9. yr <- range(junk.y)
  10. plot(density(s[[1]]), xlim = xr, ylim = yr, main = "")
  11. for (i in 1:length(s)) {
  12. lines(density(s[[i]]), xlim = xr, ylim = yr, col = i)
  13. }
  14. }
  15. # 下面函数的输入必须是一个数值列表
  16. plot.multi.dens(list(rating, rating2))

8.1 直方图和密度图 - 图5

sm 包也引入了一种绘制多个密度图的方式,输入数据必须是数据框。

  1. library(sm)
  2. #> Warning in fun(libname, pkgname): couldn't connect to
  3. #> display "/private/tmp/com.apple.launchd.aGFOp8QcsU/
  4. #> org.macosforge.xquartz:0"
  5. #> Package 'sm', version 2.2-5.6: type help(sm) for summary information
  6. sm.density.compare(data$rating, data$cond)
  7. # 添加一个图例 (颜色编号从2往上升)
  8. legend("topright", levels(data$cond), fill = 2 + (0:nlevels(data$cond)))

8.1 直方图和密度图 - 图6