6.7 映射向量值

6.7.1 问题

你想将向量中所有值为 x 的实例改为值 y

6.7.2 方案

  1. # 创建一些样本数据
  2. str <- c("alpha", "beta", "gamma")
  3. num <- c(1, 2, 3)

最简单的方法是使用 plyr 包里的 revalue()mapvalues()

  1. library(plyr)
  2. revalue(str, c(beta = "two", gamma = "three"))
  3. #> [1] "alpha" "two" "three"
  4. mapvalues(str, from = c("beta", "gamma"), to = c("two",
  5. "three"))
  6. #> [1] "alpha" "two" "three"
  7. # 对于数值型向量,revalue()
  8. # 没作用,由于它使用一个命名了的向量,向量名一般是字符串而不是数值,但
  9. # mapvalues()仍然有作用
  10. mapvalues(num, from = c(2, 3), to = c(5, 6))
  11. #> [1] 1 5 6

如果你不想依赖 plyr包,你可以使用 R 内置函数。注意,这些方法将直接修改向量;也就是说,你不需要把结果保存回变量。

  1. # 把'beta' 替换为 'two'
  2. str[str == "beta"] <- "two"
  3. str
  4. #> [1] "alpha" "two" "gamma"
  5. num[num == 2] <- 5
  6. num
  7. #> [1] 1 5 3

也可以使用R的字符串查找和替换函数来重新映射字符串向量的值。注意,alpha 前后的 ^$ 确保整个字符串匹配。没有它们,如果有一个值为alphabet,它也会被匹配,替代 onebet

  1. str <- c("alpha", "beta", "gamma")
  2. sub("^alpha$", "one", str)
  3. #> [1] "one" "beta" "gamma"
  4. # 把所有列的 'a' 替代为 'X'
  5. gsub("a", "X", str)
  6. #> [1] "XlphX" "betX" "gXmmX"
  7. # gsub() 替代所有匹配的元素 sub()
  8. # 只替代每一个元素首先匹配到的内容