我正在研究一个涉及清理大学专业数据清单的项目。我发现很多拼写错误,所以我正在使用函数gsub()
来替换拼写错误的拼写错误。例如,说'biolgy'拼写错误的专业称为主要名单。我如何让R检测拼写错误并将其替换为正确的拼写?我试过gsub('biol', 'Biology', Major)
,但是它只替换了'biolgy'中的前四个字母。如果我做gsub('biolgy', 'Biology', Major)
,它仅适用于这种情况,但这并不能检测到其他形式的“生物学”拼写错误。在R中,如何用另一个字符串替换包含特定模式的字符串?
谢谢!
感谢您的回复,我刚刚与agrep一起玩过。我发现它只是返回一个整数(我猜对应于更改的字符串的数量),但它实际上是否执行更改?例如,假设我有动物= c(“老鼠”,“狗”,“猫”)。如果我想用“奶酪”代替鼠标,那么我可以使用agrep(“mou”,“奶酪”,动物)吗?当我这样做时它返回一个整数(0)。谢谢!! – Alan 2011-03-14 18:57:36
'agrep'返回矢量指数,所以你可以很容易地使用下标来指定一个值:'动物[agrep(“mou”,动物)] < - “奶酪”' – aL3xa 2011-03-14 19:10:04
非常感谢你:) – Alan 2011-03-14 19:19:07