处理twitterfeed可视化。我有一个很大的数据集。我只想使用包含特定字符串的推文消息。在短的未知字符串中有效查找特定术语或短语的简单方法是什么?
我现在有这样一行:
数据= data.filter(函数(d,I){返回d.text.indexOf( '新年')= - 1真:假的? ;});
它返回包含字符串“新的一年”一个通过twitterfeed所有的鸣叫。工作正常! :)
但是,如何选择多个字符串?
其实,我想这一块也返回和/或“新年快乐”包含像“NEWYEAR”变化的鸣叫和/或“快乐2013”和/或拼写错误等
希望有人能帮助我..
2013年快乐!
结合你想要的所有支票?即'return(d.text.indexOf('new year')!= - 1 || d.text.indexOf('newyear')!= - 1 || ...)? true:false;'可能会更好地使用正则表达式。 –
性能有多重要?匹配变体有多重要?解决这些问题的质量解决方案并不简单。 – erickson
http://en.wikipedia。org/wiki/String_searching_algorithm#Algorithms_using_finite_set_of_patterns – tripleee