2013-10-04 22 views
0

我想知道是否有可能编写一个PHP脚本,通过一个非常大的数据集(1亿+)来尝试查找数据集中的特定字符串?检测是否存在,然后自动处理

如果可行的话,它是否是在数据集中识别关键字的有效形式?

如果没有处理,通过这些大型数据集更好的方式来尝试的检测字符串,我所有的耳朵

+0

一切都是可能的编程。 – vikingmaster

+0

这是一个有趣的问题,但很广泛,可能很快就会关闭。你能指定一些关于约束条件,文件类型,数据库连接等的信息。 –

+0

是的Sébastien,我被一位Google代表询问,试图找到检测和自动处理谷歌违反策略的方法。例如,如果有人将版权内容放入他们的Google Adwords内容中。现在据我所知,谷歌使用BigTable作为他们的数据库,所以我认为所有的数据都在这个数据库中。如果你有更好的方式,除了使用脚本,正如我所说的那样,所有的耳朵! – Ciaran

回答

2

那么像杰瑞说,一切皆有可能的编程。

我通过Hadoop,MapReduce等处理大量数据。

相关问题