2012-03-13 62 views
1

我正在运行一个站点,并且我的集合中有4.5百万个文档。我需要为任何文档添加另一个字段,那么在所有那些450万中将会有10个不同的字符串。 该字符串将像“Apache 2.0使用E”。按序列号搜索会比搜索字符串更快吗?

我需要找到所有的文件,例如,在这个字段中有“Apache 2.0 Using E”。那么我应该用这个字符串搜索,还是应该为所有字符串创建另一个集合,而不是按照字段的ID搜索我的4.5密耳集合?当然我会使用索引,但通过序列号搜索比搜索字符串更快?

谢谢。

回答

2

总体而言,搜索数字相等性可能会比字符串比较更快,也有助于搜索文档的大小更小。很难说速度增加是否会很大,因为性能会受到一些可能使字符串与整数比较变矮的因素的影响 - 例如文档的大小增加如何影响RAM中的内容,对每个请求的字符串的另一个查询比较慢。

索引将是太多更快。