要从聊天室总结随访,这个问题实际上涉及到这是做所有〜500K的文件的扫描一个发现()查询找到15:
db.tweet_data.find({
$or:
[
{ in_reply_to_screen_name: /^kunalnayyar$/i, handle: /^kaleycuoco$/i, id: { $gt: 0 } },
{ in_reply_to_screen_name: /^kaleycuoco$/i, handle: /^kunalnayyar$/i, id: { $gt: 0 } }
],
in_reply_to_status_id_str: { $ne: null }
}).explain()
{
"cursor" : "BtreeCursor id_1",
"nscanned" : 523248,
"nscannedObjects" : 523248,
"n" : 15,
"millis" : 23682,
"nYields" : 0,
"nChunkSkips" : 0,
"isMultiKey" : false,
"indexOnly" : false,
"indexBounds" : {
"id" : [
[
0,
1.7976931348623157e+308
]
]
}
}
此查询使用case-insensitive regular expressions这将不会有效地使用索引(尽管在这种情况下实际上没有定义一个索引)。
建议的方法:
创建用于搜索目的小写handle_lc
和inreply_lc
字段
在那些添加compound index:
db.tweet.ensureIndex({handle_lc:1, inreply_lc:1})
化合物索引的顺序允许有效查找的所有鸣叫或者通过handle
或通过精确匹配代替正则表达式(handle,in_reply_to
)
搜索:
db.tweet_data.find({ $or: [ { in_reply_to_screen_name:'kunalnayyar', handle:'kaleycuoco', id: { $gt: 0 } }, { in_reply_to_screen_name:'kaleycuoco', handle:'kunalnayyar', id: { $gt: 0 } } ], })
有用以包括与[.explain()](HTTP一个示例查询://www.mongodb.org/display/DOCS/Explain)。 – Stennie 2012-07-28 15:10:34