Mongodb聚合过滤器像子文档

如果我们有以下MongoDB中的文档，

测试数据

{id:1, filter:{f1:'v1-1', f2:'v2-1', f3:['v3-1', 'v3-3']}} 
{id:2, filter:{f1:'v1-1', f2:'v2-2', f3:['v3-2', 'v3-3']}} 
{id:3, filter:{f1:'v1-1', f2:'v2-2', f3:['v3-1', 'v3-3']}}

准备收集

db.test.drop() 
db.test.insert({id:1, filter:{f1:'v1-1', f2:'v2-1', f3:['v3-1', 'v3-3']}}) 
db.test.insert({id:2, filter:{f1:'v1-1', f2:'v2-2', f3:['v3-2', 'v3-3']}}) 
db.test.insert({id:3, filter:{f1:'v1-1', f2:'v2-2', f3:['v3-1', 'v3-3']}})

你可以考虑过滤领域为用于过滤功能例如，在许多购物网站上，他们会告诉你有多少LE D电视和现场多少台液晶电视。

我想使用MongoDB来计算每个过滤器选项的多少个文档（包括数组字段中的每个项目），预期结果如下。

预期结果

[ 
    { 
     _id : { key: 'f1', value: 'v1-1' }, count: 3 
    }, 
    { 
     _id : { key: 'f2', value: 'v2-1' }, count: 1 
    }, 
    { 
     _id : { key: 'f2', value: 'v2-2' }, count: 2 
    }, 
    { 
     _id : { key: 'f3', value: 'v3-1' }, count: 2 
    }, 
    { 
     _id : { key: 'f3', value: 'v3-2' }, count: 1 
    }, 
    { 
     _id : { key: 'f3', value: 'v3-3' }, count: 3 
    } 
]

这很容易使用的map/reduce得到结果，

的Map/Reduce的解决方案

map = function() { 
    for (k in this.filter) { 
     if (this.filter[k] instanceof Array) { 
      for (j in this.filter[k]) { 
       emit({ key: k, value: this.filter[k][j]}, 1); 
      } 
     } else { 
      emit({ key: k, value: this.filter[k]}, 1); 
     } 
    } 
} 

reduce = function (k, values) { 
    result = 0; 
    values.forEach(function(v) { result += v; }); 
    return result; 
} 

db.test.mapReduce(map, reduce, {out:{inline:1}})

但与性能问题map/reduce，它不能用于实时查询。如果添加一些查询条件，结果集可能会更改，所以我无法将地图/缩减结果保存到另一个集合中以进行实时查询。

我可以使用聚合框架来计算计数一个过滤器，

只有一个过滤器聚合解决方案

db.test.aggregate(
{$project: {"filter.f2":1, "_id":0}}, 
{$group: {"_id": {"key": {$ifNull: [null, "f2"]}, "value":"$filter.f2"}, "count" : {$sum: 1}}} 
) 

[ 
    { 
     "_id" : { "key" : "f2", "value" : "v2-2" }, "count" : 2 
    }, 
    { 
     "_id" : { "key" : "f2", "value" : "v2-1" }, "count" : 1 
    } 
]

但我不知道该怎么做了所有的过滤器选项。任何想法？

来源

2013-06-12 jxie

如果你改变你的数据结构是这样的，请注意，所有的值是数组，即使单值的：

{ 
    _id: 1, 
    filters: [{ 
    key: 'f1', 
    values: ['v1-1'] 
    },{ 
    key: 'f2', 
    values: ['v2-1'] 
    },{ 
    key: 'f3', 
    values: ['v3-1', 'v3-3'] 
    }] 
} 
{ 
    _id: 2, 
    filters: [{ 
    key: 'f1', 
    values: ['v1-1'] 
    },{ 
    key: 'f2', 
    values: ['v2-2'] 
    },{ 
    key: 'f3', 
    values: ['v3-2', 'v3-3'] 
    }] 
} 
{ 
    _id: 3, 
    filters: [{ 
    key: 'f1', 
    values: ['v1-1'] 
    },{ 
    key: 'f2', 
    values: ['v2-2'] 
    },{ 
    key: 'f3', 
    values: ['v3-1', 'v3-3'] 
    }] 
}

你可以做一个聚合函数是这样的：

db.test.aggregate({ 
    $unwind: "$filters" 
},{ 
    $project: { 
    _id: 1, 
    key: "$filters.key", 
    values: "$filters.values" 
    } 
},{ 
    $unwind: "$values" 
},{ 
    $group: { 
    _id: { 
     $concat: ["$key","|","$values"] 
    }, 
    count: { $sum: 1 } 
    } 
})

如果你愿意，你可以跳过这个项目的步骤，我只是把它放在那里作为一个很好的东西。不管怎样，你都需要两次放松。

来源

2013-06-12 19:47:13 Tal

很好的答案，谢谢！我使用的是mongodb 2.2，所以我需要在$ group部分使用'_id：{key：“$ key”，values：“$ values”}'。 – jxie

Mongodb聚合过滤器像子文档

回答

相关问题