2016-12-02 84 views
0

我必须运行复杂聚合,其中一个步骤是计算sold_qty字段的总和,然后我需要将此总和与非聚合字段all_qty相减。我的数据如下:计算字段和聚合字段之间的差异

{item_id: XXX, sold_qty: 1, all_qty: 20, price: 100 } 
{item_id: XXX, sold_qty: 3, all_qty: 20, price: 100 } 
{item_id: YYY, sold_qty: 1, all_qty: 20, price: 80 } 

这些是来自要约的交易。 all_qty和price字段是多余的 - 表示来自其他结构的单个值 - 报价并且仅在单个报价(由item_id标识)的所有交易中重复。

在SQL中的条款我需要的是:

SELECT (all_qty - sum(sold_qty)) * price GROUP BY item_id 

我所做的是聚集

'{ 
"query": {"term": {"seller": 9059247}}, 
"size": 0, 
"aggs": { 
    "group_by_offer": { 
    "terms": { "field": "item_id", size: 0}, 
    "aggs": { "sold_sum": {"sum": {"field": "sold_qty"}}} 
} 
} 
}' 

但我不知道下一步该怎么做,以实现我的目标。

+0

你有哪个版本的ES的? – Val

回答

0

由于您已经存储了冗余字段,如果我是您,我还会存储all_price = all_qty * pricesold_price = sold_qty * price的结果。这不是强制性的,但是在执行时会比执行脚本来执行相同的计算更快。

{item_id: XXX, sold_qty: 1, sold_price: 20, all_qty: 20, price: 100, all_price: 2000 } 
{item_id: XXX, sold_qty: 3, sold_price: 300, all_qty: 20, price: 100, all_price: 2000 } 
{item_id: YYY, sold_qty: 1, sold_price: 80, all_qty: 20, price: 80, all_price: 1600 } 

所有你必须接下来要做的就是总结sold_price平均all_price,只需使用bucket_script管道聚合得到两者的区别:

{ 
    "query": { 
    "term": { 
     "seller": 9059247 
    } 
    }, 
    "size": 0, 
    "aggs": { 
    "group_by_offer": { 
     "terms": { 
     "field": "item_id", 
     "size": 0 
     }, 
     "aggs": { 
     "sold_sum": { 
      "sum": { 
      "field": "sold_price" 
      } 
     }, 
     "all_sum": { 
      "avg": { 
      "field": "all_price" 
      } 
     }, 
     "diff": { 
      "bucket_script": { 
      "buckets_path": { 
       "sold": "sold_sum", 
       "all": "all_sum" 
      }, 
      "script": "params.all - params.sold" 
      } 
     } 
     } 
    } 
    } 
} 
+0

这有什么好运? – Val