2015-11-19 99 views
0

我有一年的15分钟间隔数据在我的kairosdb。我需要依次执行以下操作: - 使用标记过滤数据 - 使用少量标记对过滤的数据进行分组。我没有指定标签的值,因为我希望它们在运行时根据标签值自动分组。 - 曾经分组在这些标签上,我想汇总总和15分钟间隔数据到一个月。kairosdb聚合组由

我写了这个查询,从基于kairosdb谷歌代码论坛上提供的信息的python脚本运行。但汇总的值似乎不正确。产量似乎偏斜。我想知道我出错的地方。我在python中这样做。这里是我的JSON查询:

agg_query = { 
      "start_absolute": 1412136000000, 
      "end_absolute": 1446264000000, 
      "metrics":[ 
       { 
       "tags": { 
        "insert_date": ["11/17/2015"] 
       }, 
       "name": "gb_demo", 
       "group_by": [ 
        { 
         "name": "time", 
         "range_size": { 
          "value": "1", 
          "unit": "months" 
         }, 
         "group_count": "12" 
        }, 
        { 
         "name": "tag", 
         "tags": ["usage_kind","building_snapshot_id","usage_point_id","interval"] 
        } 
       ], 
       "aggregators": [ 
        { 
         "name": "sum", 
         "sampling": { 
          "value": 1, 
          "unit": "months" 
         } 
        } 
       ] 
       } 
       ] 
      } 

参考:数据是这样的: [1441065600000,53488],[1441066500000,43400],[1441067400000,44936],[1441068300000,48736],[1441069200000 ,51472],[1441070100000,43904],[1441071000000,42368],[1441071900000,41400],[1441072800000,28936],[1441073700000,34896],[1441074600000,29216],[1441075500000,26040],[1441076400000,24224 ],[1441077300000,27296],[1441078200000,37288],[1441079100000,30184],[1441080000000,27824],[1441080900000,27960],[1441081800000,28056],[1441082700000,29264],[1441083600000,33272] [1441084500000,33312],[1441085400000,29360],[1441086300000,28400],[1441087200000,28168],[1441088100000,28944],[1443657600000,42112],[1443658500000,36712],[1443659400000,38440],[1443660300000 ,38824],[1443661200000,43440],[144 3662100000,42632],[1443663000000,42984],[1443663900000,42952],[1443664800000,36112],[1443665700000,33680],[1443666600000,33376],[1443667500000,28616],[1443668400000,31688],[1443669300000, 30872],[1443670200000,28200],[1443671100000,27792],[1443672000000,27464],[1443672900000,27240],[1443673800000,27760],[1443674700000,27232],[1443675600000,27824],[1443676500000,27264] ,[1443677400000,27328],[1443678300000,27576],[1443679200000,27136],[1443680100000,26856]]

这是一些2015年9月和10月的数据快照。当我运行这个时, 9月的时间戳,它会正确地累计9月份的数据,但是10月份它不会。

回答

0

我相信您的小组会按照日历月份(1月至12月)创建小组,但您的总和聚合器会按照您的开始日期开始的运行月份对值进行求和......这似乎有点奇怪。这是你看到的原因吗?

这是什么数据?什么是汇总结果?

+0

是的,结果有点奇怪。仅在第一个月正确完成聚合,因为其余值不准确。你能不能详细说明你通过运行月总和聚合者总结你的意思。任何建议我如何解决这个问题。在数据中,我有一年的15分钟间隔数据,我需要汇总并创建每月数据。 – Shilpi

+0

按时间分组功能将按日历月份创建集群。我不建议这么做,因为如果你查询一年以上的数据,你会在不同年份的同一月份总结upp。只需设置每月聚合器,并在聚合器选项中使用align_sampling = true。 – Loic

+0

非常感谢Loic。这种工作。现在正在总结不同的月份。但结果稍微偏离。 – Shilpi