2013-05-28 119 views
0

我已成功安装Cloudera Hadoop/HBase集群的OpenTSDB ontop。将csv数据导入OpenTSDB

我的问题是,我有历史1分钟股票数据的里姆斯,看起来像这样:

"Date","Time","Open","High","Low","Close","Volume" 
12/30/2002,0930,24.53,24.65,24.53,24.65,762200 
12/30/2002,0931,24.65,24.68,24.52,24.6,90400 

.....

从QS指南中的文档,它说,在批量导入部分:当我尝试这对我的数据,它抛出一个异常无益

./tsdb导入文件

有关如何将其导入OpenTSDB的任何提示?谢谢。

回答

4

您需要编写一个脚本来将您的CSV文件转换为OpenTSDB格式的文件。对于OpenTSDB的一般格式为metric timestamp value tags

为例说明如下您的样品可以写成:

stock.open 1041269400 24.53 symbol=XXX 
stock.high 1041269400 24.65 symbol=XXX 
stock.low 1041269400 24.53 symbol=XXX 
stock.close 1041269400 24.65 symbol=XXX 
stock.volume 1041269400 762200 symbol=XXX 
stock.open 1041269460 24.65 symbol=XXX 
stock.high 1041269460 24.68 symbol=XXX 
stock.low 1041269460 24.52 symbol=XXX 
stock.close 1041269460 24.6 symbol=XXX 
stock.volume 1041269460 90400 symbol=XXX 

虽然因为它似乎你与1分钟的时间工作,开/关是多余的,所以也许这会更合适:

stock.quote.1m 1041269340 24.53 symbol=XXX 
stock.quote.1m 1041269400 24.65 symbol=XXX 
stock.quote.1m 1041269460 24.6 symbol=XXX