apache-storm

    0热度

    1回答

    我应该保持一个偏移量文件并读取该偏移线,放出,更新偏移=偏移+ 1 class SimSpout(storm.Spout): # Not much to do here for such a basic spout def initialize(self, conf, context): ## Open the file with read only permit

    0热度

    1回答

    我有一个风暴螺栓,它将密钥和值写入特定元组的哈希表中,并使用存储在其他元素中的密钥从哈希映射中读取值。当任务数量设置为1时,它可以正常工作,但只要我增加了这个数字,那么当它们不应该时,键就开始返回空值。我认为这是因为每个螺栓任务正在创建自己的哈希映射实例,因此数据不共享。我如何获得所有螺栓任务共享一个Hashmap? 我目前正在创建的准备方法HashMap中,像这样: protected Map<

    0热度

    1回答

    我在打开包含一个文件得到错误文本等 rt @whufc_news : west ham are the only team in the top half of the premier league without a player in the england squad . !url rt @blackpplvines : don't say anything just rt_ !url

    2热度

    1回答

    最近我一直在寻找使用storm,flink等进行实时数据处理...... 我遇到的所有体系结构都使用kafka作为数据源和流处理器之间的一个层,为什么这个图层应该存在?

    1热度

    1回答

    当风暴的工作人员使用storm 1.1.0运行我的拓扑时,我得到了起搏器的错误 - > java.lang .IllegalArgumentException:未找到匹配的字段:waitUntilReady for class org.apache.storm.pacemaker.PacemakerClient 似乎在使用反射时,调用者无法找到方法waitUntilReady? 但我在Pacema

    0热度

    1回答

    我想将我的风暴拓扑中传入的所有原始数据存储在HDFS群集中。 这是JSON或二进制数据,以2k /秒的速率传入。 我试图使用HDFS螺栓(http://storm.apache.org/releases/0.10.0/storm-hdfs.htmlà,但使用正常的HDFS不允许压紧螺栓使用序列文件博尔特 压缩才是可能的。 我不想使用序列文件,因为我没有一个真正的关键。 另外,我已经卡桑德拉用于存储

    0热度

    1回答

    我可以看到如何将字段内容和任务ID散列在一起用于保持字段中具有相同值的所有元组进入相同的螺栓任务。但是,如果有多名工人,他们应该如何保证?当然,螺栓任务不在工人之间共享?

    0热度

    1回答

    在apache风暴中collector.fail的作用是什么? 它是从源头(喷口)重播元组,还是仅从它发出的最后一个螺栓重放元组? 注意:我不固定我的元组,所以在这种情况下会发生什么?

    0热度

    1回答

    这是我尝试运行的基本wordcount拓扑。但我收到错误为'INFO org.apache.storm.zookeeper.server.SessionTrackerImpl - SessionTrackerImpl exited loop!'。谁能帮我这个?? 当我删除cluster.shutdown(),推文连续不断地来,直到我按下Ctrl + C。同样WORDCOUNT没有显示## imp

    0热度

    1回答

    我正在尝试对Apache Storm进行情感分析并使用Hbase检索结果。谁能告诉我该怎么做?