2015-10-30 37 views
1

我正在使用twitter streaming api。并且对决定索引数据的标准有点困惑。现在我有一个索引,其中包含一个doc_type中的所有推文和另一个doc类型中的用户。elasticsearch的索引标准

是它去保存它们的最好方式或者我应该创建一个新的文档类型,为每个类别

什么应该是存储的最佳方式(类别可包括hashtag和鸣叫内容的基础上决定)这样的数据?

在此先感谢。

回答

1

首先,你的问题的答案是,这非常取决于你的用例。你的应用程序在做什么?你对推文做什么?你计划拥有多少类别?

但是,总的来说,我会寻求一种解决方案,您可以在所有推文上使用相同的索引和相同的doc_type。这允许您在所有推文上构建查询和聚合,而不用考虑不同类别的类别。它还允许您轻松添加新类别,而无需更改查询。

如果您想对推文进行一些分类,您可以向存储在elasticsearch中的推文文档添加类别字段。然后,您可以使用此类别字段来实现您的特定应用程序逻辑。

如果您的类别名称中有空格或标点符号,请不要忘记将类别字段定义为not_analyzed。否则它会被分解。