elasticsearch的索引标准

2015-10-30 37 views 1 likes

我正在使用twitter streaming api。并且对决定索引数据的标准有点困惑。现在我有一个索引，其中包含一个doc_type中的所有推文和另一个doc类型中的用户。elasticsearch的索引标准

是它去保存它们的最好方式或者我应该创建一个新的文档类型，为每个类别

什么应该是存储的最佳方式（类别可包括hashtag和鸣叫内容的基础上决定）这样的数据？

在此先感谢。

2015-10-30 ds46

回答

首先，你的问题的答案是，这非常取决于你的用例。你的应用程序在做什么？你对推文做什么？你计划拥有多少类别？

但是，总的来说，我会寻求一种解决方案，您可以在所有推文上使用相同的索引和相同的doc_type。这允许您在所有推文上构建查询和聚合，而不用考虑不同类别的类别。它还允许您轻松添加新类别，而无需更改查询。

如果您想对推文进行一些分类，您可以向存储在elasticsearch中的推文文档添加类别字段。然后，您可以使用此类别字段来实现您的特定应用程序逻辑。

如果您的类别名称中有空格或标点符号，请不要忘记将类别字段定义为not_analyzed。否则它会被分解。

2015-10-31 22:12:27 paweloque