2016-07-01 72 views

回答

1

我认为这个问题是有点朦胧......

如果索引数据在你的工作,你没有指定_id - 你将产生重复 - 这是可怕的局面。
但是,如果您指定_id,您只需重新编制相同文档的索引几次 - 它不是很糟糕,但它对您的服务器来说是额外的和不必要的工作。
但是,如果你的工作消耗大量的资源(CPU,内存等),你可能会超载你的服务器...

+0

是的,我们确实指定id,它似乎并没有产生重复。我将需要改进索引,以便它不会做任何不必要的工作。 –

0

什么都不应该发生。 Elasticsearch可以轻松应对。我的建议是从另一面看这个问题。也许最好是尝试改进同步。例如将插入注册到队列中,然后将其缩放到多个工作人员。顺便说一句你用散装插入?

+0

不,我没有使用批量插入。插入时会提高性能吗? –

+1

你应该使用批量。没有它,每一个操作都是单独的http请求。通过批量,您可以在单个请求中插入或更新1000个条目。检查这个https://www.elastic.co/guide/en/elasticsearch/reference/current/docs-bulk.html – saimaz

相关问题