inverted-index

    0热度

    1回答

    如果弹性搜索使用倒排索引,我想知道elasticsearch如何能够支持范围查询和短语查询。 注意:我看到倒排索引支持它们,但我不清楚它们是如何在内部执行的。

    0热度

    1回答

    我需要使用Cassandra的存储倒排索引,其中单词及其制品频率存储如下: word, article_title, frequency 的独特单词数约为40M和Cassandra节点的数量= 2。 将单词的第一个字符用作分区键或单词本身会更好吗? 主键是什么?

    0热度

    2回答

    我正在浏览弹性搜索的在线权威指南。 我在下面的链接中描述的倒排索引的不变性一个问题:当一个新的文档中的索引被添加 https://www.elastic.co/guide/en/elasticsearch/guide/current/making-text-searchable.html 会发生什么?是否会重新创建倒排索引以包含与新文档相关的详细信息/元数据? 它会不会影响弹性的表现?

    0热度

    1回答

    Elastic/Lucene如何处理未分析的字段?它不必为该字段值创建倒排索引或位置(我会想象)。它只需要记录该值? 我怀疑它仍然只是一个倒数索引的术语。而且这个词的位置将始终固定在该领域的开始和该领域的结束。这看起来准确吗?

    2热度

    1回答

    我想快速确定存储在Vertica中的数据库中包含某个关键字的表和列。 Vertica为全文搜索提供Text Index功能。但是,文本索引只能针对特定的架构/关系而不是整个数据库。 有谁知道是否有一种简单的方法来为Vertica中的整个数据库构建倒排索引?

    0热度

    2回答

    我有以下格式的倒排索引: { IndexLength: 5, InvertedIndex: { word1: [0, 2, 4], word2: [1, 3] } } 什么是转化成“字词1字词2字词1字词2字1”使用JavaScript字符串这个最有效的方法是什么?

    -1热度

    1回答

    我是C++新手。我试图做倒排索引,但我无法理解线索。我想要统计这个词的频率。你能解释这个代码,以及如何计算这个词的频率?请帮我解决这个问题。 class node{ public: node() { clear(); } node(char z) { clear(); } ~node() { for (int x = 0; x < MAX_NODES; x

    1热度

    1回答

    我在lucene中保存字段id和msg以支持全文搜索。当用户输入一个关键字时,lucene执行搜索并显示结果,当用户使用保存的ID点击该关键字时,我打开从数据库获取结果并显示更多细节。 是否有可能为Lucene来节省味精只是倒排索引申请,而不是整个味精领域,把我交给刚的ID,这样我可以从数据库获取结果显示的结果吗? 通过这样做我的数据不会是多余的。

    0热度

    1回答

    我正在处理一个问题,我需要将一些计算的数据存储在CPP(地图数据)中以供将来参考,以便稍后可以将其直接加载到内存中。 (有点类似蟒蛇酱) 什么是最快的方法来实现这一点。

    0热度

    1回答

    这一天,我研究了信息检索(特别是关于文本检索)。 我想制作一个搜索引擎。但我对倒序索引和向量空间模型(另外,布尔模型等...用于将文档表示为向量)的标题事物感到困惑 我认为倒转索引是向量空间模型的可选函数,因为这索引模型可以帮助程序更有效地获得术语(或单词) ....这是我的想法......是吗? 请发表评论。