fuzzy-search

    0热度

    1回答

    A BK Trees (Burkhard-Keller Trees)与模糊字符串搜索(例如拼写检查,单词推荐)相关联。所有的BK树搜索算法都与explained here相同。目标是返回,例如"seek" and "peek" if I search for "aeek"。 现在,我的问题是,我想利用这个模糊字符串搜索算法来搜索从所有类似的项目给予词典。例如,给一个词“寻找”,我想找到全部类似的单

    0热度

    1回答

    我有做一个的fuziness距离一个简单的文本字段搜索简单弹性查询: GET /jobs/_search { "query": { "fuzzy": { "attributes.title": { "value": "C#" "fuzziness": 1 } } } } 上面的查询也正是它被告知这样做,

    1热度

    1回答

    我正在努力匹配'字段'到多字段(或_all字段) 我想对cross_fields进行模糊匹配,但它不受支持。 任何想法如何做到这一点或任何其他方式来做到这一点? query: { multi_match: { query: term, type: "cross_fields", fields: ['_all'] } } 这里试图溶液 Elas

    0热度

    1回答

    我有一组文档,每个文档都用一组可以包含空格的标签进行注释。用户提供一组可能拼错的标签,我想找到匹配标签数量最多的文档(可选择加权)。 有几千个文档和标签,但每个文档至多有100个标签。 我正在寻找一个轻量级且高性能的解决方案,其中搜索应该完全在客户端使用JavaScript,但是可以使用node.js对索引进行一些预处理。 我的想法是使用multiset和模糊索引来创建文档的反向索引,该索引可以找

    2热度

    3回答

    我有一个包含大约700万群众来源记录的Microsoft SQL Server数据库表,主要包含带有一些相关详细信息的字符串名称值。对于几乎每一条记录,似乎都有十几个类似的错字记录,我试图做一些模糊匹配来识别诸如“苹果”,“Aple”,“苹果”,“Spple”等记录组。这些名字也可以包含多个空格之间的单词。 我想出了一个使用编辑距离标量函数的解决方案,该函数返回从string1转换为string2

    0热度

    2回答

    我在我的数据库表中有一个varchar字段让我们称之为store_name,这个字段从实体A获得它的值,现在实体B将store_name输入到不同的数据库表B现在我想要表A中的所有记录,其中store_name与表B中的值匹配。 您会如何建议我执行查询,因为我不控制这两个字段的值? 您如何看待PostgreSQL fuzzystrmatch? 这些表包含数千条记录。 谢谢

    1热度

    1回答

    我想搜索并计算在较大序列(F)内发生的小DNA序列(R)的数量,但R有几个可能是变量。我认为最简单的方法是设置R的比率并在F中将所有命中数计数在80%以上,但似乎只执行此操作的命令(例如difflib的SequenceMatcher或get_close_matches)需要使用列表才能工作。我不能把F分成任何这样的名单。有任何想法吗? 编辑2:更多信息请求。 DNA片段(F)中存在一定数量的重复序

    0热度

    2回答

    我正在清理一个我继承的脏数据库,并且需要对模糊匹配名称进行人工审查。我提出了一个可行的解决方案,但速度非常慢 - 15k行7分钟。我有这种感觉,我忽略了一些非常简单的解决方案。 记录示例: 1 John Smith 2 John Q Smith 3 Janway Smith 4 Jane Chen 5 David Jones 6 Natalia La Brody 7 Natalia L

    1热度

    1回答

    由于数据在遗留系统中存储错误,因此我使用R和agrep()来匹配公司名称列表 - 因为数据在传统系统中存储错误 - 没有第四种常规格式,公司在同一级别上录制作为客户,这意味着每个新客户都有一个新的公司条目,这导致一家公司拥有许多不同的公司名称 - 这在很多情况下都能正常工作。 有时,特别是对于短字符串,我得到的 - 至少对我来说 - 奇怪的比赛,例如(ABC是第一家名称): ABC ABAXIS

    1热度

    1回答

    我们使用exists-db base来存储各种xml文档,我们使用xquery执行搜索。这是示例XML文档: <person personID="some_id"> <name> <familyName>Doe</familyName> <firstName>John</firstName> </name> </person> 我们