fuzzy-search

    2热度

    1回答

    我正在研究一个将比较两个字符串并挑选出类似短语和单词的项目。 例如,请阅读以下两个问题。 问题1:这本小说的主角经常在Celeste经营的咖啡馆吃饭。它开始与主角参加​​他的母亲的葬礼,并没有表现出悲伤的迹象。对于10分,Meursault在阿尔伯特加缪的小说中在沙滩上射击阿拉伯人? 问题2:本书中的角色与他的朋友Emmanuel一起在消防车上跳跃,经常在Celeste's吃午餐。它开始于主角的母

    -1热度

    1回答

    我正在寻找一个Python中的函数,其工作原理与SQL中用于匹配字符串的'%'完全相同。我需要这样来匹配一些由于导出方式而具有奇怪间距的字符串,所以我需要在每个单词之间放入%来查找我想要的字符串。 例如: “你好你怎么样” “你好你怎么样” “你好你怎么样” “你好你怎么样” 我想用sql的方式将字符串匹配到“%Hello%%how%%%%”

    0热度

    1回答

    如何通过ListJS上的输入字段搜索后对项目进行计数? 我不知道在哪里可以得到它,因为我只是用简单的例子: var params = { valueNames : ['titleList', 'currentList', 'typeCode', 'categoryCode'], plugins: [ ListFuzzySearch() ] } var searchSigh

    18热度

    1回答

    使用OCR工具我从截图(每个约1-5个句子)中提取文本。但是,手动验证提取的文本时,我注意到不时发生的几个错误。 中的文字 “您好!有我真的很喜欢星火❤️”,我注意到: 1)像字母 “I”,和 “L” 得到改为 “|”, “!” 。 2)表情符号未正确提取并被其他字符替换或被忽略。 3)不时删除空格。 因此,我最终可能会得到一个这样的字符串:“你好,7l |真的像Spark!” 因为我试图匹配这些

    0热度

    2回答

    我具有包括数据类别的名称一个Python 2.7组对象,我想是能够做一些形式的模糊元件检查看,如果给定输入的用户的一部分,是的元件集合。 这里是一个玩具为例,来解说我想什么。鉴于以下一组和用户输入: SET = {'red_ball', 'green_ball', 'red_cup', 'green_cup'} user_input = 'yellow ball' 我想程序打印出类似以下内容

    1热度

    1回答

    我正在运行模糊匹配算法,它允许两个字符串通过Levenshtein度量标准有一个单独的差异。但是,当两个相继字母调换频繁错字: 乔呐比 - >乔的比 专业图片SI Onal地区 - >专业图片是 Onal地区 但这些不同之处由Levenshtein给出2。我怎样才能匹配那些不同呢?

    0热度

    1回答

    对于我的学士论文项目,我正在开发Chatbot的自然语言理解单元。现在我面临以下问题: 我有一个词,让我们说'汽车',这是德国人的汽车。现在,用户可能会将'autto'作为输入,因为他只是简单地犯了一个错字(添加了额外的't'),并且通常在聊天界面中,用户不遵循大写/小写规则,而是输入所有内容小写。 对于我的NLU算法,我需要为每个单词找到GermaNet中正确的Synset(大致相当于WordN

    1热度

    3回答

    考虑这个例子: >> from fuzzywuzzy import process >> choices = ['account', 'update', 'query'] >> process.extract('u', choices) [('account', 90), ('update', 90), ('query', 90)] 在上述情况下,它混​​淆了我的最终用户是帐户排名上面更

    -1热度

    1回答

    我有一个很小的数据集(〜1000行)。每一行都有一个用户名,名字和姓氏。我可以使用pg_trgm对这三个字段进行模糊搜索,并将这三个字段连接在一起,每个字段之间有两个空格?或者,是否有更好的方法来搜索这组用户,使用卦或任何其他方法?

    0热度

    1回答

    搜索是我当前应用程序中最重要的部分之一。它需要感觉像是一个快速,准确的全球搜索。该应用基于Firebase,我发现Firebase的equalTo()/ startAt()组合在这方面相当欠缺。 我想达到的目标: 按相关 下令由字匹配字结果(所以OO宗座外方传教会应产生上述结果) 在多个属性中搜索(因此põhjalapime应产生以上结果) 模糊搜索(莱文斯坦?) - pojala应符合Põhja