我们有一个填充了OCR数据和手动输入数据的数据库。内容中存在拼写错误的SQL Server全文搜索
使用CONTAINS命令进行搜索时,并非所有结果都出现。因此,搜索“猴子人”并不会返回数据中包含男人,男人的记录。
有没有办法在数据中允许这些问题?
我已经对Lucene.NET和Soundex进行了粗略浏览,但是看不到这些功能太多。
感谢您的任何想法
我们有一个填充了OCR数据和手动输入数据的数据库。内容中存在拼写错误的SQL Server全文搜索
使用CONTAINS命令进行搜索时,并非所有结果都出现。因此,搜索“猴子人”并不会返回数据中包含男人,男人的记录。
有没有办法在数据中允许这些问题?
我已经对Lucene.NET和Soundex进行了粗略浏览,但是看不到这些功能太多。
感谢您的任何想法
我相信你正在寻找的东西叫做模糊匹配。
类似的帖子:
或许有用:
http://web.archive.org/web/20100209050309/http://anastasiosyal.com/archive/2009/01/11/18.aspx
And another - http://stackoverflow.com/questions/921978/fuzzy-matching-using-t-sql – Edward
我不知道你是否会发现免费软件做到这一点。我的公司已将具有此功能的Informatica与Data Quality一起使用,此工具用于清理数据,以便稍后您可以查询,而不必担心遗漏拼写错误的单词。 – 2014-01-17 18:04:03