如何解析自由格式文本字符串以根据位置和名称字典检测位置和名称等内容?在我的特定应用程序中,如果我的字典中没有更多的条目,那么将会有数万个条目,所以我很确定只是通过它们来完成所有的事情都是不可能的。此外,是否有任何方法添加“模糊”匹配,以便您还可以检测字典单词的编辑中的子字符串?如果我没有弄错,它属于自然语言处理领域,更具体地说是命名实体识别(NER);然而,我试图找到关于NER背后的算法和流程的信息已经空了。我宁愿使用Python,因为我最熟悉的是,尽管我愿意考虑其他解决方案。从字典中查找文本字符串中的单词
1
A
回答
1
你可以尝试下载斯坦福命名实体识别器: http://nlp.stanford.edu/software/CRF-NER.shtml
如果你不想用别人的代码,你想自己做,我建议采取看看算法他们的相关论文,因为他们使用的条件随机场模型已经成为NER的一种相当常见的方法。
我不确定如何回答你的问题的第二部分关于寻找没有更多细节的子字符串。您可以修改斯坦福大学的课程,或者您可以使用词性标注器在文本中标记专有名词。这不会将位置与名称区分开来,但它会使找到与每个专有名词相隔x个字的单词变得非常简单。
相关问题
- 1. 查找字符串中的单词词
- 2. 查找字符串中的单词
- 3. 在词典键中查找字符串,其中的字符串并非完全是字典中的键
- 4. 查找字符串中特定单词字符的索引号
- 5. 从文本文件中查找字母数字字符串
- 6. 查找单词中的中间字符
- 7. 字符串查找单词的Javascript
- 8. 字典未知大小 - 查找单词是否在字典中
- 9. C++查找返回字符串变量文本中的最后一个单词。字符串getFirstWord(文本)
- 10. Java查找字符串中的词
- 11. 查找词典中最大的唯一字符串
- 12. 从PowerShell中发送词典[字符串,字符串]到TextTransform.exe
- 13. 查找字符串中每个单词的第一个字母
- 14. 使用字典检查文本字符串并用X替换单词。 Python的
- 15. 快速检查字符串是否包含字典文件中的单词?
- 16. 从词典字符串中制作字典
- 17. 查找字符列表中的单词
- 18. 查找单词和分割字符串
- 19. 检查字符串中的单词
- 20. 查找字符串中的单词的简单代码
- 21. 在vba词中查找单词后插入字符串
- 22. 在字符串中查找文本
- 23. 在XML中查找文本字符串
- 24. 查找和比较字符串中单个单词的长度
- 25. 如何查找字典中的单词频率(CSV文件)
- 26. 查找python中字符串中单词的出现次数3
- 27. 如何在java中查找字符串中的整个单词
- 28. 在Java中查找字符串中的最小单词
- 29. 在java中查找字符串中的最小单词
- 30. C#RegEx查找字符串中的特定字符串或全部单词