我尝试使用NLTK在python中进行命名实体识别。 我想提取个人技能列表。 我有技能列表,并希望在申请中搜索并标记技能。 我注意到NLTK拥有NER标签,用于预定义标签,如Person,Location等。 Python中是否有外部gazetter tagger我可以使用? 任何想法如何做到这一点比搜索术语更复杂(有时多词术语)?使用Python从个人Gazetter中命名实体识别
感谢, 阿萨夫
我尝试使用NLTK在python中进行命名实体识别。 我想提取个人技能列表。 我有技能列表,并希望在申请中搜索并标记技能。 我注意到NLTK拥有NER标签,用于预定义标签,如Person,Location等。 Python中是否有外部gazetter tagger我可以使用? 任何想法如何做到这一点比搜索术语更复杂(有时多词术语)?使用Python从个人Gazetter中命名实体识别
感谢, 阿萨夫
我没有使用NLTK最近就够了,但如果你有,你知道是技能的话,你不需要做NER-只是一个文本搜索。
也许使用Lucene或其他一些搜索库来查找文本,然后对它进行注释?这是很多工作,但如果你正在处理大量可能没问题的数据。或者,您可以将正则表达式搜索集中在一起,速度较慢,但对于较小数量的数据可能工作正常,并且实现起来会更容易。