我有一个文档列表,我根据用户在Apache SOLR上的查询索引这些文档。我想通过使用相关索引文档中的关键字来提取一些新闻文章,并将其与索引文档一起显示给用户。是否有任何算法或程序可以从文档中提取相关关键字并将其用于提取新闻?从维基百科文章中提取Java关键字
0
A
回答
0
您应该研究TF-IDF关键字提取。大约两年前,我使用英文Wiki和一个简单的Python Script做了一个类似的过程。在继续操作之前,您需要回答几个问题。您可以使用TF-IDF关键词提取here
- 你只关心单个关键字一个整洁的小书面记录,否则将评估的短语,也和到什么长度?
- 你会对传入的数据进行任何自然语言处理,比如标记和词干?
- 您是否将关键字限制为某些文章类型?某些类别的文章可以有他们自己的TF-IDF分数,所以你可能想要试验你所需要的。
+0
我想要在用户查询中提供关键字和短语。但是这些应该是总结整个查询的相关关键字,而不是其他停用词或不相关的东西。是的,我将使用Apache SOLR处理这些查询。 – SplinterCell 2014-11-26 21:19:47
相关问题
- 1. jsoup - 从维基百科文章中提取文本
- 2. 从维基百科文章(Python)中提取第一段
- 3. 从维基百科文章中提取数据
- 4. PHP +维基百科:从维基百科文章的第一段获取内容?
- 5. 从维基百科中提取内容
- 6. 提取维基百科
- 7. 从维基百科在php和mysql中提取描述和关键字
- 8. 按主题搜索并从维基百科中提取关键字
- 9. 提取和解析维基百科文章
- 10. 从维基百科API提取数据
- 11. 从维基百科文章中删除我的名字
- 12. 获得维基百科文章概要
- 13. 隐藏维基百科文章反馈
- 14. 总结维基百科文章
- 15. 从维基百科获取维基百科主题标题
- 16. 从Java中提取维基百科表中的特定元素
- 17. 如何从维基百科获取文章修订历史
- 18. 从维基百科获取文章XML转储 - 通过标题
- 19. 从维基百科获取文章的第一段
- 20. 如何从当前维基百科文章中获取相关主题?
- 21. 从维基百科取代文本
- 22. 从文章中提取关键字
- 23. 从文本中提取维基百科条目
- 24. 为维基百科文章提供的人员的MQL
- 25. 如何使用维基百科API获取维基百科文章信息框中的信息?
- 26. 维基百科的文章频率文章
- 27. 维基百科的别名提取
- 28. 提取维基百科JSON密钥php
- 29. 维基百科的JAVA API
- 30. android:从维基百科文章显示标题和文本
你将什么归类为“相关关键字”? – MatsLindh 2014-11-23 23:47:29
相关关键词是指根据用户查询与用户相关的关键词。如果我将这个查询命名为“足球比赛”,那么在这种情况下足球就是我的一个相关关键词。 – SplinterCell 2014-11-25 01:01:08