-3
A
回答
1
20个新闻组数据集是一个非常受欢迎的主题。如果您使用Python,您可以在这里使用scikit learn.See更多信息访问:http://scikit-learn.org/stable/datasets/twenty_newsgroups.html
2
看一看TAC共享任务:http://www.nist.gov/tac/2011/Summarization/
编辑:你可以回去的时间,看看前面的TAC/DUC摘要共享任务。另请注意,您需要签署一些许可协议。
相关问题
- 1. 自动更正文档语料库
- 2. 关于“自动文本摘要(基于语言)”
- 3. R语言中的文本摘要
- 4. 英语语料库需要
- 5. 从哪里获得新闻摘要语料库?
- 6. 来自twitter的语料库
- 7. 是否有任何支持HTTP摘要的Ruby库?
- 8. 是否有免费的医疗或临床报告/语料库?
- 9. 自动文本摘要:使用Django/python的Web应用程序?
- 10. 构建您自己的文本语料库
- 11. 使用类放大文本语料库
- 12. Jekyll Post摘抄:如何知道是否有自动生成的摘录?
- 13. 带有toctree的自动摘要不为方法创建文档
- 14. 如何在文本语料库周围切出X个单词的segmentx - 对文本语料库
- 15. Orchard博客摘要文本
- 16. Cloud9是否自动具有语法?
- 17. 狮身人面像自动摘要未显示属性摘要
- 18. EF及摘要的自动生成
- 19. 自动创建TextField的摘要
- 20. 自动文摘:提取基于什么是基于自动摘要提取算法
- 21. 是否有自动生成脚本清晰库的工具?
- 22. 用于生成自动摘要的开源库
- 23. 使用语义相似度的文本摘要
- 24. 对齐语料库的Perl脚本
- 25. 如何从文本语料库中提取语义相关性
- 26. 从文本语料库中分离非结构化语句
- 27. 是否可以刷新jqGrid组摘要?
- 28. [R文本挖掘包:允许把新的文件到现有的语料库
- 29. 减少摘要中的文本量
- 30. 泄漏摘要摘自Valgrind的日志文件丢失