我正在使用solr搜索引擎来进行文档回复中的项目目的。我的数据集是.txt文件格式。但是solr只给出了json,xml,pdf和其他一些文件格式的选项。没有文本文件的选项。
对于使用.txt文件作为数据集,我需要对solr进行一些修改吗?我们可以搜索Solr搜索引擎中的.txt文件吗?
0
A
回答
0
所有你需要做的 - 就是索引你的txt文件。
欲了解更多信息和具体的例子看看这里 - http://www.slideshare.net/LucidImagination/indexing-text-and-html-files-with-solr-4063407
0
最有可能你将有空格分隔文件以.txt files.So索引文本文件,你可以写Python脚本流文档解决并执行提交。
0
除了txt文件,Solr还可以索引其他几种文档格式。详情请看Apache Tika。
0
您可以使用CSV请求处理程序来处理此问题。 https://wiki.apache.org/solr/UpdateCSV 在这里,您可以配置分隔符和转义字符。例如:如果你有一个“|”分隔文件,您可以指定“& separator = |”
下面是索引标签有限文本文件:
卷曲 'http://localhost:8983/solr/update/csv?commit=true&separator=%09&escape= \ & stream.file =/TMP /的Result.txt'
0
我发现了快速启动引导在一个非常有用的线https://lucene.apache.org/solr/5_3_1/quickstart.html
java -classpath /solr-5.0.0/dist/solr-core-5.0.0.jar -Dauto=yes
-Dc=gettingstarted -Ddata=files -Drecursive=yes org.apache.solr.util.SimplePostTool docs/
对我来说特别有用的部分是-Dauto=yes
。当此选项打开时,Solr的可以处理许多类型的文件(不要问我为什么)
Entering auto mode. File endings considered are xml,json,csv,pdf,doc,docx,ppt,pptx,xls,xlsx,odt,odp,ods,ott,otp,ots,rtf,htm,html,txt,log
我所知道的是,我打开该选项,而现在我的实例将接受PDF,XML和txt文件。
相关问题
- 1. 可以Solr索引/搜索静态文件吗?
- 2. 我可以使用Solr来搜索现有的Lucene索引吗?
- 3. 使用AJAX搜索引擎在Chrome中搜索搜索引擎
- 4. 搜索引擎可以索引JavaScript生成的网页吗?
- 5. 用于文件搜索的可安装的搜索引擎包
- 6. Apache Solr搜索可以索引但不搜索
- 7. 搜索引擎索引JSON结果吗?
- 8. 我们可以在同一个Solr索引中使用不同的语言进行索引和搜索吗?
- 9. 我们可以告诉Solr/Lucene max chars分析搜索吗?
- 10. 可以搜索引擎搜索查询字符串中的内容吗?
- 11. Solr搜索引擎的结果
- 12. 基于Solr的搜索引擎入门
- 13. 搜索引擎
- 14. Solr的搜索,而索引
- 15. Solr可以在重新索引时提供搜索服务吗?
- 16. 在搜索引擎中自动搜索
- 17. 我们可以直接将WARC文件索引到Solr吗?
- 18. 可以使用SKOS的搜索引擎?
- 19. JQGrid&搜索引擎索引
- 20. 在txt文件中的PHP搜索引擎
- 21. 如何使用搜索:搜索API在txt文件中搜索?
- 22. 比较:DB全文搜索,以搜索引擎(Lucene的)
- 23. 为什么没有搜索引擎可以搜索〜符号?
- 24. do solr-4.3.1可用于hbase-0.94.6.1中的索引搜索吗?
- 25. 我可以使用Sphinx Search来创建元搜索引擎吗?
- 26. 我可以创建自定义[视频]搜索引擎吗?
- 27. SOLR索引和搜索?
- 28. 没有索引的Solr全文搜索?
- 29. 搜索引擎中的倒排索引
- 30. 是否可以/明智地不链接索引中的任何页面? (搜索引擎优化,搜索引擎)
数据如何存储在txt中?逗号分隔? – sidgate