0
我正在使用Solrj索引Solr中的文档,其中一个字段是url。在创建solr文档并将其传递给SolrServer时,我没有进行任何明确的解码,以保持url的原始格式。但是,一旦它被索引,网址就被解码。如何防止solr在编制索引时解码url?
下面是一个包含撇号的测试示例。
http://test.com/test/Help/What%e2%80%99s_N1
Solr中的索引,它被解码为
http://test.com/test/Help/What's_N1
下面是一个示例代码:
SolrServer solrServer = new StreamingUpdateSolrServer(solrPostUrl, solrQueueSize, solrThreads);
SolrInputDocument solrDoc = new SolrInputDocument();
solrDoc.addField("url", "http://test.com/test/Help/What%e2%80%99s_N1");
UpdateResponse solrResponse = solrServer.add(solrDoc);
我看着SolrInputDocument对象,它确实有正确的格式,即编码版本。
我会很感激,如果有人可以提供这个指针。
感谢