carrot2

    0热度

    1回答

    对于Apache Solr和Carrot2,我都很新。我正在尝试使用Solr对很多输入文件进行索引。最终目标是对文档进行分组。 我不清楚聚类是由Solr还是由carrot2工作台完成的? 任何人都可以在这里指导我吗?

    0热度

    1回答

    我有一套文档(多行句子文本)。我想用carrot2将它们聚类。根据文档中指定的xml文件格式。必须有一个查询和文件的片段和网址和标题。 我的问题有以下几种: - 我应该在XML文件中的查询组件写? 应该给出什么作为我没有他们的文件的网址和标题。我只有从数据集中提取的文档(多行文本)。 我认为对第一个问题的回答是*:*。那是对的吗?? 请帮忙!! 编辑: - 的carrot2-wordbench指定

    1热度

    1回答

    技术的内部属性:Maven的3 +的IntelliJ + ElasticSearch 5.5.0 + Carrot2 3.15.1 我有Carrot2和ElasticSearch一个项目,上升了一些冲突。 Carrot2使用Lucene 5.3.1,ElasticSearch使用6.3.1版本。我想强制carrot2使用6.3.1 Lucene版本来修复它。 我试图在我的项目的主要POM文件添加属

    0热度

    1回答

    我试图在Apache SOLR中启用雇主集群(子集群生成)。为此,我使用SOLR集群组件,将“outputSubclusters”参数设置为true。 但是,当我以JSON显示输出时,从集群过程收到的对象不显示任何子集群,这让我想知道......我在这里错过了什么? 这里是我的solrconfig.xml中群集部件: <searchComponent name="clustering"

    -1热度

    1回答

    我已经收录使用Solr 6.5的本地文件夹与data_driven_schema_configs模式 我有安装carrot2网3.15和胡萝卜工作台 它的确定:所有的工作以及 我想打开任何文件列表结果中的一个文件... 当我使用工作台(在Linux的Ubuntu 14.04)我得到一个格式良好的URL像“file:///mnt/xxx/yyy.pdf”但openlink不起作用打开) 当我使用ca

    0热度

    1回答

    我已经下载了Carrot2并试过了,我收到了回复“我们的歉意,发生了以下处理错误:org.carrot2.source.etools.IpBannedException:org.apache.http.client。 HttpResponseException:Forbidden“ 我读过这不是问题,因为允许的搜索次数是有限的。但这是我第一次搜索! (请原谅我可怜的英语,我不是说英语的人)。 拉奎

    0热度

    1回答

    我一直在寻找(在制作我自己的过程中)到solr的carrot2的默认集群组件。在clustering component类有2种方法,其中的聚类算法被称为: 在重写的过程方法 SolrDocumentList solrDocList = SolrPluginUtils.docListToSolrDocumentList( results.docList, rb.req.getSearcher(),

    0热度

    1回答

    我正在使用carrot2的STC(后缀树聚类)算法对一堆文档进行聚类。默认情况下,算法形成的最大群集数为。有没有办法决定生成的集群数量? 以下是调用STC群集的代码。 ProcessingResult byDomainClusters = controller.process(documents, null, STCClusteringAlgorithm.class); List<Cluster

    0热度

    1回答

    我下载了用于Mac的Carrot2文档集群服务器版本3.15.0。读取我的文件说: DCS需要Java运行时环境(JRE)版本1.7.0或更高版本。至 运行DCS,执行'dcs'脚本并将您的浏览器指向 http://localhost:8080以获取进一步说明。 Mac OS Sierra并不容易,但我安装了1.8.0_112。 问题是我不知道如何执行'dcs'脚本。 有.cmd,.sh,.war

    -1热度

    1回答

    我刚刚开始与Carrot2 Workbench合作对搜索引擎结果执行聚类。可视化效果很好,但我希望导出群集列表和文档数量。另外,我会对可能导出与集群相关的属性(如权重)感兴趣。 我在工作台上的界面上没有看到任何东西,但有没有可能的方法,我可以使用工作台,然后用额外的代码片段导出? 任何帮助表示赞赏。我一直在寻找一段时间,到目前为止还没有看到任何答案。 问候, 安德鲁