carrot2

    2热度

    2回答

    如何增加Carrot2 Document Clustering Workbench的Java堆大小?

    0热度

    1回答

    通过使用弹性搜索通过carrot2插件进行聚类时,文档是否有任何限制。 这就像我们可以在最多10000个文件中使用carrot2进行聚类那样是否有任何限制?

    0热度

    1回答

    我是刚刚发现伟大的Carrot2框架的初学者。 我尝试使用Java API将LingoClusteringAlgorithm中的Facebook注释列表(约100个注释约10-200个字符)聚类在一起。我可以使用评论文本作为“标题”字段并将字段“片段”,“网址”和“查询”留空吗?或者有更好的方法(f.ex.使用评论文本两次“title”和“snippet”?)

    0热度

    1回答

    我正在寻找一些利用Carrot2 Java API从Solr搜索中检索集群结果的Java代码示例。日Thnx。

    0热度

    1回答

    我可以使用cluto和carrot2工具将推文群组分组吗? 最后一个问题是carrot2和cluto语言独立的NLP工具?

    1热度

    2回答

    有没有什么办法可以隐藏ES作为响应返回的一些常见字段? 例如,如果我得到如下回应: { "took": 74, "timed_out": false, "_shards": { "total": 15, "successful": 15, "failed": 0 }, "hits": { "total": 2

    0热度

    2回答

    SOLR/Carrot2集成 我有多个文本文件每个i上的Solr为波纹管 <add> <doc> <person>data </person> <organization>data here </organization> <content>Some spanish text here</content > </doc> <add> 模式在索

    0热度

    1回答

    我正在使用carrot2对一组500个电子邮件进行集群。我正在使用carrot2提供的BisectingKMeans算法。在同一个数据集上,当我指定k = 9时,只生成6个,当我给它运行8个集群时,会生成7个 - 但是,当我给出10个集群运行时,将生成全部10个集群。 任何人都可以请帮我找出背后的原因?

    0热度

    2回答

    我有非常大的solr索引。我想标记所有文档的术语,这些术语能更好地表示该文档,如this。这种类型的聚类结果是否也出现在文档标签下? 哪种方法比较好,索引时间文档标记或查询时间文档标签,如carrot2?

    1热度

    1回答

    我目前正在尝试使用Solr来进行群集。我正在使用STC算法。但是,我不知道如何生成群集的标签。我知道使用了后缀树中的节点标签,但是以什么方式?将选择什么后缀(术语)?谢谢。