mallet

    1热度

    1回答

    我正在尝试在项目中使用MALLET机器学习库来进行词义消歧。我的特征向量包含一个x令牌的固定大小的令牌窗口,位于目标令牌的左侧和右侧。槌训练实例被创建这样的: // Create training list Pipe pipe = new TokenSequenceLowercase(); InstanceList instanceList = new InstanceList(pipe);

    0热度

    1回答

    我尝试使用运行MALLET主题建模通过以下命令行: bin/mallet import-dir --input data\my_text \ --output my.mallet \ --remove-stopwords TRUE \ --keep-sequence TRUE \ --gram-sizes 1,2 \ --kee

    0热度

    2回答

    我正在尝试使用Java API进行主题建模。这个包提供了一个方便的例子。但是,考虑到我的数据的规模要大得多,我认为从一个文件导入它是不切实际的。 我查看了链接到另一个MALLET问题的PowerPoint演示文稿,发现了一个名为FileIterator的东西,我相信我应该可以使用它们代替示例Java代码中使用的CsvIterator。但是,我不确定我是否正确使用它。我试着用它运行我的代码,并且它在

    1热度

    1回答

    我已经将木槌文件导入,现在我想从导入的数据建模主题并将它们存储在文本文件中,从那里我将能够读取这些主题。任何人都可以帮助编写主题提取命令,因为我在下面输入了主题提取命令,但它会引发异常。 仓\槌进口-DIR --input d:\数据\ TEST1 --output test1.mallet --keep序列--remove-停用词--extra-停用词通过去除extra.txt - -keep-

    4热度

    2回答

    我正在使用槌子主题建模示例代码,虽然它运行良好,我想知道这个声明的参数实际上是什么意思? instances.addThruPipe(new CsvIterator(new FileReader(dataFile), "(\\w+)\\s+(\\w+)\\s+(.*)", 3, 2, 1) // (data, target, name) fi

    1热度

    1回答

    我计算LDA的模型的估计与槌在Java中,我期待为长期话题矩阵。 计算模型,并获得主题的文档矩阵得好: ParallelTopicModel model = ...; //... estimating the model int numTopics = model.getNumTopics(); int numDocs = model.getData().size(); // Getti

    0热度

    1回答

    感谢您阅读并花时间考虑并回应此问题。 我正在使用Gensim的Mallet包装(ldamallet.py),它的作用就像魅力。我需要为我的语料库(在我的所有文档中)获得主题比例,我不知道该怎么做。 model.alpha不是它,因为它没有被归一化为1.另外,alpha包含我的Dirichlet参数,而不是主题比例。我对么? 任何帮助,非常感谢。

    1热度

    1回答

    当我运行具有较多主题(例如T> 300)的Mallet LDA时,我会获得带有空主题词(没有单个主题词)的主题。 这是为什么发生?这是Mallet中的一个错误吗? 我在ubuntu 14.04机器上使用了mallet 2.0.7。 编辑 mallet-2.0.7/bin/mallet import-dir --input $path/$posts --output $outputDir/$post

    1热度

    1回答

    我在学习木槌,我正在尝试这个例子。所以,我跑这个命令 斌/槌进口DIR --input抽样数据/网络/ * --output web.mallet 从链接http://mallet.cs.umass.edu/import.php 我得到的输出是文件名为web.mallet,但不是可读格式。它是web.mallet:Java序列化数据,版本5。如何转换成可以读取的特征向量或者转换成csv文件或文本文

    1热度

    1回答

    我在R中使用木槌,直到我安装devtools时它工作正常。之后,我开始得到以下我从来没有得到的错误。 Error in .jcall("RJavaTools", "Ljava/lang/Object;", "invokeMethod", cl, : java.lang.NoSuchMethodException: No suitable method for the given para