2013-06-22 66 views
2

当我运行斯坦福LLDA TMT阶的机型,我遇到了一些问题。其中之一是我尝试使用LLDA tmt模型进行推理时出现线程错误。我运行的代码是完全由Shreyas卡尼克在sourceforge上的链接提供的一个,线程错误

@Skarab:这里是链接到我以前bit.ly/ocK2T9(学习)和bit.ly/qIWb6C代码(推理),请让我知道你是否仍然遇到任何错误。

该错误消息是,


命令开始:周六6月21日21时34分48秒CDT 2013 的java -Dscalanlp.distributed.hub =插座://crick7.mayo.edu:41080 /毂-Dscalanlp.distributed.id =/TMT/0 -Xmx100000m edu.stanford.nlp.tmt.TMTMain “/data4/bsi/nlp/s110067.sharp/bioask/tmtModels/example-7-llda-infer.scala”

加载模型...

TSVFile("test.csv") ~> IDColumn(1) ~> Column(2) ~> TokenizeWith(SimpleEnglishTokenizer.V1() ~> CaseFolder() ~> WordsAndNumbersOnlyFilter() ~> MinimumLengthFilter(3)) 

生成输出... [同期] 128个许可证 [同期] 128个许可证

Exception in thread "Thread-3" java.lang.IndexOutOfBoundsException: 1 
    at scala.collection.LinearSeqOptimized$class.apply(LinearSeqOptimized.scala:51) 
    at scala.collection.immutable.List.apply(List.scala:45) 
    at scalanlp.stage.Column.map(ColumnSelectors.scala:51) 
    at scalanlp.stage.Column.map(ColumnSelectors.scala:46) 
    at scalanlp.stage.generic.Mapper$$anonfun$apply$1$$anonfun$apply$2.apply(Mapper.scala:36) 
    at scalanlp.stage.Item.map(Item.scala:32) 
    at scalanlp.stage.generic.Mapper$$anonfun$apply$1.apply(Mapper.scala:36) 
    at scalanlp.stage.generic.Mapper$$anonfun$apply$1.apply(Mapper.scala:36) 
    at scala.collection.Iterator$$anon$19.next(Iterator.scala:335) 
    at scala.collection.Iterator$$anon$19.next(Iterator.scala:335) 
    at edu.stanford.nlp.tmt.data.concurrent.Concurrent$$anonfun$map$2.apply(Concurrent.scala:96) 
    at edu.stanford.nlp.tmt.data.concurrent.Concurrent$$anonfun$map$2.apply(Concurrent.scala:88) 
    at edu.stanford.nlp.tmt.data.concurrent.Concurrent$$anon$4.run(Concurrent.scala:45) 

你能给的帮助?非常感谢!

+0

要复制概率,您shd状态:scala版本,JVM版本,操作系统,您的内存和处理器,其他相关 –

回答

0

检查任何的.csv文件DOS/Unix的不兼容性。

我的经验可能是相关的: 我也收到错误java.lang.IndexOutOfBoundsException,从Windows上的命令行运行的TMT-0.4.0的时候。我的工作流程有一个python程序将我的数据集分解为训练和测试.csv文件。但是他们是用DOS模式写的。例如,请参阅 http://www.cs.toronto.edu/~krueger/csc209h/tut/line-endings.html

对此的确认是,在Excel中打开它们时,出现了额外的一行,并且在Emacs中打开它们时,会显示一个^ M。

我在.csv文件上运行了dos2unix,然后TMT Scala程序开始工作。