2011-03-21 110 views
0
$:~/mgizapp/scripts$ ./plain2snt-hasvcb.py 
Error, the input should be 
./plain2snt-hasvcb.py evcb fvcb etxt ftxt esnt(out) fsnt(out) evcbx(out) fvcbx(out) 
You should concatenate the evcbx and fvcbx to existing vcb files 

有人可以解释所有的plain2snt脚本acrane投入?该脚本是从mgiza ++程序用于从http://geek.kyloo.net/software/doku.php/mgiza:forcealignment有人可以解释这个mgiza脚本是如何工作的吗?

evcb字对齐=? #is它是source.vcb文件? fvcb =? #is它是target.vcb文件?

esnt(下)=? fsnt(out)=?

evcbx(下)=? fvcbx(out)=?

ANSWER

我设法根据我(不相等)与GIZA经验++和你链接到网页它的工作

$mkcls -n10 -psourcelangfile.vcb -Vsourcelangfile.vcb.classes 
$mkcls -n10 -psourcelangfile.vcb -Vtargetlangfile.vcb.classes 
$plain2snt sourcelangfile targetlangfile 
$snt2cooc sourcelang_targetlang.cooc sourcelangfile.vcb targetlangfile.vcb sourcelangfile_targetlangfile.snt 

回答

1

,我会说evcb和fvcb是您已经生成的“英文”和“外文”词汇文件以及etxt和ftxt是“英文”和“外文”文本输入。似乎esnt和fsnt是“英语”和“外语”句子输出文件(可能是句子的单词由vcb文件中的唯一标识符替换)。最后,evcbx和fvcbx似乎是输出位置,用于通过串联扩充原始词汇文件。

我希望这可以帮助,我希望别人谁在使用MGIZA可以跳和纠正我,如果我错了。

相关问题