2014-10-01 32 views
0

我正在尝试在我正在使用的项目中使用OpenNLP,而且我对它很陌生。我尝试了使用命名实体识别以及http://opennlp.sourceforge.net/models-1.5/ 的培训数据。但是,我想查看已使用的培训数据。即实际打开.bin文件并以英文查看其内容。有人可以指出我正确的方向。 我试图使用UltraISO来读取.bin文件,但我没有成功。 PLs help !! Thanx :)如何在opennlp中查看.bin文件的内容

+0

'bin'是* generic *文件的扩展名,表示文件可以是任何东西*,但是*纯文本。 (特别是它与“ISO”无关)。您需要正确的软件才能打开它,或在某处找到文件格式的规格并编写软件来阅读它。 – usr2564301 2014-10-01 11:46:00

回答

0

使用Unix file命令查找文件类型,如file en-token.bin。对于大多数OpenNLP .bin文件,它会告诉你这些只是ZIP文件。

0

bin文件实际上是一个序列化java对象的字节,它表示一个名为NameFinderME(ME意思是最大熵,这是OpenNLP中使用的主要多项式逻辑回归(ish)算法)的TokenNameFinder实现。通过对此文件执行任何操作,您将无法看到培训数据。 更正:它不是名称查找程序,它是序列化的namefinderMODEL。