opennlp

0热度

1回答

为什么输入myCategorizer.categorize（）;必须是apache opennlp 1.8中的String []，而不是像apache OpenNLP 1.5版中的字符串？因为我想检查单独的字符串而不是数组。 public void trainModel() { InputStream dataIn = null; try {;

0热度

1回答

训练分类模型Opennlp

我试图用下面的代码来训练一个模型，但我一直收到DocumentCategorizerME.train()方法的错误，它告诉我将factory更改为doccatfactory。为什么？ public void trainModel() { DoccatModel model = null; InputStream dataIn = null; try {

2热度

1回答

定制OpenNLP名称查找在训练集识别数据，而不是测试组

所以我终于OpenNLP纳入我的项目，我已经成功培训了15,000行的训练数据的我的模型，将其存储，并且可以加载它，当我想用它来识别我的程序中的实体！，我用它来识别井号标签，所以我的训练数据看起来是这样的： ... Jim , I know you to be a fighter <START:HASHTAG> #usmarine <END> @ USMC Kira has your

1热度

2回答

从非结构化年鉴文本中提取人名

我有许多美国学校年鉴的人脸肖像和名称的扫描页面。来自页面的所有文本都是OCR化的并且每个页面以多个版本收集：非结构化文本文件。 Example Xml带有每句话的坐标。 Example 带有每个单个字母的坐标的Xml。 Example 的目标是，以确定哪些文本字符串代表的人的名字，并将其与人像有关。问题在于每一本年鉴都是独一无二的，每一页都可能是独一无二的，所以没有共同的模式可以应用（但可能有一

1热度

1回答

将训练数据添加到现有模型（bin文件）

我正在尝试向nl-personTest.bin文件添加额外的训练数据，其中OpenNLP。现在是我的问题，当我运行我的代码添加额外的训练数据时，它将删除已经存在的数据并只添加我的新数据。如何添加额外的训练数据而不是替换它？我没有使用下面的代码，（得到它来自Open NLP NER is not properly trained） public class TrainNames {

1热度

1回答

OpenNLP find（）方法

此刻我试图在文档中查找名称。即时通讯使用下面的方法来找到名字： find(String[] tokens) 我也发现了下面这个方法： find(String[] tokens,String[][] additionalContext) 我可以做什么用这种方法，如何使用它？

-4热度

1回答

搜索引擎建议 - 链接（表格完成）

我需要在我的应用程序中创建搜索引擎。当用户输入例如“购买100只白色蝙蝠侠T恤”，它应该自动打开填充有输入的页面（页面购买 - >文章：蝙蝠侠T恤，数量：100，颜色：白色）。此外，如果用户键入“买入”，它应该是像“买入”或类似的一些建议.. 我试图完成的是机智NLP（阿帕奇openNLP +英语），但我可以”完全解决它。任何建议，我应该使用什么，我应该采取哪种方法？

1热度

1回答

OpenNLP分类程序版本1.8

我试图在openNLP 1.8版中构建分类程序，但代码如下，我不断收到NullPointerException。我究竟做错了什么？ public class test { public static void main(String[] args) throws IOException { InputStream is = new FileInputStr

1热度

1回答

将文本和表格写入word中，用空白/输入

我正在将text和text从tables写入word文档。使用以下代码将tables放置在正确的paragraphs下。 Iterator<IBodyElement> iter = xdoc.getBodyElementsIterator(); while (iter.hasNext()) { IBodyElement elem = iter.n

-1热度

1回答

什么是设置的权衡：params.put（TrainingParameters.ITERATIONS_PARAM，“100”）;

什么是权衡设置： params.put(TrainingParameters.ITERATIONS_PARAM, "100"); 什么设置10节100或1000实际上呢？谢谢