lucene.net

    0热度

    1回答

    我试图做的是太值添加到索引如下: doc.Add(new Field("field_name", value, Field.Store.YES, Field.Index.ANALYZED)); 值为"Cell phones",所以它实际上做的是在索引"Cell"和`“电话”中添加两个独立的值。如何让它添加一个:“手机”?

    1热度

    1回答

    我一直在拉我的头发,试图让它工作。 这就是我想要实现: 使用lucene.Net搜索功能 主机这在Azure上 问题: 我用这个教程Lucene.Net ultra fast search for MVC or WebForms site => made easy!到开始,它完美的工作,同时从我的localdb检索创建索引文件在我的本地磁盘,并随后调用休息方法来执行搜索。 现在我试图将部分代码转换

    0热度

    1回答

    我与那里的文档的结构和一些可能含有像自定义标签索引工作自定义标签: “有些长句<custom-tag attr="value" />该到此为止” “有些长句<custom-tag attr="value" />该到此为止<custom-tag-2 attr="value2" />” “另一位长句<another-custom-tag attr="value" />从而结束<another-cust

    1热度

    1回答

    我得到Lock obtain timed out异常,并且完全为空索引文件夹。 此异常抛出的那一刻我尝试使用下面的代码创建一个索引: IndexWriter writer = new IndexWriter(directory, analyzer, IndexWriter.MaxFieldLength.UNLIMITED) 我怎么可能解决这个错误?

    1热度

    1回答

    我正在使用lucene.net索引我的pdf文件。刷新索引后,它会多次显示相同的文档(=我刷新索引的次数)。 我正在使用最新版本的lucene.net索引(Lucene.net 3.0.3)。 这是我的索引代码。 public void refreshIndexes() { // Create Index Writer string strIndexDir = @

    1热度

    1回答

    我正在处理文档管理项目,我想从pdf中提取文本。我怎样才能做到这一点。我正在使用Itextsharp在本地系统上提取PDF 这是我用于此目的的功能。 Path是一个FTP服务器路径 public static string ExtractTextFromPdf(string path) { using (PdfReader reader = new PdfReader(pat

    0热度

    1回答

    我是Lucene.net的新手。我有一种情况,我需要搜索文件夹中的所有文档,以查找用户输入的关键字。 我编制了文件夹中的所有文件的索引,并为用户输入的关键字准备了一个查询并执行搜索。 问题是我可以得到命中,当我试图迭代命中时,我无法从命中文档中获取字段。 这是我的代码。 public void Searching() { Analyzer analyzer = new Standard

    0热度

    1回答

    只见提取所有可用条款场的一个例子here 它不适合我porpouses的原因是因为条款和存储的值是不同的,例如, "black cat"的储值将被重新编为"black"和"cat"两个条款。在我的代码中,我需要在这种情况下提取整个存储的值"black cat"。

    2热度

    1回答

    我正在使用lucene.net来索引我的pdf文件。大约需要40分钟索引15000 pdfs和索引时间增加与我的文件夹中的pdf文件数量增加。 我该如何提高lucene.net中的索引速度? 是否有任何其他索引服务具有快速索引性能? 我正在使用最新版本的lucene.net索引(Lucene.net 3.0.3)。 这是我的索引代码。 public void refreshIndexes()

    0热度

    1回答

    我的问题是找到获取最后一个(时间戳)索引Lucene文档的最快方法。 以下是文件中的字段的样子: // Index file contents Field contentField = new Field( FieldContent, message.content, Field.Store.YES, Field.Index.AN