2017-10-04 85 views
1

我在取时间写了一个nutch插件。我正在对获取的网页进行一些分析,并将结果存储在对应于网页的hbase中。我不知道如何添加额外的字段以及如何使用nutch将数据写入该字段。如何通过nutch在hbase中添加额外的字段?

+0

尝试索引更新schema.xml! –

+0

你想添加额外的领域,而索引? –

+0

是否可以在hbase中添加额外的字段? – Rajeev

回答

1

如果你想增加额外的字段建立索引时Solr中::

如果固定的附加字段(静态)的值,那么你可以使用的Nutch的指数静态插件。

它允许您添加一些字段及其内容。

第1步:

您首先需要启用index.static财产Nutch的-site.xml中

第2步:

添加index.static财产

<property> 
<name>index.static</name> 
<value>first_field:value,second_field:value</value> 
<description> 
    Used by plugin index-static to adds fields with static data at indexing time. 
    You can specify a comma-separated list of fieldname:fieldcontent per Nutch job. 
    Each fieldcontent can have multiple values separated by space, e.g., 
    field1:value1.1 value1.2 value1.3,field2:value2.1 value2.2 ... 
    It can be useful when collections can't be created by URL patterns, 
    like in subcollection, but on a job-basis. 
    </description> 
</property> 

步骤3:

添加字段定义在schema.xml中

第4步:

启用在plugin.includes

或者您可以按照https://wiki.apache.org/nutch/WritingPluginExample-1.2写作插件

相关问题