有没有什么办法在同一个数据流中执行多个GetHTMLElement
?我想scrapy某些属性首先执行GetHTMLElement
(选择属性)和执行UpdateAttribute
处理器Apache中的多个GetHTML属性Nifi
(attrib: ${HTMLElement})
这第一部分工作得很好,但是当我尝试执行第二GetHTMLElement
,它不能解析后的任何从flowContent ...
我在2种独立的方式执行他们,并MergeContent
和工作合并他们......但现在我需要执行2 在流动的不同部分“获取”(拆分后)并且合并将不起作用...
谢谢你的帮助......我tryed问它在Hortonworks社区(https://community.hortonworks.com/questions/131614/multiple-gethtmlelement.html)
非常感谢!对于可以添加的每个属性实现CSS Selector会很好,只需使用一个处理器就可以从HTML中获取许多属性(如EvaluateJSONPath或EvaluateXPath) –