2016-01-28 156 views
-1

我想从一个网页下载html代码源。我可以使用HTTP客户端做到这一点吗? 在这种情况下,让我先生成行? 我正在使用Pentaho数据集成6,谢谢。下载网站源代码

回答

0

要从网页下载HTML,您应该使用HTTP Client。从documentation

HTTP客户端的步骤没有做任何事情

问:HTTP客户端的步骤没有做任何事情,我怎么做工作?

答:需要触发HTTP客户端步骤。使用行生成器步骤生成例如1个空行并将其链接到HTTP客户端步骤。

所以你需要先行。例如,使用Generate RowsData Grid与您要获取的网址。

image of transformation

如果你只需要添加的网页的URL你想要的HTML中HTTP Client的HTML将被放置在result