1
在阅读了一些教程之后,我设法提供了jsdom并用几行代码表达并在jsdom环境中抓取了任何网址的着陆页。使用JSDOM刮写包含其子页面的网页
但是,我似乎无法找到任何关于通过页面和链接进行进一步搜索的文档。
在阅读了一些教程之后,我设法提供了jsdom并用几行代码表达并在jsdom环境中抓取了任何网址的着陆页。使用JSDOM刮写包含其子页面的网页
但是,我似乎无法找到任何关于通过页面和链接进行进一步搜索的文档。
在jsdom中没有递归设置。刚刚获得来自顶级页面所有链接,并发出这些都是新的擦伤(递归)
同一域中的尝试https://github.com/rc0x03/node-promise-parser
遵循example.com中的所有链接:
pp('example.com')
.find('a')
.follow('@href')