我在摆弄使用Node.js从电子商务网站刮取数据。我使用Request来检索页面的DOM,并使用Cheerio来执行服务器端DOM选择。 const cheerio = require('cheerio');
const request = require('request');
// takes a URL, scrapes the page, and returns an object
我使用Node.js开始一个新项目,我想知道是否有任何方法来管理从cheerio.load()函数返回的内容。 我试图使用回调和承诺(然后赶上),但它没有工作。 例如: var $ = cheerio.load(html);
//what if it's falied ???? how I can handle it?
我问这个,因为我试图运行脚本薮时间,但有时它的工作,有时没有。 BTW:
所以我有一个问题,我无法获得电影的链接,我想为“人们也喜欢”部分刮到它显示你类似的电影。我不能太上一些电影该页面,但因为有一个人物部分 function findCommonMovies(movie, callback){
request('http://www.imdb.com/find?ref_=nv_sr_fn&q='+ movie +'&s=all', function (er
我正在学习如何为个人项目执行爬网程序(使用'cheerio')。爬行本身工作正常,但不知何故我正在构建的对象(eventDetails)没有被返回。您可以在下面看到,在函数级别声明的对象已正确填充请求,但不在其外部。你能帮忙吗?谢谢。 function crawlEventDetails(eventLink){
var eventDetails = new Object();
我在本示例中使用了cheerio。 我想找到第400个单词并选择它的parentNode。 <article>
<p>Lorem ipsum dolor sit amet, consectetur adipiscing elit. Integer nec odio. Praesent libero. Sed cursus ante dapibus diam. Sed nisi. Nul