2012-09-20 41 views
0

检索元的内容我有一个脚本,它允许检索各种指定网址的信息:JsFiddle通过URL

正如你所看到的元内容是从“的baseUrl”(在的开始时得到的脚本)。 对于该页面上的所有href(baseUrl),还有一个div(#links)。 我的问题:如何获取链接的元内容而不是baseUrl?

回答

0

你的脚本正在做的是加载主页并解析出数据。为了获得链接的URL上的元标记,您需要基本再次使用链接网址运行脚本,而不仅仅是您的baseUrl。如果你无限循环,你基本上已经构建了一个web爬虫。