2012-08-02 150 views
1

您好我想提取一个外部网站(不在我的域名)的源代码,然后解析它,使其成为一个应用程序。我知道如何使用JAVA的Jsoup库来完成它,但我无法找到任何有关如何使用Javascript或Jquery或任何客户端Web编程语言来完成它的链接。 有人可以指导我在哪个库上使用。基本上,我想获取网页的HTML源代码,然后解析它以提取某些标记下的某些链接。提取网页的源代码

回答

4

由于same origin policy,您无法单独使用JavaScript来执行此操作。这可以防止您从其他域中读取信息。

你需要做的是使用serverside proxy来获取信息。 Ajax调用可以调用代理来获取页面。

+0

但是,那么你需要有你自己的服务器吗? – user1019083 2012-08-02 15:01:59

+0

我试图通过创建一个Chrome扩展,它将只从网页加载一些图像。所以我不会有服务器! – user1019083 2012-08-02 15:10:48