2010-07-16 73 views
0

某些网页拥有他们的网址,其中包含超链接的“下载”文本。如何从网页下载文件?

如何通过python或ironpython获取超链接形式的URL /页面。

我可以用python或ironpython下载带有这些超链接的文件吗? 我该怎么做?

是否有任何C#工具?

我不是英语母语的人,所以很抱歉我的英语。

+1

我想你是指超链接。 – jcao219 2010-07-16 00:59:16

+0

@ jcao219:对不起,^ _ ^。 – Begtostudy 2010-07-16 01:03:40

+1

对于你的问题的第二部分: http://stackoverflow.com/questions/257409/download-image-file-from-the-html-page-source-using-python – Cambium 2010-07-16 01:12:40

回答

2

您应该可以使用CPython(普通Python)和IronPython的BeautifulSoup library。检查出findAll()方法。这应该列出所有链接的列表。

soup.findAll('a') 
+1

美丽的汤中文文档http:// www.crummy.com/software/BeautifulSoup/documentation.zh.html – jcao219 2010-07-16 01:06:13

1

最简单的方法是将HTML页面传递到XML/HTML解析器,然后在根节点上调用getElementsByTagName("A")。一旦你明白了,遍历整个列表并取出href参数。