2016-10-04 48 views
-1

我正在尝试使用Python来读取HTML中的一个URL的内容。要获取URLHTML内容,我是否会完全使用模块wgeturllib或其他模块?在Python中从URL中获取HTML

之后回答: 我将使用urllib模块,因为它带有默认的Python 2.7版本,我无法从此计算机下载外部模块。模块的

列表,取指URL内容:

Wget 
Beautiful Soup 
Urllib 
Requests 
+0

您是否尝试过'BeautifulSoup'? –

+0

是的。有多种选择(向列表中添加请求),您可以使用其中的任何选项。 – tdelaney

+0

你能告诉我们你试过了什么吗?本网站上有很多关于此主题的问题和解答。你有具体的问题吗? – MooingRawr

回答

2

这里是一个样本,让你开始用requests

import requests 

resp = requests.get('http://httpbin.org/get') 
if resp.ok: 
    print (resp.text) 
else: 
    print ("Boo! {}".format(resp.status_code)) 
    print (resp.text) 
+0

这是最简单的。如果您使用的是Python3.x,请将'print resp.text'替换为'print(resp.text)'。 –

+0

除此之外:http://httpbin.org是用于测试客户端的极好资源。 –

+0

谢谢,@ 345243lkj - 我修正了样本和评论。 –