urllib

    101热度

    4回答

    如何通过urllib获取标题的代码?如果URL是没有HTTP URL

    1热度

    3回答

    我使用了urllib.urlopen一些HTTP代理,有时(可能是当他们需要授权)我得到以下提示打印到控制台: Enter username for Private Proxy Access (country) at xxx.xxx.xxx.xxx:xxxx 我怎样才能提高人们对这样的事情发生的异常? 这里的例子: from urllib import urlopen p = '64.79

    1热度

    1回答

    我一直在尝试使用python 3获取有关过期ssl证书的信息,但它能很好地获得尽可能详细的workup。任何接受者? 到目前为止,我一直在试图使用urllib.request来获取这些信息(无济于事),这是否会将任何人都视为愚蠢? 我已经看到了一些使用旧版本python的类似工作的例子,但没有使用v3。 http://objectmix.com/python/737581-re-urllib-ge

    2热度

    1回答

    当我使用urllib2通过squid代理建立HTTP 1.1连接时,squid在HTTP 1.0中创建一个新的持续连接。 我该如何说服squid与目标服务器交谈1.1?

    0热度

    2回答

    我希望检索一个网站的源,它是在点击链接时动态生成的。链接本身是如下: <a onclick="function(); return false" href="#">Link</a> 这阻止我直接查询,让我得到动态生成的网页(的urllib/2)的URL。 如何检索网站的源代码,这是通过上面的函数(在HTML中)通过python生成的?有没有一种方法可以绕过return false" href=

    2热度

    2回答

    由于某些原因,我在调用urllib.urlopen时遇到跟踪/ BPT陷阱错误。我试过urllib和urllib2,结果相同。下面是引发错误的代码: def get_url(url): from urllib2 import urlopen if not url or not url.startswith('http://'): return None return

    0热度

    1回答

    我试图用urlretrieve从该采取何种形式的URL下载文件: http://example.com/download.php?id=6456&name=foo 但出于某种原因,我只是得到一个空的响应。 我试过在this question建议的方法似乎并没有帮助,因为 remotefile.info() 不包含关键“内容处置”,只有 ['content-length', 'x-powered

    3热度

    2回答

    我可以一次下载多个线程的速度很快,但问题是,几分钟后它会逐渐减慢到几乎完全停止,我不知道为什么。我的代码没有什么问题,我可以看到,而且我的RAM/CPU很好。我唯一能想到的就是urllib2没有正确处理大量的连接。如果有帮助,我使用代理服务器,但是我没有这个问题。有没有人对此问题有任何建议或见解?谢谢!

    0热度

    3回答

    使用Python我需要通过查询字符串将非UTF-8编码数据(特别是shift-jis)传输到URL。 我应该如何传输数据?引用它?用utf-8编码? 感谢

    1热度

    2回答

    我试图格式化文件,以便它可以插入到数据库中,该文件最初是压缩和大约1.3MB大。 每一行看起来是这样的: 398,%7EAnoniem+001%7E,543,480,7525010,1775,0 这是怎样的代码看起来像这样解析这个文件: Village = gzip.open(Root+'\\data'+'\\' +str(Newest_Date[0])+'\\' +str(Newest_Date