urllib

1热度

1回答

我已经试过如下： import urllib link = 'https://automatetheboringstuff.com/chapter7/' f = urllib.request.urlopen(link) myfile = f.read() print(myfile) 但是，这似乎只是返回页面的源代码，而不是文本内容。

1热度

1回答

我如何请求（获取）并使用python读取xml文件？

我尝试使用Python请求上的RSS源。在过去，我使用过urllib，或者要求库来达到这个目的，并且它工作的很好。但是这一次，我继续获得406 status error，我知道该页面告诉我它不接受请求中的头部详细信息。我尝试改变它，但无济于事。这就是我试过 import requests url = 'https://www.treasurydirect.gov/TA_WS/securitie

1热度

1回答

Urllib读取错误的网站

我想在网站上提取一些信息，但是urllib不会提取与我的浏览器中显示的网站相同的信息。 generic_link_seq = "http://yeastmine.yeastgenome.org/yeastmine/sequenceExporter.do?object=1016810" sauce = urllib.request.urlopen(generic_link_seq).re

0热度

1回答

Python urllib不打开任何http URL

在我的一台生成机器上，Python urllib不打开任何http URL，但wget或curl做得很好。另外当我用sudo运行脚本时，我没有任何错误。每次我得到：错误111（拒绝连接）的任何URL #!/usr/bin/python3 import urllib.request x = urllib.request.urlopen('http://pythex.org/')

1热度

2回答

无法使用python下载PDF

我想使用python脚本下载pdf。我曾尝试使用urlib，pdfkit和curl。当我尝试下载pdf时，我正在获取页面的html/js内容而不是pdf文件。请帮我解决这个问题。使用pdfkit： import pdfkit pdfkit.from_url('http://www.kubota.com/product/BSeries/B2301/pdf/B01_Specs.pdf', 'out

1热度

2回答

urllib.request.urlopen每次都会给我错误Python 3.6

这是我的代码，非常简单。 import urllib.request x = urllib.request.urlopen('https://www.google.com/') print(x.read()) 和它给我这个错误： /Library/Frameworks/Python.framework/Versions/3.6/bin/python3.6 /Users/myName/Lib

1热度

1回答

如何urllib.request里代码转换Python的Java代码

这是Python代码 import urllib.request as urllib2 import json data = { "Inputs": { "input1": { "ColumnNames": ["id", "regex"], "Values": [ [ "0", "the regex value" ],] },

1热度

1回答

为什么我会为此Python脚本获取连接拒绝异常？

我正在写一个Python脚本来使用请求模块从azlyrics中获取歌曲的歌词。这是我写的剧本： import requests, re from bs4 import BeautifulSoup as bs url = "http://search.azlyrics.com/search.php" payload = {'q' : 'shape of you'} r = requests.

1热度

2回答

当页面需要太长的响应时间时urllib请求失败

我有一个简单的函数（在python 3中）获取一个url并尝试解决它：打印错误代码（如果有）（例如404）或解析其中一个缩短网址到完整的网址。我的网址位于csv文件的一列中，输出保存在下一列中。问题出现在程序遇到一个URL，服务器花费很长时间来响应 - 程序崩溃。如果服务器耗时过长，是否有一种简单的方法可以强制urllib打印错误代码。我看着Timeout on a function call，但

0热度

2回答

的urllib镜像和存储HTTP状态同时

我崇拜的urllib模块和I将其用于与Python 2.7数据的海量，恒定检索。像这样...... import urllib urllib.urlretrieve("http://www.example.com/mirror_me.txt","mirror_me.txt") 我所镜像的服务对于我多久可以打到他们的服务有非常严格的规定。这几乎总是一个200响应时，我打不过偶尔我需要留意404