urllib

    1热度

    1回答

    我已经试过如下: import urllib link = 'https://automatetheboringstuff.com/chapter7/' f = urllib.request.urlopen(link) myfile = f.read() print(myfile) 但是,这似乎只是返回页面的源代码,而不是文本内容。

    1热度

    1回答

    我尝试使用Python请求上的RSS源。在过去,我使用过urllib,或者要求库来达到这个目的,并且它工作的很好。但是这一次,我继续获得406 status error,我知道该页面告诉我它不接受请求中的头部详细信息。我尝试改变它,但无济于事。 这就是我试过 import requests url = 'https://www.treasurydirect.gov/TA_WS/securitie

    1热度

    1回答

    我想在网站上提取一些信息,但是urllib不会提取与我的浏览器中显示的网站相同的信息。 generic_link_seq = "http://yeastmine.yeastgenome.org/yeastmine/sequenceExporter.do?object=1016810" sauce = urllib.request.urlopen(generic_link_seq).re

    0热度

    1回答

    在我的一台生成机器上,Python urllib不打开任何http URL,但wget或curl做得很好。另外当我用sudo运行脚本时,我没有任何错误。 每次我得到:错误111(拒绝连接)的任何URL #!/usr/bin/python3 import urllib.request x = urllib.request.urlopen('http://pythex.org/')

    1热度

    2回答

    我想使用python脚本下载pdf。我曾尝试使用urlib,pdfkit和curl。当我尝试下载pdf时,我正在获取页面的html/js内容而不是pdf文件。请帮我解决这个问题。 使用pdfkit: import pdfkit pdfkit.from_url('http://www.kubota.com/product/BSeries/B2301/pdf/B01_Specs.pdf', 'out

    1热度

    2回答

    这是我的代码,非常简单。 import urllib.request x = urllib.request.urlopen('https://www.google.com/') print(x.read()) 和它给我这个错误: /Library/Frameworks/Python.framework/Versions/3.6/bin/python3.6 /Users/myName/Lib

    1热度

    1回答

    这是Python代码 import urllib.request as urllib2 import json data = { "Inputs": { "input1": { "ColumnNames": ["id", "regex"], "Values": [ [ "0", "the regex value" ],] },

    1热度

    1回答

    我正在写一个Python脚本来使用请求模块从azlyrics中获取歌曲的歌词。这是我写的剧本: import requests, re from bs4 import BeautifulSoup as bs url = "http://search.azlyrics.com/search.php" payload = {'q' : 'shape of you'} r = requests.

    1热度

    2回答

    我有一个简单的函数(在python 3中)获取一个url并尝试解决它:打印错误代码(如果有)(例如404)或解析其中一个缩短网址到完整的网址。我的网址位于csv文件的一列中,输出保存在下一列中。问题出现在程序遇到一个URL,服务器花费很长时间来响应 - 程序崩溃。如果服务器耗时过长,是否有一种简单的方法可以强制urllib打印错误代码。我看着Timeout on a function call,但

    0热度

    2回答

    我崇拜的urllib模块和I将其用于与Python 2.7数据的海量,恒定检索。像这样...... import urllib urllib.urlretrieve("http://www.example.com/mirror_me.txt","mirror_me.txt") 我所镜像的服务对于我多久可以打到他们的服务有非常严格的规定。这几乎总是一个200响应时,我打不过偶尔我需要留意404