urlparse

    2热度

    2回答

    我一个CSV具有以下结构工作: "2012-09-01 20:03:15","http://example.com" 的数据是我的浏览历史记录的清理倾倒。我有兴趣计算特定日期前五个唯一的域名。这是我到目前为止: from urlparse import urlparse import csv from collections import Counter domains = Count

    3热度

    1回答

    当netloc是空的urlparse.urlunparse是不一致的: >>> urlparse.urlunparse(('http','','test_path', None, None, None)) 'http:///test_path' >>> urlparse.urlunparse(('ftp','','test_path', None, None, None)) 'ftp:///

    11热度

    5回答

    我很新的python。我试图解析一个URL文件只留下域名。 我的日志文件中的一些网址以http://开头,有些以www.some开头。 这是我的代码的一部分剥去http://部分。我需要添加什么来查找http和www。并删除? line = re.findall(r'(https?://\S+)', line) 目前,当我运行的代码只有http://被剥离。如果我将代码更改为以下内容: lin

    0热度

    1回答

    我: from urlparse import urlparse s = "http://google.com" + "\n" # this line is read from file, when I loop over file's lines urlparse(s) ParseResult(scheme='http', netloc='google.com\n', path='', p

    16热度

    1回答

    我想分析查询部分从URL,这是我的代码来做到这一点: >>> from urlparse import urlparse, parse_qs >>> url = '/?param1¶m2=2' >>> parse_qs(urlparse(url).query) >>> {'param2': ['23']} 该代码看起来不错,但“parse_qs”方法失去像“参数1”或查询参数“参

    0热度

    1回答

    我有以下网址的代码:http://localhost/summary/myfile.csv 我想让url看起来像这样:http:// localhost/summary? file = myfile.csv 代码将被写入烧瓶。 我的第一个URL代码如下: @app.route('/summary/<filename>',methods = ['GET']) def api_summary(fil

    2热度

    2回答

    我正在使用python来生成一个查询字符串,然后将被解析的JavaScript。 考虑一个相当“复杂”的数据块: import urllib params = { 'record': 'customer', 'filters': [ ('id', '>', 5), ('name', 'startswith', 'Jean Luc')

    14热度

    2回答

    有没有一个标准功能来检查IRI,来检查URL显然,我可以使用: parts = urlparse.urlsplit(url) if not parts.scheme or not parts.netloc: '''apparently not an url''' 我尝试了上面的URL包含Unicode字符: import urlparse url = "http://f

    4热度

    2回答

    在Python的urlparse中,可以使用urlparse解析URL,然后使用parse_qsl解析查询。 我想删除查询(名称,值)对,然后重建URL。 有一个urlunparse方法,但没有unparse_qsl方法。 什么是从qsl列表重建查询的正确方法?

    0热度

    1回答

    我想从查询字符串中删除某些项目,这样做的最好方法是解析查询字符串,迭代并删除我不想要的特定密钥并将其全部加入一起。 遵循python指南,它似乎是urlencode函数,他们说使用,不会像预期的那样工作。 收取下面的代码,它简单地解析查询字符串,然后将它连接在一起。我已将其设置为保留空值。 >>> f = 'name=John%20Doe&seq=123412412412&wer' >>> q