urlparse

2热度

2回答

我一个CSV具有以下结构工作： "2012-09-01 20:03:15","http://example.com" 的数据是我的浏览历史记录的清理倾倒。我有兴趣计算特定日期前五个唯一的域名。这是我到目前为止： from urlparse import urlparse import csv from collections import Counter domains = Count

3热度

1回答

为什么urlparse.urlenparse工作不一致？

当netloc是空的urlparse.urlunparse是不一致的： >>> urlparse.urlunparse(('http','','test_path', None, None, None)) 'http:///test_path' >>> urlparse.urlunparse(('ftp','','test_path', None, None, None)) 'ftp:///

11热度

5回答

查找http：//和或www。并从域中剥离。离开domain.com

我很新的python。我试图解析一个URL文件只留下域名。我的日志文件中的一些网址以http：//开头，有些以www.some开头。这是我的代码的一部分剥去http：//部分。我需要添加什么来查找http和www。并删除？ line = re.findall(r'(https?://\S+)', line) 目前，当我运行的代码只有http：//被剥离。如果我将代码更改为以下内容： lin

0热度

1回答

和里urlparse '\ n'

我： from urlparse import urlparse s = "http://google.com" + "\n" # this line is read from file, when I loop over file's lines urlparse(s) ParseResult(scheme='http', netloc='google.com\n', path='', p

16热度

1回答

分析查询部分从URL

我想分析查询部分从URL，这是我的代码来做到这一点： >>> from urlparse import urlparse, parse_qs >>> url = '/?param1¶m2=2' >>> parse_qs(urlparse(url).query) >>> {'param2': ['23']} 该代码看起来不错，但“parse_qs”方法失去像“参数1”或查询参数“参

0热度

1回答

将参数值添加到烧瓶中的URL python

我有以下网址的代码：http：//localhost/summary/myfile.csv 我想让url看起来像这样：http：// localhost/summary？ file = myfile.csv 代码将被写入烧瓶。我的第一个URL代码如下： @app.route('/summary/<filename>',methods = ['GET']) def api_summary(fil

2热度

2回答

Javascript的等效Python的urlparse.parse_qs（）？

我正在使用python来生成一个查询字符串，然后将被解析的JavaScript。考虑一个相当“复杂”的数据块： import urllib params = { 'record': 'customer', 'filters': [ ('id', '>', 5), ('name', 'startswith', 'Jean Luc')

14热度

2回答

Python：如何检查一个字符串是否是一个有效的IRI？

有没有一个标准功能来检查IRI，来检查URL显然，我可以使用： parts = urlparse.urlsplit(url) if not parts.scheme or not parts.netloc: '''apparently not an url''' 我尝试了上面的URL包含Unicode字符： import urlparse url = "http://f

4热度

2回答

Python urlparse.unparse_qsl？

在Python的urlparse中，可以使用urlparse解析URL，然后使用parse_qsl解析查询。我想删除查询（名称，值）对，然后重建URL。有一个urlunparse方法，但没有unparse_qsl方法。什么是从qsl列表重建查询的正确方法？

0热度

1回答

Urlecoding从字典回来的字符串

我想从查询字符串中删除某些项目，这样做的最好方法是解析查询字符串，迭代并删除我不想要的特定密钥并将其全部加入一起。遵循python指南，它似乎是urlencode函数，他们说使用，不会像预期的那样工作。收取下面的代码，它简单地解析查询字符串，然后将它连接在一起。我已将其设置为保留空值。 >>> f = 'name=John%20Doe&seq=123412412412&wer' >>> q