所以我使用python来做一些网页解析,我想将完整的网址分成两部分。说我有地址http://www.stackoverflow.com/questions/ask。我需要协议和域名(例如http://www.stackoverflow.com)和路径(例如/ questions/ask)。我想这可能是通过一些正则表达式来解决的,但我并不那么方便。有什么建议么?如何拆分网址
Q
如何拆分网址
2
A
回答
0
import re
url = "http://stackoverflow.com/questions/ask"
protocol, domain = re.match(r"(http://[^/]*)(.*)", url).groups()
7
使用Python模块里urlparse:
https://docs.python.org/library/urlparse.html
对于这样一个明确的和见多识广的问题,不编写自己的代码麻烦,更何况自己的正表达式。他们造成太多麻烦;-)。
12
丹是正确的:是里urlparse您的朋友:
>>> from urlparse import urlparse
>>>
>>> parts = urlparse("http://www.stackoverflow.com/questions/ask")
>>> parts.scheme + "://" + parts.netloc
'http://www.stackoverflow.com'
>>> parts.path
'/questions/ask'
+0
得爱电池包括哲学。我认为最初的b/c正则表达式我不知道电池是否包含在内。谢谢。 – 2008-11-13 18:22:03
相关问题
- 1. 如何在SQL Server拆分网址
- 2. PathHierarchyTokenizerFactory不拆分网址
- 3. 拆分JavaScript网址的jQuery
- 4. 拆分地址
- 5. 拆分网址标签在JavaScript
- 6. JavaScript网址拆分为表单手动输入网址
- 7. 清漆拆分网址和更改网址
- 8. 拆分地址列
- 9. 拆分地址 - TSQL
- 10. 如何分割网址?
- 11. 如何正确拆分网站?
- 12. 地址拆分公式
- 13. 拆分逗号分隔的地址
- 14. 如何区分音频网址和视频网址?
- 15. 拆分地址 - 使用拆分()导致奇怪的5位
- 16. 如何拆分web.config?
- 17. 如何拆分值
- 18. 如何拆分ObservableCollection
- 19. perl:如何拆分?
- 20. 如何拆分UIView
- 21. 如何拆分列?
- 22. 如何拆分BitArray
- 23. 如何拆分UIBarButtonItem?
- 24. 如何拆分主分支?
- 25. 分号网址
- 26. 如何在asp.net分裂URL和替换我如何通过asp.net拆分网址“哈希”
- 27. 验证网址,然后将其拆分成URL和域名
- 28. .htaccess - 如何删除部分网址?
- 29. 如何查找网址的一部分
- 30. 如何用.htaccess重写部分网址?
重复。请参阅http://stackoverflow.com/questions/258746/slicing-url-with-python和http://stackoverflow.com/questions/163009/urllib2-file-name – 2008-11-13 10:57:44