beautifulsoup用于从网站中的基本URL获取所有链接

我想从网站基URL获取所有链接/ html页面。我阅读文档，并知道它可以使用python Beautifulsoup组合来实现。您可以让我知道如何安装BeautifulSoup和任何其他先决条件的步骤。一旦安装了BeautifulSoup，我如何在Python代码中使用它。如果有人可以共享python代码来实现这一点。beautifulsoup用于从网站中的基本URL获取所有链接

来源

2017-04-05 Nisha

看看：[用Python扒网页]（http://stackoverflow.com/documentation/python/1792/web-scraping-with-python#t=201704051114226410689） –

您的问题没有提供您的操作系统或特定目标的信息。我假设你已经安装了Python。 pip是管理python包的命令行工具。您可以在终端上运行下面的命令

pip install beautifulsoup4

的beautifulsoup documentation就是要学习更多的开始的好地方。

来源

2017-04-05 10:39:14 dontpanic

Python已经安装，Python 2.7版本0.8。我正在尝试通过cmd安装everythng。当我运行命令pip安装beautifulsoup时，它说'pip'不被识别为内部或外部命令， – Nisha

此question中的片段可能会帮助您检索基本网址中的所有链接。

来源

2017-04-06 18:06:39 pythonlearn

感谢此..在运行此之前，我感觉很漂亮需要sip和pip。我在安装时遇到问题。将首先要求更多细节。 – Nisha

如果您的操作系统是windows，只需下载包含pip作为捆绑模块的python 3.6。然后将你的python 3.6和python 3.6/scripts添加到你的环境路径中。然后你可以在命令提示符下使用pip install beautifulsoup4。 – pythonlearn

beautifulsoup用于从网站中的基本URL获取所有链接

回答

相关问题