2017-04-05 56 views
0

我想从网站基URL获取所有链接/ html页面。我阅读文档,并知道它可以使用python Beautifulsoup组合来实现。您可以让我知道如何安装BeautifulSoup和任何其他先决条件的步骤。 一旦安装了BeautifulSoup,我如何在Python代码中使用它。如果有人可以共享python代码来实现这一点。beautifulsoup用于从网站中的基本URL获取所有链接

+0

看看:[用Python扒网页](http://stackoverflow.com/documentation/python/1792/web-scraping-with-python#t=201704051114226410689) –

回答

0

您的问题没有提供您的操作系统或特定目标的信息。我假设你已经安装了Python。 pip是管理python包的命令行工具。您可以在终端上运行下面的命令

pip install beautifulsoup4 

beautifulsoup documentation就是要学习更多的开始的好地方。

+0

Python已经安装,Python 2.7版本0.8。我正在尝试通过cmd安装everythng。当我运行命令pip安装beautifulsoup时,它说'pip'不被识别为内部或外部命令, – Nisha

0

question中的片段可能会帮助您检索基本网址中的所有链接。

+0

感谢此..在运行此之前,我感觉很漂亮需要sip和pip。我在安装时遇到问题。将首先要求更多细节。 – Nisha

+0

如果您的操作系统是windows,只需下载包含pip作为捆绑模块的python 3.6。然后将你的python 3.6和python 3.6/scripts添加到你的环境路径中。然后你可以在命令提示符下使用pip install beautifulsoup4。 – pythonlearn

相关问题