bs4

0热度

3回答

是否有替代bs4的find_all（）方法返回另一个汤对象，而不是一个列表，为进一步导航？

找到所有的<ul>后，我想进一步提取文字和href的。我对这一点HTML所特别关注的问题是，我需要大部分，但不是页面中的所有<li>项目。我看到当我find_all()，我返回一个列表对象，它不允许我进一步导航它作为汤对象。例如，在下面的代码片段，最终创造{'cityName': 'href',}一本字典，我曾尝试： city_list = soup.find_all('ul', {'class

0热度

1回答

bs4 parent attrs python

我刚刚开始使用Python进行编码，我的朋友问我应用程序在网络上找到特定的数据，很好地表示它。我已经找到漂亮的网页，其中包含数据，我可以找到基本信息，但接下来的挑战是要深入。虽然在Python 3.4使用BS4我已经达到了示范代码： <tr class=" " somethingc1="" somethingc2="" somethingc3="" data-something="1" som

1热度

3回答

如何从“chrome：// downloads”页面获取字符串

我用Chromedriver下载该文件，然后我想解析"chrome://downloads"获取下载状态，但是我无法获取字符串，请参考下面的代码和结果。我也在Chrome中检查了HTML。我可以看到<span id="name">Noto-hinted (1).zip</span>，但是如果我使用view page source，我找不到字符串"Noto-hinted (1).zip"。这是<sp

0热度

1回答

部分在Python BS4成为可变

假设我们有一些代码： <tr class=" " somethingc1="" somethingc2="" somethingc3="" data-something="1" something="1something4" something_id="6something7"> <td class="text-center td_something"> <div> <span doo="t

0热度

1回答

Bs4创建对象很慢

我有问题。只与PYTHON2。 r = self.session.get('http://..................') print "CREATE BS" print datetime.now() soup = BeautifulSoup(r.content, 'html.parser') print "CREATE BS END" print datetime.now()

0热度

2回答

Python美丽的汤 - 获取输入值

我的计划是通过使用Bs4来获取_AntiCsrfToken。我有这个HTML在我的HTML来自和我自己编写的代码是 token = soup.find('input', {'name':'_AntiCsrfToken'})['value']) print(token) ，但它给了我一个错误说 Traceback (most recent call last): File "C:

-2热度

2回答

Python beautifulsoup我无法在csv文件上编写

我的目标是编写一个可从网站检索特定数据的python脚本。具体我要提取这些数据： <span class="street-address" itemprop="streetAddress">191, Corso Peschiera</span> 和 <div itemprop="telephone" class="tel elementPhone">0184 662271</div> 只

0热度

1回答

BeautifulSoup - Python - 从HTML中找到密钥

我一直在使用bs4和Python进行练习，现在我已经陷入困境。我的计划是做一个如果 - 在那里我想要做类似像 If(I find a value inside this html) Do This method Else: Do something else 否则状态，我已经刮了一个HTML，我发现随机它看起来像 - <div class="Talkinghand" d

-1热度

1回答

如何从whoscored

我需要从whoscored.com数据，但是当我输入验证码 import requests from bs4 import BeautifulSoup as soup url = "https://www.whoscored.com/Statistics" page_html = requests.get(url) page_soup = soup(page_html.content, '

1热度

1回答

从维基百科参考部分刮刮目录部分

我正在尝试创建一个刮刮维基百科页面参考部分的URL的程序，但是，我遇到了隔离该标签/类的问题。 ## Import required packages ## from urllib.request import urlopen from urllib.error import HTTPError from bs4 import BeautifulSoup import re selec