bs4

    0热度

    3回答

    找到所有的<ul>后,我想进一步提取文字和href的。我对这一点HTML所特别关注的问题是,我需要大部分,但不是页面中的所有<li>项目。我看到当我find_all(),我返回一个列表对象,它不允许我进一步导航它作为汤对象。 例如,在下面的代码片段,最终创造{'cityName': 'href',}一本字典,我曾尝试: city_list = soup.find_all('ul', {'class

    0热度

    1回答

    我刚刚开始使用Python进行编码,我的朋友问我应用程序在网络上找到特定的数据,很好地表示它。 我已经找到漂亮的网页,其中包含数据,我可以找到基本信息,但接下来的挑战是要深入。 虽然在Python 3.4使用BS4我已经达到了示范代码: <tr class=" " somethingc1="" somethingc2="" somethingc3="" data-something="1" som

    1热度

    3回答

    我用Chromedriver下载该文件,然后我想解析"chrome://downloads"获取下载状态,但是我无法获取字符串,请参考下面的代码和结果。我也在Chrome中检查了HTML。我可以看到<span id="name">Noto-hinted (1).zip</span>,但是如果我使用view page source,我找不到字符串"Noto-hinted (1).zip"。这是<sp

    0热度

    1回答

    假设我们有一些代码: <tr class=" " somethingc1="" somethingc2="" somethingc3="" data-something="1" something="1something4" something_id="6something7"> <td class="text-center td_something"> <div> <span doo="t

    0热度

    1回答

    我有问题。只与PYTHON2。 r = self.session.get('http://..................') print "CREATE BS" print datetime.now() soup = BeautifulSoup(r.content, 'html.parser') print "CREATE BS END" print datetime.now()

    0热度

    2回答

    我的计划是通过使用Bs4来获取_AntiCsrfToken。 我有这个HTML在我的HTML来自 和我自己编写的代码是 token = soup.find('input', {'name':'_AntiCsrfToken'})['value']) print(token) ,但它给了我一个错误说 Traceback (most recent call last): File "C:

    -2热度

    2回答

    我的目标是编写一个可从网站检索特定数据的python脚本。 具体我要提取这些数据: <span class="street-address" itemprop="streetAddress">191, Corso Peschiera</span> 和 <div itemprop="telephone" class="tel elementPhone">0184 662271</div> 只

    0热度

    1回答

    我一直在使用bs4和Python进行练习,现在我已经陷入困境。 我的计划是做一个如果 - 在那里我想要做类似像 If(I find a value inside this html) Do This method Else: Do something else 否则状态,我已经刮了一个HTML,我发现随机它看起来像 - <div class="Talkinghand" d

    -1热度

    1回答

    我需要从whoscored.com数据,但是当我输入验证码 import requests from bs4 import BeautifulSoup as soup url = "https://www.whoscored.com/Statistics" page_html = requests.get(url) page_soup = soup(page_html.content, '

    1热度

    1回答

    我正在尝试创建一个刮刮维基百科页面参考部分的URL的程序,但是,我遇到了隔离该标签/类的问题。 ## Import required packages ## from urllib.request import urlopen from urllib.error import HTTPError from bs4 import BeautifulSoup import re selec