我是网站从汽车网站上抓取数据以获取价格。现在,我正在通过创建两个单独的列表来解决这个问题。定价数据和另一款车型。最终,我想要把每个列表加入到一起来创建一个csv。 我正在采取的解决这个问题的具体步骤如下:1)建立与网站的连接,2)创建两个空列表来写入数据,3)从页面的每个部分选择正确的数据,4 )迭代数据并将数据存储到列表中(这是我遇到问题的地方),以及5)最终我将把这两个列表作为一个csv加入到一起。在Python中结合两个单独的WebScraped列表
from bs4 import BeautifulSoup
import urllib2
#1) establishing a connection to the website
wiki = "http://www.morong.com/used-inventory/index.htm?start=16&"
req = urllib2.Request(wiki)
page = urllib2.urlopen(req)
soup = BeautifulSoup(page, 'lxml')
#2) creating two empty lists to write the data into
valueHolder = []
nameHolder = []
#3) selecting the correct data from each part of the page
value = soup.findAll("span", { "class" : "value" })
name = soup.findAll("a", {"class" : "url"})
#4) iterates over rows and turns each row into a text field
for row in value:
valueholder = row.text
for row in name:
nameHolder = row.text
print(valueholder)
print(nameHolder)
当我打印valueHolder和nameHolder时,我只返回每个for-loop的最后一行。我怎样才能打印所有的值?
我正在回答这个问题。但我认为这是OP所需要的 – wander95
哇,太棒了!这工作。 –