0
在.py文件中,我有一个存储url列表的变量。如何正确构建循环以从每个url检索代码,以便我可以从每个页面提取特定的数据项目?如何查看网址列表以检索页面数据 - Python
这是我到目前为止已经试过:
import requests
import re
from bs4 import BeautifulSoup
import csv
#Read csv
csvfile = open("gymsfinal.csv")
csvfilelist = csvfile.read()
print csvfilelist
#Get data from each url
def get_page_data():
for page_data in csvfilelist.splitlines():
r = requests.get(page_data.strip())
soup = BeautifulSoup(r.text, 'html.parser')
return soup
pages = get_page_data()
print pages
添加的代码我目前得到了 – McLeodx
您不调用'get_page_data'。你也循环遍历'csvfilelist'这是一个字符串(所以你正在循环每个字符),你可以把它改成'csvfilelist.splitlines()'来遍历每一行。 – solarc
谢谢,这工作。现在它只是从第一个网址提取代码。我需要做什么来重复所有的网址? – McLeodx