2017-05-06 67 views
0

我对Python比较陌生。我正在尝试从网站上抓取网址,并将它们写入csv文件。我已经能够打印网址,但是,我一直无法写入或存储在任何地方。任何帮助?Python:将链接刮到CSV

import requests 
import csv 
from bs4 import BeautifulSoup 
url = 'http://comm.eval.org/communities/resources/libraryview?LibraryKey=1eff4fd7-afa0-42e1-b275-f65881b7489b' 
r=requests.get(url) 
html_url = r.text 
soup = BeautifulSoup(html_url, "html.parser") 
with open('output.csv', 'wb') as f: 
    bsoup_writer = csv.writer(f) 
    for link in soup.find_all('a'): 
     bsoup_writer.writerow([link.get('href'), link.get('class'), link, get('id')]) 
+0

@YashTD我编辑的以上代码反映您的建议,但是我收到错误:Traceback(最近调用最后一次):文件“”,第4行,在 NameError:名称'get'未定义您有任何想法吗?我也必须创建输出文件,还是代码创建它? –

回答

0

这应该做你要找的内容:

with open('output.csv', 'wb') as f: 
    bsoup_writer = csv.writer(f) 
    for link in soup.find_all('a'): 
     bsoup_writer.writerow([link.get('href'), link.get('class'), link.get('id')]) 

一定要包括你的脚本的顶部以下CSV导入:

import csv 
+1

你可以用'csv.writer'来改善这一点 –