写在excel中递归数据我有一个叫做网页列表:html
从Python列表
一位html(i)
元素提取我的电子邮件地址。我把这些电子邮件地址列表:email
我要生成一个Excel文件这样的:
为了写上一个Excel文件,所有我发现电子邮件地址。
由于每个html(i)
页面可能包含不同数量的电子邮件地址,因此我想编写一个代码来自动考虑每页找到的不同电子邮件数量。
我的想法是与此类似:
#set the standard url to generate the full list of urls to be analyzed
url = ["url1","url2", "url3", "url-n"]
#get all the url pages' html codes
for i in range (0,len(url):
html=[urllib.urlopen(url[i]).read() for i in range(0,len(url)) ]
#find all the emails in each html page.
for i in range (0,len(url):
emails = re.findall(r'[\w\.-][email protected][\w\.-]+', html[i])
#create an excel file
wb = Workbook()
#Set the excel file.
for i in range (0,len(html)):
for j in range (0, len(emails)):
sheet1.write(i, j, emails[j])
wb.save('emails contact2.xls')
当然是行不通的。它只写入list html最后一个元素中包含的电子邮件地址。有什么建议么?
我不确定我明白你描述的'emails'列表是什么。它是某种嵌套列表吗?如果没有,你可能需要在你的外部循环中生成它(而不是提前)。 – Blckknght
1个列表'emails'没有任何意义..你如何分开每个'html'的邮件?你有每个'html'的列表吗?也许你想使用'dict'? –
我修改了代码,粘贴了我正在处理的内容。我希望你们更清楚。感谢您的帮助 –