我正在尝试搜索网页(http://www.phillyhistory.org/historicstreets/)。我认为相关的源html是这样的:将值输入到搜索栏并从网页下载输出
<input name="txtStreetName" type="text" id="txtStreetName">
你可以在网站上看到源html的其余部分。我想进入那个文本框并输入一个街道名称并下载一个输出(即在页面的搜索框中输入'Jefferson'并查看杰弗逊的历史街道名称)。我曾尝试使用requests.post,并试图在URL中尝试输入?get = Jefferson来测试如果没有运气的话。任何人有任何想法如何获得此页?谢谢,
卡梅伦说我现在尝试(有些进口未使用的,因为我打算解析等)
代码:
import requests
from bs4 import BeautifulSoup
import csv
from string import ascii_lowercase
import codecs
import os.path
import time
arrayofstreets = []
arrayofstreets = ['Jefferson']
for each in arrayofstreets:
url = 'http://www.phillyhistory.org/historicstreets/default.aspx'
payload = {'txtStreetName': each}
r = requests.post(url, data=payload).content
outfile = "raw/" + each + ".html"
with open(outfile, "w") as code:
code.write(r)
time.sleep(2)
这没有工作,只给了我下载的默认网页(即杰弗森在搜索栏中没有输入和检索。
嗨Dziugas,这正是我试过的。我没有得到正确的输出。我在这个问题上编辑了我的回答 – www3