1
我一直在试图通过机械化来刮擦国会财务披露reports;表单提交成功,但我找不到任何搜索结果。我的脚本如下:用Python抓取aspx机械化 - 获取搜索结果
br = Browser()
br.addheaders = [('User-agent', 'Mozilla/5.0 (X11; U; Linux i686; en-US; rv:1.9.0.1) Gecko/2008071615 Fedora/3.0.1-1.fc9 Firefox/3.0.1')]
br.open('http://clerk.house.gov/public_disc/financial-search.aspx')
br.select_form(name='aspnetForm')
br.set_all_readonly(False)
br['filing_year'] = ['2008']
response = br.submit(name='search_btn')
html = response.read()
我是新来的刮,并希望对此有任何更正/建议。谢谢!
你还好吗使用'selenium'的替代解决方案? – alecxe
@alecxe当然,如果这是首选的方法 – sirallen