我已经看到了谷歌提取的结果,但它不适用于此。我想简单地进入代码并更改参数,并在运行时执行搜索并删除职位,地点和日期。这是我迄今为止所拥有的。任何帮助将是伟大的,并提前感谢。Python提取来自monster.com的搜索结果
我会脚本在给定的参数(工程师软件CA)上执行monster.com上的搜索,并刮去结果。
#! /usr/bin/python
import re
import requests
from urllib import urlopen
from BeautifulSoup import BeautifulSoup
parameters = ["Software","Engineer","CA"]
base_url = "http://careers.boozallen.com/search?q="
search_string = "+".join(parameters)
final_url = base_url + search_string
a = requests.get(final_url)
raw_string = a.text.strip()
soup = BeautifulSoup(raw_string)
job_urls = soup.findAll(name = 'a', attrs = { 'class': 'jobTitle fnt11_js' })
for job_url in job_urls:
print job_url.text
print
raw_input("Press enter to close: ")
我知道这个,下面,作为一个标准刮。
handle = urlopen("http://jobsearch.monster.com/search/Engineer_5?q=Software&where=AZ&rad=20&sort=rv.di.dt")
responce = handle.read()
soup = BeautifulSoup(responce)
job_urls = soup.findAll(name = 'a', attrs = { 'class': 'jobTitle fnt11_js' })
for job_url in job_urls:
print job_url.text
print
也许你需要把 “&”,而不是 “+” 在您的search_string的顶部? – 2012-02-02 16:39:24
尝试过,仍然没有结果。谢谢。为什么这被标记下来?即时通讯只是要求我的项目帮助。我认为它会工作,并需要帮助 – Garrett 2012-02-02 16:41:57
你到底在找什么?如果您对某些无法正常工作的问题有任何疑问,可以提出问题,但我们无法为您解决问题。 – silent1mezzo 2012-02-02 16:33:23