这些都是在蟒蛇履带的定义:如何代理添加到BeautifulSoup履带
from __future__ import with_statement
from eventlet.green import urllib2
import eventlet
import re
import urlparse
from bs4 import BeautifulSoup, SoupStrainer
import sqlite3
import datetime
如何我添加了一个旋转的代理(每线程开一个代理),以递归cralwer上BeautifulSoup工作?
我知道,如果我是用机械化的浏览器中添加的代理:
br = Browser()
br.set_proxies({'http':'http://username:[email protected]:port',
'https':'https://username:[email protected]:port'})
,但我想知道具体是什么样的解决方案将BeautifulSoup需要。
非常感谢您的帮助!