2010-01-22 87 views
25

httplib(现在http.client)和朋友都有conn.getresponse()和一个HTTPResponse类,但conn.getrequest()和一个HTTPRequest类的服务器端操作似乎缺乏。Python是否有解析HTTP请求和响应的模块?

我知道BaseHTTPServer和BaseHTTPRequestHandler可以执行此功能,但他们不公开这些方法以供在模块之外使用。

基本上我想要的是BaseHTTPRequestHandler#parse_request是一个返回HTTPRequest对象而不是填充成员变量的静态方法。

回答

2

对于服务器端处理,你想看看像wsgiref

WSGI标准将请求解析为包含所有相关标头和元素的简单字典。

2

您可能会发现WebOb有用。像Pylons,Turbogears和Bfg这样的框架将它用作它们api的一部分。它确实在假设您正在WSGI下工作。

43

杰夫,使解析我创建基础HTTP请求处理的小九线的子类:

from BaseHTTPServer import BaseHTTPRequestHandler 
from StringIO import StringIO 

class HTTPRequest(BaseHTTPRequestHandler): 
    def __init__(self, request_text): 
     self.rfile = StringIO(request_text) 
     self.raw_requestline = self.rfile.readline() 
     self.error_code = self.error_message = None 
     self.parse_request() 

    def send_error(self, code, message): 
     self.error_code = code 
     self.error_message = message 

现在,您可以采取字符串内的HTTP请求的文本,并通过实例解析它这个类:

# Simply instantiate this class with the request text 

request = HTTPRequest(request_text) 

print request.error_code  # None (check this first) 
print request.command   # "GET" 
print request.path    # "/who/ken/trust.html" 
print request.request_version # "HTTP/1.1" 
print len(request.headers)  # 3 
print request.headers.keys() # ['accept-charset', 'host', 'accept'] 
print request.headers['host'] # "cm.bell-labs.com" 

# Parsing can result in an error code and message 

request = HTTPRequest('GET\r\nHeader: Value\r\n\r\n') 

print request.error_code  # 400 
print request.error_message # "Bad request syntax ('GET')" 
+0

这与http://stackoverflow.com/questions/5975952/how-to-extract-http-message-body-in-basehttprequesthandler-do-post结合是非常方便的解析自己的HTTPRequest 。 – Joe 2014-08-17 15:16:01