2013-04-02 83 views
4

我想将文件上传到Web服务器。从我读过的,最好的方法是在HTTP POST请求上使用multipart/form-data编码类型。Python - HTTP multipart/form-data POST请求

我的研究似乎表明,没有简单的方法来使用Python标准库来完成此操作。我使用Python 3

(注:看到一个名为requestsPyPI Link)来轻松地完成这个包)

我目前使用这种方法:

import mimetypes, http.client 
boundary = 'wL36Yn8afVp8Ag7AmP8qZ0SA4n1v9T' # Randomly generated 
for fileName in fileList: 
    # Add boundary and header 
    dataList.append('--' + boundary) 
    dataList.append('Content-Disposition: form-data; name={0}; filename={0}'.format(fileName)) 

    fileType = mimetypes.guess_type(fileName)[0] or 'application/octet-stream' 
    dataList.append('Content-Type: {}'.format(fileType)) 
    dataList.append('') 

    with open(fileName) as f: 
     # Bad for large files 
     dataList.append(f.read()) 

dataList.append('--'+boundary+'--') 
dataList.append('') 
contentType = 'multipart/form-data; boundary={}'.format(boundary) 

body = '\r\n'.join(dataList) 
headers = {'Content-type': contentType} 

conn = http.client.HTTPConnection('http://...') 
req = conn.request('POST', '/test/', body, headers) 

print(conn.getresponse().read()) 

本工程以发送文本。

有两个问题:这只是文本,整个文本文件必须作为一个巨大的字符串存储在内存中。

如何上传任何二进制文件?有没有办法做到这一点,而无需将整个文件读入内存?

+1

你应该使用你已经提到的请求包。有很多东西不是由标准库处理的,比如会话管理,认证,检查SSL证书......你不使用请求模块的原因是什么? – Achim

+0

您可以将代码从请求模块中复制出来,然后执行您所需的操作。 – User

+1

这当然是你的决定。但是如果我可以选择打包高质量,经过充分测试的“使命证明”,......图书馆或我自己的自定义代码,我总是会选择第一个。 ;-) – Achim

回答

1

我看了一下这个模块

class HTTPConnection: 
    # ... 
    def send(self, data): # line 820 
     """Send `data' to the server. 
     ``data`` can be a string object, a bytes object, an array object, a 
     file-like object that supports a .read() method, or an iterable object. 
     """ 

数据是完全体。 您可以传递这样一个迭代器:(我没有尝试一下)

def body(): 
    for fileName in fileList: 
    # Add boundary and header 
    yield('--' + boundary) + '\r\n' 
    yield('Content-Disposition: form-data; name={0}; filename= {0}'.format(fileName)) + '\r\n' 

    fileType = mimetypes.guess_type(fileName)[0] or 'application/octet-stream' 
    yield('Content-Type: {}'.format(fileType)) + '\r\n' 
    yield('\r\n') 

    with open(fileName) as f: 
     # Bad for large files 
     yield f.read() 
    yield('--'+boundary+'--') + '\r\n' 
    yield('') + '\r\n' 
+0

这是一个好主意,并在3.2或3.3中进行了一些修改。如果给HTTPConnection.request或HTTPConnection.send一个迭代器,那么也必须指定内容长度头。 但是,我正在使用Python 3.1。也许这是不可行的。 – William

+0

你用python 3.1得到了什么问题? – User

+0

在3.1'body'不能是一个可迭代的。我们实际上已经从3.1移开,所以这回答了我的问题。 – William

2

看看小Doug Hellmann's urllib2,由我翻译成python3。

我用它几乎是这样的:

import urllib.request 
import urllib.parse 
from lib.multipart_sender import MultiPartForm 

myfile = open('path/to/file', 'rb') 
form = MultiPartForm() 
form.add_field('token', apipost[mycgi['domain']]._token) 
form.add_field('domain', mycgi['domain']) 
form.add_file('file', 'logo.jpg', fileHandle=myfile) 
form.make_result() 

url = 'http://myurl' 
req1 = urllib.request.Request(url) 
req1.add_header('Content-type', form.get_content_type()) 
req1.add_header('Content-length', len(form.form_data)) 
req1.add_data(form.form_data) 
fp = urllib.request.urlopen(req1) 
print(fp.read()) # to view status 
+0

谢谢,但想法是使用标准库。 – William

0

您可以使用unirest来拨打电话。示例代码

import unirest 

# consume async post request 
def consumePOSTRequestSync(): 
params = {'test1':'param1','test2':'param2'} 

# we need to pass a dummy variable which is open method 
# actually unirest does not provide variable to shift between 
# application-x-www-form-urlencoded and 
# multipart/form-data 
params['dummy'] = open('dummy.txt', 'r') 
url = 'http://httpbin.org/post' 
headers = {"Accept": "application/json"} 
# call get service with headers and params 
response = unirest.post(url, headers = headers,params = params) 
print "code:"+ str(response.code) 
print "******************" 
print "headers:"+ str(response.headers) 
print "******************" 
print "body:"+ str(response.body) 
print "******************" 
print "raw_body:"+ str(response.raw_body) 

# post sync request multipart/form-data 
consumePOSTRequestSync() 

退房的博客文章了解更多详情http://stackandqueue.com/?p=57