3
我有一个数据库,超过200万条记录。每个记录都包含一个图像的URL,我需要下载并存储到AWS S3。从MongoDB获取大数据的最佳方法
与其一次下载一个,然后一次上传一个,有没有更好的方法来处理这个问题?
我使用Python,因此pymongo目前。
for item in itemsCursor:
download_image(item['imageurl')
def download_image(item):
name = 'example.jpg'
response = requests.get(url)
img = Image.open(StringIO(response.content))
img.save('temp.jpg', "JPEG")
s3.meta.client.upload_file('temp.jpg', 'bucket', name)
grequests https://pypi.python.org/pypi/grequests –