我有一个约200,000个实体的列表,我需要为这些实体中的每一个查询特定的RESTful API,最后以所有以JSON格式保存的200,000个实体txt文件。 这样做的天真的方式是通过200,000个实体的列表并逐个查询,将返回的JSON添加到列表中,并在完成时将所有内容都添加到文本文件中。喜欢的东西:向文本文件写入大量查询
from apiWrapper import api
from entities import listEntities #list of the 200,000 entities
a=api()
fullEntityList=[]
for entity in listEntities:
fullEntityList.append(a.getFullEntity(entity))
with open("fullEntities.txt","w") as f:
simplejson.dump(fullEntityList,f)
显然,这是不可靠的,200000个查询到API将需要大约10个小时左右,所以我想它得到其写入文件之前,事情会导致错误。 我想正确的方法是把它写成块,但不知道如何实现它。有任何想法吗? 另外,我不能用数据库做到这一点。
你可以在工作队列上稍微扩展一点吗?使用哪些模块?链接到文档? – leonsas
该链接已经在那里......并且该模块被称为“队列” – wim