编辑 - 我使用的是Windows 10提高数据库查询速度与Python
是否有快速的替代pd._read_sql_query的MS SQL数据库?
我在使用熊猫来读取数据并在数据上添加一些列和计算。我已经删除了大部分的修改,现在我基本上只是阅读(每天一百到二百万行;我的查询是读取前一天的所有数据)数据并将其保存到本地数据库(Postgres的)。
我连接的服务器遍布世界各地,除了查询数据外,我没有任何特权。如果可能,我希望解决方案保留在Python中。我想加快它,并消除任何开销。另外,您可以看到我正在将文件临时写入磁盘,然后将其打开到STDIN副本。有没有办法跳过文件创建?它有时超过500MB,这似乎是一种浪费。
engine = create_engine(engine_name)
query = 'SELECT * FROM {} WHERE row_date = %s;'
df = pd.read_sql_query(query.format(table_name), engine, params={query_date})
df.to_csv('../raw/temp_table.csv', index=False)
df= open('../raw/temp_table.csv')
process_file(conn=pg_engine, table_name=table_name, file_object=df)
什么是你的本地OS(你的PostgreSQL正在运行)? – MaxU
Windows 10,对不起。添加到OP – trench