我一直保存文件为.csv一年多,并将这些文件连接到Tableau Desktop,以便一些最终用户(使用Tableau Reader查看数据)。使用postgres替换csv文件(大熊猫来加载数据)
我想我决定迁移到postgreSQL,我将使用熊猫库to_sql来填补它。
- 我得到的每一天9个不同的文件,我处理他们每个人(我现在把它们合并成.csv.bz2格式月刊文件),通过添加列,计算,置换信息等
- 我创建两个使用pd.concat和pd.merge的大量csv文件,其中包含Tableau连接到的 已处理文件。这些文件是从字面上覆盖在添加新的数据每天这是费时
是否还好还是做我的文件连接和串联与大熊猫和输出数据导出到Postgres的?这将是我第一次使用真正的数据库,与学习SQL语法和创建视图或表格相比,我更喜欢熊猫。我只是想避免一遍又一遍地覆盖相同的csv文件(以及其他一些我遇到的csv问题)。
每个问题有1个问题,目前这个问题过于宽泛 – EdChum
将其缩小到我的主要问题和我最犹豫的事情上(因为当我阅读数据库时,我看到了很多关于规范化表格以及我和我最初的实现肯定不会那么干净......我基本上将它用作一个大的平面文件来存储数据并将Tableau连接到) – trench