我刚开始使用luigi
库。我经常抓取一个网站并将任何新记录插入到Postgres数据库中。由于我试图重写部分脚本以使用luigi
,因此我不清楚"marker table"应该如何使用。使用luigi更新Postgres表
工作流程:
- 抽取数据
- 查询数据库,以检查是否有新的数据从旧的数据不同。
- 如果是这样,则将新数据存储在同一个表中。
但是,使用luigi的postgres.CopyToTable
,如果该表已存在,则不会插入新数据。我想我应该使用table_updates
表中的inserted
列来确定应该插入哪些新数据,但是我不清楚该过程是什么样的,我在网上找不到任何明确的示例。