让说,我有交易数据和访问数据火花流数据的衔接VS历史数据
visit
| userId | Visit source | Timestamp |
| A | google ads | 1 |
| A | facebook ads | 2 |
transaction
| userId | total price | timestamp |
| A | 100 | 248384 |
| B | 200 | 43298739 |
我想加入的交易数据和访问数据,做销售的归属。我希望在事务发生时(流式传输)实时进行。
在spark中使用连接函数可以在一个数据和非常大的历史数据之间进行连接吗? 历史数据是访问,因为访问可以随时(例如访问是在交易发生前一年)
您的交易数据多久更新一次? –
交易数据将被实时处理。如果你的意思是记录,它永远不会更新(最终交易) – rendybjunior
对不起。 Meant更新为添加记录时未更新的记录。 –