我有2个rdd,其中一个作为词典列表,另一个作为元组列表,如下所示 -如何使用pyspark在字典列表中添加元组值的列表?
rdd1 = [{'id1',['string','string',count]},{'id2 ',['string','string',count]},{'id3',['string','string',count]}] rdd2 = [(id1,count),(id2,count),( id3,count)]
现在我想添加从rdd2到rdd1的计数,如果rdd2的id与rdd1匹配。 你能帮我实现吗?
预先感谢您。
谢谢哈科。你很棒。从你的代码中学到了很多东西。 –