昨天我开始了Google-Dataflow的工作,通常运行时间大约10-30分钟。它今天早上还在运行。当查看堆栈驱动程序时,我看到一个作业日志的重复循环: I Refused to split GroupingShuffleReader <at position ShufflePosition(base64:AAAABOA3nVgAAQ) of shuffle range [ShufflePosi
我在存储CSV文件,我想读它,并将其写入BigQuery资料表。这是我的CSV文件,其中第一行是标题: GroupName,Groupcode,GroupOwner,GroupCategoryID
System Administrators,sysadmin,13456,100
Independence High Teachers,HS Teachers,,101
John Glenn Mi