我想通过Google Dataflow将数据加载到Google CloudSQL实例中。 我认为没有内置的Sink for CloudSQL,我决定使用org.apache.beam.sdk.io.jdbc.JdbcIO。 但是,到CloudSQL的吞吐量非常低(约6条记录/秒)。在Google Dataflow上使用JdbcIO的吞吐量非常低
我怀疑CloudSQL的规格太差,但升级后并没有改进。
在日志数据流中,有很多是记录如下:
Proposing dynamic split of work unit my-project;2017-06-27_02_58_19-14077185378147382467;6703504927792172410 at
{"fractionConsumed":0.9669782519340515}
Rejecting split request because custom reader returned null residual source.
发生了什么事?我该如何提高性能?