1
如何使用Dataflow Java SDK处理节点间通信。意思呢,提交给Dataflow流水线的作业的所有者是否对集群维护和调度具有良好的控制权?节点间通信
似乎是这样的自动管理的用户,因为Dataflow使用容器虚拟机注册Kubernetes API服务器。如果需要影响集群调度的能力,我看到两种可能性 - a)访问原始套接字(如果可用,如何?)或b)为Spark中的节点间通信(如“Akka”)注入代码。为此,是否会在Transforms或PCollections中开发用户定义的功能,或者根据需要开发用户定义的功能?
即时通讯专家,但AFAIK节点间通讯是不可能的,并在文档中提到。看看谷歌dataproc。 –