2016-06-09 35 views
2

我通过从源代码构建安装tensorflow 0.8。 我使用具有4个GPU的AWS EC2 g2.8xlarge实例。 我试图在这里运行tensorflow分布MNIST测试,代码: https://github.com/tensorflow/tensorflow/blob/master/tensorflow/tools/dist_test/scripts/dist_mnist_test.sh无法运行tensorflow分布式MNIST测试

我的脚本:

bash dist_mnist_test.sh "grpc://localhost:2223 grpc://localhost:2224" 

,我得到这个消息:

E0609 14:53:07.430440599 62872 tcp_client_posix.c:173]  failed to connect to 'ipv4:127.0.0.1:2223': socket error: connection refused 
E0609 14:53:07.445297934 62873 tcp_client_posix.c:173]  failed to connect to 'ipv4:127.0.0.1:2224': socket error: connection refused 

任何一个知道这里有什么问题?非常感谢!

回答

2

此脚本不能独立运行。特别是,它期望您创建了一个TensorFlow集群,其中运行脚本的之前的每个地址都运行create_tf_cluster.sh脚本可以使用Kubernetes设置此类群集。 dist_test.sh脚本端到端运行这些脚本。

请参阅my answer您的其他问题,其中有一个建议脚本在分布式TensorFlow上运行MNIST。

+0

非常感谢您的回答! – xyd