distributed-computing

    0热度

    1回答

    假设我的python服务器有三种不同的响应可用。一位用户同时发送三个HTTP请求。 我怎样才能确保一个请求得到我的三个不同的答案中的一个唯一的答复? 我正在使用python和mysql。 的问题是,即使我店已经在MySQL的回应状态,这是一个有点太晚了由下一个请求进来的时候。

    2热度

    1回答

    我正在集群模式下运行一个很大的工作。但是,我只对两个浮动数字感兴趣,我希望在工作成功时以某种方式阅读。 这里我想做: from pyspark.context import SparkContext if __name__ == "__main__": sc = SparkContext(appName='foo') f = open('foo.txt', 'w')

    1热度

    2回答

    我必须建立一个函数“removePunctuation”这条标点符号和结果通过这项测试任务: # TEST Capitalization and punctuation (4b) testPunctDF = sqlContext.createDataFrame([(" The Elephant's 4 cats. ",)]) testPunctDF.show() Test.assertEqu

    0热度

    2回答

    我有一个自由文本描述,基于此我需要执行分类。例如,描述可以是事件的描述。根据事件的描述,我需要预测与事件相关的风险。例如:“在城里谋杀” - 这种描述是“高”风险的候选人。 我试过逻辑回归,但意识到目前仅支持二进制分类。对于基于自由文本描述的多类分类(只有三种可能的值),最适合的算法是什么? (线性回归或朴素贝叶斯)

    4热度

    2回答

    我复制从公文网站pyspark.ml例如: http://spark.apache.org/docs/latest/api/python/pyspark.ml.html#pyspark.ml.Transformer data = [(Vectors.dense([0.0, 0.0]),), (Vectors.dense([1.0, 1.0]),),(Vectors.dense([9.0, 8.0]

    3热度

    4回答

    我有一组构成分布式系统的全状态服务。每个人都有一个Docker文件,可以构建它并运行其单元测试。我需要检查他们如何以分布式的方式与彼此进行交互。要运行测试,我需要: 能够在不同的节点上同时运行多个Docker文件,这将被视为单个测试运行。 能够在每个Docker文件的命令执行顺序中设置障碍。换句话说,假设所有Docker文件同时运行,我需要确保所有文件在启动阶段Y之前已完成阶段X。 能够停止任何节

    0热度

    1回答

    我想在AWS中拥有2个实例的集群,并且希望使用静态IP查找器。但点燃无法找到群集中的节点并挂起下面的消息。 [18时49分54秒]安全状态[认证=关,TLS/SSL = OFF] 我的例子点燃静态IP取景配置如下所述。 这里我尝试过使用AWS实例的公有IP地址以及AWS实例的私有IP地址,但它没有工作,也找不到集群节点。 我点燃配置静态IP取景低于: <bean class="org.apache

    2热度

    2回答

    我使用以下代码运行应用程序。我不明白为什么只有1个执行者在使用,即使我有3个。当我尝试增加范围时,我的工作失败,导致任务管理器失去执行者。 在总结中,我看到了shuffle写入的值,但shuffle读取值为0(可能导致所有数据都在一个节点上,并且不需要执行任何shuffle读取操作)。 val rdd: RDD[(Int, Int)] = sc.parallelize((1 to 10000000

    0热度

    5回答

    这里的其他情况下的Windows应用程序的一个实例所作的更改是我的情景: 我必须发展有两个主要用户C#.NET WPF应用程序:团队领导(TL )和一名操作技术员(OT)。此应用程序将在同一网络上的多个独立机器上运行。操作技术人员将使用该应用程序查看作业编号列表,并且团队领导将能够根据需要更新作业编号列表。 我的问题是,我不知道如何在Team Lead制作完成后向操作技术员显示这些更改。 在OT和

    2热度

    1回答

    基于Unbalanced factor of KMeans?,我试图计算不平衡因子,但是我失败了。 RDD r2_10的每个元素都是一对,其中密钥是簇,值是一个点的元组。所有这些都是ID。下面我介绍会发生什么: In [1]: r2_10.collect() Out[1]: [(0, ('438728517', '28138008')), (13824, ('4647699097', '65