2016-08-12 59 views

回答

1

创建一个maven项目并添加以下依赖关系(适用于Spark latest 2.0.0)。您可以从eclipse中运行简单的程序(如JavaALSExample.java)开始。

https://github.com/apache/spark/blob/master/examples/src/main/java/org/apache/spark/examples/ml/JavaALSExample.java

有可在火花的github仓库,你可以参考更多的Java样本。希望这可以帮助。

<dependency> 
     <groupId>org.apache.spark</groupId> 
     <artifactId>spark-core_2.11</artifactId> 
     <version>2.0.0</version> 
    </dependency> 
    <dependency> 
     <groupId>org.apache.spark</groupId> 
     <artifactId>spark-mllib_2.11</artifactId> 
     <version>2.0.0</version> 
    </dependency> 
    <dependency> 
     <groupId>org.apache.spark</groupId> 
     <artifactId>spark-sql_2.11</artifactId> 
     <version>2.0.0</version> 
</dependency> 
+0

谢谢你的回答。你能告诉我,我必须解压火花库,是否足以将上面的行添加到pom.xml中 –

+0

当您将添加上述依赖项时,运行spark mllib示例所需的所有jar文件将下载到您的本地Maven仓库。只有当你不使用Maven项目时,你将不得不手动下载并在eclipse构建路径中包含必需的jar文件。推荐使用maven。 – abaghel

+0

非常感谢你。我使用了你的建议并创建了一个maven项目。我想我差不多都有。我只是得到这个*一个主URL必须在你的配置*异常中设置,我不知道要设置它。 –