我想弄清楚如何测试对Cassandra数据库的Spark SQL查询 - 就像在SQL Server Management Studio中那样。目前我必须打开Spark控制台并输入Scala命令,这些命令非常繁琐且容易出错。如何在没有Scala的情况下测试Spark SQL查询
喜欢的东西:
scala > var query = csc.sql("select * from users");
scala > query.collect().foreach(println)
特别是带有长查询,这可能是一个真正的痛苦。
这似乎是一个非常低效的方法来测试您的查询是否正确以及您将返回哪些数据。另一个问题是当您的查询错误时,您会收到一英里长的错误消息,并且您必须向上滚动控制台才能找到它。如何在不使用控制台或编写自己的应用程序的情况下测试我的Spark查询?
也许是因为我使用DataStax企业,但没有火花SQL我的系统上,我可以看到。 Spark预装了,但它可能不是完整版本? – KingOfHypocrites
@KingOfHypocrites,恐怕是这样,https://github.com/apache/spark/tree/master/bin,你可以在那里看到'spark-sql',在apache spark –
从今天下降的DSE 4.7开始, thirftserver通过'dse start-spark-sql-thriftserver'支持 – phact