我有Hive表格指向JSON文件作为内容,这些表格需要JSON SerDe jar(从here)以查询表格。在我的主持的Hadoop发行版的机器(或VM),我可以简单地在蜂巢或直线CLI执行:在SparkSQL Thrift服务器上添加Hive SerDe jar
ADD JAR /<local-path>/json-serde-1.0.jar;
,然后我可以在我的蜂巢表执行SELECT查询。
我需要将这些Hive表用作我的Tableau(安装在Windows,我的主机中)的数据源,因此我启动了Spark中的Thrift服务器。
对于不包含JSON(并且不需要SerDe)的Hive表,Tableau可以轻松地连接和读取表。
当涉及到包含JSON数据的蜂巢表,但是,它看起来像的Tableau找不到蜂巢JSON SERDE罐子,我得到以下错误:
'java.lang.RuntimeException: MetaException(message:java.lang.ClassNotFoundException Class org.openx.data.jsonserde.JsonSerDe not found)'.
如何添加蜂房JSON SerDe jar,以便Tableau可以读取Hive JSON表?
感谢您的帮助。我正在使用ODBC。特别是Databricks的Simba Spark ODBC驱动程序。 ODBC的过程是否相同? – menorah84
是的,它应该是相同的程序。 –