mapr

    0热度

    1回答

    我正在尝试访问配置单元CLI。但是,它无法从以下AccessControl问题开始。 足够强烈,我能够查询来自Hue的配置单元数据而没有AccessControl问题。但是,配置单元CLI不起作用。 我在MapR群集上。 任何帮助,非常感谢。 [<user_name>@<edge_node> ~]$ hive SLF4J: Class path contains multiple SLF4J b

    0热度

    1回答

    我正在./bin/pyspark在打开pyspark外壳,但我得到以下错误:搜索 `py4j.protocol.PY4JNetworkError: An error occurred while trying to connect to the Java Server` 约了很多。找不到解决方案。 我应该如何解决这个问题? 感谢,

    1热度

    1回答

    我正尝试从MapR DB中将数据提取到数据框中,然后使用钻取工具在pyspark外壳中进行连接。 这是我做我的pyspark壳: `dataframe_mysql = sqlContext.read.format("jdbc").option("url", "jdbc:drill:zk=localhost:5181/drill/demo_mapr_com-drillbits;schema=dfs;

    0热度

    2回答

    我试图导入使用SQOOP从SQL Server数据。但我发现一个奇怪的情况 Sqoop列表的故事才发现表DBO。****,除此之外,Sqoop不能列出 但SQL Server上,我可以看到其他表中列出 List of Tables from the SQOOP command List of Tables from SQL Server

    0热度

    1回答

    我有一个5节点cluster.I使用pyspark将一个100k csv文件加载到数据帧并执行一些etl操作并将输出写入parquet文件。 当我加载数据框时,如何将数据集统一划分到每个执行器处理20k记录的所有执行者OS中。

    0热度

    1回答

    我正在寻找一个解决方案,使用maprstream与弹簧整合。我可以创建流和主题,也可以使用流:主题组合来消费/发布消息。通过参考link来使用卡夫卡客户端: 但是使用Spring集成努力消费/发布消息,并且看不到任何解释相同的示例程序。有人可以帮助我吗?

    0热度

    1回答

    很多天这下面maprclient工具正在我的Windows机器上 突然接到UnsatisfiedLinkError的 一个问题可能是什么固定在跌破发行 C:\选项\ MAPR-客户5.2.2.4 \ BIN> maprlogin.bat密码 - 用户pimbdu_t Picked up JAVA_TOOL_OPTIONS: -Djava.vendor="Sun Microsystems Inc."

    1热度

    1回答

    我刚开始学习Hadoop,并且有各种格式的输入类型。我有几个程序要研究,我的主要问题是如何确定输入格式是TextInputFormat还是KeyValueTextInputFormat或其他。 你的帮助是非常赞赏

    0热度

    2回答

    我不知道它是否是mapr-db json的常见问题。 我使用一个Streamsets目的地,这是一个Mapr-DB json表来推送包含10列的记录。我确定第一列成为行键。当我去 mapr dbshell find /tmp/my_table 我只看到JSON行密钥而不是其他列 {"_id":"mykey1"} {"_id":"mykey2"} {"_id":"mykey3"} {"_

    0热度

    1回答

    准入控制嵌入在每个impalad守护程序中,并通过statestore服务进行通信。 impalad后台程序确定查询是立即运行还是查询排队。 但是,如果突然的请求流导致更多查询的运行时间超出预期,则整个Impala内存限制和群集级别的Linux cgroups机制将成为防止内存过度分配的硬限制。当查询达到这些限制时,Impala取消查询。 这是否意味着Impala资源限制在个别Impala守护程序