mapr

    1热度

    1回答

    我是相对较新的火花,目前我正在包装我的头,关于如何(重新)通过将数据从S3导入到日志文件(地板文件)进行分区。 我在S3中有一堆GZip日志文件,格式为{bucket}/{YYYY-MM-DD}/{CustomerId}.log.gz。日志文件的大小从< 1MB到500MB。 导入时我正在一个pyspark脚本执行以下操作: # load, unpack and parse file from S

    0热度

    1回答

    我写了一个应用程序,列出HDFS中的所有文件,然后对它们进行一些处理。这是我的代码的部分,列出HDFS中的所有文件: Configuration configuration = new Configuration(); FileSystem hdfs; hdfs = FileSystem.get(new URI(url), configuration); RemoteIterator<Loc

    0热度

    2回答

    在我的笔记本电脑中安装MapR沙箱后,如何在MapR沙箱上练习示例练习?我在哪里可以找到说明? 谢谢。 Venkat

    0热度

    1回答

    这里我有2个区域服务器,其中我已经用它的UID(JAVA字节数组)创建了2个下面命名的度量。 度量sys.rack.1:[0,1,5] 度量sys.rack.2:[0,1,6] 我需要预裂HBASE“TSDB”表相应地在2个区域服务器之间共享负载。 http://opentsdb.net/docs/build/html/user_guide/writing.html#pre-split-hbase

    1热度

    3回答

    我想在Windows pc上运行mapr沙箱,并使用8gb内存。但是当我试图导入ovf时,它总是说ovf已经损坏,而我已经使用了多个源,在另一台机器上运行的ovf没有运行在我的one.I试图玩配置以及我也试过提取并运行ovf作为vmdk,但不会进行配置设置,因此无法正常工作。现在我已经在vmplayer上试了一下,它得到了安装,并说ovf格式是不适合的,当你再次尝试时,它不会看到ovf文件规范的关

    1热度

    1回答

    我试图在Mapr5上安装Apache Zeppelin(spark 1.5.2 hadoop 2.7.0)。我接着从当前页https://github.com/apache/incubator-zeppelin 当我用下面的命令 指令MVN -Pmapr50 -Pyarn -Pbuild-颇-Pspark-1.5 -Dspark.version = 1.5.2 -Phadoop-2.6 - Dha

    1热度

    1回答

    我在AWS上运行最短路径示例时遇到问题。我下载至S3的giraph罐(即我使用和上载有相同的AMI内部编译),正确地配置在zookeper主机和从机,并且我没有以下步骤: 纳米/ tmp/tiny_graph.txt [0,0,[1,1,3,3]] [1,0,[0,1,2,2,3,1]] [2,0, [1,2,4,4]] [3,0,[0,3,1,1,4,4]] [4,0,[3,4,2,4]] hd

    0热度

    1回答

    是否有任何Oozie动作可用于workflow.xml,以便将oozie生成的日志从oozie作业执行中清除两天?

    0热度

    1回答

    我已经安装了麒麟与MapR分布,而事情似乎工作 罚款达到一个点。我运行了sample.sh脚本,现在我有 “learning_kylin”项目,并且我可以在该多维数据集上运行“构建”,并在完成100%时报告成功。 但是..这样做后,显示屏总是显示我的立方体为0.0 字节,如果我从文档运行示例查询,我得到一个 “超时访问立方体”错误。 我注意到的另一个奇怪的事情是,“构建”对话框是 显示今天的日期的

    0热度

    1回答

    你好我是新来的学习者在mapr,有人可以给我一个jar或pom.xml示例文件的列表,用于开发hbase应用程序,通过我使用沙箱版本5.0.0用于测试和谢谢大家