-1
我是数据分析/大数据分析的n00b。我目前正在学习统计和R.我想知道学习和使用Apache Drill的知识先决条件,以便我可以优化学习计划?学习Apache Drill的知识先决条件是什么?
我是数据分析/大数据分析的n00b。我目前正在学习统计和R.我想知道学习和使用Apache Drill的知识先决条件,以便我可以优化学习计划?学习Apache Drill的知识先决条件是什么?
Drill仍处于alpha状态,文档非常有限。如果您需要稳定性,Cloudera Impala可能是短期内更好的选择。
您需要学习两件事 - 如何将数据导入Drill可以使用的表单以及如何运行查询。后者很简单 - 学习SQL。
前者比较复杂。这些非常有限的例子在Twitter的Parquet数据格式中使用本地文件,因此这将是一个很好的开始。对于更实际的(即分布式)场景,请了解HDFS(Hadoop分布式文件系统)和Zookeeper,HBase或MongoDB。
警告 - 如果您真的想在真正的大数据环境中使用Drill(您不应该这样做,因为它在alpha模式下),您会发现这是一个陡峭的学习曲线,需要大量复杂的信息。打破它一个很好的方法可能是: