2015-01-11 40 views
0

我有一个SAS应用程序,用于从Oracle提取数据并使用Base SAS和SAS宏生成报告。现在问题是我的数据库日益庞大,从Oracle获取数据需要更多时间,因此我的工作运行缓慢。构建用于Hadoop框架上的报告和分析的应用程序

所以我希望我的应用程序能够构建在Hadoop上进行报告和分析。有人可以建议我任何方法,我需要使用什么工具。

回答

0

简短的回答是:这取决于。

卸载从Oracle数据我会建议你使用Sqoop(http://sqoop.apache.org/),它是专为这个特定的使用情况,甚至可以做增量负载,可以卸载的数据

当数据创建蜂巢表卸载后,您可以使用Impala构建您所需的报告。 Impala本身可以与Hive表一起工作,所以唱歌非常简单。当然,您必须将您的SAS代码重写为一组可以在Impala上运行的SQL语句。

接下来,如果你需要的可视化工具,在它上面运行,你可以尝试这样的Tableau或任何其他工具,它能够利用ODBC/JDBC来连接黑斑羚

最后,我认为Hadoop的+ Sqoop + Impala将覆盖您的需求。但我建议你也看看MPP数据库,因为使用SAS意味着你有相当结构化的数据,MPP数据库将更适合这种情况。

+0

感谢您的建议。在这里有替代SAS的替代品吗,我的意思是,我可以用R或其他工具替代SAS来生成Excel报告。还可以使用Hive/Impala生成excel报告。 – Paul

+0

不,Hive和Impala将能够生成将由您的Excel应用程序读取的CSV文件。如果它还不够,你可以用Java/Python/R /等编写一个简单的应用程序。这将创建一个xlsx文件为您提供csv,这非常简单。但无论哪种方式,我建议您切换到一些商务智能解决方案,他们在报告中更好,除了生成Excel报告之外,还有更多功能 – 0x0FFF

相关问题