我是Hadoop的新手,因此如果我的问题太不成熟,我很抱歉。我们如何处理来自Hadoop DB的处理数据(输出)?
我知道Hadoop用于分析大数据集上的数据。 最后,我们如何处理分析的数据,我们创建报告和演示文稿?
例如对于 如果在SSRS报告的情况下,报告将基于使用SQL查询从RDBMS中提取的结果数据生成。
但是,基于Hadoop的数据库如何工作?从客户端请求特定报告,这需要Hadoop数据库中的数据点,然后流程如何? 我相信客户端不会直接在hadoop上运行Job来为其报告生成提取所需的数据,因为hadoop作业需要更多时间来处理。
我的问题是,通过运行处理的数据(结果集)是否被存储在任何中间体DB上的hadoop DB MR作业,像RDBMS? ,以便客户端可以提取生成报告所需的数据?
请在此澄清我。