2015-05-31 51 views
1

我有包含大量记录(39885593)的imapla表,并且需要通过Tableau使用impala表创建仪表板。使用Impala作为数据源创建Tableau仪表板

我试图acheive以多种方式这一要求,如下

1)提取的帕拉从表中的数据在的Tableau提取物,然后创建所述仪表板。 2)最初使用数据提取,然后将连接切换到实时连接 3)实时连接

方法1:可以使用数据提取创建仪表板。给出好的表现。这个应用程序的问题是数据是每天都在增长的事务数据,所以如果我通过这种方法进行数据提取,将会在Tableau Server中占用更多空间。

方法2:使用此方法可以高效地设计仪表板,但是当我从数据提取切换到实时并将发布仪表板时,发布仪表板时也需要大量时间来发布仪表板,当我通过Tableau服务器查看仪表板时在浏览器中打开仪表盘需要更多时间。

方法3:实时连接在设计和发布仪表板时性能非常低。

如果有人遇到过这种requiremnt请给我提供相同的建议。

感谢

回答

0

你说的实时连接使性能下降,也许你可以尝试把成的Tableau之前自定义SQL查询聚合在因帕拉的数据?

0

除非你需要最新的实时访问数以百万计的交易记录,我推荐用提取物(可能的多提取物)工作

但是你提取物的尺寸减小到用以支持可视化所需的最低。您可以添加数据源过滤器,隐藏未使用的字段,累积数据以在摘录中聚合到视图所需的详细程度。

对于大型数据集,不要尝试制作只是整个数据集副本的单个数据集,制作多个小数据集,每个数据集只支持一个(或一组小)相关所需的信息观点。想象一个像物化视图的提取物。

如果视图只显示100标志,然后力争有100只在它使用的提取记录,即使这些都是100点的记录总结的基础数据源从1亿信息。

然后你就可以有更大的提取物,甚至活源供人下钻成(过滤)详细视图时使用,而且仪表板的第一视图可以快速启动。

这种方式的交互性,刷新和发布可以很快。

对于这种方法来工作,你可能需要习惯了在工作簿中的多个数据源,即使是基于相同的数据库上。还可以使用筛选器操作,参数和计算字段来筛选和链接数据源。

+0

感谢亚历克斯的建议,它确实帮助我进入下一步... –

相关问题