Greenplum表示它具有并行数据加载。我对它是如何工作有疑问。请给我解释一下。我知道记录是并行读取的,但我无法理解并行写入是如何完成的。并行写入是在同一个数据库上完成还是在不同的数据库(分段)上完成?请做解释。谢谢在Greenplum中加载并行数据
-1
A
回答
1
并行写入是在不同的段上完成的,数据由一个或多个在ETL服务器上运行的gpfdist实例提供。我怀疑是神奇的一个重要组成部分是distributed by
扩展,它用于分散跨段服务器的数据库的行。
0
借助gpfdist或gphdfs可以在段级别完成并发读取/写入操作。例如,如果要将数据卸载到磁盘上的文件,则可以使用连接到多个gpfdist位置的可写外部表,并且每个数据段将数据写入这些目标是并行的。
0
约翰是对的。
gpfdist的每个实例默认都会处理4个并发连接。 加载时,每个带有连接的段将根据表的分布散列读取它们的“块”数据并进行处理。
参见:https://blog.2ndquadrant.com/parallel_etl_with_greenplum/
相关问题
- 1. Greenplum加载程序不会将数据写入管道文件
- 2. greenplum中的增量负载
- 3. 在窗体中加载数据并在数据库中更新行
- 4. 使用Beatbox从greenplum获取数据并加载到salesforce中。 AttributeError:'小数'对象没有'替换'属性
- 5. Greenplum中的数据库创建日期
- 6. Sqoop在进行历史加载时在块中加载数据
- 7. Java下载并行数据
- 8. 从Parse.com加载数据并保存在本地数据中
- 9. 安排在greenplum数据库上运行的postgreSQL查询
- 10. Greenplum在块中执行查询
- 11. 如何在Greenplum中执行更新?
- 12. Greenplum中的'concat'函数
- 13. 从Excel文件加载数据并加载到临时表中
- 14. 在Modal中加载数据
- 15. 在CodeIgniter中加载数据
- 16. 在ListView中加载数据
- 17. Bookmarklet在完全加载后加载jQuery并运行函数?
- 18. 在运行时保存并加载数据透视表配置
- 19. 在Magma中加载并运行脚本;
- 20. 插入数据并在列中添加上一行数据
- 21. R:连接到Greenplum数据库
- 22. Greenplum段之间的数据分布
- 23. Pivotal Greenplum - 增量数据问题
- 24. 从.Net连接到GreenPlum数据库
- 25. Greenplum:清除数据库日志
- 26. javascript并行加载
- 27. 将数据动态加载到表中并使用数据表进行分页
- 28. Android:在运行时加载表数据
- 29. 加载行数据库变量在php
- 30. 在UIViewController中加载和卸载数据
-1:这是在管理员引导解释的,第12章 “装入和取出数据” – mys