2011-02-02 31 views
2

我想为4 GB的输入字符串创建后缀树。理想情况下,内存中树的大小约为100 GB。我无法在普通桌面上执行此操作。有没有办法在Windows HPC集群上做到这一点?我如何在HPC的不同计算节点上分发后缀树?如何在HPC群集上创建分布式后缀树

+0

集群的大小是多少? 100 GB仍然是很多内存,也许你应该考虑写一些(大部分)到磁盘。另外,你将如何处理这些数据? – suszterpatt 2011-02-02 12:25:23

回答

2

是的,可以这样做; Google学术搜索专家列出several papers。诀窍在于初始分配后缀到初始处理器;必须选择它,以便每个处理器都可以独立地发现它是树的一部分。一旦完成,通常的后缀树操作可以相当有效地完成。我不知道任何公开的实现例子。