2016-12-02 31 views
3

here 所述,在分布式基础设施中UIMA和火花之间存在一些重叠。我打算用火花来使用UIMA。 (现在我正在转向UIMAFit)任何人都可以告诉我,当我们用火花开发uima时,我们真正面临的问题是什么。 什么是可能的遭遇。 (对不起,我还没有做过任何研究。)UIMA with Spark

回答

3

主要问题是访问对象,因为UIMA试图在运行分析引擎时重新实例化对象。如果对象具有本地引用,那么从远程Spark群集访问时会出现问题。某些RDD函数可能无法在UIMA上下文中使用。但是如果你不使用单独的远程集群,那么就不会有问题。 (我正在谈论uima-fit 2.2)

+0

谢谢@Hasitha –

+0

非常感谢@Hasitha –