0
我刚刚开始使用Hadoop,我正在努力弄清楚如何使用非文件的其他输入源,即读取AWS SimpleDB中的所有行,或来自另一个系统上的REST API的所有记录。在线一切只显示如何处理文件或一些选定的数据库。不使用文件的Hadoop自定义输入格式
InputFormat的API看起来相当复杂,所以我试图找出从任何非文件数据源读取数据的最快方法,然后可以使用Amazon的Elastic MapReduce(基于Hadoop)进行MapReduced。我使用JAVA编写代码。
谢谢!