2013-07-05 27 views
-5

问候大师Cloudera考试的Hadoop数据类型

如何了解Hadoop datatype..read doc ..? 从Cloudera的考试部分样题:

问题2

你需要编写代码来执行复杂的计算需要几个步骤。您已决定将这些作业链接在一起,并为存储中间计算结果的密钥开发自定义组合类。这个键实现哪个接口? A.可写 B.可转让 C. CompositeSortable D. WritableComparable

I say is D. WritableComparable 

问题3

你正在开发一个使用一年的关键的应用程序。哪个Hadoop提供的数据类型最适合代表一年的密钥? A.文本 B. IntWritable C.空字符 D. BytesWritable E.这些都不合适。您需要实现一个自定义密钥。

I say is E 
+1

请不要将您的文本格式设置为代码,也不要将代码格式化为代码。谢谢。还有几年(例如2010)可以用一个整数(用vint压缩)表示,这里的字节类型不在范围内。 –

回答

0

Q1:D. WritableComparable - 正确 Q2:B. IntWritable为一年总是会适合整数字段的整数。您可以使用A,B,D中的任何一种,但B最简单/有效,因此最合适。

+0

研究类似hadoop的用例的数据类型的好资源是什么? –

+0

有类似权威指南,Hadoop in Action等书籍。但至少您可能想要访问Apache网站并开始阅读。 –

0

Q1答案是D,因为您需要序列化和反序列化值。 Writablecomparable仅用于二级分类。这不是必需的 Q2.Year需要是文本,因为我们不计算任何东西。它只是作为一个Key传递。