我想找出一个好的,强大的MapReduce框架,可以从Scala中使用。Scala中的MapReduce实现
回答
要添加到Hadoop上的答案:至少有两个Scala包装器使Hadoop的工作更可口。
Scala的地图缩小(SMR):http://scala-blogs.org/2008/09/scalable-language-and-scalable.html
SHadoop:http://jonhnny-weslley.blogspot.com/2008/05/shadoop.html
UPD 10月5日11
还有Scoobi框架,有很棒的表现力。
你可能会对使用CouchDB的Scala界面scouchdb感兴趣。另一个想法是使用GridGain。 ScalaDudes有一个使用GridGain和Scala的例子。另一个例子是here。
回过头来,我遇到了这个问题,最后写了一点基础设施,以便从Scala使用Hadoop。我自己使用了一段时间,但我终于开始将它放到网络上。它的名字(非常原始的)ScalaHadoop。
进一步jshen的观点:
hadoop流只是使用套接字。使用unix流,你的代码(任何语言)只需要能够从标准输入读取并输出制表符分隔的流。实现一个映射器,如果需要的话,还可以使用reducer(如果相关,将其配置为组合器)。
对于在hadoop之上的scala API检出Scoobi,它仍处于繁重的发展过程中,但显示出许多承诺。还有一些努力在Scala incubator的hadoop之上实现分布式集合,但是这种努力尚不可用。
还有一个用于级联Twitter的新型scala包装器,名为Scalding。 在简单查看Scalding的文档后,似乎 虽然它使级联平滑的集成它仍然没有解决我所看到的与级联主要问题:类型安全。 级联中的每个操作都在级联的元组上进行操作(基本上是带有或不带有单独架构的字段值列表),这意味着 类型的错误即I.e.将键作为字符串加入并将键作为长键导致 运行时失败。
- 1. 用Akka实现MapReduce
- 2. Hadoop MapReduce Java实现中的减速器
- 3. 使用MapReduce实现PageRank
- 4. 实现自定义MapReduce
- 5. 在Scala中实现'.clone'
- 6. MapReduce现实生活中使用
- 7. JMS使用Scala实现队列实现
- 8. Scala中的哪些类型实现flatMap?
- 9. 如何在Scala中实现string.replaceAll的链
- 10. 如何在Scala中实现Python的issuperset()
- 11. GPU上是否有MapReduce实现(CUDA)?
- 12. 如何使用shell命令实现MapReduce?
- 13. 神经网络实现MapReduce样式
- 14. Scala实现startsWith在流上
- 15. Scala多实现设计
- 16. Scala OnCreate替代实现
- 17. Scala:实现通用折叠
- 18. 在Scala Breeze中实现元素UFunc
- 19. 在Scala中实现MyMap(高阶函数)
- 20. 在Scala中实现抽象类
- 21. 如何在scala中实现equals和hashCode
- 22. 如何在scala中实现GetResult [List [String]]?
- 23. 如何在Scala中实现DAO?
- 24. 在Play Framework 2.4中为Scala实现Akka
- 25. 如何在Scala 2.9.0中实现Hadoop Mapper?
- 26. 在Scala.NET中如何实现Scala闭包?
- 27. 在Play Framework 2.4中为Scala实现CORS
- 28. 在Scala类中实现可变方法
- 29. 如何在scala中实现neo4j?
- 30. 练习:在Scala中实现Stream
很抱歉,我没有要求Java实现。事实上,Hadoop可以插入到Scala中,但是样板代码必须用Java编写。 – 2009-06-08 03:26:28
编写一个ScalaHadoopAdapter,负责处理所有样板并将其发布为免费/开放源代码? – yfeldblum 2009-06-12 04:39:17
样板不需要用java编写。 – jshen 2009-11-24 04:17:16