Tôi muốn tìm ra khung công tác MapReduce tốt và mạnh mẽ, được sử dụng từ Scala.Triển khai MapReduce ở Scala
Trả lời
Để thêm vào câu trả lời trên Hadoop: có ít nhất hai trình bao bọc Scala giúp làm việc với Hadoop ngon miệng hơn.
Scala MapReduce (SMR): http://scala-blogs.org/2008/09/scalable-language-and-scalable.html
SHadoop: http://jonhnny-weslley.blogspot.com/2008/05/shadoop.html
UPD 05 tháng 10 11
Ngoài ra còn có Scoobi khuôn khổ, có biểu cảm tuyệt vời.
http://hadoop.apache.org/ là ngôn ngữ bất khả tri.
Tôi xin lỗi nhưng tôi đã không yêu cầu thực hiện Java. Thật vậy, Hadoop có thể được cắm vào Scala nhưng mã soạn sẵn phải được viết bằng Java. –
Viết một ScalaHadoopAdapter mà sẽ chăm sóc của tất cả các boilerplate và xuất bản nó như là miễn phí/mã nguồn mở? – yfeldblum
các boilerplate không cần phải được viết bằng java. – jshen
Bạn có thể quan tâm đến scouchdb, giao diện Scala để sử dụng CouchDB.
Một ý tưởng khác là sử dụng GridGain. ScalaDudes có một ví dụ về cách sử dụng GridGain với Scala. Và here là một ví dụ khác.
Một thời gian ngắn, tôi đã gặp phải vấn đề này và kết thúc bằng việc viết một cơ sở hạ tầng nhỏ để giúp dễ dàng sử dụng Hadoop từ Scala. Tôi đã tự mình sử dụng nó một thời gian, nhưng cuối cùng tôi đã có mặt để đưa nó lên web. Nó được đặt tên (rất ban đầu) ScalaHadoop.
để biết thêm điểm jshen:
phát trực tuyến hadoop chỉ đơn giản sử dụng ổ cắm. bằng cách sử dụng các luồng unix, mã của bạn (bất kỳ ngôn ngữ nào) chỉ đơn giản là có thể đọc từ các dòng được phân tách bằng thẻ stdin và đầu ra. triển khai trình ánh xạ và nếu cần, bộ giảm tốc (và nếu có liên quan, hãy định cấu hình đó làm bộ kết hợp).
Đối với API scala trên đầu trang của kiểm tra hadoop Scoobi, nó vẫn còn trong phát triển nặng nhưng cho thấy rất nhiều lời hứa. Ngoài ra còn có một số nỗ lực để triển khai các bộ sưu tập được phân phối trên đỉnh của hadoop trong Scala incubator, nhưng nỗ lực đó không thể sử dụng được.
Ngoài ra còn có một trình bao bọc scala mới để xếp tầng từ Twitter, được gọi là Scalding. Sau khi tìm kiếm rất ngắn gọn tài liệu về Scalding, có vẻ như rằng trong khi nó làm cho việc tích hợp với tầng mượt mà hơn, nó vẫn không giải quyết được vấn đề chính với tầng lớp: loại an toàn. Mọi hoạt động trong tầng hoạt động trên các bộ xếp tầng (về cơ bản là một danh sách các giá trị trường có hoặc không có lược đồ riêng) có nghĩa là lỗi loại, I.e. Tham gia một khóa dưới dạng Chuỗi và khóa dưới dạng dẫn dài để lỗi thời gian chạy.
Scalding có API an toàn loại: https://github.com/twitter/scalding/wiki/Type-safe-api-reference và trong API trường (mà bạn đang đề cập đến), tham gia một chuỗi dài không gây ra trường hợp ngoại lệ thời gian chạy (nếu chúng là cả hai số). Tất nhiên, trong API an toàn kiểu như vậy, việc tham gia bị cấm bởi trình biên dịch. –
Cá nhân, tôi đã trở thành một fan hâm mộ lớn của Spark
Bạn có khả năng để thực hiện các bộ nhớ máy tính cụm, giảm đáng kể chi phí bạn sẽ kinh nghiệm từ hoạt động MapReduce đĩa chuyên sâu.
- 1. Hadoop MapReduce, câu hỏi triển khai Java
- 2. Triển khai ExpandoObject trong Scala
- 3. Triển khai thuật toán Biến đổi Fourier Nhanh với MapReduce
- 4. Phát triển Android đáng kể ở Scala
- 5. Cách đối sánh mẫu trong Scala được triển khai ở cấp độ bytecode như thế nào?
- 6. DSL thú vị, được triển khai trong Scala?
- 7. Triển khai Giao diện Java với kiểu thô từ Scala
- 8. Cần trợ giúp triển khai thuật toán này với bản đồ Hadoop MapReduce
- 9. Làm cách nào để triển khai MapReduce trong C# bằng PLINQ?
- 10. Triển khai và lưu trữ scala trên đám mây?
- 11. Tôi có thể phát triển Lego Mindstorms ở Scala không?
- 12. MapReduce trên AWS
- 13. ở đâu là thực hiện triển khai "authenticate_user!" phương pháp?
- 14. Các tệp triển khai khung UIKit nằm ở đâu?
- 15. Tôi có thể tìm thấy triển khai XMLHttpRequest ở đâu?
- 16. Triển khai sơ đồ trang web ở Django
- 17. Cách triển khai sắp xếp trong hadoop?
- 18. Mạng Bayesian ở Scala
- 19. Triển khaiKhông triển khai tệp
- 20. MapReduce và SQL GROUP BY
- 21. Triển khai ngữ cảnh
- 22. Generics in Scala: triển khai giao diện/đặc điểm hai lần?
- 23. Làm cách nào để triển khai biến áp đơn lẻ `List` trong Scala?
- 24. Scala untyped macro ở vị trí infix
- 25. Bắt đầu với MapReduce/Hadoop
- 26. Cách triển khai BOOST_TYPEOF?
- 27. Triển khai trên EC2
- 28. khớp mẫu - triển khai
- 29. Nơi triển khai CLLocationManager
- 30. Triển khai diễn viên Scala diễn viên khác nhau Tổng quan
SHadoop khá cũ - nó sử dụng khung MR cũ. Tôi đã cập nhật các điểm liên quan tại một số điểm: https://github.com/schmmd/Hadoop-Scala-Commons – schmmd
Tính năng Scalding cũng là một tùy chọn. https://github.com/twitter/scalding –