Tôi đang phát triển một ứng dụng web và tôi muốn thực hiện hai loại hoạt động thống kê/mô hình hóa.Cách tích hợp R trong ứng dụng web
(1) Phân tích hàng loạt từ dữ liệu được lưu trữ trong phần phụ trợ của ứng dụng của tôi (cụm HBase). Thông thường, hoạt động này cần phải được thực hiện thường xuyên, nói mỗi tối. Kích thước của dữ liệu có thể vượt quá những gì có thể được lưu trữ trong bộ nhớ cục bộ, vì vậy điều này có thể cần phải gọi một số gói hỗ trợ tính toán song song. (2) Khi thực thi R được kích hoạt bởi yêu cầu người dùng trong giao diện người dùng. Trường hợp sử dụng điển hình bao gồm dự báo chuỗi thời gian nhỏ. Người dùng có thể đặt yêu cầu trong cùng một thời gian vì vậy cần có một số hỗ trợ cho đồng thời. Hiệu suất là tối quan trọng bởi vì người dùng không thể chờ đợi vô thời hạn cho các phản ứng sẽ đến.
Câu hỏi của tôi là: sự kết hợp tốt nhất của công nghệ/gói CRAN để giải quyết hai vấn đề đó là gì? Ý tưởng của tôi cho thời điểm này là:
- Sử dụng máy chủ Rs kết hợp với máy khách Ruby. Ngoài ra, tôi đang nghĩ về việc tự viết cho mình máy chủ trong Java và sử dụng các ràng buộc R/Java hiện có.
- Sử dụng RHadoop để xử lý công việc trên các tập dữ liệu lớn.
Tôi thấy RevoDeployR là một công cụ tuyệt vời nhưng không phải là nguồn mở, phải không?
Cảm ơn bạn đã giúp đỡ của bạn
Cảm ơn rất nhiều câu trả lời của bạn. –