Chúng tôi muốn triển khai Hadoop trên hệ thống của mình để cải thiện hiệu suất của nó.Tích hợp Hadoop và MySQL
Quy trình hoạt động như sau: Hadoop sẽ thu thập dữ liệu từ cơ sở dữ liệu MySQL sau đó xử lý. Đầu ra sau đó sẽ được xuất trở lại cơ sở dữ liệu MySQL.
Đây có phải là triển khai tốt không? Điều này có cải thiện hiệu suất tổng thể của hệ thống của chúng tôi không? Các yêu cầu và điều này đã được thực hiện trước đây? Một hướng dẫn tốt sẽ thực sự hữu ích.
Cảm ơn
Đó là cách sử dụng Hadoop thông thường. Xem kiến trúc Lamda. Sử dụng MySQL như một lớp tốc độ là tiêu chuẩn (mặc dù các công cụ khác cũng được sử dụng). SQOOP sẽ không tồn tại nếu điều này không mang tính chuẩn mực. – nick
Thông thường hadoop có ý nghĩa khi chúng tôi thêm khả năng mở rộng lớn. Chạy hàng chục người lập bản đồ sẽ lặp lại một MySQL sẽ không mang lại nhiều lợi ích. Sử dụng thông thường là có hadoop để tiền xử lý và tổng hợp dữ liệu thô, và sau đó tải vào RDBMS ... –