2013-03-01 40 views
6

Tôi mới dùng DynamoDB, và tôi tự hỏi liệu sẽ có bất kỳ sự khác biệt nào trong việc tạo báo cáo từ kho dữ liệu cặp khóa/giá trị này so với từ DBMS hay không.Tạo báo cáo từ Dynamodb

Ứng dụng (Java) của tôi ghi dữ liệu vào DynamoDB và tôi hy vọng tạo báo cáo kinh doanh (ví dụ: báo cáo bán hàng) trong số đó.

Điều tôi hiểu là Amazon cung cấp EMR (Bản đồ đàn hồi giảm), tiếp tục đọc là nó có Hive bên dưới sẽ cho phép tôi sử dụng SQL như cú pháp để truy vấn DynamoDB.

Nếu dữ liệu của tôi nhỏ hơn 50GB, có sử dụng EMR quá mức cần thiết cho tác vụ này không?

Trả lời

7

Có tổ hợp sử dụng cú pháp SQL giống như. Hive vẫn được viết bằng java và dưới mui xe nó vẫn là java. Hive wiki là một nơi tốt để start.Here là một bài viết tốt về việc sử dụng Dynamo DB với EMR http://aws.amazon.com/articles/28549

nên dữ liệu của tôi được ít hơn 50GB, đang sử dụng EMR một overkill cho công việc này?

Tôi không nghĩ vậy, khi bạn đã thiết lập EMR và đã xuất bảng động thành s3 hoặc bảng nội bộ. Sau đó bạn có thể truy vấn S3 hoặc bảng hadoop nội bộ mà không ảnh hưởng đến khả năng thông lượng tạm thời của DynamoDB. Vì S3 rất nhanh, bạn có thể viết tất cả các loại truy vấn phức tạp để lấy các báo cáo mà bạn muốn.

The command line tool để khởi động EMR rất dễ cài đặt và nếu bạn muốn tiết kiệm tiền, bạn luôn có thể đặt giá thầu cho các phiên bản tại chỗ.

Ngoài ra khi công việc đang chạy chậm, bạn có thể tăng lõi và các nút nhiệm vụ để công việc chạy nhanh chóng nếu bạn muốn.

Các vấn đề liên quan