6

Dịch vụ phân tích nhật ký Amazon Athena với S3 Glacier

Chúng tôi có petabyte dữ liệu trong S3. Chúng tôi là https://www.pubnub.com/ và chúng tôi lưu trữ dữ liệu sử dụng trong S3 của mạng của chúng tôi cho mục đích thanh toán. Chúng tôi có các tệp nhật ký được phân tách bằng tab được lưu trữ trong thùng S3. Athena cho chúng tôi HIVE_CURSOR_ERROR lỗi.Amazon AWS Athena S3 và thùng hỗn hợp Glacier

Xô S3 của chúng tôi được thiết lập để tự động đẩy lên sông băng AWS sau 6 tháng. Thùng của chúng tôi có các tệp S3 nóng và sẵn sàng để đọc ngoài các tệp sao lưu Glacier. Chúng tôi đang nhận được lỗi truy cập từ Athena vì điều này. Tệp được tham chiếu trong lỗi là bản sao lưu Glacier.

Đoán của tôi là câu trả lời sẽ là: không giữ các bản sao lưu băng hà trong cùng một nhóm. Chúng tôi không có tùy chọn này một cách dễ dàng do kích thước khối lượng dữ liệu của chúng tôi. Tôi tin rằng Athena sẽ không làm việc trong thiết lập này và chúng tôi sẽ không thể sử dụng Athena để phân tích nhật ký của chúng tôi.

Tuy nhiên, nếu có cách chúng tôi có thể sử dụng Athena, chúng tôi sẽ vui mừng. Có giải pháp cho HIVE_CURSOR_ERROR và cách bỏ qua các tệp Glacier không? Xô s3 của chúng tôi là một xô phẳng không có thư mục.

AWS Athena S3 Operation Exception

Tên đối tượng tập tin S3 hiển thị trong ảnh chụp màn hình ở trên và dưới được bỏ qua từ ảnh chụp màn hình. Tham chiếu tệp trong số HIVE_CURSOR_ERROR thực ra là đối tượng Glacier. Bạn có thể thấy nó trong ảnh chụp màn hình của S3 Bucket của chúng tôi.

Amazon S3 Bucket object in Glacier accessed by Athena

Note Tôi cố gắng để đăng bài trên https://forums.aws.amazon.com/ nhưng đó là không bueno.

enter image description here

+2

Tôi nghĩ đây có thể là lỗi trong Athena. Không nơi nào trong tài liệu Athena họ nhắc đến Glacier. – spg

+0

Tôi đã thêm một số chi tiết khác cho thấy tên tệp đối tượng s3 của chúng tôi là trong thực tế ở trạng thái đối tượng sông băng. – PubNub

Trả lời

3

Các documentation from AWS ngày 16 Tháng Năm 2017 quốc gia đặc biệt mà Athena không hỗ trợ các lớp lưu trữ GLACIER:

Athena không hỗ trợ các lớp lưu trữ khác nhau trong xô theo quy định của mệnh đề VỊ TRÍ , không hỗ trợ lớp lưu trữ GLACIER và không hỗ trợ các nhóm Yêu cầu Pays . Để biết thêm thông tin, hãy xem Storage Classes, Changing the Storage Class of an Object in |S3|Requester Pays Buckets trong Hướng dẫn dành cho nhà phát triển dịch vụ lưu trữ đơn giản Amazon.

Chúng tôi cũng quan tâm đến điều này; nếu bạn làm cho nó hoạt động, xin vui lòng cho chúng tôi biết làm thế nào. :-)

+0

Cảm ơn bạn! Điều này thật ý nghĩa. BTW chúng tôi đã trở thành Athena người dùng chuyên gia. Presto thật tuyệt. – PubNub

Các vấn đề liên quan