Tôi có bảng hive được xây dựng trên một tải các tệp sàn gỗ bên ngoài. Các tệp Paruqet phải được tạo bởi công việc tạo tia lửa, nhưng do đặt cờ siêu dữ liệu thành sai nên chúng không được tạo. Tôi tự hỏi nếu nó có thể khôi phục lại nó một cách không đau đớn. Cấu trúc tệp như sau:Tạo siêu dữ liệu cho các tệp lát gỗ
/apps/hive/warehouse/test_db.db/test_table/_SUCCESS
/apps/hive/warehouse/test_db.db/test_table/_common_metadata
/apps/hive/warehouse/test_db.db/test_table/_metadata
/apps/hive/warehouse/test_db.db/test_table/end_date=2016-04-20
/apps/hive/warehouse/test_db.db/test_table/end_date=2016-04-21
/apps/hive/warehouse/test_db.db/test_table/end_date=2016-04-22
/apps/hive/warehouse/test_db.db/test_table/end_date=2016-04-23
/apps/hive/warehouse/test_db.db/test_table/end_date=2016-04-24
/apps/hive/warehouse/test_db.db/test_table/end_date=2016-04-25
/apps/hive/warehouse/test_db.db/test_table/end_date=2016-04-26
/apps/hive/warehouse/test_db.db/test_table/end_date=2016-04-27
/apps/hive/warehouse/test_db.db/test_table/end_date=2016-04-28
/apps/hive/warehouse/test_db.db/test_table/end_date=2016-04-29
/apps/hive/warehouse/test_db.db/test_table/end_date=2016-04-30
Giả sử tệp _metadata
không tồn tại hoặc lỗi thời. Có cách nào để tạo lại nó thông qua lệnh hive/tạo ra nó mà không cần phải bắt đầu công việc toàn bộ tia lửa?
@Niemand vui lòng chỉnh sửa câu hỏi bằng nhận xét mới nhất của bạn! –
Không phải _metadata nằm trong thư mục được phân đoạn của bạn cùng với tệp .parquet? Ngoài ra, bạn có thể đọc các tập tin từ một vỏ tia lửa? –
Có, một số siêu dữ liệu có mặt trong các tệp của chính chúng và có, chúng có thể truy vấn được từ cả hai trình bao vỏ và tổ ong. Nó chỉ là tôi nghĩ rằng truy vấn hive là chậm hơn nhiều mà không có tập tin _metadata cụ thể này hiện nay. – Niemand