Tôi biết có vấn đề đã biết với dấu phân tách khi lưu bảng vào csv (hoặc tệp văn bản khác) trong Hive. Vì vậy, tôi tự hỏi nếu các bạn có thể giúp tôi vượt qua điều đó.xuất bảng Hive sang csv trong hdfs
Tôi có bảng hiện có (Bảng A) và tôi muốn lưu nó ở định dạng csv thành hdfs. Từ đọc các câu trả lời khác tôi tin rằng tôi sẽ phải đầu tiên tạo ra một bảng bên ngoài (nhưng tôi không chắc chắn làm thế nào toàn bộ điều sẽ xem xét).
Có ai giúp được không?
Cá nhân, tôi chỉ sử dụng 'chèn thư mục ghi đè' và có tệp phân tách' \ 001'. Nhưng nếu bạn * phải * có một csv, tôi nghĩ rằng bạn tốt nhất ra piping truy vấn đến một địa phương .csv và sau đó 'hadoop fs -put'-ing nó vào hdfs, được mô tả ở đây http://stackoverflow.com/question/18129581/how-do-i-output-the-kết quả-of-a-hiveql-query-to-csv – gobrewers14
Tôi muốn tránh lưu một tệp lớn vào thư mục cục bộ nếu có thể.Vấn đề của tôi là sau đó tôi cần phải tải các tập tin vào R và để làm điều này bạn thường chỉ định một dấu phân cách, không chắc chắn làm thế nào điều này sẽ làm việc (hoặc nếu nó sẽ làm việc) với một nhân vật vô hình. – Laura
Tôi tải dữ liệu từ hdfs để kích hoạt và chỉ định dấu phân tách là '" \ 001 "'. Tôi đã không bao giờ có (một lý do) để nhập một tập tin từ HDFS để R nhưng tôi giả sử nó có thể mất bất kỳ dấu phân cách miễn là nó được chỉ định một cách chính xác. – gobrewers14