2013-07-09 21 views
5

Tôi mới làm quen với tổ chức hadoop. chúng tôi đang sử dụng hoop hadoop nguồn mở. Nó được cài đặt trên ubuntu một cụm nút duy nhất. Tôi có 1 triệu hàng dữ liệu trong một tệp csv mà tôi đã chuyển nó từ cửa sổ sang linux. khi tải dữ liệu lên tổ ong bằng cách sử dụng các giá trị null của lệnh foolwing sẽ được tải lên bảng.giá trị null được tải lên bảng hive từ tệp csv

LOAD DATA INPATH '/home/goldstone/Desktop/RejectStats.csv' 
OVERWRITE INTO TABLE rejstats; 

Tôi thậm chí đã cố gắng tải lên các giá trị bằng cách đặt đúng định dạng tệp hdfs nhưng vẫn cho cùng một vấn đề.

cấu trúc bảng của tôi là như sau:

CREATE TABLE rejstats(amount_requested INT , appdate TIMESTAMP , loan_title STRING , dbt_income_ratio FLOAT , city STRING , state STRING , employment_lenght STRING) 
ROW FORMAT 
DELIMITED FIELDS TERMINATED BY '\t' 
STORED AS TEXTFILE; 

Tôi gắn các ảnh chụp màn hình của các giá trị null trả lại.

vui lòng bất cứ ai có thể giúp tôi giải quyết vấn đề này. Cảm ơn bạn.

Trân trọng, Divya.

Trả lời

7

Tôi nghĩ bạn đang cố gắng nhập tệp được phân tách bằng dấu phẩy vào bảng nơi bạn đang sử dụng FIELDS TERMINATED BY '\t' tab i.e. Hãy thử các cách sau:

CREATE TABLE rejstats (amount_requested INT , appdate TIMESTAMP , 
loan_title STRING , dbt_income_ratio FLOAT , city STRING , 
state STRING , employment_lenght STRING) ROW FORMAT DELIMITED FIELDS 
TERMINATED BY ',' STORED AS TEXTFILE; 

LOAD DATA INPATH '/home/goldstone/Desktop/RejectStats.csv' 
OVERWRITE INTO TABLE rejstats; 
+0

Loại dữ liệu dấu thời gian có được hỗ trợ trong tổ ong không? vì tôi đang gặp lỗi trong khi truy xuất dữ liệu từ bảng hive chứa kiểu dữ liệu dấu thời gian. – divya

+0

có bắt đầu với Hive 0.8.0. – Neethu

+0

hive không hỗ trợ dấu thời gian, nhưng định dạng mặc định (khi đọc từ chuỗi qua csv) là 'YYYY-MM-dd HH: MM: SS.000' – sfosdal

Các vấn đề liên quan