Tôi mới sử dụng Hadoop và tôi mới bắt đầu làm việc trên Hive, tôi hiểu rằng nó cung cấp một ngôn ngữ truy vấn để xử lý dữ liệu trong HDFS. Với HiveQl
chúng ta có thể tạo các bảng và tải dữ liệu vào nó từ HDFS.Hive lưu trữ bảng của nó ở đâu?
Vì vậy, câu hỏi của tôi là: các bảng đó được lưu trữ ở đâu? Cụ thể là nếu chúng ta có 100 GB tệp trong HDFS của chúng tôi và chúng tôi muốn tạo bảng hive ra khỏi dữ liệu đó, kích thước của bảng đó và nó được lưu trữ ở đâu?
Nếu hiểu biết của tôi về khái niệm này là sai hãy sửa lại cho tôi ..
Ý bạn là "tải toàn bộ bảng vào bộ nhớ và ánh xạ nó trong siêu lưu trữ"? Hive không làm bất cứ điều gì như thế khi bạn tạo một bảng được quản lý. –
Sau đó, những gì đang thực sự happing có trong khi chúng tôi tải dữ liệu vào một bảng hive? – talin
@JeremyBeard Nếu ngữ nghĩa của tôi sai, vui lòng chỉnh sửa bài đăng. Nếu toàn bộ khái niệm là sai, tôi rất muốn biết đâu là sự hiểu biết của tôi không chính xác, vì vậy tôi khuyến khích bạn gửi câu trả lời – mlegge