Tôi có một tập tin văn bản rất lớn của các hình thứcphát hiện có nghĩa là sử dụng lợn hoặc hadoop
dữ liệu được lưu trong dữ liệu thư mục/data1.txt, data2.txt và vân vân
merchant_id, user_id, amount
1234, 9123, 299.2
1233, 9199, 203.2
1234, 0124, 230
and so on..
Những gì tôi muốn làm dành cho mỗi người bán, tìm số tiền trung bình ..
vì vậy về cơ bản cuối cùng tôi muốn lưu đầu ra vào tệp. giống như
merchant_id, average_amount
1234, avg_amt_1234 a
and so on.
Làm cách nào để tính độ lệch chuẩn?
Xin lỗi vì đã hỏi một câu hỏi cơ bản như vậy. :( Mọi trợ giúp sẽ được đánh giá cao. :)
Câu trả lời hay cho câu hỏi này sẽ phải đề cập đến các khái niệm cơ bản về hadoop cũng như các thuật toán cần thiết để tính toán các số liệu khác nhau.Tôi sẽ chỉnh sửa lại câu hỏi này, hoặc có thể yêu cầu một câu hỏi khác và nêu lên những gì bạn biết về cách giải quyết vấn đề này với heo hoặc lợn và cụ thể hơn về một thứ đang giữ bạn. –