Tôi muốn thử một ví dụ về thuật toán học máy ALS. Và mã của tôi hoạt động tốt, Tuy nhiên tôi không hiểu tham số rank
được sử dụng trong thuật toán.Thứ hạng trong máy ALS Học thuật toán trong Apache Spark Mllib
Tôi đã sau mã trong java
// Build the recommendation model using ALS
int rank = 10;
int numIterations = 10;
MatrixFactorizationModel model = ALS.train(JavaRDD.toRDD(ratings),
rank, numIterations, 0.01);
Tôi đã đọc một số nơi mà nó là số nhân tố tiềm ẩn trong mô hình.
Giả sử tôi có tập dữ liệu (người dùng, sản phẩm, xếp hạng) có 100 hàng. Giá trị phải là rank
(các yếu tố tiềm ẩn).
Tyler, Cảm ơn lời giải thích tốt như vậy. Tuy nhiên, tôi có một câu hỏi ở đây, các yếu tố tiềm ẩn, mà chúng tôi giả định, họ chỉ là người dùng (lựa chọn, sở thích) hoặc họ có thể bao gồm các đặc điểm của mặt hàng đó? –
Đó hoàn toàn là một đặc tính của dữ liệu. –
nếu bạn có thể đưa ra chính xác câu trả lời cho Lambda, mà tôi tin là thông số ALS duy nhất khác sử dụng ... Đây là câu trả lời hay nhất tôi đã tìm thấy để xếp hạng –