Tôi đang viết một ứng dụng tia lửa và muốn sử dụng các thuật toán trong MLlib. Trong tài liệu API tôi tìm thấy hai lớp khác nhau cho cùng một thuật toán.Sự khác biệt giữa org.apache.spark.ml.classification và org.apache.spark.mllib.classification
Ví dụ: có một LogisticRegression trong org.apache.spark.ml.classification cũng là LogisticRegressionwithSGD trong org.apache.spark.mllib.classification.
Sự khác biệt duy nhất tôi có thể tìm thấy là một trong org.apache.spark.ml được kế thừa từ Công cụ ước tính và có thể được sử dụng trong xác thực chéo. Tôi khá bối rối khi chúng được đặt trong các gói khác nhau. Có ai biết lý do cho nó không? Cảm ơn!
Xin chào Yijie, cảm ơn rất nhiều! Theo tôi hiểu, nếu tôi muốn thực hiện xác nhận chéo trên các thuật toán nằm trong o.a.s.mllib, tôi chỉ có thể đặt các thông số theo cách thủ công và chạy nhiều lần thay vì sử dụng phương thức Cross-validator. Bạn có cách nào tốt hơn để làm điều đó không? – ailzhang
@ailzhang, có thể bạn có thể đăng bài này dưới dạng một câu hỏi khác và xem liệu ai đó có thể giúp tôi không :) Tôi biết rất ít về Mllib –
ok ~ cảm ơn sự giúp đỡ của bạn! – ailzhang