Tôi đang ở giữa việc tái cấu trúc mã của mình để tận dụng lợi thế của DataFrames, Estimators, and Pipelines. Ban đầu tôi đã sử dụng MLlib Multiclass LogisticRegressionWithLBFGS trên RDD[LabeledPoint]
. Tôi thích học tập và sử dụng API mới, nhưng tôi không chắc chắn làm thế nào để lưu mô hình mới của tôi và áp dụng nó trên dữ liệu mới.Spark ML - Lưu OneVsRestModel
Hiện tại, triển khai ML của LogisticRegression
chỉ hỗ trợ phân loại nhị phân. Tôi, thay vì sử dụng OneVsRest như vậy:
val lr = new LogisticRegression().setFitIntercept(true)
val ovr = new OneVsRest()
ovr.setClassifier(lr)
val ovrModel = ovr.fit(training)
bây giờ tôi muốn lưu OneVsRestModel
của tôi, nhưng điều này dường như không được hỗ trợ bởi các API. Tôi đã thử:
ovrModel.save("my-ovr") // Cannot resolve symbol save
ovrModel.models.foreach(_.save("model-" + _.uid)) // Cannot resolve symbol save
Có cách nào để lưu điều này, vì vậy tôi có thể tải ứng dụng mới để tạo dự đoán mới không?
Tôi ước tôi có thể +2 mục này. Không chỉ là chính xác những gì tôi cần, nó làm cho công việc tính toán xác suất thô dễ dàng hơn rất nhiều. Tôi nghĩ tôi sẽ phải tùy chỉnh src. Cảm ơn! –
@ zero323 là có một phiên bản pyspark của câu trả lời của bạn? Đang cố gắng tìm cách để lưu các mô hình pyspark.ml – ajkl
@AjinkyaKale Trong phiên bản 1.6? – zero323