Tôi đang cố gắng tiết kiệm hàng ngàn mô hình được sản xuất bởi ML Pipeline. Như đã nêu trong câu trả lời here, các mô hình có thể được lưu như sau:Làm thế nào để lưu mô hình từ ML Pipeline đến S3 hoặc HDFS?
import java.io._
def saveModel(name: String, model: PipelineModel) = {
val oos = new ObjectOutputStream(new FileOutputStream(s"/some/path/$name"))
oos.writeObject(model)
oos.close
}
schools.zip(bySchoolArrayModels).foreach{
case (name, model) => saveModel(name, Model)
}
Tôi đã cố gắng sử dụng s3://some/path/$name
và /user/hadoop/some/path/$name
như tôi muốn các mô hình được lưu vào amazon s3 cuối cùng nhưng cả hai đều thất bại với những thông điệp cho thấy sự không thể tìm thấy đường dẫn.
Cách lưu mô hình vào S3 của Amazon?
nó hoạt động, nhưng khi mô hình reload từ HDFS, một số thông tin sẽ bị mất, chẳng hạn như cha mẹ vv ... –