Thuật toán MLlib của Apache Spark (ví dụ: Cây quyết định) lưu mô hình ở một vị trí (ví dụ: myModelPath
) nơi tạo hai thư mục, tức là. myModelPath/data
và myModelPath/metadata
. Có nhiều tệp trong các đường dẫn này và các tệp đó không phải là tệp văn bản. Có một số tệp có định dạng *.parquet
.Định dạng tệp mô hình Apache Spark MLlib
Tôi có vài câu hỏi:
- định dạng của những tập tin này là gì?
- Tệp/tệp nào chứa mô hình thực tế?
- Tôi có thể lưu mô hình ở một nơi khác, ví dụ như trong DB không?