Tôi đang gặp sự cố khi tìm thư viện cho phép các tệp Parquet được viết bằng Python. Điểm thưởng nếu tôi có thể sử dụng Snappy hoặc một cơ chế nén tương tự kết hợp với nó.Phương pháp viết các tệp Parquet bằng Python?
Cho đến nay, phương pháp duy nhất tôi tìm thấy là sử dụng Spark với hỗ trợ ParParquet.
Tôi có một số tập lệnh cần phải viết các tệp Parquet không phải là công việc Spark. Có cách tiếp cận nào để viết các tệp Parquet trong Python không liên quan đến pyspark.sql
không?
dường như định dạng Parquet có thirft file định nghĩa bạn không thể sử dụng để truy cập vào nó? – Srgrn