Trong Scala, cách giải nén văn bản chứa trong file.gz
để văn bản có thể được xử lý? Tôi sẽ hài lòng với nội dung của tệp được lưu trữ trong một biến hoặc lưu tệp dưới dạng tệp cục bộ để chương trình có thể đọc sau đó.giải nén và đọc tệp gzip trong scala
Cụ thể, tôi đang sử dụng Scalding để xử lý dữ liệu nhật ký nén, nhưng Scalding không xác định cách đọc chúng trong FileSource.scala
.
Bạn có thể trích xuất nội dung từ gzip sử dụng Java 'java.util.zip. GZipInputStream' và sau đó làm việc với nội dung của nó – 4lex1v
với thư viện tệp tốt hơn, đó là 'myFile.newInputStream.gzipped.lines', theo https://github.com/pathikrit/better-files/blob/master/README.md –