Tôi xử lý nhiều văn bản/dữ liệu mà tôi trao đổi giữa Python, R và đôi khi là Matlab.Tệp văn bản SQLite hoặc phẳng?
Việc truy cập của tôi là tệp văn bản phẳng, nhưng đôi khi cũng sử dụng SQLite để lưu trữ dữ liệu và truy cập từ mỗi chương trình (không phải là Matlab). Tôi không sử dụng GROUPBY, AVG, vv trong SQL nhiều như tôi làm các hoạt động này trong R, vì vậy tôi không nhất thiết yêu cầu các hoạt động cơ sở dữ liệu.
Đối với các ứng dụng như vậy yêu cầu trao đổi dữ liệu giữa các chương trình để sử dụng các thư viện có sẵn trong mỗi ngôn ngữ, có quy tắc hay nào về định dạng/phương thức trao đổi dữ liệu để sử dụng (thậm chí XML hoặc NetCDF hoặc HDF5) không?
Tôi biết giữa Python -> R có rpy hoặc rpy2 nhưng tôi đã tự hỏi về câu hỏi này theo nghĩa chung hơn - tôi sử dụng nhiều máy tính mà tất cả đều không có rpy2 và cũng sử dụng một vài phân tích khoa học khác phần mềm yêu cầu truy cập vào dữ liệu vào các thời điểm khác nhau (các giai đoạn xử lý và phân tích cũng được tách ra).
+1 cho sqlite và dự đoán sử dụng rộng rãi cơ sở dữ liệu trong tương lai mặc dù hiện tại không rõ ràng. –
Cảm ơn bạn - vâng, không đọc toàn bộ tập tin chắc chắn là điểm cộng của nó. – hatmatrix