Tôi đang triển khai một thư viện đa bảng trong Python như một bài tập lập trình cho công việc mới của mình, và tôi đã thực hiện các yêu cầu mà hoạt động nhưng không phù hợp và dư thừa. Tôi muốn một mô hình tốt hơn cho nó, cái gì đó cho phép chuyển động dữ liệu giữa các mô hình cơ bản, được lưu trữ dưới dạng dữ liệu dạng bảng trong các tệp phẳng và tất cả các kết quả phân tích thống kê có thể được hỏi về điều này. Ngay bây giờ, tôi có một sự tiến triển từ một tập hợp các bộ dữ liệu cho mỗi hàng trong bảng, để một biểu đồ đếm tần số xuất hiện của các bộ dữ liệu quan tâm, đến một bộ nối tiếp - hơi vụng về - biên dịch xuất ra một tập hợp các ô bảng để hiển thị. Tuy nhiên, cuối cùng tôi phải quay lại bàn hoặc biểu đồ thường xuyên hơn tôi muốn vì không có đủ thông tin tại chỗ.Mô hình dữ liệu tốt cho việc lập bảng chéo là gì?
Vì vậy, có ý tưởng nào không?
Chỉnh sửa: Dưới đây là ví dụ về một số dữ liệu và những gì tôi muốn có thể xây dựng từ . Lưu ý rằng "." biểu thị một chút dữ liệu 'bị thiếu', đó chỉ là điều kiện được tính.
1 . 1
1 0 3
1 0 3
1 2 3
2 . 1
2 0 .
2 2 2
2 2 4
2 2 .
Nếu tôi được nhìn vào mối tương quan giữa các cột 0 và 2 ở trên, đây là bàn Tôi muốn có:
. 1 2 3 4
1 0 1 0 3 0
2 2 1 1 0 1
Ngoài ra, tôi muốn để có thể tính toán tỷ lệ tần suất/tổng, tần số/tổng phụ, & c.
Đó là không phải là rất rõ ràng với tôi những gì bạn đang cố gắng làm. Bạn có thể mô tả các yêu cầu hoặc đưa ra một ví dụ với một số dữ liệu và hiển thị các biến đổi bạn muốn làm không? –
Trong ví dụ này, bạn nên viết nó theo thứ tự cột lớn. – jonnii
jonnii, tôi không phải là một nhà thống kê; bạn có thể làm rõ ý bạn là gì? –