Tôi tình cờ gặp pandas và có vẻ lý tưởng cho các phép tính đơn giản mà tôi muốn làm. Tôi có một nền tảng SAS và đã nghĩ rằng nó sẽ thay thế proc freq - có vẻ như nó sẽ mở rộng đến những gì tôi có thể muốn làm trong tương lai. Tuy nhiên, tôi dường như không thể có được cái đầu của tôi xung quanh một nhiệm vụ đơn giản (tôi không chắc chắn nếu tôi phải nhìn vào pivot/crosstab/indexing
- cho dù tôi cần phải có một Panel
hoặc DataFrames
vv ...). ai đó có thể cho tôi một số gợi ý về cách làm như sau:Chữ thập đơn giản trong gấu trúc
Tôi có hai tập tin CSV (một cho năm 2010, một cho năm 2011 - dữ liệu giao dịch đơn giản) - Các cột là thể loại và số lượng
2010:
AB,100.00
AB,200.00
AC,150.00
AD,500.00
2011:
AB,500.00
AC,250.00
AX,900.00
Những được nạp thành các đối tượng riêng biệt DataFrame.
Những gì tôi muốn làm là có được danh mục, tổng, chủng loại, và tần số của thể loại, ví dụ:
2010:
AB,300.00,2
AC,150.00,1
AD,500.00,1
2011:
AB,500.00,1
AC,250.00,1
AX,900.00,1
Tôi không thể tìm hiểu xem mình có nên sử dụng pivot/crosstab/groupby/an index
v.v. ... Tôi có thể nhận tổng hoặc tần suất - dường như tôi không thể nhận được cả hai ... Nó phức tạp hơn một chút bởi vì tôi muốn làm điều đó trên cơ sở từng tháng, nhưng tôi nghĩ nếu có ai đó tốt bụng để chỉ cho tôi kỹ thuật/hướng đi đúng đắn tôi sẽ có thể đi từ đó.
Vì vậy, bạn đang nói rằng mỗi tệp '.csv' chỉ là một hàng duy nhất, và sau đó trong hàng đơn đó, giá trị đầu tiên là năm tiếp theo là dữ liệu khi bạn trình bày nó ở trên? – benjaminmgross
Hi Factor3, đó chỉ là cách S/O quyết định định dạng nó (lần đầu tiên tôi sử dụng nó, vì vậy sẽ phải tìm ra cho rằng trong tương lai) ... Hãy để tôi làm rõ ... có hai tập tin - 2010. csv và 2011.csv; chúng chứa 'n' nhiều hàng, mỗi hàng chứa hai cột. Tôi đã cố gắng đơn giản hóa câu hỏi - nhưng đồng ý rằng định dạng có phần gây hiểu lầm ngay bây giờ mà tôi đã đọc lại nó! –
Tôi đã cung cấp một số ví dụ chi tiết và cách tiếp cận thay thế trong [** Hỏi & Đáp **] này (https://stackoverflow.com/q/47152691/2336654) mà bạn hoặc những người khác có thể thấy hữu ích. – piRSquared