Tôi đang tìm cách làm việc trên tệp SPSS (.sav) bằng cách sử dụng pandas
. Trong sự vắng mặt của chương trình SPSS, đây là những gì một file điển hình trông giống như khi chuyển đổi sang .csv:Làm thế nào để bảo quản Nhãn khi tệp SPSS (.sav) được nhập vào gấu trúc qua rpy?
Mở điều tra về những gì hai hàng đầu tiên biểu thị (Tôi không biết SPSS), có vẻ như hàng đầu tiên chứa Label
s, trong khi hàng thứ hai chứa VarName
s.
Khi tôi đưa file vào gấu trúc như sau:
import pandas.rpy.common as com
def savtocsv(filename):
w = com.robj.r('foreign::read.spss("%s", to.data.frame=TRUE)' % filename)
w = com.convert_robj(w)
return w
và sau đó làm một cái đầu(), dòng đầu tiên (Label) là mất tích:
Nhãn có thể được duy trì như thế nào?
- Ref: Is there a Python module to open SPSS files?
- Python: 2.7.10
- Pandas: 0.17.1
Tuyệt vời, điều đó dường như làm những gì tôi cần, cảm ơn. Tôi đoán tôi có thể sau đó một người nào đó với gấu trúc nêm này vào được các tiêu đề cột, thay thế các giá trị varName. Nhưng có thể thực hiện chuyển đổi ** và ** bao gồm các nhãn trong một lần (một cuộc gọi đến 'com.robj.r()'), để lưu bàn giao để thực hiện thao tác hơn nữa trong gấu trúc không? – Pyderman
Có thể đọc tệp một lần và nhận các thuộc tính trên đối tượng trả về nhưng nó sẽ yêu cầu một cuộc gọi r khác mà tôi nghĩ. Vui lòng xem bản cập nhật. – ayhan
Hoạt động tốt, cảm ơn agin. – Pyderman