Tôi quen thuộc với các chủ sở hữu dữ liệu R như vectơ, dataframe, v.v. nhưng cần phải làm một số phân tích văn bản và có vẻ như python có một số thiết lập tốt để làm như vậy. Câu hỏi của tôi là nơi tôi có thể tìm thấy một lời giải thích về cách python giữ dữ liệu.Đi tới Python từ R, tương đương python của một khung dữ liệu là gì?
Cụ thể tôi có tập dữ liệu trong tệp được phân tách bằng tab nơi văn bản ở cột thứ 3 và điểm của dữ liệu tôi cần ở cột thứ 4.
id1 id2 text score
123 889 "This is the text I need to read..." 88
234 778 "This is the text I need to read..." 78
345 667 "This is the text I need to read..." 91
Trong R Tôi muốn chỉ cần tải nó vào một khung dữ liệu có tên df1
và khi tôi muốn gọi một cột tôi muốn sử dụng $ text df1 hoặc df1[,3]
và nếu tôi muốn có một tế bào cụ thể tôi có thể sử dụng df1[1,3]
.
Tôi nhận được cảm giác về cách đọc dữ liệu vào trăn nhưng không phải cách xử lý bảng như cấu trúc.
Bạn đề xuất làm việc với điều này như thế nào cho người mới sử dụng python?
Python không có tương đương với khung dữ liệu –
@DavidHeffernan Còn về những thứ [gấu trúc] (http://pandas.pydata.org/) thì sao? Không phải là (dự định được) đóng? – joran
@joran Đó là bên thứ ba. Tôi cho rằng tôi có nghĩa là không có gì được xây dựng theo cách mà khung dữ liệu R được xây dựng. –