Tôi đang làm một số bài tập với bộ dữ liệu như vậy:Danh sách với nhiều từ điển Từ điển VS với vài danh sách?
Danh sách với nhiều từ điển
users = [
{"id": 0, "name": "Ashley"},
{"id": 1, "name": "Ben"},
{"id": 2, "name": "Conrad"},
{"id": 3, "name": "Doug"},
{"id": 4, "name": "Evin"},
{"id": 5, "name": "Florian"},
{"id": 6, "name": "Gerald"}
]
điển với vài danh sách
users2 = {
"id": [0, 1, 2, 3, 4, 5, 6],
"name": ["Ashley", "Ben", "Conrad", "Doug","Evin", "Florian", "Gerald"]
}
Pandas dataframes
import pandas as pd
pd_users = pd.DataFrame(users)
pd_users2 = pd.DataFrame(users2)
print pd_users == pd_users2
Câu hỏi:
- Tôi có nên cấu trúc bộ dữ liệu như người sử dụng hoặc như users2?
- Có sự khác biệt về hiệu suất không?
- Có thể đọc dễ hơn cái kia không?
- Có tiêu chuẩn nào tôi nên tuân thủ không?
- Tôi thường chuyển đổi chúng thành các khung dữ liệu gấu trúc. Khi tôi làm điều đó, cả hai phiên bản đều giống nhau ... đúng không?
- Kết quả là đúng đối với mỗi phần tử vì vậy không quan trọng nếu tôi làm việc với quyền của gấu trúc df phải không?
câu hỏi đẹp tôi sẽ đi với các tùy chọn đầu tiên vì tôi Recon tìm kiếm và chèn sẽ ít tẻ nhạt so với thứ hai – therealprashant
Tôi sẽ đi với cái đầu tiên miễn là thuận tiện sử dụng là khía cạnh quan trọng nhất. Việc có ID cùng với NAME sẽ hữu ích khi di chuyển mọi thứ xung quanh. –
Phiên bản đầu tiên có thể dễ dàng sắp xếp ở vị trí thứ hai. –