Tôi có một cơ sở dữ liệu MongoDB 0.7 GB chứa các mẩu tin mà tôi đang cố tải vào một khung dữ liệu. Tuy nhiên, tôi gặp lỗi.Một cách tốt hơn để tải dữ liệu MongoDB vào một DataFrame bằng cách sử dụng Pandas và PyMongo?
MemoryError:
Mã của tôi trông như thế này:
cursor = tweets.find() #Where tweets is my collection
tweet_fields = ['id']
result = DataFrame(list(cursor), columns = tweet_fields)
Tôi đã thử các phương pháp trong các câu trả lời sau đây, mà tại một số điểm tạo ra một danh sách tất cả các yếu tố của cơ sở dữ liệu trước khi tải nó.
Tuy nhiên, trong một câu trả lời mà nói về danh sách(), người nói rằng đó là tốt cho các tập dữ liệu nhỏ, bởi vì tất cả mọi thứ được nạp vào bộ nhớ.
Trong trường hợp của tôi, tôi nghĩ rằng đó là nguồn gốc của lỗi. Có quá nhiều dữ liệu được tải vào bộ nhớ. Tôi có thể sử dụng phương pháp nào khác?