Cách nhanh nhất để lặp qua tất cả các tệp trong thư mục bằng NTFS và Windows 7 khi filecount trong thư mục lớn hơn 2.500.000 là gì? Tất cả các tệp đều bằng phẳng trong thư mục cấp cao nhất.Lặp lại một số lượng lớn các tệp trong một thư mục
Hiện nay tôi sử dụng
for root, subFolders, files in os.walk(rootdir):
for file in files:
f = os.path.join(root,file)
with open(f) as cf:
[...]
nhưng nó là rất rất chậm. Quá trình này đã được chạy trong khoảng một giờ và vẫn chưa xử lý một tệp nhưng vẫn phát triển với khoảng 2kB Dung lượng bộ nhớ mỗi giây.
Nó có phải là một tùy chọn để cơ cấu lại hệ thống tệp sao cho thay vì một thư mục có nhiều tệp, bạn có nhiều thư mục, mỗi thư mục chứa một số tệp? – thejh
có, đó sẽ là một ý tưởng. nhưng nó cũng sẽ mất nhiều thời gian để lặp lại ở đây và di chuyển các tập tin? – reox
1000000000 tệp trong một thư mục phẳng hoặc trong một cây thư mục? Trong trường hợp sau, cây sâu bao nhiêu? –