Tôi đang sử dụng fread trong data.table (1.8.8, R 3.0.1) trong một nỗ lực để đọc các tệp rất lớn.Lỗi tràn ngăn xếp bảo vệ fread
Tệp trong câu hỏi có 313 hàng và ~ 6.6 triệu cols hàng dữ liệu số và tệp có kích thước khoảng 12gb. Đây là một Centos 6.4 với RAM 512GB.
Khi tôi cố gắng để đọc trong file:
g=fread('final.results',header=T,sep=' ')
'header' changed by user from 'auto' to TRUE
Error: protect(): protection stack overflow
tôi đã cố gắng bắt đầu R với max-ppsize 500000, đó là tối đa, nhưng lỗi tương tự.
Tôi cũng đã cố gắng thiết lập kích thước ngăn xếp để không giới hạn thông qua
ulimit -s unlimited
bộ nhớ ảo đã được thiết lập để không giới hạn.
Tôi không thực tế với tệp có kích thước này? Tôi đã bỏ lỡ một cái gì đó khá rõ ràng?
Vui lòng thử v1.8.9 trên R-Forge (liên kết trên trang chủ data.table). Có 10 bản sửa lỗi cho 'fread' ở đó, xem TIN TỨC. Hỗ trợ tệp lớn là một trong số chúng, nhưng trên Windows như đã được chấp nhận trên Linux. 6,6 triệu cột (!) Là mới và cũng có thể là một lỗi mới. Vui lòng xác nhận với v1.8.9 và chúng tôi sẽ đi từ đó ... –
@MatthewDowle Có Tôi không hài lòng với 6 triệu hàng. Cài đặt 1.8.9, lỗi tương tự. Tôi đã tạo một tệp nhỏ hơn nhiều, 10 hàng x 50K cols, cùng một lỗi. 10 hàng x 49.999 cols nó hoạt động. – mpmorley
Ý của bạn là các cột trong nhận xét đó (bạn đã viết 6 triệu hàng)? Rất thú vị và kỳ lạ nó không thành công tại 50.000 cột chính xác. Thực hiện tốt để mài giũa trong đó một cách nhanh chóng. Tôi không nhớ bất kỳ giới hạn cột nào như thế. Sẽ có một cái nhìn. –