Tôi đang tiêu thụ một nguồn cấp dữ liệu gần đây đã thêm một tiêu đề Unicode BOM (U + FEFF), và nhiệm vụ rake của tôi bây giờ là điều sai lầm bởi nó.Làm thế nào để tránh vấp ngã trên UTF-8 BOM khi đọc các tập tin
Tôi có thể bỏ qua 3 byte đầu tiên với file.gets[3..-1]
nhưng có cách nào thanh lịch hơn để đọc tệp trong Ruby có thể xử lý chính xác, cho dù BOM có hiện diện hay không?
Thats Unicode BOM không phải là UTF-8. – AnthonyWJones
Cảm ơn, tôi vừa mới nhận ra điều đó. Nó thực sự là 3 byte, không phải một ... Tôi đã chỉnh sửa câu hỏi để nói nhiều. –