Đây là lỗi mà tôi nhận được khi cố gắng chạy tolower()
trên vectơ ký tự từ tệp không thể thay đổi (ít nhất, không phải thủ công - quá lớn).Lỗi trong chuỗi (multibyte không hợp lệ)
Error in tolower(m) : invalid multibyte string X
Nó có vẻ là tên công ty của Pháp mà là vấn đề với các nhân vật É
. Mặc dù tôi đã không điều tra tất cả chúng (cũng không thể làm như vậy bằng tay).
Thật lạ lùng, bởi vì tôi nghĩ rằng các vấn đề mã hóa sẽ được xác định trong thời gian read.csv()
, thay vì trong quá trình hoạt động sau khi thực tế.
Có cách nào nhanh chóng để xóa các chuỗi nhiều chuỗi này không? Hoặc, có lẽ một cách để xác định và chuyển đổi? Hoặc thậm chí chỉ cần bỏ qua chúng hoàn toàn?
'ToLower ("École") 'mang lại cho tôi' "École" 'mà có vẻ đúng (tôi :-) Pháp) – flodel
Câu hỏi này có thể hữu ích: http://stackoverflow.com/ question/4993837/r-invalid-multibyte-string – thelatemail
Tôi cũng nên đề cập đến rằng tôi không nhận được cùng một lỗi trên Windows (hoặc ít nhất, khi tôi có Windows) –