Trong trang web của chúng tôi, một số người dùng Mac gặp khó khăn khi họ sao chép-dán văn bản từ tệp PDF vào TextArea (do TinyMCE xử lý). Tất cả các chữ nổi bật bị hỏng, và trở thành ví dụ e?
cho một é
, i?
cho một î
, v.v. Tôi không thể tạo lại vấn đề này với máy tính Windows.PHP: Unicode nhấn mạnh char và dấu phụ
Khi tôi đã viết nội dung của TextArea trên một tệp (trước khi chèn nó vào cơ sở dữ liệu), tôi chỉ phát hiện ra rằng é
ban đầu là khác nhau về mặt truyền thống é
(trên Vim, xem bên dưới).
Thật vậy:
// the corrupted é - first line of the screenshot
echo bin2hex($char); // display 65cc81
// traditionnal é
echo bin2hex('é'); // display c3a9
Sau khi tìm kiếm rất nhiều, ở đây tôi: Dường như Mac OS bản Unicode nhấn mạnh chars như một sự kết hợp của hai ký tự: trong ví dụ của chúng tôi, e + ́
. Cho đến nay, tôi đã không tìm thấy bất kỳ giải pháp nào để thay thế số é
bị hỏng bằng thực tế, để tránh e?
trong cơ sở dữ liệu.
Và tôi hơi tuyệt vọng.
http://unicode.org/reports/tr15/ – hakre