Tôi tự hỏi làm thế nào bạn làm sạch các ký tự đặc biệt mà MS Word như, chẳng hạn như m- và n-dấu gạch ngang và dấu ngoặc kép?Làm thế nào để bạn đối phó với các ký tự "đặc biệt" mà MS Word thêm?
Tôi thường thấy mình sao chép nội dung từ khách hàng từ Word và dán vào trang HTML tĩnh, nhưng nội dung kết thúc bằng ký tự lạ vì các ký tự đặc biệt không được chuyển đổi thành mã ACSII chính xác của chúng và do đó hiển thị dưới dạng văn bản bị cắt xén. (Đối với các trang web cơ bản này, tôi đang sử dụng Dreamweaver.)
Tôi đã thấy rất nhiều vấn đề tương tự khi khách hàng sao chép nội dung từ Word vào trường văn bản chỉ (chủ yếu là văn bản). Khi tôi đặt nó vào một PDF (thông qua PHP) hoặc nó hiển thị trên trang nó cũng đã bị cắt xén văn bản.
Bạn giải quyết vấn đề này bằng cách nào? Có dịch vụ dọn dẹp hoặc chương trình bạn sử dụng không?
Đối với các trang HTML đặc biệt, mọi thứ đều là UTF8, do đó không phải là vấn đề. –
Nếu các ký tự bị cắt xén, KHÔNG phải mọi thứ đều là UTF-8. Thủ phạm phổ biến là thuộc tính biểu mẫu chấp nhận biểu mẫu bị thiếu và một số trình duyệt web nhất định không giải thích chính xác. –
Vâng, nếu bất kỳ trình duyệt nào không hiểu đúng, thì tôi sẽ nói nó không hoạt động. Đây là tài liệu của tôi, v.v.:
Có điều gì đó không có sai không? –