Tôi có một bộ tài liệu Word mà tôi muốn xuất bản bằng cách sử dụng công cụ PHP mà tôi đã viết. Tôi sao chép và dán các tài liệu Word vào một hộp văn bản và sau đó lưu chúng vào MySQL bằng cách sử dụng chương trình PHP. Vấn đề tôi phát sinh từ tất cả các ký tự không chuẩn mà tài liệu Word có, như dấu ngoặc kép và dấu ba chấm ("..."). Những gì tôi làm tại thời điểm này là tìm kiếm và thay thế những thứ này bằng tay (và cả các ký hiệu nước ngoài như e-level) với văn bản thuần hoặc HTML (& eacute; vv) Có chức năng nào trong PHP tôi có thể gọi nó không lấy đầu ra của một tài liệu Word và chuyển đổi tất cả mọi thứ mà phải là thực thể thành các thực thể, và các biểu tượng khác không hiển thị đúng trong Firefox thành các biểu tượng hiển thị.Chuyển đổi tài liệu Word thành HTML có thể sử dụng được trong PHP
Cảm ơn!
Theo kinh nghiệm của tôi, ngay cả với tất cả các bảng mã ký tự thiết lập đúng, một số nhân vật chỉ được nuốt vào thời điểm họ nhận được đến trình duyệt. Tôi không biết nếu đây là một lỗi trong PHP (ngôn ngữ máy chủ tôi sử dụng nhiều nhất) hoặc những gì, nhưng tôi đã tìm thấy chuyển đổi cho các thực thể đáng tin cậy hơn. – eyelidlessness
Xin chào Richard, bạn có lời khuyên nào về cách thiết lập MySQL để hỗ trợ UTF-8 không? Cảm ơn! – Ben
TẠO DATABASE db_name CHARACTER SET 'utf8' - xem http://dev.mysql.com/doc/refman/5.0/en/charset-database.html và http://dev.mysql.com/doc/refman/5.0 /en/charset-table.html. Lưu ý rằng bạn sẽ phải làm điều gì đó như SET NAMES 'utf8'; khi bạn kết nối với DB để đảm bảo bạn tìm nạp dữ liệu bằng UTF-8. –