2012-07-09 37 views
5

thể trùng lặp:
What is the best free way to clean up Word HTML?
PHP to clean-up pasted Microsoft inputRemove MS Word "HTML" sử dụng PHP

tôi cho phép khách hàng để nhập các ghi chú trong một trình soạn thảo văn bản giàu có, và chỉ gần đây đã nâng cấp lên ckEditor 3x, loại bỏ các lớp MS, kiểu và nhận xét theo mặc định (khi người dùng dán vào đối tượng trình soạn thảo). Vì vậy, di chuyển về phía trước tôi tất cả các thiết lập.

Gần đây tôi đã có một nhu cầu để làm sạch 5 năm giá trị ghi chú một số trong đó có MS từ tạo HTML nhúng. Tôi cần phải lặp qua phần văn bản này và làm sạch nó.

Tôi không cần phải loại bỏ tất cả các thẻ span, chỉ những thẻ được xác định là được viết bởi Microsoft.

Tôi đã thử sử dụng HTMLCleaner, nhưng không xóa HTML được tạo bởi MS. http://word2cleanhtml.com thực hiện chính xác những gì tôi muốn, tuy nhiên các nhà phát triển hiện không cung cấp API để sử dụng công khai (kể từ ngày 9 tháng 7 năm 2012).

Tôi đã tìm một lớp học như vậy trong vài tuần qua và không có nhiều may mắn. Có ai trong số các bạn đã tìm thấy một lớp học hữu ích mà bạn muốn chia sẻ không?

+0

Để làm rõ, tôi cần một lớp phía máy chủ mà tôi có thể nhúng vào ứng dụng hiện có của mình. Có một số công cụ tuyệt vời trong SO câu hỏi/câu trả lời được giới thiệu bởi Mario, tuy nhiên tôi thấy rằng họ được thiết kế cho chuyển đổi một shot cho hầu hết các phần - hoặc sử dụng curl để đăng lên trang web của họ. Không thể làm điều đó với PHI. –

+0

Mario, nơi URL của bạn đã biến mất? Chúng hữu ích, và là một phần của sự biện minh cho việc đóng cửa của tôi. Chúng cũng có ích cho OP để thực hiện dọn dẹp HTML bằng cách sử dụng một kịch bản hồi tưởng. – halfer

+0

Tôi hy vọng câu hỏi này sẽ có sẵn, vì câu trả lời của maxhud bên dưới đề cập đến câu hỏi của tôi cho T. htmlpurifier là một lớp, không phải là trang web mà người dùng duyệt và tải lên. –

Trả lời

Các vấn đề liên quan