Triển khai nguồn mở sẽ được ưu tiên.Có thư viện java nào để chuyển đổi tài liệu từ pdf sang html không?
6
A
Trả lời
2
Rõ ràng, nó không phải là một nhiệm vụ dễ dàng, định dạng PDF là phong phú hơn nhiều so với một HTML (ngoài ra bạn phải trích xuất hình ảnh và liên kết chúng, vv).
Trích xuất văn bản đơn giản đơn giản hơn nhiều (mặc dù không tầm thường ...).
Tôi thấy trong thanh bên của câu hỏi của bạn một câu hỏi tương tự: Converting PDF to HTML with Python trỏ đến thư viện (poppler, được viết bằng C++, có thể được truy cập bằng JNI/JNA) và câu hỏi liên quan mang lại nhiều câu trả lời hơn.
1
1
Thử sử dụng PDFBox từ nền tảng apache.
Các vấn đề liên quan
- 1. Tài liệu HTML sang PDF?
- 2. Chuyển đổi HTML sang PDF (không phải PDF sang HTML) bằng cách sử dụng PHP
- 3. Chuyển đổi HTML sang PDF
- 4. Chuyển đổi PDF sang HTML
- 5. C# chuyển đổi pdf sang html
- 6. Chuyển đổi HTML sang PDF - Bất kỳ thư viện nào cho ASP.net
- 7. Rails: Chuyển đổi HTML sang PDF?
- 8. Chuyển đổi Tài liệu Maven Site Software sang PDF
- 9. Có thư viện nào để chuyển đổi định dạng wikitext sang html bằng php không?
- 10. Chuyển đổi tài liệu MS Word sang PDF trong ASP.NET
- 11. Html sang PDF với chuyển đổi webkit
- 12. Có cách nào để chuyển tiếp một tài liệu PDF sang một tài liệu PDF khác bằng iTextSharp không?
- 13. Chuyển đổi base64 sang PDF trong Java
- 14. Chuyển đổi HTML sang PDF trên iOS?
- 15. Android - làm thế nào để chuyển đổi html sang pdf?
- 16. Chuyển đổi PDF sang HTML bằng Python
- 17. chuyển đổi html sang .doc bằng Python?
- 18. Làm thế nào để chuyển đổi tài liệu sang PDF trên một ngăn xếp Linux/PHP?
- 19. Chuyển đổi tài liệu Word sang PDF bằng cách sử dụng Java
- 20. Chuyển đổi PDF sang PS
- 21. Làm cách nào để chuyển đổi Tài liệu Jsoup sang Tài liệu W3C?
- 22. Chuyển đổi PDF sang hình ảnh thu nhỏ trong Java
- 23. Chuyển tài liệu tham khảo thư mục từ tài liệu sang bibtex hoặc endnote
- 24. Phần mềm Linux/Unix nào để sử dụng để chuyển đổi html hoặc pdf thành tài liệu?
- 25. Cách chuyển đổi MS doc sang pdf
- 26. Cách chuyển đổi từ markdown sang pdf
- 27. PDF sang HTML trong iPhone
- 28. Chuyển đổi bảng tính Excel sang HTML bằng thư viện Apache POI
- 29. Làm cách nào để chuyển đổi tài liệu docx sang html bằng php?
- 30. Có trình chuyển đổi Java 7 sang Java 6 không?
Tôi cũng muốn biết giải pháp cho điều này. PDFBox có thể làm như vậy (http://java.dzone.com/articles/converting-pdf-html-using?utm_source=feedburner&utm_medium=feed&utm_campaign=Feed%3A+javalobby%2Ffrontpage+%28Javalobby+%2F+Java+Zone%29), nhưng theo một cách rất hạn chế. – Alp