Tôi thấy rằng có một công cụ chuyển đổi được gọi là WordToHtmlConverter
nhưng phương pháp xử lý không được hiển thị. Làm cách nào để chuyển một tệp tài liệu và nhận tệp HTML (hoặc OutputStream
)?Chuyển đổi Word sang HTML với Apache POI
Trả lời
Mã này hiện đang hoạt động cho tôi!
HWPFDocumentCore wordDocument = WordToHtmlUtils.loadDoc(new FileInputStream("D:\\temp\\seo\\1.doc"));
WordToHtmlConverter wordToHtmlConverter = new WordToHtmlConverter(
DocumentBuilderFactory.newInstance().newDocumentBuilder()
.newDocument());
wordToHtmlConverter.processDocument(wordDocument);
Document htmlDocument = wordToHtmlConverter.getDocument();
ByteArrayOutputStream out = new ByteArrayOutputStream();
DOMSource domSource = new DOMSource(htmlDocument);
StreamResult streamResult = new StreamResult(out);
TransformerFactory tf = TransformerFactory.newInstance();
Transformer serializer = tf.newTransformer();
serializer.setOutputProperty(OutputKeys.ENCODING, "UTF-8");
serializer.setOutputProperty(OutputKeys.INDENT, "yes");
serializer.setOutputProperty(OutputKeys.METHOD, "html");
serializer.transform(domSource, streamResult);
out.close();
String result = new String(out.toByteArray());
System.out.println(result);
Tôi có thể nhận được toàn bộ mã cho nó không ..? –
Cảm ơn bạn Ron. Đề nghị của bạn đã cứu tôi. Tôi đã thử mẫu được cung cấp nhưng nó bỏ qua hình ảnh, bảng và nội dung bên trong Sơ đồ (như hộp). Có cách nào để trích xuất điều đó nữa không. Tôi thấy vài ví dụ để trích xuất hình ảnh một mình một cách riêng biệt. Có cách nào để có được tất cả cùng nhau. Nếu không, chúng ta có thể đặt những hình ảnh, bảng giống như chính xác ở vị trí của tập tin gốc. Có nghĩa là đáp ứng yêu cầu "hiển thị tệp doc dưới dạng nội dung HTML" (không bỏ qua hình ảnh, bảng, sơ đồ, v.v.) –
- 1. Chuyển đổi bảng tính Excel sang HTML bằng thư viện Apache POI
- 2. Chuyển csv sang xls/xlsx bằng Apache poi?
- 3. Có thể phân tích MS Word bằng Apache POI và chuyển đổi nó thành XML không?
- 4. Apache POI HWPF - sự cố khi chuyển đổi tệp doc sang pdf
- 5. Html sang PDF với chuyển đổi webkit
- 6. chuyển đổi html sang .doc bằng Python?
- 7. Chuyển đổi PartialView sang HTML
- 8. Chuyển đổi HTML sang PDF
- 9. Chuyển đổi PDF sang HTML bằng Python
- 10. chuyển đổi html sang javascript
- 11. Chuyển đổi Html sang RTF
- 12. Chuyển đổi TeX sang html
- 13. Chuyển đổi PDF sang HTML
- 14. Chuyển đổi HTML sang XAML
- 15. Chuyển đổi HTML sang XML
- 16. Chuyển đổi Gtk sang html
- 17. Đang cố gắng chuyển Apache POI tới Android
- 18. Chuyển đổi PDF sang Word chất lượng cao bằng PHP?
- 19. Chuyển đổi Word docx sang Excel bằng OpenXML
- 20. Chuyển đổi tài liệu MS Word sang PDF trong ASP.NET
- 21. Làm mới Bảng Pivot với Apache POI
- 22. Nhập dữ liệu CSV với Apache POI
- 23. Chuyển đổi HTML sang RTF cho .NET
- 24. Chuyển đổi HTML sang odt, doc, docx
- 25. Chuyển đổi HTML + JavaScript sang exe
- 26. Apache POI - Vấn đề đầu ra Docx
- 27. C# chuyển đổi pdf sang html
- 28. Chuyển đổi .doc sang html trong php
- 29. Rails: Chuyển đổi HTML sang PDF?
- 30. Sử dụng Apache Poi để phân tích bảng trong bảng trong tài liệu word
đây có phải là điều bạn yêu cầu không? http://stackoverflow.com/questions/227236/convert-word-doc-to-html-programmatically-in-java – enrique2334
Nó không ... Trong Apache POI họ có một lớp mới trong gói org.apache.poi .hwpf.converter để xử lý điều đó ... nhưng không thể tìm thấy bất kỳ hướng dẫn nào về cách sử dụng chúng. – Ron