2008-12-11 37 views

Trả lời

2

Rõ ràng, nó không phải là một nhiệm vụ dễ dàng, định dạng PDF là phong phú hơn nhiều so với một HTML (ngoài ra bạn phải trích xuất hình ảnh và liên kết chúng, vv).
Trích xuất văn bản đơn giản đơn giản hơn nhiều (mặc dù không tầm thường ...).
Tôi thấy trong thanh bên của câu hỏi của bạn một câu hỏi tương tự: Converting PDF to HTML with Python trỏ đến thư viện (poppler, được viết bằng C++, có thể được truy cập bằng JNI/JNA) và câu hỏi liên quan mang lại nhiều câu trả lời hơn.

1

Chỉ những người tôi biết phải được thanh toán.

BFO
JPedal

Các vấn đề liên quan