Tôi đang cố chuyển đổi PDF sang HTML theo chương trình. Cho đến nay tôi đã sử dụng pdftohtml nhưng người dùng của chúng tôi không hài lòng với kết quả.Trình chuyển đổi PDF sang HTML tốt cho Ruby on Rails là gì?
Đây là những gì tôi cần:
Tôi đang sử dụng Ruby on Rails, nhưng bất kỳ công cụ làm việc trên Unix sẽ làm việc như tôi có thể gọi nó từ dòng lệnh. Nhưng tất nhiên là một gem hay plugin đẹp sẽ là hoàn hảo.
Tôi muốn nó được mã nguồn mở
Nó cần phải có khả năng xử lý hình ảnh
Nó sẽ được tốt đẹp nếu có một tùy chọn để loại bỏ các hình ảnh nếu cần
Cần phải ổn định
Cần phải trả về html với bố cục gần với bản gốc pdf (Tôi đã thử pdftohtml và kết quả không phải là tốt trong rất nhiều trường hợp)
Có lý do cụ thể nào bạn cần đầu ra html không, chứ không phải cái gì khác? Là một trong những câu trả lời cho biết, pdf và html là các mô hình tài liệu khác nhau đáng kể. Nếu chúng ta biết yêu cầu cơ bản, chúng ta có thể đề xuất các lựa chọn thay thế tốt hơn ... – Stobor
Logic hiện tại là lấy pdf và hiển thị nó dưới dạng HTML. Có một số giải pháp đã được phát triển trong công ty của tôi, nhưng kết quả cuối cùng không tốt đến mức họ muốn cải thiện nó – marcgg