2010-07-07 94 views
39

Tôi đã googled (không có bất kỳ may mắn nào) cho open source software that can convert doc, ppt, and pdf to HTML5. (Chính xác những gì Scribd làm) Có tương đương nguồn mở với loại chuyển đổi Scribd không?Chuyển đổi pdf, doc, ppt sang html5

Nếu có ai biết về dịch vụ phải trả tiền, điều đó cũng sẽ hoạt động. Scribd có một API, nhưng đó là để sử dụng với trình xem flash. Ngoài ra, tôi muốn lưu trữ nội dung của riêng mình khi tôi cần kiểm soát thêm tài liệu html được chuyển đổi.

+0

Xin chào! Bất kỳ may mắn với điều này? –

Trả lời

1

http://wvware.sourceforge.net/

wvHtml: chuyển đổi tài liệu Word của bạn vào HTML4.0.

Có thể: http://www.abisource.com/ nhưng trong trường hợp này có vẻ như "doc mở"> "xuất khẩu html" bằng tay, có thể bổ sung giúp đỡ. Bạn không chắc chắn, ý của bạn là gì: "phần mềm nguồn có thể chuyển đổi".

Hoặc này: http://www.zope.org/Members/sf/NuxDocument

Ngoài ra pdftohtml sẽ cung cấp cho bạn một trang html output.But bạn sẽ phải làm việc trên interface.Since đồ họa của nó không có vẻ là rất tương tác.

15

Bạn không thể tìm thấy một phiếu mua hàng duy nhất thực hiện tất cả điều này, đặc biệt là trong thế giới nguồn mở. Nó có nhiều khả năng là bạn sẽ kết thúc dựa vào một mishmash của sự vật, và thậm chí có thể cần phải chuỗi một số chuyển đổi để có được HTML. (Ví dụ: PDF -> ps -> HTML)

OpenOffice hỗ trợ chuyển đổi thành HTML và có thể được gọi từ dòng lệnh.

http://pdftohtml.sourceforge.net/ có vẻ hợp lý khi chuyển đổi pdf sang html.

Đối với Tài liệu có định dạng Word ML hoặc OpenXML, bạn có thể hiểu rằng bạn có thể sử dụng các phép biến đổi XSLT vì cả hai định dạng đầu vào và đầu ra là XML. Tôi đã nhìn thấy một số stylesheets nổi xung quanh mạng mà làm điều này, nhưng YMMV.

Ngẫu nhiên, tại sao có yêu cầu cụ thể đối với nguồn mở? MS Powerpoint đã hỗ trợ save-as-HTML chẳng hạn.

+1

+1 cho OpenOffice – vladr

+0

phiên bản cũ của powerpoint được sử dụng để xuất một loạt hình ảnh cho nội dung như pdf sang html. Điều này có thể đã thay đổi vì tôi đã không thử nó trong một thời gian. –

+0

Pdftohtml chỉ đơn giản là cung cấp cho một đầu ra trang html duy nhất nhưng trông không phải là rất nice.as đầu ra phức tạp cho đầu ra html tốt đẹp nhưng sau đó nó tạo ra tài liệu html riêng biệt cho mỗi trang trong pdf.Đó có thể không khả thi cho số lượng lớn các tập tin pdf. – Daenarys

5

Open Office sẽ chuyển đổi pdf sang html nhưng bạn sẽ bị ảnh hưởng đến chất lượng thiết kế.

Tôi đề nghị một trong hai: Crocodoc như một dịch vụ thanh toán (Nó cung cấp hương vị khác nhau cho các nền tảng khác nhau như Python, Ruby, Java, phát triển PHP được phép làm việc trên API của họ.) Hoặc chờ đợi một công cụ chính thức của Adobe (nó đang hoạt động).

+3

Crocodoc là miễn phí ngay bây giờ :) – Viral

+0

cảm ơn cho các bản cập nhật –

1

Đối pdf có là một dự án mã nguồn mở bắt đầu bởi mozilla và nó rất tốt: https://github.com/mozilla/pdf.js/

Bạn có thể thấy một ví dụ hello world: https://github.com/mozilla/pdf.js/tree/master/examples/helloworld

Đối với phần còn lại của các loại tài liệu tôi nghĩ LibreOffice nói rằng là lập kế hoạch để xây dựng một cái gì đó trong html5, nhưng cho đến nay không có bất cứ điều gì được thực hiện.

-1

Tôi biết câu hỏi là hơi cũ tuy nhiên tôi đã tìm thấy công cụ mã nguồn mở mới gọi là flaxpaper http://flexpaper.devaldi.com/

+0

ok nó WS mã nguồn mở bây giờ họ tính phí cho dịch vụ. mọi thứ đã thay đổi qua nhiều năm –

Các vấn đề liên quan