2010-11-19 46 views
9

Tôi đang sử dụng pisa, một thư viện chuyển đổi HTML sang PDF cho Python.chuyển đổi html sang .doc bằng Python?

Có tồn tại cùng một thứ cho tài liệu Word không: thư viện chuyển đổi HTML sang .doc cho Python?

+0

Tại sao bạn sẽ muốn điều này? MS Word có thể đọc HTML. – MSalters

+0

Tôi có cùng một vấn đề: Tôi có một html sử dụng pisa để chuyển đổi sang pdf và tôi muốn làm điều tương tự với từ. của nó một tài liệu lớn, ~ 20 trang, sử dụng cùng một đoạn mã để tạo ra html và sau đó xuất khẩu qua pisa hoặc cái gì khác sẽ là tuyệt vời. –

+0

@Eric: Gần đây, tôi có cùng một vấn đề. Chỉ cần tự hỏi, bạn đã tìm thấy một giải pháp để chuyển đổi HTML sang Word .docx? Cảm ơn. –

Trả lời

3

Mặc dù tôi không nhận thức của một mô-đun trực tiếp mà có thể cho phép bạn chuyển đổi này, tuy nhiên:

  1. Bạn có thể chuyển đổi HTML-đồng bằng văn bản đầu tiên sử dụng mô-đun html2text.
  2. Sau đó, bạn có thể sử dụng mô-đun python-docx này để chuyển đổi văn bản thành tệp doc hoặc docx.
9

Bạn có thể sử dụng win32com từ các tiện ích mở rộng python pywin32 cho cửa sổ, để cho MS Word chuyển đổi nó cho bạn. Một ví dụ đơn giản:

import win32com.client 

word = win32com.client.Dispatch('Word.Application') 

doc = word.Documents.Add('example.html') 
doc.SaveAs('example.doc', FileFormat=0) 
doc.Close() 

word.Quit()