2009-02-28 16 views

Trả lời

13

Ví dụ và mã mẫu trên trang web của apache khá tốt. Tôi khuyên bạn nên bắt đầu ở đó.

http://poi.apache.org/hwpf/quick-guide.html

Để có được bit cụ thể của văn bản, đầu tiên tạo ra một org.apache.poi.hwpf.HWPFDocument. Lấy phạm vi bằng getRange(), sau đó lấy đoạn văn từ đó. Sau đó, bạn có thể nhận được văn bản và các thuộc tính khác.

Here để biết ví dụ về cách trích xuất hình ảnh. Here cho bản sửa đổi mới nhất kể từ khi viết bài này.

Và tất nhiên, Javadocs

Lưu ý rằng, theo trang web của POI,

HWPF vẫn đang được phát triển sớm.

1

Nó không phải miễn phí (hoặc thậm chí rẻ!) Nhưng Aspose.Words sẽ có thể làm được điều này. Tải xuống đánh giá của họ sẽ cho phép bạn chơi với các tệp nhỏ.

Tệp đích có phải là Tài liệu không? Bạn có thể mở tài liệu trong Office và lưu chúng dưới dạng HTML. Sau đó, việc chia tách trở nên tầm thường. RTF cũng là một lựa chọn khả thi, nhưng tôi không thể đề xuất một trình phân tích cú pháp RTF tốt trên đỉnh đầu của tôi.

Chỉnh sửa để nói: Tôi vừa nhớ một giải pháp khả thi khác: Jacob, nhưng bạn sẽ cần một phiên bản Office chạy trên cùng một máy. Nó ngắn cho Java COM Bridge và nó cho phép bạn thực hiện cuộc gọi đến các thư viện COM trong Office để thao tác các tài liệu. Tôi chắc chắn nó không đáng sợ như nó có thể âm thanh!

Các vấn đề liên quan