Có cách nào hợp lý để trích xuất văn bản thuần từ tệp Word không phụ thuộc vào tự động hóa COM không? (Đây là tính năng dành cho ứng dụng web được triển khai trên nền tảng không phải Windows - không thể thương lượng trong trường hợp này.)Cách tốt nhất để trích xuất văn bản từ tài liệu Word mà không cần sử dụng COM/tự động hóa?
Chống từ dường như là một lựa chọn hợp lý, nhưng có vẻ như nó có thể bị bỏ.
Một giải pháp Python sẽ là lý tưởng, nhưng dường như không có sẵn.
Lưu ý rằng python 3 loại bỏ popen3, xem https://docs.python.org/3/library/subprocess.html # replace-os-popen-os-popen2-os-popen3 – codeape