thể trùng lặp:
Tool to compare large numbers of PDF files?Cách đáng tin cậy để (lập trình) so sánh các tệp PDF?
Tôi đang trong kịch bản cổ điển mà các doanh nghiệp cung cấp cho bạn một loạt các dạng pdf mới cho năm mới không có sửa đổi ghi nhận nào và bạn được cho là để tìm ra những gì khác với những năm trước.
Tôi đang nói nhiều biểu mẫu ở đây, vì vậy tôi đang cố gắng tìm cách so sánh các tệp PDF để phác thảo các khác biệt mà không cần mọi người tự duyệt qua từng và từng mẫu.
Ý tưởng của tôi là trích xuất tất cả văn bản từ tệp PDF và đổ nó vào tệp .txt rồi chạy sự khác biệt trên tệp văn bản, nhưng nghe có vẻ khủng khiếp.
Câu hỏi của tôi nói theo lập trình, nhưng tôi sẽ hài lòng với bất kỳ công cụ đáng tin cậy nào để so sánh các tệp PDF và chủ yếu tìm cách lấy ý tưởng từ trải nghiệm của mọi người. Cũng sẵn sàng giải trí mọi giải pháp có lập trình (tốt nhất là trong C# nhưng xin hãy chụp bất kỳ ý tưởng nào).
Tại sao bản sao này lại trùng lặp? rõ ràng câu hỏi được đặt ra là làm thế nào để làm điều đó theo chương trình. Bất kỳ số lượng công cụ có thể cài đặt nào không phải là câu trả lời cho câu hỏi này. – Vin