Tôi nhận được Tệp qua Tải lên HTTP và cần đảm bảo tệp PDF của tệp đó. Ngôn ngữ lập trình là Python, nhưng điều này không quan trọng.Kiểm tra xem Tệp PDF có hợp lệ không (Python)
Tôi nghĩ đến các giải pháp sau:
Kiểm tra xem các byte đầu tiên của chuỗi là "% PDF". Đây không phải là một kiểm tra tốt nhưng ngăn việc sử dụng tải lên các tệp khác một cách vô tình.
Dùng thử libmagic (lệnh "tệp" trên bash sử dụng nó). Điều này thực hiện kiểm tra chính xác giống như 1.
Đọc thư và thử đọc số trang. Nếu lib có thể đọc được một trang, nó phải là một pdf hợp lệ. Vấn đề: Tôi không biết một lib cho python mà có thể làm được điều này
Vì vậy, bất cứ ai có bất kỳ giải pháp cho một lib hoặc lừa khác?
Cảm ơn
+1 cho đơn giản. Nếu bạn chỉ muốn được khá chắc chắn những gì bạn đã có ít nhất là cố gắng để được một PDF này là cả một đơn giản và nhanh chóng. – technicalbloke