Có cách nào để xác định loại tệp PDF: nếu tệp PDF hiện có là hình ảnh được quét hoặc nếu tệp được tạo từ tệp dữ liệu bằng iTextSharp và C#?cách xác định loại tệp PDF bằng cách sử dụng iTextSharp
Trả lời
Document Properties/Advanced/Pdf Nhà sản xuất
bạn có thể xây dựng được không? Một mẫu mã có lẽ ... – ESB
có lẽ bạn có thể thêm một số siêu dữ liệu để PDF mà bạn tạo ra với iTextSharp.
Tôi không tạo ra chúng - Tôi nhận được hàng tấn chúng trong thư mục của tôi và cần xác định rằng không cần mở mỗi pdf – ESB
Tôi chỉ cần thực hiện phương pháp này để thay thế các nhà sản xuất PDF sau khi tìm kiếm nơi ngay trong cửa sổ đồng hồ của đối tượng PdfWriter, nó thay đổi "PDF Creator" trong PDF vì nó là không thể truy cập bằng cách mặc định :
private static void ReplacePdfCreator(PdfWriter writer)
{
/*
Warning
*
This is not an option offered as is and i had to workaround it by using Reflection and change it
manually.
*
Alejandro
*/
Type writerType = writer.GetType();
PropertyInfo writerProperty =
writerType.GetProperties(BindingFlags.NonPublic | BindingFlags.Static | BindingFlags.Instance)
.FirstOrDefault(p => p.PropertyType == typeof(PdfDocument));
if (writerProperty != null)
{
PdfDocument pd = (PdfDocument)writerProperty.GetValue(writer);
Type pdType = pd.GetType();
FieldInfo infoProperty =
pdType.GetFields(BindingFlags.NonPublic | BindingFlags.Static | BindingFlags.Instance)
.FirstOrDefault(p => p.Name == "info");
if (infoProperty != null)
{
PdfDocument.PdfInfo pdfInfo = (PdfDocument.PdfInfo)infoProperty.GetValue(pd);
if (pdfInfo != null)
{
string creator = pdfInfo.GetAsString(new PdfName("Producer")).ToLowerInvariant();
if(creator.Contains("itextsharp"))
{
// created with itext sharp
}
else if(creator.Contains("adobe"))
{
// created with adobe something (distiller, photoshop, whatever)
}
else if(creator.Contains("pdfpro"))
{
// created with pdf pro
}
else if(add your own comparison here, for example a scanner manufacturer software like HP's one)
{
}
}
}
}
}
- 1. Cách xác định vị trí của bảng trong tệp pdf bằng iTextsharp trong C#
- 2. Tạo pdf phù hợp PDF/A chỉ với hình ảnh bằng cách sử dụng iTextSharp
- 3. Cần trợ giúp về việc tạo tệp PDF từ HTML bằng cách sử dụng itextsharp
- 4. Thêm tệp PDF hiện có từ tệp vào tài liệu không được sử dụng bằng cách sử dụng iTextSharp
- 5. iTextSharp cho PDF - cách thêm tệp đính kèm?
- 6. Tải tệp lên: Cách loại trừ loại MIME bằng cách sử dụng xác nhận?
- 7. Cách xác định tệp PDF cần OCR?
- 8. Cách chuyển đổi PDF sang tệp văn bản trong iTextSharp
- 9. Chèn trang vào tệp PDF hiện có bằng itextsharp
- 10. cách đọc tệp pdf bằng cách sử dụng lisp
- 11. Khóa PDF để chỉnh sửa bằng iTextSharp
- 12. Thêm đầu trang và chân trang cho PDF bằng cách sử dụng iTextsharp
- 13. Làm thế nào để tính toán kích thước hình ảnh chính xác trong pdf bằng cách sử dụng itextsharp?
- 14. Có cách nào để thay thế văn bản trong tệp PDF bằng itextsharp không?
- 15. Đọc tệp PDF bằng cách sử dụng javascript
- 16. Tìm kiếm từ cụ thể bằng PDF bằng Itextsharp
- 17. Đọc pdf bằng cách sử dụng iText
- 18. Thêm bảng vào PDF sẵn có sử dụng iTextSharp
- 19. Xoay PDF trong C# bằng iTextSharp
- 20. Làm cách nào để xóa lề trên mặc định trên tài liệu pdf bằng itextsharp?
- 21. Xác định loại tệp bằng C#
- 22. Xóa các đối tượng vô hình PDF bằng iTextSharp
- 23. Tham gia nhiều tệp PDF vào một trang PDF được định vị tham gia bằng cách sử dụng PHP
- 24. Xác định khoảng cách bằng cách sử dụng mapkit
- 25. PDF Kết hợp với iTextSharp
- 26. Thêm ảnh bằng pdf bằng cách sử dụng Prawn
- 27. Cách tìm Trang trống trong tệp pdf
- 28. Đặt lề trang bằng iTextSharp
- 29. Làm cách nào để xác định tuổi của tệp bằng cách sử dụng PHP?
- 30. Có thể lấy các yếu tố cấu trúc từ một tệp PDF bằng iTextSharp không?
Tiêu chí của bạn là gì? Làm cách nào để phân biệt giữa các tệp PDF từ máy quét và loại tài liệu khác của bạn? Có phải số lượng ký tự được in không? Có phải số lượng diện tích trang được bao phủ bởi hình ảnh không? Có phải tên chương trình đã tạo tệp PDF không? iTextSharp có thể giúp bạn xác định các giá trị như vậy nhưng bạn phải đưa ra các tiêu chí trước. – mkl
"Làm thế nào để bạn phân biệt giữa các tệp PDF từ máy quét ..." - bạn thậm chí không thể chọn văn bản – ESB
Hhmmm, đó không nhất thiết phải là trường hợp. Có các giải pháp quét làm một số OCR bổ sung và sau đó làm phong phú thêm các tệp PDF được quét bằng văn bản ẩn nhưng có thể chọn. Và mặt khác, thật dễ dàng để tạo * một tệp PDF * từ một tệp dữ liệu bằng iTextSharp và C# * mà không có bất kỳ văn bản có thể chọn nào. Vì vậy, tôi có thể giải thích câu hỏi của bạn để bạn thực sự muốn phân biệt giữa các tệp PDF với văn bản có thể chọn và những tệp không có? – mkl