Tôi không thể phát hiện trang trống trong tệp pdf. Tôi đã tìm kiếm trên internet cho nó nhưng không thể tìm thấy một giải pháp tốt.Cách tìm Trang trống trong tệp pdf
Sử dụng Itextsharp Tôi đã thử với kích thước trang, Xobjects. Nhưng họ không cho kết quả chính xác.
tôi đã cố gắng
if(xobjects==null || textcontent==null || size <20 bytes)
then "blank"
else
not blank
Nhưng thời gian tối đa nó sẽ trả về câu trả lời sai. Tôi đã sử dụng iTextSharp
Mã này nằm dưới ... Tôi đang sử dụng iTextSharp Librabry
Đối xobjects
PdfDictionary xobjects = resourceDic.GetAsDict(PdfName.XOBJECT);
//here resourceDic is PdfDictionary type
//I know that if Xobjects is null then page is blank. But sometimes blank page gives xobjects which is not null.
Đối contentstream
RandomAccessFileOrArray f = reader.SafeFile;
//here reader = new PdfReader(filename);
byte[] contentBytes = reader.GetPageContent(pageNum, f);
//I have measured the size of contentbytes but sometimes it gives more than 20 bytes for blank page
Đối textContent
String extractedText = PdfTextExtractor.GetTextFromPage(reader, pageNum, new LocationTextExtractionStrategy());
// sometimes blank page give a text more than 20 char length .
Bạn thấy gì trên trang mà bạn biết để trống? (Chỉnh sửa chi tiết này vào câu trả lời của bạn, thay vì phụ thêm chi tiết đáng kể trong các ý kiến). – halfer
@halfer xem ngay bây giờ. –
Đó là một câu hỏi hay. Tôi không biết câu trả lời, vì trước đây tôi chưa thực hiện bất kỳ phân tích cú pháp PDF nào. Bạn đã phân tích ba loại đối tượng đó để xem các trang trống có điểm chung nào không? Ví dụ: nội dung văn bản nào thực sự xuất hiện trên một trang trống? – halfer