Trong chương trình của tôi, tôi có một chuỗi (thu được từ thư viện bên ngoài) không khớp với bất kỳ cụm từ thông dụng nào.string.matches (". *") Trả về false
String content = // extract text from PDF
assertTrue(content.matches(".*")); // fails
assertTrue(content.contains("S P E C I A L")); // passes
assertTrue(content.matches("S P E C I A L")); // fails
Bất kỳ ý tưởng nào có thể sai? Khi tôi in content
để stdout, có vẻ ok.
Đây là đoạn mã để trích xuất văn bản từ PDF (Tôi đang sử dụng iText 5.0.1):
PdfReader reader = new PdfReader(source);
PdfTextExtractor extractor = new PdfTextExtractor(reader,
new SimpleTextExtractingPdfContentRenderListener());
return extractor.getTextFromPage(1);
được đánh dấu là yêu thích vì đây không phải là lần đầu tiên tôi bị trúng bom java như vậy. –