Bạn có thể sử dụng Docotic.Pdf library để tìm kiếm văn bản trong các tập tin PDF.
Tiếp theo mẫu cho thấy làm thế nào để tìm chuỗi xác định trong một tập tin PDF và số trang tương ứng:
static void searchForTextStrings()
{
string path = "";
string[] stringsToFind = new string[] { };
using (PdfDocument pdf = new PdfDocument(path))
{
for (int i = 0; i < pdf.Pages.Count; i++)
{
string pageText = pdf.Pages[i].GetText();
foreach (string s in stringsToFind)
{
int index = pageText.IndexOf(s, 0, StringComparison.CurrentCultureIgnoreCase);
if (index != -1)
Console.WriteLine("'{0}' found on page {1}", s, i);
}
}
}
}
Một tìm kiếm case-sensitive có thể được thực hiện nếu bạn loại bỏ số thứ ba của phương pháp IndexOf.
Tuyên bố từ chối trách nhiệm: Tôi làm việc cho Bit Miracle, nhà cung cấp thư viện.
Cảm ơn bạn đã nhập mã! Tuy nhiên, mẫu này cần cài đặt Adobe Professional. Vì lý do bản quyền, tôi muốn có một thành phần để làm điều này. – splattne