tôi đang cố gắng để đọc văn bản từ file pdf sử dụng iTextSharp sử dụng đoạn mã sau và gán vào một textbox (multiline) - (Windows Desktop App)đọc Toán Phương trình sử dụng iTextSharp
Lưu ý: Mã này hoạt động tốt .
public string ReadPdfFile(string fileName)
{
StringBuilder text = new StringBuilder();
if (File.Exists(fileName))
{
PdfReader pdfReader = new PdfReader(fileName);
for (int page = 1; page <= pdfReader.NumberOfPages; page++)
{
ITextExtractionStrategy strategy = new LocationTextExtractionStrategy();
string currentText = PdfTextExtractor.GetTextFromPage(pdfReader, page, strategy);
currentText = Encoding.UTF8.GetString(ASCIIEncoding.Convert(Encoding.Default, Encoding.UTF8, Encoding.Default.GetBytes(currentText)));
text.Append(currentText);
}
pdfReader.Close();
}
return text.ToString();
}
NHƯNG tập tin pdf của tôi có một phương trình
và tất cả tôi nhận được là sản phẩm follwing
những gì có thể được bổ sung vào đây để đạt được văn bản sau đây? Bất kỳ loại trợ giúp nào cũng sẽ được đánh giá cao!
Tôi đã bỏ phiếu tán thành câu hỏi này vì tôi thấy nó thú vị, nhưng tôi nghĩ điều này sẽ thực sự, thực sự khó khăn. Làm thế nào là pdf được tạo ra ở nơi đầu tiên? Bạn có thể chia sẻ nó? –
Bạn đang hy vọng loại đầu ra nào? Biểu thức toán học của bạn không thể được thể hiện trong Mặt phẳng đa ngôn ngữ cơ bản. – usr2564301
@amedeevangasse Vâng nó khá đơn giản. Kiểm tra phần mềm latex! Bạn cần phải kích hoạt chế độ toán học cho nó, nhập phương trình và nó cho bạn đầu ra ở định dạng pdf. –