2013-10-15 22 views
11

Tôi muốn tạo tài liệu PDF động bằng HTML và hình ảnh động. Mã của tôi hoạt động tốt với HTML chuẩn và đường dẫn đầy đủ cho hình ảnh, nhưng khi tôi cố gắng nhúng nội dòng hình ảnh vào tài liệu tôi nhận được lỗiItextsharp.xmlworker có thể hiển thị hình ảnh được nhúng không?

Chi tiết ngoại lệ: System.IO.IOException: Tài liệu không có trang .

Có cách nào để nhúng hình ảnh mà không có cuộc gọi HTTP cho mỗi hình ảnh không? Tôi không muốn điều đó bởi vì tôi nghĩ rằng nó sẽ gây ra vấn đề khả năng mở rộng và hình ảnh nhạy cảm.

Đây là mã của tôi cung cấp cho các IOException:

public ActionResult MakePdf() 
    { 
     string html = @"<?xml version=""1.0"" encoding=""UTF-8""?> 
      <!DOCTYPE html 
       PUBLIC ""-//W3C//DTD XHTML 1.0 Strict//EN"" 
       ""http://www.w3.org/TR/xhtml1/DTD/xhtml1-strict.dtd""> 
      <html xmlns=""http://www.w3.org/1999/xhtml"" xml:lang=""en"" lang=""en""> 
       <head> 
        <title>Minimal XHTML 1.0 Document with W3C DTD</title> 
       </head> 
       <body><img src='' width='62' height='80' style='float: left; margin-right: 28px;' /></body></html>"; 

     var bytes = Encoding.UTF8.GetBytes(html); 

     using (MemoryStream input = new MemoryStream(bytes)) 
     { 
      MemoryStream output = new MemoryStream(); 
      using (Document document = new Document(PageSize.LETTER, 50, 50, 50, 50)) 
      { 
       using (PdfWriter writer = PdfWriter.GetInstance(document, output)) 
       { 
        writer.CloseStream = false; 
        document.Open(); 

        XMLWorkerHelper xmlWorker = XMLWorkerHelper.GetInstance(); 
        xmlWorker.ParseXHtml(writer, document, input, null); 
        document.Close(); 
        output.Position = 0; 

        return new FileStreamResult(output, "application/pdf"); 
       } 
      } 
     } 
    } 

Trả lời

21

Chúng tôi cần phải viết ImageTagProcessor riêng của chúng tôi để hỗ trợ xử lý các cơ sở 64 hình ảnh:

public class CustomImageTagProcessor : iTextSharp.tool.xml.html.Image 
{ 
    public override IList<IElement> End(IWorkerContext ctx, Tag tag, IList<IElement> currentContent) 
    { 
     IDictionary<string, string> attributes = tag.Attributes; 
     string src; 
     if (!attributes.TryGetValue(HTML.Attribute.SRC, out src)) 
      return new List<IElement>(1); 

     if (string.IsNullOrEmpty(src)) 
      return new List<IElement>(1); 

     if (src.StartsWith("data:image/", StringComparison.InvariantCultureIgnoreCase)) 
     { 
      // data:[<MIME-type>][;charset=<encoding>][;base64],<data> 
      var base64Data = src.Substring(src.IndexOf(",") + 1); 
      var imagedata = Convert.FromBase64String(base64Data); 
      var image = iTextSharp.text.Image.GetInstance(imagedata); 

      var list = new List<IElement>(); 
      var htmlPipelineContext = GetHtmlPipelineContext(ctx); 
      list.Add(GetCssAppliers().Apply(new Chunk((iTextSharp.text.Image)GetCssAppliers().Apply(image, tag, htmlPipelineContext), 0, 0, true), tag, htmlPipelineContext)); 
      return list; 
     } 
     else 
     { 
      return base.End(ctx, tag, currentContent); 
     } 
    } 
} 

Sau đó chúng ta có thể tiêm vi xử lý mới này vào HtmlPipelineContext:

 using (var doc = new Document(PageSize.A4)) 
     { 
      var writer = PdfWriter.GetInstance(doc, new FileStream("test.pdf", FileMode.Create)); 
      doc.Open(); 
      var html = @"<img src='' width='62' height='80' style='float: left; margin-right: 28px;' />"; 

      var tagProcessors = (DefaultTagProcessorFactory)Tags.GetHtmlTagProcessorFactory(); 
      tagProcessors.RemoveProcessor(HTML.Tag.IMG); // remove the default processor 
      tagProcessors.AddProcessor(HTML.Tag.IMG, new CustomImageTagProcessor()); // use our new processor 

      CssFilesImpl cssFiles = new CssFilesImpl(); 
      cssFiles.Add(XMLWorkerHelper.GetInstance().GetDefaultCSS()); 
      var cssResolver = new StyleAttrCSSResolver(cssFiles); 
      cssResolver.AddCss(@"code { padding: 2px 4px; }", "utf-8", true); 
      var charset = Encoding.UTF8; 
      var hpc = new HtmlPipelineContext(new CssAppliersImpl(new XMLWorkerFontProvider())); 
      hpc.SetAcceptUnknown(true).AutoBookmark(true).SetTagFactory(tagProcessors); // inject the tagProcessors 
      var htmlPipeline = new HtmlPipeline(hpc, new PdfWriterPipeline(doc, writer)); 
      var pipeline = new CssResolverPipeline(cssResolver, htmlPipeline); 
      var worker = new XMLWorker(pipeline, true); 
      var xmlParser = new XMLParser(true, worker, charset); 
      xmlParser.Parse(new StringReader(html)); 
     } 
     Process.Start("test.pdf"); 
+2

Làm tốt lắm! Tôi đã cố gắng để có được một 'IImageProvider' tùy chỉnh để làm việc nhưng không bao giờ nghĩ thử một thẻ' img' tùy chỉnh! –

+1

Tuyệt vời! Tôi đã đọc về điều này vào sáng nay http://demo.itextsupport.com/xmlworker/itextdoc/flatsite.html nhưng chưa bắt đầu triển khai. Cảm ơn đã phản ứng nhanh chóng! –

+0

Ví dụ về Gread. Nhưng mã hoạt động tốt nhưng trong Acrobat Reader, trang đầu tiên không được hiển thị chính xác. Văn bản không được hiển thị. Có bất kỳ vấn đề đã biết với điều này? – dixus

0
  string originalFile = "Original1.pdf"; 
      string copyOfOriginal = "Re-copia.pdf"; 

      byte[] bytes = Convert.FromBase64String(archivo); 

      System.IO.FileStream stream = new FileStream(originalFile, FileMode.CreateNew); 
      System.IO.BinaryWriter writer = new BinaryWriter(stream); 
      writer.Write(bytes, 0, bytes.Length); 
      writer.Close(); 

      PdfReader reader1 = new PdfReader(originalFile); 
      using (FileStream fs = new FileStream(copyOfOriginal, FileMode.Create, FileAccess.Write, FileShare.None)) 
      // Creating iTextSharp.text.pdf.PdfStamper object to write 
      // Data from iTextSharp.text.pdf.PdfReader object to FileStream object 
      using (PdfStamper stamper = new PdfStamper(reader1, fs)) 
      { 

       int pageCount = reader1.NumberOfPages; 

       // Create New Layer for Watermark 
       PdfLayer layer = new PdfLayer("WatermarkLayer", stamper.Writer); 
       // Loop through each Page 
       for (int i = pageCount; i <= pageCount; i++) 
       { 
        // Getting the Page Size 
        Rectangle rect = reader1.GetPageSize(i); 



        // Get the ContentByte object 
        PdfContentByte cb = stamper.GetUnderContent(i); 

        // Tell the cb that the next commands should be "bound" to this new layer 
        cb.BeginLayer(layer); 
        cb.SetFontAndSize(BaseFont.CreateFont(BaseFont.HELVETICA, BaseFont.CP1252, BaseFont.NOT_EMBEDDED), 50); 

        PdfGState gState = new PdfGState(); 
        cb.SetGState(gState); 


        string codbartest = codBarras; 
        BarcodePDF417 bcpdf417 = new BarcodePDF417(); 
        //Asigna el código de barras en base64 a la propiedad text del objeto.. 
        bcpdf417.Text = ASCIIEncoding.ASCII.GetBytes(codbartest); 
        Image imgpdf417 = bcpdf417.GetImage(); 
        imgpdf417.SetAbsolutePosition(50, 50); 
        imgpdf417.ScalePercent(100); 
        cb.AddImage(imgpdf417); 
        // Close the layer 
        cb.EndLayer(); 
       }[enter image description here][1] 
+0

câu trả lời của bạn hoàn toàn bỏ qua rằng op đang hỏi về điều này trong trường hợp sử dụng html-to-pdf ... – mkl

Các vấn đề liên quan