2013-06-16 27 views
5

Cho một tệp PDF. Tôi có thể tìm hiểu phần mềm/thư viện nào (ví dụ: PDFBox, Adobe Acrobat, iText ...) nơi được sử dụng để tạo/chỉnh sửa nó không?Tôi có thể cho biết phần mềm nào đã tạo tệp PDF không?

+0

làm thế nào về điều này? "Http://bytescout.com/products/developer/pdfextractorsdk/extract-info-about-pdf-file – Sabilv

+1

Nếu tôi hiểu bạn câu trả lời chính xác, cách duy nhất để làm như vậy là kiểm tra dữ liệu meta Có nghĩa là, không có thông tin bổ sung nào có thể được nhúng vào tệp thực tế? – eliwallach

Trả lời

2

Bạn có thể thử mở tệp trong Adobe Đọc và xem các thuộc tính.

Bạn có thể tìm thấy điều này trong: Tệp -> Thuộc tính trong Adobe Reader sau khi bạn mở tệp pdf.

enter image description here

0

Nó thường khó xác định mà phần mềm thực sự thiết kế một PDF bởi vì hầu hết các sản phẩm Microsoft Office có thể chuyển đổi một tập tin sửa sang PDF. Bằng cách này, tôi có nghĩa là, mở một tài liệu gõ thường xuyên, bạn có tùy chọn để lưu nó dưới dạng PDF. Nếu bạn đã quen thuộc với các trang trình bày Powerpoint, có thể dễ dàng nói dựa trên thiết kế khi tệp ở dạng PDF.

Mặt khác, Adobe Acrobat có khả năng tạo tệp như các biểu mẫu ứng dụng mà chúng tôi thường tải xuống (từ trang web đại sứ quán, trang web nhập cư, v.v.).

Các phần mềm khác như Adobe Photoshop, Illustrator, v.v ... có thể lưu tệp dưới dạng PDF. Hy vọng điều này giúp đỡ.

2

Đặc tả Adobe xác định trường Nhà sản xuất (xem 'Mac OS X 10.5.6 Quartz PDFContext' trong câu trả lời của nimeshjm) như tên của ứng dụng "chuyển đổi từ định dạng khác sang PDF". Trong trường hợp tạo PDF theo lập trình, PDF không thực sự được chuyển đổi, do đó, bạn thường sẽ tìm thấy tên của SDK tạo tại đây.

Trường Người tạo có liên quan và được định nghĩa là tên của ứng dụng đã tạo tài liệu mà từ đó PDF đã được chuyển đổi. Đây thường là MS Word.

Lưu ý rằng đây là tất cả theo quy ước. Trong thực tế, bạn không thể thực sự dựa vào điều này và bạn có thể gặp phải ví dụ các trường sản xuất trống rỗng.

2

Bạn có thể có thể lấy đi mà không cần bất kỳ thư viện PDF nào cho loại thao tác này. Nó sẽ không được 100% đáng tin cậy nhưng tôi nghĩ rằng bạn có thể có thể giả định độ tin cậy 99%.

Vì vậy, ... hãy viết một số mã để mở tệp PDF của bạn dưới dạng luồng văn bản và hạ thấp xuống cho/Nhà sản xuất. Bạn sẽ tìm thấy nội dung như sau:

69 0 obj 
<< 
/Creator (PDF+Forms 2.0) 
/CreationDate (D:20010627111809) 
/Title (Demo) 
/Producer (Cardiff Software - TELEform 7.0) 
/ModDate (D:20010627111810-05'00') 
>> 

Lấy các bit giữa dấu ngoặc đơn và chú của Bob. Về mặt kỹ thuật, văn bản có thể được lưu trữ ở các định dạng khác nhưng tôi nghĩ rằng các văn bản này sẽ không phổ biến đối với loại mục nhập cụ thể này.

Nếu bạn không thể tìm thấy nội dung nào ở đây thì hãy tìm dữ liệu XMP luôn được đảm bảo ở dạng văn bản rõ ràng. Nó sẽ trông giống như thế này,

39 0 obj 
<</Subtype/XML/Length 15172/Type/Metadata>>stream 
<?xpacket begin='' id='W5M0MpCehiHzreSzNTczkc9d'?> 
<x:xmpmeta xmlns:x="adobe:ns:meta/" x:xmptk="Adobe XMP Core 4.0-c320 44.293068, Sun Jul 08 2007 18:10:11"> 
<rdf:RDF xmlns:rdf="http://www.w3.org/1999/02/22-rdf-syntax-ns#"> 
    <rdf:Description rdf:about="" 
    xmlns:dc="http://purl.org/dc/elements/1.1/" 
    xmlns:xap="http://ns.adobe.com/xap/1.0/" 
    xmlns:xapGImg="http://ns.adobe.com/xap/1.0/g/img/" 
    xmlns:xapMM="http://ns.adobe.com/xap/1.0/mm/" 
    xmlns:pdf="http://ns.adobe.com/pdf/1.3/" 
    dc:format="application/pdf" 
    xap:CreatorTool="Adobe Illustrator CS2" 
    xap:CreateDate="2006-05-04T15:53:27-07:00" 
    xap:ModifyDate="2006-05-04T15:53:27-07:00" 
    xap:MetadataDate="2006-05-04T15:53:27-07:00" 
    xapMM:DocumentID="uuid:61AC83CBC0DBDA11A32BC847EF128E34" 
    xapMM:InstanceID="uuid:cba15bf3-d7da-4a4e-a563-fc20d13e258a" 
    pdf:Producer="Adobe PDF library 7.77"> 
    <dc:title> 
    <rdf:Alt> 
    <rdf:li xml:lang="x-default">3.01 PDF components</rdf:li> 
    </rdf:Alt> 
    </dc:title> 
... 

Sự kết hợp của hai điều này sẽ thực tế luôn đúng. Nếu bạn muốn 100% reliablity thì bằng mọi cách sử dụng một thư viện PDF nhưng với nhiều mục đích thì điều này là đủ.

Trả lời của tôi có thể mô tả các khái niệm dựa trên ABCpdf. Đó là những gì tôi làm việc. Đó là những gì tôi biết. :-)

Các vấn đề liên quan