2010-05-07 24 views
5

Chúng tôi đang sử dụng lucene trong một ứng dụng web để tìm kiếm trong một số lượng lớn các tài liệu PDF.Cách tìm kiếm PDF trong Acrobat Reader VÀ chuyển đến một trang nhất định thông qua tham số?

Các công việc là như thế này:

  1. Một người dùng nhập vào cụm từ tìm kiếm

  2. Một danh sách các kết quả tìm kiếm được trình bày cho người dùng.

  3. Mỗi kết quả tìm kiếm đại diện cho một tài liệu PDF và hiển thị cho người dùng trên trang mà cụm từ tìm kiếm được tìm thấy. Mỗi trang trong số này được thể hiện dưới dạng siêu liên kết.

  4. Nếu giờ đây người dùng nhấp vào liên kết như vậy, anh ấy sẽ chuyển trực tiếp đến trang đó.

  5. Nhưng giờ đây, người dùng gặp vấn đề với cụm từ tìm kiếm không được đánh dấu trên trang. Do đó người dùng phải tự tìm kiếm để tìm cụm từ tìm kiếm trên trang.

Điều chúng tôi muốn là cách đánh dấu cụm từ tìm kiếm trên trang cụ thể trong PDF.

open parameters cho Acrobat Reader cho phép tìm kiếm tài liệu PDF (có đánh dấu nhấn) HOẶC nhảy tới một trang cụ thể. Nhưng sự kết hợp của cả hai tham số - mà chúng ta sẽ cần - không hoạt động.

Có ai có ý tưởng về cách nhảy tới một trang và đánh dấu cụm từ tìm kiếm trong tài liệu PDF có thể hoạt động không? Tôi đã xem xét Acrobat SDK nhưng không thấy cách chúng ta có thể sử dụng nó (nó được ghi lại một cách khủng khiếp).

Trả lời

0

Xin lỗi có thể không phải là một câu trả lời, nhưng một workaround có thể là để bí mật PDF sang HTML và sử dụng Lucene highlighter (tương tự như những gì Google làm)

0

Bạn sẽ phải viết một đoạn Javascript để có được hành vi bạn đang tìm kiếm.

2

acrobat sử dụng plugin để tìm kiếm các thuật ngữ hilite và yêu cầu luồng fdf để biểu thị các từ hilite. Xem ở đây để con trỏ:

support.dtsearch.com/dts0152.htm

update:

giả sử bạn biết trang # và lời # trên trang để hilight, đây là một cách để làm nó:

trên trang web:

<iframe id="acroframe" src="pdfpage/example.pdf#xml=http://example.com/hilite.aspx?hilite=8e3302ee-ff88-41ee-bdfb-9e8df87cc3ad&toolbar=1&navpanes=0&statusbar=0&view=FitH"> 
</iframe> 

PDF sẽ xuất hiện trong khung hình, nó sẽ hiển thị thanh công cụ, ẩn navpane & thanh trạng thái và vừa với trang ngang. Sau đó, nó sẽ truy vấn trang web để lấy dữ liệu xfdf cho hilighting: http://example.com/hilite.aspx?hilite=8e3302ee-ff88-41ee-bdfb-9e8df87cc3ad

Ở đây tôi đã sử dụng khóa guid mà trước đó tôi đã lưu trong phiên với giá trị xfdf hilite. Hilite.aspx trang sẽ trở lại giống như sau để hilite từ trong tài liệu:

<XML> 
<Body units=characters color=#ff00ff mode=active version=2> 
<Highlight> 
<loc pg=15 pos=3583 len=5> 
</Highlight> 
</Body> 
</XML> 

này sẽ hilight 5 ký tự trên trang 15 bắt đầu từ vị trí 3583. (lưu ý: xfdf không là có thật "XML" bất chấp sự giống nhau)

Lưu ý rằng trình đọc Acrobat sẽ phải có tùy chọn "Bật tìm kiếm nổi bật từ máy chủ đánh dấu bên ngoài" tùy chọn đã đăng ký.

Các vấn đề liên quan