2010-02-27 38 views
5

Tôi đang lập chỉ mục danh sách liên kết, các liên kết này cập nhật khá thường xuyên vì vậy tôi đang tự động hóa hình thu nhỏ cho các trang web.Cạo "xem trước" trang web - Python

Đối với hầu hết các trang web thật dễ dàng, như tôi chỉ cần lấy hình ảnh lớn nhất trên trang hy vọng nó mô tả nội dung.

Nhưng thời điểm khác có video như nội dung chính của trang.


Ai đó có mẹo để giải quyết vấn đề này? Đó sẽ là tuyệt vời!


Về việc sử dụng Webkit để tạo ra ảnh chụp màn hình tôi found this

Trả lời

3

wkhtmltopdf sử dụng một bản sao nhúng của WebKit engine render (sử dụng trong Safari, Chrome vv) để lưu một trang web sang PDF, bao gồm tất cả hình ảnh (không có video Flash mặc dù tôi đoán). Đó có thể là điểm khởi đầu cho hình thu nhỏ chính xác hơn nhiều.

+0

+1 điểm bắt đầu tốt đẹp. –

+0

Đây là một ý tưởng tuyệt vời. Tôi sẽ xem những gì tôi có thể tìm thấy. Nó sẽ là ** Tuyệt vời ** nếu tôi có thể tìm cách sử dụng điều này. – RadiantHex

3

Có các dịch vụ (miễn phí và trả phí) thực hiện chính xác những gì bạn cần. Tôi sử dụng shrink the web:

Các vấn đề liên quan