2010-03-28 36 views
6

Nếu bạn đã quen thuộc với Reddit, bạn sẽ biết cách tất cả các bài đăng của họ chứa hình ảnh có một bản xem trước hình thu nhỏ nhỏ bên cạnh tiêu đề của bài gửi. Làm thế nào để Reddit đi về làm điều đó? Liệu nó có kiểm tra xem liệu liên kết có kết thúc với .jpg, .png, .bmp không?Tôi làm cách nào để trích xuất hình ảnh từ trang web mà tôi đang liên kết đến?

Trả lời

3

reddit sẽ cố gắng kéo hình thu nhỏ từ bất kỳ nguồn nào - không chỉ là URL hình ảnh. Điều này được thực hiện trước hết bằng cách đặt quy tắc cho các trang web cụ thể và thứ hai là có một quy trình chung để truy xuất hình thu nhỏ cho các URL không xác định - và tự động là periodic task.

Một trong nhiều (nhiều) lợi ích của reddit là the source code is open và nếu bạn hiểu Python, bạn nên xem /r2/lib/scraper.py để có cái nhìn chi tiết hơn về cách quy trình này hoạt động.

Ngoài ra, trong khi StackOverflow là một nơi tuyệt vời để có câu hỏi liên quan đến lập trình được trả lời, bạn cũng có thể muốn kiểm tra riêng của reddit /r/redditdev để biết thông tin về phát triển reddit.

Hey there redditor!

0

Bạn có thể kiểm tra nội dung của thẻ <img>.

+0

Bạn có ý là nội dung của thẻ trên Reddit không? Dường như họ nén và giảm hình ảnh và lưu hình ảnh đó dưới dạng hình thu nhỏ có kích thước trên máy chủ của họ. – vette982

1
  1. Thật vậy, nếu URL chứa .jpg, .png, vv sử dụng đó.
  2. Nếu trang web là một miền phổ biến (flickr.com, youtube.com, amazon.com, vv), có một bộ quy tắc được xác định trước để trích xuất một cái gì đó bạn biết sẽ có liên quan (nó có thể hình ảnh nổi bật, hình thu nhỏ của YouTube , hình ảnh sản phẩm Amazon, , v.v.)
  3. Nếu không, nếu tất cả bạn phải làm việc với một số HTML, bạn sẽ phải tự mình tìm hiểu. Bạn có thể chọn trang đầu tiên trên trang, kích thước lớn nhất theo kích thước, hoặc thậm chí là số được xác định là phù hợp nhất (ví dụ: tương đối lớn, bên trong nội dung bạn nghĩ là nội dung chính.)

Nếu bạn phải sử dụng tùy chọn cuối cùng, một kỹ thuật tôi khuyên bạn nên trích xuất nhiều hình ảnh và thử nghiệm A/B để tìm hình ảnh có tỷ lệ nhấp tốt nhất. Bằng cách đó bạn gần như luôn luôn có được cái tốt nhất.

Các vấn đề liên quan