2012-07-03 31 views
6

Tôi đang phát triển một ứng dụng trong đường ray yêu cầu phải kiểm tra xem trang web đã nhập có URL thân thiện với công cụ tìm kiếm được tạo hay không.Một giải pháp tôi đang lưu ý là sử dụng nokogiri để phân tích cú pháp HTML của trang web và tìm trong thẻ liên kết để tìm các URL và xem chúng có thân thiện với công cụ tìm kiếm không. Có cách nào khác có thể thực hiện được không? Mọi trợ giúp sẽ thực sự tuyệt vời.Mã Ruby để kiểm tra xem một trang web có URL thân thiện với công cụ tìm kiếm

+0

nếu bạn thực sự muốn xem tất cả các liên kết trong trang, nokogiri là cách để đi. làm thế nào để bạn có kế hoạch phân biệt một url thân thiện với SEO từ một SEO không thân thiện với SEO? –

+0

Tôi không có bất kỳ ý tưởng về cách tôi sẽ làm điều đó.Tôi sẽ nhìn vào Anemone đầu tiên như @Casper đã đề xuất. Bạn có cách khác mà có thể làm việc cho trường hợp này? Cảm ơn –

+0

Thật không may không, tôi đã được chỉ tò mò; -) –

Trả lời

5

Bạn có hai vấn đề ở đây:

  1. Làm thế nào để bạn chính thức (lập trình) xác định những gì một "search engine URL frienldy là". Tôi giả sử bạn có một số cách để làm điều này rồi. Vì vậy, lá ...

  2. Cách kiểm tra tất cả các liên kết trên trang web.

Vì vậy, đối (2) Tôi sẽ nhìn vào một cái gì đó giống như Anemone mà sẽ làm cho nó dễ dàng cho bạn để thu thập thông trang web hoàn chỉnh:

Anemone là một thư viện Ruby mà làm cho nó nhanh chóng và không đau để viết các chương trình thu hút một trang web. Nó cung cấp một DSL đơn giản để thực hiện các hành động trên mỗi trang của một trang web, bỏ qua một số URL nhất định và tính đường dẫn ngắn nhất đến một trang nhất định trên một trang web.

Thiết kế đa luồng giúp Anemone nhanh. API làm cho nó đơn giản. Và sự biểu cảm của Ruby làm cho nó mạnh mẽ.

Để thu thập thông tin đơn giản Anemone thậm chí sẽ cung cấp cho bạn một loạt các liên kết trên một trang, vì vậy bạn thậm chí không nhất thiết cần Nokogiri. Đối với những thứ phức tạp hơn có thể bạn muốn kết hợp Anemone với một cái gì đó như Mechanize và Nokogiri. Điều đó phụ thuộc vào yêu cầu của bạn.

+0

Cảm ơn bạn đã chia sẻ thông tin về Anemone Gem, nó sẽ rất hữu ích đối với tôi. Tôi cũng chưa thực sự tìm ra cách để (1) vấn đề, Vì vậy, nếu bạn có giúp đỡ về điều đó thì hãy chia sẻ điều đó. –

+0

Anemone là tuyệt vời, nó giải quyết mục đích của tôi ở đây, Cảm ơn –

+0

@JimmyThakkar - Cảm ơn ý kiến ​​của bạn. Thật không may là tôi không có bất kỳ ý tưởng tốt cho các liên kết SEO. Nó không phải là một vấn đề dễ dàng để giải quyết. Những gì tôi sẽ làm là lần đầu tiên ghi lại trên giấy những gì một liên kết SEO tốt. I E. tạo ra một định nghĩa trên giấy đầu tiên! Sau đó bạn có thể thử và xây dựng một thuật toán cho nó. Nhưng trước tiên bạn cần phải có các quy tắc rõ ràng. Có lẽ tìm kiếm các từ khóa phù hợp trên trang vv .. Tuy nhiên con người có thể khá nhanh chóng xem nếu một liên kết là SEO hay không. Vì vậy, chỉ cần thực hiện (2) bạn đã có thể liệt kê các liên kết và nhanh chóng quét 100 + liên kết chỉ trong vài giây bằng cách chỉ nhìn vào chúng. – Casper

Các vấn đề liên quan