2012-05-07 9 views
7

Tôi đang tạo trang web sẽ có các đánh giá về chính sách bảo mật của hàng trăm nghìn trang web khác trên internet. Nội dung ban đầu của nó dựa trên hoạt động của tôi thông qua kết xuất web trang CommonCrawl 5 tỷ và analyzing all the privacy policies với tập lệnh, để xác định các đặc điểm nhất định (ví dụ: "Bán thông tin cá nhân của bạn").Liên kết với nhau> 100 nghìn trang mà không bị SEO phạt

Theo SEO MOZ Beginner's Guide to SEO:

Công cụ tìm kiếm có xu hướng chỉ thu thập thông khoảng 100 liên kết trên bất kỳ trang web nào. Hạn chế lỏng lẻo này là cần thiết để tránh spam và bảo tồn các xếp hạng .

Tôi đã tự hỏi điều gì sẽ là một cách thông minh để tạo trang web điều hướng không để lại trang mồ côi, nhưng vẫn tránh được hình phạt SEO mà họ nói đến. Tôi có một vài ý tưởng:

  • Tạo trang chữ cái (hoặc Google Sitemap .xml's), như "Sites bắt đầu bằng Ado *". Và nó sẽ liên kết "Adobe.com" ở đó chẳng hạn. Điều này, hoặc bất kỳ sự phân chia vô nghĩa nào khác của các trang, có vẻ như đã bị loại bỏ và tôi tự hỏi liệu Google có thể không thích nó hay không.
  • Sử dụng từ khóa hoặc mô tả meta để phân loại
  • Tìm cách áp dụng các danh mục thú vị hơn, chẳng hạn như địa lý hoặc dựa trên nội dung. Mối quan tâm của tôi ở đây là tôi không chắc chắn làm thế nào tôi sẽ có thể áp dụng các loại như vậy trên bảng cho rất nhiều trang web. Tôi cho rằng nếu cần tôi có thể viết một trình phân loại khác để thử và phân tích nội dung của các trang từ quá trình thu thập thông tin. Âm thanh như một công việc lớn trong và của chính nó mặc dù.
  • Sử dụng dự án DMOZ để giúp phân loại các trang.

Wikipedia và StackOverflow rõ ràng đã giải quyết vấn đề này rất tốt bằng cách cho phép người dùng phân loại hoặc gắn thẻ tất cả các trang. Trong trường hợp của tôi, tôi không có sự sang trọng đó, nhưng tôi muốn tìm ra lựa chọn tốt nhất có sẵn.

Tại cốt lõi của câu hỏi này là cách Google phản hồi các cấu trúc điều hướng khác nhau. Liệu nó có phạt những người tạo ra một trang web theo một cách có lập trình/vô nghĩa không? Hay nó không quan tâm miễn là mọi thứ được kết nối thông qua liên kết?

Trả lời

3

Google PageRank không phạt bạn vì có> 100 liên kết trên một trang. Nhưng mỗi liên kết trên một ngưỡng nhất định sẽ giảm giá trị/tầm quan trọng trong thuật toán PageRank.

Trích dẫn SEOmoz và Matt Cutts:

thể Bạn bị xử phạt?

Trước khi chúng tôi đào sâu quá, tôi muốn nói rõ ràng rằng giới hạn 100-link chưa bao giờ là một tình huống phạt. Trong một cuộc phỏng vấn năm 2007 Tháng Tám, Rand trích Matt Cutts nói:

Các "giữ số lượng các liên kết đến dưới 100" là trong phần hướng dẫn kỹ thuật, không phải là phần nguyên tắc chất lượng. Điều đó có nghĩa là chúng tôi sẽ không xóa trang nếu bạn có 101 hoặc 102 liên kết trên trang . Hãy nghĩ về điều này nhiều hơn như một quy tắc của ngón tay cái.

Vào thời điểm đó, nó có khả năng rằng Google bắt đầu phớt lờ các liên kết sau một thời điểm nào đó, nhưng lúc tồi tệ nhất này giữ những bài 100 liên kết từ đi qua PageRank. Bản thân trang sẽ không bị xóa chỉ mục hoặc bị phạt.

Vì vậy, câu hỏi thực sự là cách làm cho Google mất tất cả các liên kết của bạn một cách nghiêm túc. Bạn thực hiện việc này bằng cách tạo một sơ đồ trang web XML để Google thu thập thông tin (bạn có thể có tệp sitemap.xml tĩnh hoặc nội dung của nó có thể được tạo động). Bạn sẽ muốn đọc trên phần About Sitemaps của tài liệu trợ giúp Công cụ quản trị trang web của Google.

Cũng giống như có quá nhiều liên kết trên một trang là một vấn đề, có quá nhiều liên kết trong một tệp sơ đồ trang web XML cũng là một vấn đề. Những gì bạn cần làm là phân trang sơ đồ trang web XML của bạn. Jeff Atwood nói về cách StackOverflow thực hiện điều này: The Importance of Sitemaps. Jeff cũng thảo luận về cùng một vấn đề trên StackOverflow podcast #24.

Ngoài ra, khái niệm này cũng áp dụng cho Bing.

+0

Suy nghĩ của bạn về các cách tiếp cận khác nhau để chia các liên kết. Google có quan tâm rằng một số bộ phận có ý nghĩa hơn các bộ phận khác? – babonk

+0

Chúng tôi chưa trải qua một thứ tự sắp xếp nào tốt hơn so với thứ tự sắp xếp khác. Chỉ cần làm theo hướng dẫn của Google dưới 10MB hoặc ít hơn cho mỗi tệp sơ đồ trang web và không quá 50.000 URL cho mỗi tệp. BTW, bạn thực sự có thể cho Google biết mức ưu tiên của mỗi liên kết trong tệp sitemap.xml. – Jason

Các vấn đề liên quan