2013-03-28 42 views
16

Tôi muốn yêu cầu Google không lập chỉ mục các phần nhất định của trang, trong yandex (nga se) có một thẻ rất hữu ích được gọi là <noindex>. làm thế nào nó có thể được thực hiện với google?<noindex> thẻ cho google

Trả lời

5

Bạn có thể ngăn Google xem các phần của trang bằng cách đặt các phần đó vào iframe bị chặn bởi robots.txt.

robots.txt

Disallow: /iframes/ 

index.html

This text is crawlable, but now you'll see 
text that search engines can't see: 
<iframe src="/iframes/hidden.html" width="100%" height=300 scrolling=no> 

/iframes/hidden.html

Search engines cannot see this text. 

Thay vì sử dụng sử dụng iframe, bạn có thể tải các nội dung của tệp ẩn bằng AJAX. Dưới đây là một ví dụ sử dụng jquery ajax để làm như vậy:

his text is crawlable, but now you'll see 
text that search engines can't see: 
<div id="hidden"></div> 
<script> 
    $.get(
     "/iframes/hidden.html", 
     function(data){$('#hidden').html(data)}, 
    ); 
</script> 
3

Không, Google does not support the <noindex> tag. Hầu như không ai làm được.

+0

có cách nào để yêu cầu Google không chỉ mục nội dung nhất định? – teslasimus

+0

Không theo bất kỳ cách nào mà Google chấp thuận: http://webmasters.stackexchange.com/questions/16390/preventing-robots-from-crawling-specific-part-of-a-page –

+0

"Hầu như không có ai" bao gồm ít nhất Yandex , xem [câu trả lời của tôi] (http://stackoverflow.com/a/22976324/2533433). Nhưng ai thực sự quan tâm đến điều đó, là một câu hỏi khác. – Izzy

-4

Tạo một file robots.txt ở mức gốc của bạn và chèn giống như sau:

Khối Google:

Chặn tất cả bot:

User-agent: * 
Disallow: /myDisallowedDir1/ 
Disallow: /myDisallowedPage.html 
Disallow: /myDisallowedDir2/ 

Trình tạo robots.txt tiện dụng:

http://www.mcanerin.com/EN/search-engine/robots-txt.asp

+4

teslasimus không muốn chặn toàn bộ trang, chỉ "một số phần nhất định". – unor

+0

điểm tốt, câu trả lời của tôi có thể được sử dụng cùng với giải pháp iframe được đề xuất ở trên – flemingslone

19

Theo Wikipedia , có một số quy tắc một số nhện theo:

<!--googleoff: all--> 
This should not be indexed by Google. Though its main spider, Googlebot, 
might ignore that hint. 
<!--googleon: all--> 

<div class="robots-nocontent">Yahoo bots won't index this.</div> 

<noindex>Yandex bots ignore this text.</noindex> 
<!--noindex-->They will ignore this, too.<!--/noindex--> 

Thật không may, họ không thể đồng ý về một tiêu chuẩn duy nhất có vẻ như - và kiến ​​thức của tôi, không có gì để giữ cho tất cả các hình thu nhỏ tắt ...

googleoff: nhận xét dường như s để hỗ trợ các tùy chọn khác nhau, mặc dù tôi không chắc chắn nơi có một danh sách đầy đủ. Có ít nhất:

  • tất cả: hoàn toàn bỏ qua những khối
  • index: Nội dung không đi vào chỉ mục của Google
  • neo: neo văn bản cho các liên kết sẽ không được liên kết với trang mục tiêu
  • đoạn : văn bản sẽ không được sử dụng để tạo ra các đoạn mã cho kết quả tìm kiếm

Note cũng có (ít nhất là cho Google) này sẽ chỉ ảnh hưởng đến chỉ số tìm kiếm, không phải là trang xếp hạng vv Hơn nữa, như là Stephen Ostermiller một cách chính xác chỉ ra trong bình luận của mình dưới đây, không may là googleongoogleoffonly work with the Google search appliance and have no effect on normal Googlebot.

Ngoài ra còn có một bài viết về một phần Yahoo (và một bài báo mô tả rằng Yandex cũng vinh danh <noindex>). Trên phần googleoff:, cũng xem this answer và bài viết tôi đã lấy hầu hết thông tin liên quan từ đó.


Bên cạnh đó, Google Webmaster Tools khuyên bạn sử dụng các thuộc tính rel=nofollow cho các liên kết cụ thể (ví dụ như quảng cáo hoặc liên kết đến các trang không thể truy cập/hữu ích cho các chương trình, chẳng hạn như đăng nhập/đăng ký). Điều đó có nghĩa, các HTML a rel Attribute nên được vinh danh bởi các chương trình của Google - mặc dù đó là chủ yếu liên quan đến xếp hạng trang, không phải cho chính chỉ mục tìm kiếm. Rất tiếc, có vẻ như không có rel=noindex5,7. Tôi cũng không chắc liệu thuộc tính này có thể được sử dụng cho các thành phần khác nữa hay không (ví dụ: <DIV REL="noindex">); nhưng trừ khi trình thu thập thông tin tôn vinh "noindex", điều đó cũng không có ý nghĩa gì cả.


tài liệu tham khảo thêm:


Wikipedia: Noindex
Which Sections of Your Web Pages Might Search Engines Ignore?
Tell Google to Not Index Certain Parts of Your Page
Use rel="nofollow" for specific links
Is it a good idea to use <a href=“http://name.com” rel=“noindex, nofollow”>name</a>?
Using HTML tags — Yandex.Help. Webmaster
existing REL values

+5

'googleoff' và' googleon' [chỉ hoạt động với công cụ tìm kiếm của Google và không ảnh hưởng đến Googlebot bình thường] (http://webmasters.stackexchange.com/question/54735/can-you-use-googleon-và-googleoff-comments-to-prevent-googlebot-from-indexing-p) –

+0

@StephenOstermiller đúng, tôi cũng đã đoán ra điều đó.Cảm ơn bạn đã chỉ ra, tôi hoàn toàn quên cập nhật ở đây! – Izzy

+1

Vì câu trả lời của bạn dài, nhận xét nói rằng đó là sai có thể không được chú ý. Bạn có thể vui lòng thêm tuyên bố vào lúc bắt đầu để cảnh báo giải pháp này không? –