Tôi muốn yêu cầu Google không lập chỉ mục các phần nhất định của trang, trong yandex (nga se) có một thẻ rất hữu ích được gọi là <noindex>
. làm thế nào nó có thể được thực hiện với google?<noindex> thẻ cho google
Trả lời
Bạn có thể ngăn Google xem các phần của trang bằng cách đặt các phần đó vào iframe bị chặn bởi robots.txt.
robots.txt
Disallow: /iframes/
index.html
This text is crawlable, but now you'll see
text that search engines can't see:
<iframe src="/iframes/hidden.html" width="100%" height=300 scrolling=no>
/iframes/hidden.html
Search engines cannot see this text.
Thay vì sử dụng sử dụng iframe, bạn có thể tải các nội dung của tệp ẩn bằng AJAX. Dưới đây là một ví dụ sử dụng jquery ajax để làm như vậy:
his text is crawlable, but now you'll see
text that search engines can't see:
<div id="hidden"></div>
<script>
$.get(
"/iframes/hidden.html",
function(data){$('#hidden').html(data)},
);
</script>
Không, Google does not support the <noindex>
tag. Hầu như không ai làm được.
Tạo một file robots.txt ở mức gốc của bạn và chèn giống như sau:
Khối Google:
Chặn tất cả bot:
User-agent: *
Disallow: /myDisallowedDir1/
Disallow: /myDisallowedPage.html
Disallow: /myDisallowedDir2/
Trình tạo robots.txt tiện dụng:
teslasimus không muốn chặn toàn bộ trang, chỉ "một số phần nhất định". – unor
điểm tốt, câu trả lời của tôi có thể được sử dụng cùng với giải pháp iframe được đề xuất ở trên – flemingslone
Theo Wikipedia , có một số quy tắc một số nhện theo:
<!--googleoff: all-->
This should not be indexed by Google. Though its main spider, Googlebot,
might ignore that hint.
<!--googleon: all-->
<div class="robots-nocontent">Yahoo bots won't index this.</div>
<noindex>Yandex bots ignore this text.</noindex>
<!--noindex-->They will ignore this, too.<!--/noindex-->
Thật không may, họ không thể đồng ý về một tiêu chuẩn duy nhất có vẻ như - và kiến thức của tôi, không có gì để giữ cho tất cả các hình thu nhỏ tắt ...
googleoff:
nhận xét dường như s để hỗ trợ các tùy chọn khác nhau, mặc dù tôi không chắc chắn nơi có một danh sách đầy đủ. Có ít nhất:
- tất cả: hoàn toàn bỏ qua những khối
- index: Nội dung không đi vào chỉ mục của Google
- neo: neo văn bản cho các liên kết sẽ không được liên kết với trang mục tiêu
- đoạn : văn bản sẽ không được sử dụng để tạo ra các đoạn mã cho kết quả tìm kiếm
Note cũng có (ít nhất là cho Google) này sẽ chỉ ảnh hưởng đến chỉ số tìm kiếm, không phải là trang xếp hạng vv Hơn nữa, như là Stephen Ostermiller một cách chính xác chỉ ra trong bình luận của mình dưới đây, không may là googleon
và googleoff
only work with the Google search appliance and have no effect on normal Googlebot.
Ngoài ra còn có một bài viết về một phần Yahoo (và một bài báo mô tả rằng Yandex cũng vinh danh <noindex>
). Trên phần googleoff:
, cũng xem this answer và bài viết tôi đã lấy hầu hết thông tin liên quan từ đó.
Bên cạnh đó, Google Webmaster Tools khuyên bạn sử dụng các thuộc tính rel=nofollow
cho các liên kết cụ thể (ví dụ như quảng cáo hoặc liên kết đến các trang không thể truy cập/hữu ích cho các chương trình, chẳng hạn như đăng nhập/đăng ký). Điều đó có nghĩa, các HTML a rel Attribute nên được vinh danh bởi các chương trình của Google - mặc dù đó là chủ yếu liên quan đến xếp hạng trang, không phải cho chính chỉ mục tìm kiếm. Rất tiếc, có vẻ như không có rel=noindex
5,7. Tôi cũng không chắc liệu thuộc tính này có thể được sử dụng cho các thành phần khác nữa hay không (ví dụ: <DIV REL="noindex">
); nhưng trừ khi trình thu thập thông tin tôn vinh "noindex", điều đó cũng không có ý nghĩa gì cả.
tài liệu tham khảo thêm:
- How to Noindex parts of a web page?
- Excluding crawler from sections of pages (Spiderline bánh xích, bạn thấy đấy, crawlers khác có thể sử dụng dấu sở hữu khác (xem thêm AddSearch bánh xích) Tôi muốn họ chỉ đơn giản làm
REL="noindex"
. một tiêu chuẩn thay vì được sử dụng với bất kỳ thẻ HTML nào như DIV/SPAN/P/A!) - Preventing Google from indexing the contents of a div by reversing the string
- Methods for preventing search engines from indexing irrelevant content on a page
Wikipedia: Noindex
Which Sections of Your Web Pages Might Search Engines Ignore?
Tell Google to Not Index Certain Parts of Your Page
Use rel="nofollow" for specific links
Is it a good idea to use <a href=“http://name.com” rel=“noindex, nofollow”>name</a>
?
Using HTML tags — Yandex.Help. Webmaster
existing REL values
'googleoff' và' googleon' [chỉ hoạt động với công cụ tìm kiếm của Google và không ảnh hưởng đến Googlebot bình thường] (http://webmasters.stackexchange.com/question/54735/can-you-use-googleon-và-googleoff-comments-to-prevent-googlebot-from-indexing-p) –
@StephenOstermiller đúng, tôi cũng đã đoán ra điều đó.Cảm ơn bạn đã chỉ ra, tôi hoàn toàn quên cập nhật ở đây! – Izzy
Vì câu trả lời của bạn dài, nhận xét nói rằng đó là sai có thể không được chú ý. Bạn có thể vui lòng thêm tuyên bố vào lúc bắt đầu để cảnh báo giải pháp này không? –
- 1. <?= ?> thẻ đặc biệt trong php
- 2. Tạo kiểu <select> thẻ cho iPhone
- 3. JQuery, đặt thuộc tính cho <a> thẻ
- 4. Vùng chứa trực tuyến cho HTML5 <audio> thẻ
- 5. Hai thẻ tập lệnh riêng biệt cho Google Analytics?
- 6. nhiều thẻ <nav>
- 7. Php <? thẻ trên WAMP
- 8. HTML5 <audio> thẻ trên Android
- 9. Thẻ Phantom <br> được trình duyệt hiển thị trước <table> thẻ
- 10. Xóa <script> thẻ bằng cách sử dụng jQuery
- 11. <img> và thẻ <image> trong HTML
- 12. Có sai không khi đặt thẻ <script> sau thẻ</body>?
- 13. Xóa thẻ html trừ các thẻ <br> hoặc <br/> bằng javascript
- 14. chèn thẻ <? Xml-stylesheet bằng xsl
- 15. Thẻ HTML5 <meter> thuộc tính
- 16. Thoát</script> thẻ bên javascript
- 17. thẻ Meta cho dịch
- 18. <blink> thẻ trong Internet Explorer
- 19. TinyMCE đang xóa <style> thẻ
- 20. Không thể nhập <input> thẻ
- 21. JSP: JSTL của <c:out> thẻ
- 22. Dải CKEditor <i> Thẻ
- 23. XmlSerializer.Serialize Tước <xml> thẻ
- 24. Maven wsdl2java <wsdlLocation> thẻ
- 25. lxml và <wbr> thẻ
- 26. Tại sao Google để thẻ html mở?
- 27. Triển khai thẻ trên Google App Engine
- 28. Phần tử <hr /> có thẻ đóng không?
- 29. SEO - Google + liên kết chỉ mục công cụ tìm kiếm khác có trong các thẻ <noscript> không?
- 30. HTML ngữ nghĩa: Tôi có nên sử dụng thẻ <nav> cho một đám mây thẻ không?
có cách nào để yêu cầu Google không chỉ mục nội dung nhất định? – teslasimus
Không theo bất kỳ cách nào mà Google chấp thuận: http://webmasters.stackexchange.com/questions/16390/preventing-robots-from-crawling-specific-part-of-a-page –
"Hầu như không có ai" bao gồm ít nhất Yandex , xem [câu trả lời của tôi] (http://stackoverflow.com/a/22976324/2533433). Nhưng ai thực sự quan tâm đến điều đó, là một câu hỏi khác. – Izzy