Tôi sử dụng Github để lưu trữ văn bản của một trong các trang web của tôi, nhưng vấn đề là Google cũng lập chỉ mục văn bản trong Github. Vì vậy, cùng một văn bản sẽ hiển thị cả trên trang web của tôi và trên Github. ví dụ. this search Lần truy cập hàng đầu là trang web của tôi. Hit thứ hai là kho Github.Cách ngăn Google lập chỉ mục kho lưu trữ Github của tôi
Tôi không quan tâm nếu mọi người nhìn thấy các nguồn nhưng tôi không muốn Google lập chỉ mục nó (và có thể phạt cho nội dung trùng lặp). Có cách nào, ngoài việc lưu trữ riêng tư, để yêu cầu Google ngừng lập chỉ mục nó?
Điều gì sẽ xảy ra trong trường hợp Github Pages? Đó là những trang mà nguồn nằm trong kho Github. Họ có cùng một vấn đề trùng lặp?
Hãy this search lượt truy cập nhiều nhất dẫn đến the Marpa site nhưng tôi không thấy số source được liệt kê trong kết quả tìm kiếm. Làm sao?
Nhìn vào robots.txt của Github, tôi thấy các đốm màu trong ngành thạc sĩ được phép nhưng tất cả các ngành khác bị vô hiệu hóa . Đó có lẽ là lời giải thích cho nội dung Marpa không được lập chỉ mục. Vì vậy, có thể nếu tôi sử dụng một nhánh khác và loại bỏ nhánh chính khỏi kho lưu trữ, việc lập chỉ mục sẽ dừng lại. – szabgab
[robots.txt chỉ thị tóm tắt] [1] [1] (http://antezeta.com/news/avoid-search-engine-indexing) –