2011-07-18 80 views

Trả lời

6
+1

Ngoài ra mật khẩu bảo vệ toàn bộ trang web. – Chirag

+0

Theo liên kết đó, "Bạn không nên sử dụng robots.txt làm phương tiện để ẩn các trang web của bạn khỏi kết quả của Google Tìm kiếm. Điều này là do các trang khác có thể trỏ đến trang của bạn và trang của bạn có thể được lập chỉ mục theo cách đó, tránh rô bốt .txt. Nếu bạn muốn chặn trang của mình khỏi kết quả tìm kiếm, hãy sử dụng một phương pháp khác như bảo vệ bằng mật khẩu hoặc thẻ noindex hoặc chỉ thị. " Xem https://developers.google.com/search/reference/robots_meta_tag –

1

Ngoài mật khẩu bảo vệ trang web của bạn, bạn có thể thêm những dòng này để robots.txt:

User-agent: * 
Disallow:/

Đây không phải ẩn trang web hiện nhưng khá hướng dẫn các chương trình không làm gián điệp nội dung.

-1

Bạn sử dụng tệp robots.txt. Đặt các tập tin trong thư mục gốc của trang web với nội dung này:

User-agent: * 
Disallow:/
2

Bạn có thể bằng cách nào đó giảm trang web của bạn được liệt kê sử dụng một robots.txt. Lưu ý rằng điều này phụ thuộc vào "thiện chí" của trình thu thập thông tin, mặc dù (một số spambots sẽ xem xét rõ ràng vị trí mà bạn không cho phép).

Cách an toàn và đáng tin cậy nhất để không có trang web được liệt kê, thật đáng buồn là không đưa nó lên internet.

Đơn giản là không liên kết đến trang web của bạn sẽ không hoạt động. Trình thu thập dữ liệu nhận thông tin của họ từ nhiều nguồn, bao gồm các liên kết giới thiệu trình duyệt và công ty đăng ký tên miền. Vì vậy, để được "vô hình", bạn sẽ không phải truy cập vào trang web của bạn và không đăng ký một tên miền (chỉ truy cập nó thông qua địa chỉ IP).
Và sau đó, nếu bạn chạy máy chủ web dựa trên địa chỉ IP, bạn vẫn có tất cả các địa chỉ ngẫu nhiên thăm dò spambots. Nó sẽ mất một lúc, nhưng họ sẽ tìm thấy bạn.

Bảo vệ bằng mật khẩu cho trang web của bạn sẽ hoạt động, làm cho nó không thể truy cập được. Mặc dù (và nó vượt ra ngoài hiểu của tôi như thế nào xảy ra) ví dụ có nghĩa là hàng ngàn giấy tờ ACM được liệt kê trong Google mà bạn không thể nhìn thấy mà không có một tài khoản và đăng nhập. Tuy nhiên, họ đang có.

0

công cụ tìm kiếm thích hợp nhất sử dụng chương trình hay crawlers đến các trang web và chỉ số họ. bạn có thể Robot File method

Các vấn đề liên quan