Theo định nghĩa phân tích cú pháp biểu mẫu Backus-Naur (BNF) trong Google's robots.txt documentation, thứ tự của chỉ thị Allow
và Disallow
không quan trọng. Vì vậy, thay đổi thứ tự thực sự sẽ không giúp bạn.
Thay vào đó, bạn nên sử dụng toán tử $
để cho biết việc đóng đường dẫn của bạn.
Kiểm tra robots.txt này. Tôi chắc chắn nó sẽ làm việc cho bạn (Tôi cũng xác nhận trong GWT):
user-agent: *
Allow: /$
Disallow:/
này sẽ cho phép http://www.example.com
và http://www.example.com/
để được thu thập thông nhưng mọi thứ khác bị chặn.
lưu ý: rằng chỉ Allow
thỏa mãn trường hợp sử dụng cụ thể của bạn, nhưng nếu bạn có index.html
hoặc default.php
, các URL sẽ không được thu thập.
lưu ý phụ: Tôi chỉ thực sự quen thuộc với các hành vi của Googlebot và bingbot. Nếu có bất kỳ công cụ nào khác mà bạn đang nhắm mục tiêu, họ có thể hoặc không có quy tắc cụ thể về cách chỉ thị được liệt kê. Vì vậy, nếu bạn muốn "thêm" chắc chắn, bạn luôn có thể hoán đổi vị trí của các khối chỉ thị Allow
và Disallow
, tôi chỉ đặt chúng theo cách đó để xóa một số nhận xét.
Thử xóa dòng 'Allow' hoặc đặt nó sau' Disallow'. Người thu thập thông tin phải dừng ở trận đấu đầu tiên. –
Brian là đúng, quy tắc kết hợp đầu tiên, nhưng hãy cẩn thận khi không cho phép mọi thứ theo cách này, Google "xem nhanh" sẽ không thể tải bất kỳ hình ảnh hoặc tập lệnh nào, vì vậy hiển thị có thể bị thay đổi. Vì vậy, có lẽ bạn sẽ cần phải tạo ít nhất một thư mục công cộng duy nhất để trang chủ của bạn được hiển thị tốt trên "chế độ xem nhanh". –