Trong robots.txt, tôi có thể viết URL tương đối sau đây cho tệp sơ đồ trang web không?Có thể sử dụng url sơ đồ trang web tương đối trong robots.txt không?
sitemap: /sitemap.ashx
Hoặc tôi phải sử dụng đầy đủ (tuyệt đối) URL cho file sitemap, như:
sitemap: http://subdomain.domain.com/sitemap.ashx
Tại sao tôi tự hỏi:
- Tôi sở hữu một dịch vụ blog mới, www.domain.com, cho phép người dùng viết blog trên accountname.domain.com.
- Tôi sử dụng các ký tự đại diện, vì vậy tất cả tên miền phụ (tài khoản) trỏ đến: "blog.domain.com".
Trong blog.domain.com Tôi đặt robots.txt để cho công cụ tìm kiếm tìm thấy sơ đồ trang web. Nhưng, do các ký tự đại diện, tất cả tài khoản người dùng đều chia sẻ cùng một tệp robots.txt. Đó là lý do tại sao tôi không thể sử dụng phương án thay thế thứ hai. Và bây giờ tôi không thể sử dụng url viết lại cho các tập tin txt. (Tôi đoán rằng các phiên bản sau này của IIS có thể xử lý này?)
Xin lưu ý @ dụ unor của có: Sơ đồ trang web có vốn S. Đây là quan trọng như Robots.txt là trường hợp nhạy cảm. – BodgeIT
Và về chủ đề của vụ án, [robotstxt.org] (http://www.robotstxt.org/robotstxt.html) chỉ định tệp được đặt tên là 'robots.txt' không có số vốn R. – khargoosh
nếu trang web đang tải https, URL Sơ đồ trang web được đề cập với http. Điều này có ổn không? Hay chúng ta phải đặt URL sơ đồ trang web dựa trên giao thức? – Shams