2013-01-07 34 views
159

Trong robots.txt, tôi có thể viết URL tương đối sau đây cho tệp sơ đồ trang web không?Có thể sử dụng url sơ đồ trang web tương đối trong robots.txt không?

sitemap: /sitemap.ashx 

Hoặc tôi phải sử dụng đầy đủ (tuyệt đối) URL cho file sitemap, như:

sitemap: http://subdomain.domain.com/sitemap.ashx 

Tại sao tôi tự hỏi:

  • Tôi sở hữu một dịch vụ blog mới, www.domain.com, cho phép người dùng viết blog trên accountname.domain.com.
  • Tôi sử dụng các ký tự đại diện, vì vậy tất cả tên miền phụ (tài khoản) trỏ đến: "blog.domain.com".

Trong blog.domain.com Tôi đặt robots.txt để cho công cụ tìm kiếm tìm thấy sơ đồ trang web. Nhưng, do các ký tự đại diện, tất cả tài khoản người dùng đều chia sẻ cùng một tệp robots.txt. Đó là lý do tại sao tôi không thể sử dụng phương án thay thế thứ hai. Và bây giờ tôi không thể sử dụng url viết lại cho các tập tin txt. (Tôi đoán rằng các phiên bản sau này của IIS có thể xử lý này?)

Trả lời

280

Theo quan chức documentation on sitemaps.org nó cần phải được một URL đầy đủ:

Bạn có thể xác định vị trí của Sơ đồ trang web sử dụng một tập tin robots.txt . Để làm điều này, chỉ cần thêm dòng sau bao gồm URL đầy đủ đến sitemap:

Sitemap: http://www.example.com/sitemap.xml 
+25

Xin lưu ý @ dụ unor của có: Sơ đồ trang web có vốn S. Đây là quan trọng như Robots.txt là trường hợp nhạy cảm. – BodgeIT

+15

Và về chủ đề của vụ án, [robotstxt.org] (http://www.robotstxt.org/robotstxt.html) chỉ định tệp được đặt tên là 'robots.txt' không có số vốn R. – khargoosh

+0

nếu trang web đang tải https, URL Sơ đồ trang web được đề cập với http. Điều này có ổn không? Hay chúng ta phải đặt URL sơ đồ trang web dựa trên giao thức? – Shams

Các vấn đề liên quan