2014-10-01 18 views
8

Kiểm tra các tìm kiếm, tôi không tìm thấy câu trả lời cuối cùng cho điều này.Làm cách nào để ngăn ứng dụng Heroku khỏi Google lập chỉ mục?

tôi có 2 ứng dụng trong Heroku:

  • myapp-stagging.herokuapp.com
  • myapp-with-real-domain-name.com

Những 2 ứng dụng không có nội dung bây giờ (không có chỉ mục trong Google)

Trước khi đẩy nội dung vào chúng, tôi muốn chắc chắn rằng ứng dụng stagging của tôi sẽ không được lập chỉ mục trong Google. Cách thích hợp để làm điều đó là gì? Tôi không hiểu vì mọi người nói về robots.txt nhưng tôi phải viết tệp này ở đâu?

Cảm ơn.

PS: SO có phải là trang StackExchange phù hợp để hỏi điều này không? Xin lỗi nếu không.

Trả lời

2

Hãy xem để được hướng dẫn đầy đủ ở đây - http://www.robotstxt.org/robotstxt.html

Nó hoạt động thích này: một robot muốn vists URL trang web, nói http://www.example.com/welcome.html. Trước khi nó làm như vậy, nó tiên kiểm tra cho http://www.example.com/robots.txt

Tôi đoán nó cung cấp cho bạn ý tưởng nơi để đặt robots.txt

+1

Cảm ơn bạn! Nhưng làm thế nào để đối phó với một số môi trường với một tệp robots.txt trên Heroku? Có cách nào để tạo 2 tệp không? Hoặc tôi nên sử dụng các biến môi trường trong Heroku? http://stackoverflow.com/questions/11813534/different-robots-txt-for-staging-server-on-heroku -> điều này nghe có vẻ hứa hẹn :) –

+0

không giúp bạn. ý nghĩa của một số env với một robots.txt là gì? đặt cược của tôi là bạn cần phải đặt trên robot txt trên dàn dựng và một trên ứng dụng thực tế – Mysterion

+1

Heroku không hoạt động như thế. Bạn có cùng một tệp cho tất cả các môi trường của mình. Nhưng bạn có thể giao dịch với env vars. Tôi đã tạo robots.txt động theo env var, dường như hoạt động :) –

Các vấn đề liên quan