Có phải tất cả các loại trang web này đều chỉ xóa bất hợp pháp Google hoặc công cụ tìm kiếm khác không?
Theo như tôi có thể nói đó là không có cách 'hợp pháp' để có được dữ liệu này cho một trang web thương mại .. Yahoo! api (http://developer.yahoo.com/search/siteexplorer/V1/inlinkData.html) chỉ dành cho việc sử dụng phi thương mại, Yahoo! Boss không cho phép truy vấn tự động, v.v.
Bất kỳ ý tưởng nào?Các trang web như Hubspot theo dõi các liên kết trong nước như thế nào?
Trả lời
Ví dụ, nếu bạn muốn tìm tất cả các liên kết đến trang chủ của Google, tìm kiếm
link:http://www.google.com
Vì vậy, nếu bạn muốn tìm tất cả các inbound link, bạn chỉ có thể đi qua cây của trang web của bạn, và cho mỗi mục tìm thấy, tạo URL. Sau đó truy vấn Google cho:
link:URL
Và bạn sẽ nhận được bộ sưu tập tất cả các liên kết mà Google có từ các trang web khác vào trang web của bạn.
Đối với tính hợp pháp của việc thu hoạch như vậy, tôi chắc chắn nó không phải là chính xác hợp pháp để tạo ra lợi nhuận từ nó, nhưng đó là không bao giờ dừng lại bất cứ ai trước, phải không?
(Vì vậy, tôi sẽ không bận tâm tự hỏi liệu họ đã làm điều đó hay không. Chỉ cần cho rằng họ làm.)
Tôi không biết những gì hubspot làm, nhưng, nếu bạn muốn tìm hiểu những gì các trang web liên kết đến trang web của bạn và bạn không có phần cứng để thu thập thông tin trên web, một điều bạn có thể làm là theo dõi HTTP_REFERER khách truy cập vào trang web của bạn. Ví dụ: đây là cách Google Analytics (theo như tôi biết) có thể cho bạn biết khách truy cập của bạn đến từ đâu. Điều này không đáng tin cậy 100% vì không phải tất cả các trình duyệt đều đặt nó, đặc biệt là trong "Chế độ Riêng tư", nhưng bạn chỉ cần một khách truy cập trên mỗi liên kết để biết rằng nó tồn tại!
Điều này được hoàn thành bằng cách nhúng tập lệnh vào từng trang web của bạn (thường ở đầu trang hoặc chân trang chung). Ví dụ: nếu bạn kiểm tra nguồn cho trang bạn đang đọc, bạn sẽ tìm thấy (ngay dưới cùng) một tập lệnh báo cáo lại thông tin của Google về lượt truy cập của bạn.
Bây giờ điều này sẽ không cho bạn biết liệu có liên kết nào không có ai từng sử dụng để truy cập vào trang web của bạn, nhưng hãy đối mặt với nó, chúng ít thú vị hơn những người thực sự sử dụng.
Chính xác, tôi nghĩ - nhìn vào ảnh chụp màn hình mẫu của Hubspot, bạn có thể thấy rằng mọi liên kết trong nước được theo dõi duy nhất đều có tại một khách truy cập từ đó. Để giải thích, dữ liệu liên kết giới thiệu có thể được lấy từ nhật ký hoặc thông qua việc nhúng nội dung nào đó vào trang web của bạn. –
- 1. Có thể theo dõi các liên kết băm như các trang có phân tích google không?
- 2. Các trang web như livescore.com hoạt động như thế nào?
- 3. Tôi nên theo dõi các mối đe dọa tiềm năng đến trang web của mình như thế nào?
- 4. jQuery theo dõi DOM như thế nào?
- 5. Làm thế nào để tạo MSDN như liên kết trong trang web tài liệu Sandcastle?
- 6. Cách theo dõi các thẻ liên kết với Google Analytics
- 7. Theo dõi trang web Giới thiệu đến thông qua liên kết trong tệp PDF?
- 8. NHibernate thực hiện theo dõi thay đổi như thế nào?
- 9. Cách tìm các liên kết bị hỏng trên trang web
- 10. Việc liên kết trong ActionScript hoạt động như thế nào?
- 11. Người dùng theo dõi như twitter ở Django, bạn sẽ làm như thế nào?
- 12. Các ứng dụng hoạt động như thế nào với các trang web?
- 13. Làm thế nào để tìm tất cả các liên kết/trang trên một trang web
- 14. Các thư viện tĩnh liên kết với các phụ thuộc như thế nào?
- 15. Tôi nên xử lý số lần xem trang phân đoạn theo dõi trong Google Analytics như thế nào?
- 16. Làm thế nào để theo dõi các dự án không liên quan đến các dự án
- 17. Trang web github hoạt động như thế nào (kiến trúc)?
- 18. Bạn đánh vần kiểm tra trang web như thế nào?
- 19. Danh sách Liên kết XOR hoạt động như thế nào?
- 20. has_one và has_many trong cùng một kiểu máy. Đường ray theo dõi chúng như thế nào?
- 21. Việc liên kết với các bộ sưu tập thực sự hiệu quả như thế nào?
- 22. Chroot ảnh hưởng đến liên kết động như thế nào?
- 23. Làm thế nào để làm cho (liên kết) nút chức năng như siêu liên kết?
- 24. Fortran deallocate danh sách liên kết như thế nào?
- 25. Theo dõi Google Analytics trong ứng dụng web một trang
- 26. Các trang web chính phát hiện múi giờ như thế nào?
- 27. malloc hiểu sự liên kết như thế nào?
- 28. Gói (Sytem.Web.Optimization) tạo ra vân tay xây dựng cho các liên kết bó như thế nào?
- 29. Trong Git, các chi nhánh địa phương có thể theo dõi nhau - điều này hữu ích như thế nào?
- 30. Cài đặt liên kết giới thiệu không theo dõi trên thị trường web android
Họ chỉ có thể thu thập dữ liệu trang web ... các trang web như http://www.80legs.com/ giúp dễ dàng hơn. –