2013-08-02 31 views
5

Tôi nhận thấy rằng đối với bản tóm tắt trang web của mình, Google Bot dường như đang đưa ra lô văn bản đầu tiên mà nó tìm thấy. Điều này xảy ra là thẻ noscript đã yêu cầu người dùng bật JavaScript, nếu nó không được bật.Cách nạp tóm tắt trang web vào Google Bot?

Tôi nghĩ rằng tôi sẽ ngăn chặn nó, bằng cách đặt một div ẩn trước đó, mà thực sự chứa một bản tóm tắt trang web.

Bây giờ, tôi tìm thấy trong phân tích cú pháp mới nhất của nó rằng nó thực sự tải trang và chạy JavaScript, bỏ qua các div ẩn và sử dụng nội dung động đã được tạo.

Thật kỳ lạ, ứng dụng của tôi đã xác định bot là Trình duyệt Safari, nhưng nó không phát hiện phiên bản.

Để tạo một câu chuyện dài, làm thế nào để tôi có được tóm tắt trang web của mình vào danh sách Google chính xác?

Đây là ứng dụng một trang yêu cầu JavaScript và chỉ hỗ trợ FireFox và Safari hiện tại.

Dưới đây là những gì nó bỏ qua

Snippet 1 (trong đầu)

<meta name='description' content='My Summary'> 

Snippet 2 (trong cơ thể)

<body> 
    <div id='google_bot' style='display:none'> 
    My Summary 
    </div> 

Cập nhật:

Lần cuối cùng nó thu thập dữ liệu trang của tôi, nó đã được phát hiện là Chrome 22 và trong tóm tắt trang web, nó thực tế sử dụng thẻ meta với mô tả tên.

+0

Bạn có một thẻ meta mô tả? – FakeRainBrigand

+0

Nó chỉ là mười lĩnh vực bóng đá của máy chủ, nó không phải là một robot thực tế bạn có thể nắm bắt và nắm giữ trong tay của bạn? – adeneo

+1

Google quyết định xem mô tả có phản ánh chính xác nội dung trang hay không. Có thể có một số hack không có giấy tờ, nhưng phương pháp chính xác là cập nhật mô tả cho một cái gì đó mà nó tin (sử dụng các từ trên trang). Nó có rất nhiều vấn đề. YouTube thường có "Bạn cần adobe flash ...". Tôi đã gửi một báo cáo lỗi về nó trong quá khứ. – FakeRainBrigand

Trả lời

4

Điều này khá dễ tìm.

Đặt mô tả trang web ở 3 vị trí, thẻ meta, div ẩn và cũng tìm thấy bot Google tìm thấy trong lần tìm kiếm cuối cùng của nó. Sử dụng một cái gì đó nhỏ để phân biệt 3, như dấu chấm câu.

Tiếp theo. Gửi trang của bạn để Google thu thập thông tin bằng Google Web Tools để bạn không phải đợi. Chỉ mất khoảng 15 phút.

Sau khi đã được tìm nạp, bạn có thể xác minh rằng nó đã lấy nội dung bạn muốn và từ đó bạn có thể gửi nó đến chỉ mục.

Từ đó hãy xem những gì đã thay đổi và xác minh nội dung được thu thập thông tin.

Lạ là nó tự xác định là Safari.

Dưới đây là một số thông tin về những tác nhân người dùng nên xem xét như:

https://support.google.com/webmasters/answer/1061943?hl=en

+0

Về tác nhân người dùng, lưu ý rằng một số trên trang bạn liên kết đến là cố ý tương tự như trình duyệt. Ngoài ra, danh sách đó là dành cho chỉ thị nhắm mục tiêu * đến * các bot, không phát hiện lưu lượng truy cập của chúng; họ cũng có thể thu thập thông tin với các tác nhân người dùng giả mạo để phát hiện các trang web cố gắng lừa người lập chỉ mục. – IMSoP

+0

Các tác nhân người dùng cho Google Bots được hiển thị rõ ràng trên liên kết tôi đã đăng. Câu hỏi/câu trả lời này chỉ dành cho Google cho mỗi OP. Papa là sếp. –

3

Nếu bạn có thực độc đáo mới nội dung thú vị liên tục, sau đó bạn có thể tạo ra a well marked-up RSS feed, RSS -> Rich Site Summary chỉ với những điều có liên quan và thêm một thẻ meta như

<link rel="alternate" type="application/rss+xml" title="RSS 2.0" href="${linkToFeed}"> 

Tôi nghĩ rằng Google Bot yêu nó ngay khi nó xác minh RSS-Feed thể hiện nội dung của trang thực tế

+1

thú vị, điều gì đã dẫn bạn đến giả thuyết này? – Smurfette

+0

vì toàn bộ giao diện không cần thiết để thu thập dữ liệu chính, điều quan trọng là thu thập dữ liệu về cách người dùng trải nghiệm dữ liệu nhưng nếu bạn cung cấp định dạng dễ đọc có thể phân tích cú pháp, hãy lấy nó ra và lưu một số cây bao nhiêu crap và workarrounds và tấn mã một webdesigner đặt arround các dữ liệu thú vị. Không đảm bảo cho bất cứ điều gì tôi nghĩ rằng nó chỉ logic –

+0

@ johnSmith Google không phải là trong kinh doanh của "tiết kiệm cây" (thậm chí tưởng tượng kỹ thuật số những người thân) họ đang trong kinh doanh phục vụ có liên quan và * spam miễn phí * kết quả tìm kiếm. Thật không may, điều này có nghĩa là họ * không thể * tin tưởng một phiên bản máy có thể đọc được của trang, bởi vì bạn có thể nói dối với máy về những gì bạn đang hiển thị cho con người. – IMSoP

Các vấn đề liên quan