2010-07-25 31 views
9

Cách tốt nhất để theo dõi người đăng ký RSS đáng tin cậy mà không cần bằng cách sử dụng Feedburner là gì? Một số cách tiếp cận rõ ràng như theo dõi bằng IP hoặc theo số lần truy cập có một số sai sót fata. Địa chỉ IP có thể thay đổi theo từng yêu cầu hoặc nhiều người dùng có thể sử dụng cùng một địa chỉ IP. Ngoài ra, người đọc nguồn cấp dữ liệu có thể yêu cầu nguồn cấp dữ liệu nhiều lần mỗi ngày hoặc thậm chí là giờ. Cả hai vấn đề làm cho nó thực sự khó khăn để có được số liệu thống kê đáng tin cậy về người đăng ký duy nhất.Cách tiêu chuẩn và đáng tin cậy để theo dõi người đăng ký RSS?

Tôi đã đọc các bài viết theo cả hai chủ đề Leo NotenboomTim Bray về chủ đề này, nhưng không có đề xuất nào của họ thực sự giải quyết cách theo dõi người đăng ký một cách chính xác và đáng tin cậy. Leo cho biết có một ID duy nhất được tạo theo chương trình để được nối vào URL nguồn cấp dữ liệu RSS cho mỗi lần trang giới thiệu được tải. Tim ủng hộ người đọc RSS tạo một hashtag duy nhất và cũng có các đề xuất khác nhau, từ việc theo dõi các liên kết đến sử dụng cookie. Một URL duy nhất sẽ đáng tin cậy, nhưng nó có hai sai sót: Nó không phải là một URL thân thiện với người dùng và nó tạo ra nội dung trùng lặp cho SEO. Có phương pháp đáng tin cậy nào khác để theo dõi người đăng ký RSS không? Feedburner ước tính số người đăng ký như thế nào?

+0

tạo tệp xml duy nhất cũ: www.site.com/rss/12345/ cho mỗi người dùng đã đăng ký trang web của bạn; do đó, tạo xml bằng php bằng cách sử dụng loại tiêu đề xml và theo dõi nó theo thời gian()! đây có thể là cách bảo mật để truy cập vào RSS của bạn. IMHO khá quyết liệt nhưng có thể hoạt động được! ;) –

Trả lời

0

Bạn có thể truy vấn nhật ký máy chủ web cho lưu lượng truy cập vào nguồn cấp dữ liệu RSS của mình, có thể lọc theo IP để nhận số lượng đơn lẻ.

Vấn đề là, điều đó phụ thuộc vào những người kiểm tra nguồn cấp dữ liệu hàng ngày. Tần suất truy cập vào nguồn cấp dữ liệu RSS của bạn bởi một cá nhân có thể thay đổi ngày và số lượng có thể thấp hơn.

+0

Cảm ơn bạn đã đề xuất. Tuy nhiên, có nhiều vấn đề với phương pháp này. Địa chỉ IP có thể thay đổi theo từng yêu cầu hoặc nhiều người dùng có thể sử dụng cùng một địa chỉ IP. Ngoài ra, người đọc nguồn cấp dữ liệu có thể yêu cầu nguồn cấp dữ liệu nhiều lần mỗi ngày hoặc thậm chí là giờ. Cả hai vấn đề làm cho nó thực sự khó khăn để có được số liệu thống kê đáng tin cậy về người đăng ký duy nhất. – VirtuosiMedia

3

Không thực sự là một cách tiêu chuẩn để thực hiện việc này. Số lượng người đăng ký luôn không đáng tin cậy nhưng bạn có thể nhận được ước tính tốt với nó.

Đây là cách Google làm nó (source):

Subscribers đếm được tính toán bằng cách kết hợp địa chỉ IP và thức ăn chăn nuôi đọc kết hợp, sau đó sử dụng sự hiểu biết chi tiết của chúng ta về vô số độc giả, tập hợp, và chương trình trên thị trường để đưa ra các suy luận bổ sung.

Tất nhiên, phần này dễ dàng cho Google, vì trước tiên họ có thể tính số lượng người dùng Google Reader đã đăng ký với nguồn cấp dữ liệu được đề cập. Sau đó, họ sử dụng kết hợp địa chỉ IP, và đó cũng là những gì bạn nên sử dụng.

Bạn có thể tính các địa chỉ IP riêng lẻ (tức là duy nhất) từ nhật ký máy chủ web, nhưng sẽ tính 10 người là 1 nếu tất cả đều sử dụng cùng một địa chỉ. Đó là lý do tại sao bạn nên kiểm tra các tiêu đề HTTP được gửi bởi khách hàng, cụ thể hơn các trường tiêu đề HTTP_X_FORWARDED_FORHTTP_VIA. Bạn có thể sử dụng địa chỉ HTTP_VIA làm địa chỉ "chính" và sau đó tính số lượng địa chỉ HTTP_X_FORWARDED_FOR duy nhất được đăng ký với nguồn cấp dữ liệu. Nếu người đăng ký không có các trường được thêm proxy này thì nó sẽ được tính là một địa chỉ IP duy nhất. Những điều này sẽ được xử lý trong mã tạo nguồn cấp dữ liệu. Bạn cũng có thể thêm một tra cứu GeoIP cho IP và lưu trữ mọi thứ vào một cơ sở dữ liệu. Điều này sẽ cho phép bạn xem quốc gia nào có nhiều người đăng ký nhất đối với nguồn cấp dữ liệu của bạn.

Điều này cũng có vấn đề. Tất cả các proxy không sử dụng các trường này và nó không khắc phục được vấn đề tính toán người đăng ký sau các cổng NAT. Tuy nhiên đó là một ước tính tốt. Bên cạnh đó, bạn có thể quan tâm đến thứ tự độ lớn hơn là số lượng người đăng ký chính xác, phải không? Nếu bộ đếm nói rằng bạn có 5989 người đăng ký, bạn có thể có nhiều người đăng ký hơn vì bộ đếm cung cấp cho bạn giới hạn dưới.

0

Nếu bạn định cấu hình nguồn cấp dữ liệu RSS của mình để yêu cầu một số loại xác thực, bạn có thể thực hiện các chỉ số dựa trên người dùng thay vì chỉ số dựa trên ip. Mặc dù đây sẽ là một giải pháp kỹ thuật chính xác, khiến mọi người chọn tham gia vào một blog đã được xác thực trong bất kỳ nội dung nào khác ngoài kịch bản Intranet là một đoạn mở rộng.

+0

Đó sẽ là lý tưởng, nhưng tiếc là xác thực không phải là cách thức hầu hết các nguồn cấp dữ liệu đã làm việc trong tự nhiên. Tôi thậm chí không chắc chắn nếu hầu hết người đọc RSS hỗ trợ một cái gì đó như thế. – VirtuosiMedia

3

Tiêu chuẩn và đáng tin cậy không chính xác trong từ điển RSS :-) Phải nhớ rằng điều đó thậm chí không có XSD chuẩn sau bao nhiêu năm? Nếu bằng cách theo dõi bạn có nghĩa là "đếm" có một vài điều bạn có thể làm và các chiến thuật phụ thuộc vào mục đích tức là chứng minh một số lượng lớn hoặc số lượng nhỏ? Đó là điều tiếp thị để bạn phải xác định mục tiêu của mình :-)

Bạn có thể phải phân loại số IP để bắt đầu - để có bộ sưu tập cơ bản về số IP lớn/doanh nghiệp/ô. Đối với họ, bạn có thể sử dụng tham chiếu làm tiêu chí lọc hợp lý và tính mọi thứ khác là duy nhất trừ khi được chứng minh khác. Đa số các số IP vẫn ổn định trong khoảng 2 ngày nhưng một lần nữa, nó luôn luôn tốt để sử dụng logic giới thiệu cơ bản như một bộ lọc cho những người chỉ giữ "nhấp" để nói. Sau đó, bạn cần một danh sách phong phú các tập hợp và phân loại về cách họ xử lý URL và nếu họ che khuất người đọc cuối hoàn toàn thì bạn cần trung bình được công bố hoặc suy luận - nó luôn là trò chơi công bằng để sử dụng phân phối công bằng số trung bình. Sử dụng cookie có thể giúp thu thập các IP tổng hợp và phân biệt giữa các đại lý tự động và cá nhân. Một điều rất quan trọng là hãy nhớ rằng bạn không thể sử dụng chỉ một phương pháp và mong đợi nó là một viên đạn bạc - bạn cần phải sử dụng 3-4 khía cạnh này cùng một lúc cộng với lập luận thống kê cơ bản.

Các vấn đề liên quan