2010-08-24 19 views
6

Các dịch vụ như Alexa và Google Analytics có khả năng theo dõi độ tuổi, giới tính, giáo dục đại học, v.v. của khách truy cập như thế nào?Alexa và Google Analytics theo dõi nhân khẩu học như thế nào?

http://www.alexa.com/siteinfo/stackoverflow.com

+0

Câu hỏi hay! Tôi đoán là họ đang thu thập địa chỉ IP của chúng tôi thông qua các trang truyền thông xã hội và liên kết thông tin theo cách đó. – mpen

Trả lời

5

Alexa chắc chắn nhận được thông tin giao thông từ người dùng thanh công cụ của nó. Vì đó là một nhóm người tương đối nhỏ và tự chọn, điều này chắc chắn dẫn đến một mẫu thiên vị (đó là lý do tại sao lưu lượng truy cập Alexa không khớp với lưu lượng truy cập được đo lường trên các trang web tôi chạy). Ngay cả với các kỹ thuật thống kê tốt nhất để giảm độ lệch, bạn không bao giờ có thể loại bỏ hoàn toàn nó khi phân bố lấy mẫu không đồng đều.

Không rõ cách Google thực hiện, mặc dù nó có thể liên quan đến việc theo dõi cookie.

Một dự án mà tôi đang nghiên cứu gần đây đã mang về câu hỏi này.

Một cách khác để thực hiện điều này (cũng có các thành kiến, nhưng khác nhau) sẽ sử dụng IP cho dịch vụ vị trí để tìm vĩ độ và kinh độ gần đúng của mỗi khách truy cập vào trang web của bạn. Sau đó sử dụng dự án của tôi (tiết lộ đầy đủ: Tôi chạy trang web đó và nó là thương mại):

http://askgeo.com

Để có được thông tin cá nhân cho vị trí đó. AskGeo thực sự cung cấp thông tin nhân khẩu học ở một số cấp địa lý (tiểu bang, quận, phân khu, thành phố, mã bưu điện, đường điều tra dân số (vài nghìn người), và nhóm điều tra dân số (khoảng một ngàn người). mức thấp nhất (ví dụ: nhóm khối điều tra dân số) cho một vĩ độ và kinh độ nhất định

Trang web trả về số lượng lớn các biến nhân khẩu học được cung cấp ở cấp nhóm khối. lấy ví dụ, nếu bạn đang cố gắng theo dõi phân bố tuổi của người dùng, thì bạn sẽ sử dụng các độ tuổi được cung cấp trong phản hồi AskGeo và cho một mẫu nhất định, bạn sẽ thêm số phần mềm phân số vào mỗi phạm vi tương ứng với tỷ lệ phần trăm dân số trong nhóm khối đó từ độ tuổi tương ứng. Ví dụ: lấy khu phố của tôi ở San Francisco. do phân bố tuổi:

  • CensusAgePercent0To4: 7,3%
  • CensusAgePercent5To9: 3,5%
  • CensusAgePercent10To: 3,2%

... (bỏ qua một chút, như bạn có thể nhận được các ý tưởng). ..

  • CensusAgePercentOver85: 1,5%

Nếu bạn có địa chỉ IP mà bạn đã theo dõi cho nhóm điều tra dân số đó, bạn sẽ thêm từng phần trăm (như một phần từ 0 đến 1) vào các bộ đếm (mềm) của bạn cho các độ tuổi đó. (Bộ đếm mềm chỉ là bộ đếm cho phép đếm số nguyên.)

Bạn có thể làm tương tự với chủng tộc, giới tính, mức thu nhập, giá trị căn nhà, vv

Phương pháp này cũng có những thành kiến, chắc chắn, vì nó giả định rằng tất cả những người trong một nhóm khối đưa ra là bình đẳng có khả năng truy cập trang web của bạn. Nhưng đó là điều mà bạn có thể làm trên trang web của riêng mình, không chỉ Google và Alexa, và nó vẫn mang lại cho bạn cảm giác tương đối về người truy cập trang web của bạn nếu số lượng mềm của bạn trong một danh mục nhất định cao hơn mức trung bình quốc gia thể loại.

Cũng có thể một kỹ thuật phức tạp hơn số lượng trực tiếp đơn giản có thể dẫn đến kết quả phong phú hơn nhiều.

0

tôi đã làm một số nghiên cứu, và dường như những nhân khẩu học được theo dõi nhân khẩu học cùng khán giả cách truyền hình được theo dõi. Có những người duyệt bằng thanh công cụ của họ (Alexa), theo dõi các trang web được truy cập. Những người này sẵn sàng (?) Cung cấp thông tin như tuổi tác, giới tính, vv và Alexa ngoại suy các nhân khẩu học chung từ mẫu này. Điều này tất nhiên lá phòng cho thiên vị, nhưng đó là một vấn đề với số liệu thống kê.

0

Alexa lấy thông tin từ thanh công cụ trình duyệt mà bạn cài đặt theo mục đích hoặc là một phần của gói với một số phần mềm. Nó đặt câu hỏi để hiểu các thông số nhân khẩu học và cũng theo dõi các trang web mà bạn truy cập. Nếu bạn biết rằng 80% khách truy cập trang web là phụ nữ và bạn có khách truy cập mới truy cập trang web này, bạn có thể nghĩ rằng có khả năng cao là người này là phụ nữ. Nếu bạn biết nhiều trang web mà người này truy cập, bạn có thể đoán rất nhiều.

Nhưng như http://netberry.co.uk/alexa-rank-explained.htm cho biết bạn chỉ có thể dựa vào thông tin từ Alexa TOP100.000 vì sau đó Alexa có đủ thông tin từ lượng người dùng nhỏ truy cập các trang web này. Họ nói "hàng triệu" nhưng đó là một phần nhỏ trong tổng số

Các vấn đề liên quan