2010-06-30 17 views
7

Tôi đang tìm một số công nghệ để nghiên cứu. Tôi ngạc nhiên rằng bạn có thể vào giao diện [chèn trang web lớn ở đây], cập nhật cài đặt và trong vài giây nó được đẩy ra để nó hoạt động trên bảng. Một ví dụ tốt về điều này là adwords. Nếu bạn truy cập vào adwords và thay đổi chiến dịch, các cài đặt đó được lưu trữ trên máy chủ có id duy nhất. Mã quảng cáo gọi máy chủ có id đó và thông tin (kích thước, màu sắc, v.v.) được kéo lên tức thì để hiển thị quảng cáo. Làm thế nào mà Google có thể đẩy nó ra hàng trăm ngàn máy chủ nhanh như vậy? Họ đang sử dụng loại hệ thống db nào?Làm cách nào để các trang web lớn (Google, Facebook, v.v.) truyền bá thông tin tới tất cả các máy chủ trong thời gian thực?

Trả lời

6

Google đã xuất bản tài liệu nghiên cứu cho Google File System (hoặc "BigFiles" của nó như đã từng biết) và BigTable, cả hai đều được sử dụng rộng rãi trong các dịch vụ của họ. Những người có lẽ sẽ làm cho đọc tốt, trong và của chính họ và bởi vì họ có thể trích dẫn trước nghệ thuật.

0

Tôi biết rằng Facebook sử dụng ngang hàng để đẩy cập nhật trên máy chủ của họ.

Máy chủ đầu tiên nhận được bản cập nhật, sau đó anh ấy gửi cho một số người khác làm điều tương tự .. và cho đến khi bản cập nhật nằm trên tất cả máy chủ của họ!

+0

Bất kỳ tên hoặc lý thuyết phần mềm nào tôi có thể nghiên cứu? –

0

Tôi đã xem xét các thông tin tương tự.

Tìm "Dữ liệu có cấu trúc".

Chi tiết cụ thể: MojoDB, CouchDB. Tìm kiếm các so sánh trên trang web mojodb.

Facebook đã tạo nguồn mở Cassandra (phân phối cơ sở dữ liệu). Tôi nghĩ rằng họ và nhiều người khác sử dụng nó ngay bây giờ.

Cũng tìm khung công tác Hadoop và Map/Reduce, như một vấn đề đáng quan tâm.

Các vấn đề liên quan