Số phân vùng xác định song song của chủ đề vì một phân đoạn chỉ có thể được tiêu thụ bởi một người tiêu dùng trong nhóm người tiêu dùng. Ví dụ, nếu bạn chỉ có 10 phân vùng cho một chủ đề và 20 người tiêu dùng trong một nhóm người tiêu dùng, 10 người tiêu dùng đang nhàn rỗi, không nhận được bất kỳ tin nhắn nào. Số lượng thực sự phụ thuộc vào ứng dụng của bạn, nhưng 1-1000s là tất cả hợp lý.
Số bản sao được xác định theo yêu cầu độ bền của bạn. Đối với một chủ đề có nhân tố N nhân bản, Kafka có thể chịu đựng được các lỗi máy chủ N-1 mà không làm mất bất kỳ thông báo nào được ghi vào nhật ký. 3 bản sao là cấu hình chung. Tất nhiên, số bản sao phải nhỏ hơn hoặc bằng số của nhà môi giới của bạn.
auto.create.topics.enable kiểm soát thuộc tính khi Kafka bật tự động tạo chủ đề trên máy chủ. Nếu điều này được đặt thành true, khi các ứng dụng cố gắng tạo, tiêu thụ hoặc tìm nạp siêu dữ liệu cho một chủ đề không tồn tại, Kafka sẽ tự động tạo chủ đề với hệ số nhân bản mặc định và số phân vùng. Tôi khuyên bạn nên tắt nó trong sản xuất và tạo chủ đề trước.
Cảm ơn thông tin ngắn gọn và sạch sẽ – Ratha
Sẽ không yêu cầu số lượng bản sao bằng số lượng nút khiến cụm của bạn cực kỳ mong manh? Một nút đi xuống và đột nhiên cụm của bạn không còn đáp ứng bởi vì nó phải đợi cho đúng số lượng bản sao. –
@SethPaulson Không có chờ đợi bởi vì một nút đi xuống. Trong trường hợp đó, người lãnh đạo sẽ xóa nó khỏi danh sách các bản sao "không đồng bộ" và cố khôi phục nó nếu nó trở lại. Xem [Tài liệu Kafka về Nhân rộng] (https://kafka.apache.org/documentation/#replication) để biết mô tả chi tiết. –