Tôi muốn có một diễn viên tiêu dùng đăng ký chủ đề Kafka và dữ liệu luồng để xử lý thêm với Spark Streaming bên ngoài người tiêu dùng. Tại sao một diễn viên? Bởi vì tôi đọc rằng chiến lược giám sát của nó sẽ là một cách tuyệt vời để xử lý thất bại Kafka (ví dụ, khởi động lại thất bại).Phát trực tiếp từ một diễn viên
tôi thấy hai lựa chọn:
- Java
KafkaConsumer
lớp: Phương pháppoll()
nó trả về mộtMap[String, Object]
. Tôi muốn một sốDStream
được trả lại giống nhưKafkaUtils.createDirectStream
và tôi không biết cách tìm nạp luồng từ bên ngoài diễn viên. - Kéo dài đặc điểm
ActorHelper
và sử dụngactorStream()
như được hiển thị trong số example này. Tùy chọn thứ hai này không hiển thị kết nối với một chủ đề mà là một ổ cắm.
Mọi người có thể chỉ cho tôi đúng hướng không?