Cho một ứng dụng SparkYếu tố nào quyết định số lượng người thực thi trong chế độ độc lập?
Yếu tố nào quyết định số lượng người thực thi trong chế độ độc lập? Trong Mesos và YARN theo tài liệu this, chúng tôi có thể chỉ định số lượng người thực hiện/lõi và bộ nhớ.
Khi một số người thực thi bắt đầu. Spark có bắt đầu các nhiệm vụ theo kiểu vòng tròn hay không và có đủ thông minh để xem liệu một số người thực thi có rảnh/bận không và sau đó lên lịch các nhiệm vụ tương ứng.
Ngoài ra, Spark quyết định số nhiệm vụ như thế nào? Tôi đã làm write một chương trình nhiệt độ tối đa đơn giản với tập dữ liệu nhỏ và Spark sinh ra hai nhiệm vụ trong một người thi hành duy nhất. Đây là chế độ độc lập Spark.
Tôi đã đặt một tệp gồm 5 khối và xem 5 tác vụ là Spark. Hình như cho một khối hai phân vùng được tạo ra. Đối với nhiều hơn một khối, cùng một số phân vùng được tạo. –