Tôi mới sử dụng Spark on YARN và không hiểu mối quan hệ giữa YARN Containers
và Spark Executors
. Tôi đã thử cấu hình sau, dựa trên kết quả của tập lệnh yarn-utils.py
, có thể được sử dụng để tìm cấu hình cụm tối ưu.Spark on YARN resource manager: Mối quan hệ giữa YARN Containers và Spark Executors
Cụm Hadoop (HDP 2.4) Tôi đang làm việc trên:
- 1 Thạc sĩ Node:
- CPU: 2 CPU với 6 lõi mỗi = 12 lõi
- RAM: 64 GB
- SSD: 2 x 512 GB
- 5 Slave Nodes:
- CPU: 2 CPU với 6 lõi mỗi = 12 lõi
- RAM: 64 GB
- HDD: 4 x 3 TB = 12 TB
- HBase được cài đặt (đây là một trong những thông số cho kịch bản dưới đây)
vì vậy, tôi chạy python yarn-utils.py -c 12 -m 64 -d 4 -k True
(c = lõi, m = nhớ, d = ổ cứng, k = HBase cài đặt) và nhận được kết quả sau:
Using cores=12 memory=64GB disks=4 hbase=True
Profile: cores=12 memory=49152MB reserved=16GB usableMem=48GB disks=4
Num Container=8
Container Ram=6144MB
Used Ram=48GB
Unused Ram=16GB
yarn.scheduler.minimum-allocation-mb=6144
yarn.scheduler.maximum-allocation-mb=49152
yarn.nodemanager.resource.memory-mb=49152
mapreduce.map.memory.mb=6144
mapreduce.map.java.opts=-Xmx4915m
mapreduce.reduce.memory.mb=6144
mapreduce.reduce.java.opts=-Xmx4915m
yarn.app.mapreduce.am.resource.mb=6144
yarn.app.mapreduce.am.command-opts=-Xmx4915m
mapreduce.task.io.sort.mb=2457
Các cài đặt này tôi đã thực hiện qua giao diện Ambari và khởi động lại cụm. Các giá trị cũng khớp với những gì tôi đã tính toán theo cách thủ công trước đây.
bây giờ tôi có vấn đề
- để tìm các thiết lập tối ưu cho
spark-submit
kịch bản của tôi- thông số
--num-executors
,--executor-cores
&--executor-memory
.
- thông số
- để có được mối quan hệ giữa các thùng chứa sợi và Chấp hành viên Spark
- để hiểu được thông tin phần cứng trong Spark của tôi Lịch sử UI (ít bộ nhớ hiển thị như tôi đặt (khi tính vào bộ nhớ tổng thể bằng cách nhân với số lượng nút công nhân))
- để hiểu được khái niệm về
vcores
trong sỢI, ở đây tôi không thể tìm thấy bất kỳ ví dụ hữu ích chưa
Tuy nhiên, tôi thấy bài này What is a container in YARN?, nhưng điều này đã không thực sự giúp như nó doesn' t mô tả mối quan hệ với người thi hành S.
Ai đó có thể giúp giải quyết một hoặc nhiều câu hỏi?