Có cách nào để viết mỗi hàng của dataframe spark
của tôi dưới dạng mục mới trong bảng dynamoDB
không? (Trong pySpark
)ghi các dòng dữ liệu tia lửa dưới dạng các mục trong bảng dynamoDB
tôi đã sử dụng mã này với boto3
thư viện, nhưng tôi tự hỏi nếu có một cách khác, tránh pandas
và for loop
bước sau:
sparkDF_dict = sparkDF.toPandas().to_dict('records')
for item in sparkDF_dict :
table.put_item(Item = item)
Đã có giải pháp cho vấn đề này chưa? Vì vậy, ít tài liệu về công cụ này. Có vẻ như việc gửi đầu ra EMR tới DynamoDB là có thể. – Gopala