6
Có hai cột:ma trận pyspark với biến giả
ID Text
1 a
2 b
3 c
Làm thế nào tôi có thể có thể tạo ra ma trận với biến giả như thế này:
ID a b c
1 1 0 0
2 0 1 0
3 0 0 1
Sử dụng thư viện pyspark và các tính năng của nó?
Traceback (gần đây nhất gọi cuối cùng): File "", dòng 2, trong NameError: Tên 'F' không được định nghĩa –
F là gì đây? –
từ chức năng nhập pyspark.sql là F –