2015-08-06 20 views
5

Tôi đang sử dụng Apache Spark Mllib 1.4.1 (pyspark, triển khai python Spark) để tạo cây quyết định dựa trên dữ liệu LabeledPoint mà tôi có. Cây tạo ra một cách chính xác và tôi có thể in nó vào thiết bị đầu cuối (trích xuất các quy tắc như thành viên này gọi đó là How to extract rules from decision tree spark MLlib) sử dụng:Làm thế nào để tôi hình dung/vẽ một cây quyết định trong Apache Spark (pyspark 1.4.1)?

model = DecisionTree.trainClassifier(...) 
print(model.toDebugString() 

Nhưng những gì tôi muốn làm là hình dung hoặc vẽ cây quyết định chứ không phải in nó để thiết bị đầu cuối. Có cách nào tôi có thể âm mưu cây quyết định trong pyspark hoặc có thể tôi có thể lưu dữ liệu cây quyết định và sử dụng R để vẽ nó? Cảm ơn!

+0

Tôi cần phải làm tương tự. Bạn đã quản lý để vẽ DT của bạn? – diplomaticguru

Trả lời

3

Có dự án này Decision-Tree-Visualization-Spark cho quán tưởng mô hình Tree Quyết định

Nó có hai bước

  • Parse Spark Quyết định sản lượng cây sang một định dạng JSON.
  • Sử dụng tệp JSON làm đầu vào cho hình ảnh D3.js.

Đối với việc kiểm tra phân tích cú pháp Dt.py

Các đầu vào của hàm def tree_json(tree) là mô hình của bạn toDebugString()

trả lời từ question

0

Mặc dù đây là một ít bài cũ, chỉ để cung cấp câu trả lời của tôi vì vậy rằng những người khác đến bài đăng này từ bây giờ có thể được hưởng lợi.

Hoặc bạn có thể sử dụng "graphviz" gói python để sử dụng trong PySpark. Nó sẽ in mô hình cây quyết định thành một cấu trúc cây gọn gàng hơn là bình thường nếu cấu trúc vòng lặp.

Chi tiết khác có thể được tìm thấy trong liên kết này: https://pypi.python.org/pypi/graphviz

Các vấn đề liên quan