2015-05-16 25 views
42

Tôi đã xây dựng Spark 1.4 từ thạc sĩ phát triển GH và quá trình xây dựng đã diễn ra tốt đẹp. Nhưng khi tôi làm bin/pyspark tôi nhận được phiên bản Python 2.7.9. Làm thế nào tôi có thể thay đổi điều này?Apache Spark: Cách sử dụng pyspark với Python 3

+6

Đối với bất cứ ai tìm kiếm làm thế nào để làm điều này: 'PYSPARK_DRIVER_PYTHON = ipython3 PYSPARK_DRIVER_PYTHON_OPTS =" sổ ghi chép "./bin/pyspark', trong trường hợp nó chạy IPython 3 notebook. – tchakravarty

Trả lời

4

Hãy xem tệp. Dòng shebang có thể được trỏ đến nhị phân 'env' tìm kiếm đường dẫn cho tệp thực thi tương thích đầu tiên.

Bạn có thể thay đổi python thành python3. Thay đổi env để sử dụng trực tiếp mã hóa nhị phân python3. Hoặc thực thi nhị phân trực tiếp với python3 và bỏ qua dòng shebang.

+1

Vâng, nhìn vào tập tin đã giúp. Cần thiết để đặt biến môi trường 'PYSPARK_PYTHON'. – tchakravarty

11
PYSPARK_PYTHON=python3 ./bin/pyspark 

Nếu bạn muốn chạy trong trong IPython Máy tính xách tay, viết:

PYSPARK_PYTHON=python3 PYSPARK_DRIVER_PYTHON=ipython PYSPARK_DRIVER_PYTHON_OPTS="notebook" ./bin/pyspark 

Nếu python3 không thể truy cập, bạn cần phải vượt qua đường dẫn đến nó để thay thế.

Hãy nhớ rằng current documentation (as of 1.4.1) có hướng dẫn cũ. May mắn thay, it has been patched.

+1

Tôi nghĩ rằng lệnh của bạn cho Máy tính xách tay IPython là không chính xác. Nên như thế này: PYSPARK_PYTHON = python3 PYSPARK_DRIVER_PYTHON = ipython3 PYSPARK_DRIVER_PYTHON_OPTS = "sổ ghi chép" ./bin/pyspark – SpiderRico

+0

@ChrisNielsen Trong terminal. –

+0

@ChrisNielsen Trong Linux hoặc OS X là một thiết bị đầu cuối/bảng điều khiển. Tôi không có ý tưởng làm thế nào nó hoạt động dưới Windows (khi trong Windows, tôi sử dụng Spark chỉ trên một container Docker). –

66

Chỉ cần đặt biến môi trường:

export PYSPARK_PYTHON=python3

trong trường hợp bạn muốn đây là một sự thay đổi vĩnh viễn thêm dòng này vào pyspark kịch bản.

+0

Điều này làm việc cho tôi. – Jinw

+0

Các biến môi trường có thể được chỉnh sửa trong/etc/profile. Đừng quên thực hiện "nguồn/etc/profile" sau khi lưu hồ sơ, vì vậy các thay đổi có thể được thực hiện ngay lập tức. – Phyticist

+0

Làm việc giống như nét duyên dáng, –

8

1, chỉnh sửa hồ sơ: vim ~/.profile

2, thêm mã vào file: export PYSPARK_PYTHON=python3

3, thực hiện lệnh: source ~/.profile

4, ./bin/pyspark

Các vấn đề liên quan