5

dưới đây là tệp POM của tôi. Tôi viết thư này một tia lửa streaming với AWS Kinesisspark kinesis thất bại trên cloudera với java.lang.AbstractMethodError

<dependency> 
     <groupId>org.apache.spark</groupId> 
     <artifactId>spark-streaming_2.10</artifactId> 
     <version>1.6.0</version> 
    </dependency> 

    <dependency> 
     <groupId>org.apache.spark</groupId> 
     <artifactId>spark-core_2.10</artifactId> 
     <version>1.6.0</version> 
    </dependency> 
    <dependency> 
     <groupId>com.amazonaws</groupId> 
     <artifactId>amazon-kinesis-client</artifactId> 
     <version>1.6.1</version> 
    </dependency> 
    <dependency> 
     <groupId>org.apache.spark</groupId> 
     <artifactId>spark-streaming-kinesis-asl_2.10</artifactId> 
     <version>1.6.0</version> 
    </dependency> 

Tôi đang phải đối mặt với bên dưới là ngoại lệ trong thời gian chạy của tia lửa của chương trình spark trên Cloudera 5,10

17/04/27 05:34:04 WARN scheduler.TaskSetManager: Lost task 0.0 in stage 58.0 (TID 179, hadoop1.local, executor 5): java.lang.AbstractMethodError 
at org.apache.spark.Logging$class.log(Logging.scala:50) 
at org.apache.spark.streaming.kinesis.KinesisCheckpointer.log(KinesisCheckpointer.scala:39) 
at org.apache.spark.Logging$class.logDebug(Logging.scala:62) 
at org.apache.spark.streaming.kinesis.KinesisCheckpointer.logDebug(KinesisCheckpointer.scala:39) 
at org.apache.spark.streaming.kinesis.KinesisCheckpointer.startCheckpointerThread(KinesisCheckpointer.scala:119) 
at org.apache.spark.streaming.kinesis.KinesisCheckpointer.<init>(KinesisCheckpointer.scala:50) 
at org.apache.spark.streaming.kinesis.KinesisReceiver.onStart(KinesisReceiver.scala:149) 
at org.apache.spark.streaming.receiver.ReceiverSupervisor.startReceiver(ReceiverSupervisor.scala:148) 
at org.apache.spark.streaming.receiver.ReceiverSupervisor.start(ReceiverSupervisor.scala:130) 
at org.apache.spark.streaming.scheduler.ReceiverTracker$ReceiverTrackerEndpoint$$anonfun$9.apply(ReceiverTracker.scala:575) 
at org.apache.spark.streaming.scheduler.ReceiverTracker$ReceiverTrackerEndpoint$$anonfun$9.apply(ReceiverTracker.scala:565) 
at org.apache.spark.SparkContext$$anonfun$38.apply(SparkContext.scala:2000) 
at org.apache.spark.SparkContext$$anonfun$38.apply(SparkContext.scala:2000) 
at org.apache.spark.scheduler.ResultTask.runTask(ResultTask.scala:66) 
at org.apache.spark.scheduler.Task.run(Task.scala:89) 
at org.apache.spark.executor.Executor$TaskRunner.run(Executor.scala:242) 
at java.util.concurrent.ThreadPoolExecutor.runWorker(ThreadPoolExecutor.java:1142) 
at java.util.concurrent.ThreadPoolExecutor$Worker.run(ThreadPoolExecutor.java:617) 
at java.lang.Thread.run(Thread.java:745) 

này chạy hoàn toàn tốt đẹp trên EMR4.4 Tuy nhiên CDH thất bại. Bất cứ đề nghị

+0

dường như có sự cố tương tự trên https://datastax-oss.atlassian.net/browse/SPARKC-460. Tuy nhiên điều này là hữu ích về kết nối cassandra không với kinesis –

Trả lời

0

Các vấn đề tiềm ẩn có vẻ là việc sử dụng các org.apache.spark.Logging:

LƯU Ý: KHÔNG SỬ DỤNG lớp này ngoài Spark. Nó được thiết kế như một tiện ích nội bộ. Điều này có thể sẽ bị thay đổi hoặc bị xóa trong các bản phát hành trong tương lai.

http://spark.apache.org/docs/1.6.2/api/java/org/apache/spark/Logging.html

này được cố định trong 2.0.0 như đã đề cập trong https://issues.apache.org/jira/browse/SPARK-9307.

Các vấn đề liên quan