python - 如何修复pyspark中的 'Container exited with a non-zero exit code 143'错误-6ren

Cách khắc phục lỗi 'Container đã thoát với mã thoát khác 0 143' trong pyspark

In lại Tác giả: Vũ trụ không gian 更新时间：2023-11-03 20:53:55

我使用以下代码计算数据帧所有行之间的余弦相似度:

from pyspark.ml.feature import Normalizer
from pyspark.mllib.linalg.distributed import IndexedRow, IndexedRowMatrix

normalizer = Normalizer(inputCol="features", outputCol="norm")
data = normalizer.transform(transformed_df)
data = index_df(data)

mat = IndexedRowMatrix(
    data.select("id", "norm")\
        .rdd.map(lambda row: IndexedRow(row.id, row.norm.toArray()))).toBlockMatrix()
dot = mat.multiply(mat.transpose())

indexed_dot = dot.toIndexedRowMatrix()
indexed_rdd = indexed_dot.rows

df = indexed_rdd.toDF()

当我使用数据帧的子集(100k 行)时，它可以工作，但当我尝试使用更多行(我的目标是 300k 行)时，我会收到下面的错误.

----> 1 df.write.mode('overwrite').parquet('some_path')

/usr/lib/spark/python/pyspark/sql/readwriter.py in parquet(self, path, mode, partitionBy, compression)
    802 self.partitionBy(partitionBy)
    803 self._set_opts(compression=compression)
--> 804 self._jwrite.parquet(path)
    805 
    806 @since(1.6)

/usr/lib/spark/python/lib/py4j-0.10.7-src.zip/py4j/java_gateway.py in __call__(self, *args)
   1255 answer = self.gateway_client.send_command(command)
   1256 return_value = get_return_value(
-> 1257 answer, self.gateway_client, self.target_id, self.name)
   1258 
   1259 for temp_arg in temp_args:

/usr/lib/spark/python/pyspark/sql/utils.py in deco(*a, **kw)
     61 def deco(*a, **kw):
     62 try:
---> 63 return f(*a, **kw)
     64 except py4j.protocol.Py4JJavaError as e:
     65 s = e.java_exception.toString()

/usr/lib/spark/python/lib/py4j-0.10.7-src.zip/py4j/protocol.py in get_return_value(answer, gateway_client, target_id, name)
    326 raise Py4JJavaError(
    327 "An error occurred while calling {0}{1}{2}.\n".
--> 328 format(target_id, ".", name), value)
    329 else:
    330 raise Py4JError(

Py4JJavaError: An error occurred while calling o303.parquet.
: org.apache.spark.SparkException: Job aborted.
    at org.apache.spark.sql.execution.datasources.FileFormatWriter$.write(FileFormatWriter.scala:224)
    at org.apache.spark.sql.execution.datasources.InsertIntoHadoopFsRelationCommand.run(InsertIntoHadoopFsRelationCommand.scala:154)
    at org.apache.spark.sql.execution.command.DataWritingCommandExec.sideEffectResult$lzycompute(commands.scala:104)
    at org.apache.spark.sql.execution.command.DataWritingCommandExec.sideEffectResult(commands.scala:102)
    at org.apache.spark.sql.execution.command.DataWritingCommandExec.doExecute(commands.scala:122)
    at org.apache.spark.sql.execution.SparkPlan$$anonfun$execute$1.apply(SparkPlan.scala:131)
    at org.apache.spark.sql.execution.SparkPlan$$anonfun$execute$1.apply(SparkPlan.scala:127)
    at org.apache.spark.sql.execution.SparkPlan$$anonfun$executeQuery$1.apply(SparkPlan.scala:155)
    at org.apache.spark.rdd.RDDOperationScope$.withScope(RDDOperationScope.scala:151)
    at org.apache.spark.sql.execution.SparkPlan.executeQuery(SparkPlan.scala:152)
    at org.apache.spark.sql.execution.SparkPlan.execute(SparkPlan.scala:127)
    at org.apache.spark.sql.execution.QueryExecution.toRdd$lzycompute(QueryExecution.scala:80)
    at org.apache.spark.sql.execution.QueryExecution.toRdd(QueryExecution.scala:80)
    at org.apache.spark.sql.DataFrameWriter$$anonfun$runCommand$1.apply(DataFrameWriter.scala:656)
    at org.apache.spark.sql.DataFrameWriter$$anonfun$runCommand$1.apply(DataFrameWriter.scala:656)
    at org.apache.spark.sql.execution.SQLExecution$.withNewExecutionId(SQLExecution.scala:77)
    at org.apache.spark.sql.DataFrameWriter.runCommand(DataFrameWriter.scala:656)
    at org.apache.spark.sql.DataFrameWriter.saveToV1Source(DataFrameWriter.scala:273)
    at org.apache.spark.sql.DataFrameWriter.save(DataFrameWriter.scala:267)
    at org.apache.spark.sql.DataFrameWriter.save(DataFrameWriter.scala:225)
    at org.apache.spark.sql.DataFrameWriter.parquet(DataFrameWriter.scala:549)
    tại sun.reflect.NativeMethodAccessorImpl.invoke0(Phương thức gốc)
    tại sun.reflect.NativeMethodAccessorImpl.invoke(NativeMethodAccessorImpl.java:62)
    tại sun.reflect.DelegatingMethodAccessorImpl.invoke(DelegatingMethodAccessorImpl.java:43)
    tại java.lang.reflect.Method.invoke(Method.java:498)
    at py4j.reflection.MethodInvoker.invoke(MethodInvoker.java:244)
    at py4j.reflection.ReflectionEngine.invoke(ReflectionEngine.java:357)
    at py4j.Gateway.invoke(Gateway.java:282)
    at py4j.commands.AbstractCommand.invokeMethod(AbstractCommand.java:132)
    at py4j.commands.CallCommand.execute(CallCommand.java:79)
    at py4j.GatewayConnection.run(GatewayConnection.java:238)
    tại java.lang.Thread.run(Thread.java:748)
Caused by: org.apache.spark.SparkException: Job aborted due to stage failure: Task 3 in stage 62.0 failed 4 times, most recent failure: Lost task 3.3 in stage 62.0 (TID 1892, blabla-worker, executor 77): ExecutorLostFailure (executor 77 exited caused by one of the running tasks) Reason: Container marked as failed: container_1557859612139_0001_01_000086 on host: blabla-worker Exit status: 143. Diagnostics: [2019-05-14 19:19:23.665]Container killed on request. Exit code is 143
[2019-05-14 19:19:23.665]Container exited with a non-zero exit code 143. 
[2019-05-14 19:19:23.665]Killed by external signal

Driver stacktrace:
    at org.apache.spark.scheduler.DAGScheduler.org$apache$spark$scheduler$DAGScheduler$$failJobAndIndependentStages(DAGScheduler.scala:1661)
    at org.apache.spark.scheduler.DAGScheduler$$anonfun$abortStage$1.apply(DAGScheduler.scala:1649)
    at org.apache.spark.scheduler.DAGScheduler$$anonfun$abortStage$1.apply(DAGScheduler.scala:1648)
    at scala.collection.mutable.ResizableArray$class.foreach(ResizableArray.scala:59)
    at scala.collection.mutable.ArrayBuffer.foreach(ArrayBuffer.scala:48)
    at org.apache.spark.scheduler.DAGScheduler.abortStage(DAGScheduler.scala:1648)
    at org.apache.spark.scheduler.DAGScheduler$$anonfun$handleTaskSetFailed$1.apply(DAGScheduler.scala:831)
    at org.apache.spark.scheduler.DAGScheduler$$anonfun$handleTaskSetFailed$1.apply(DAGScheduler.scala:831)
    at scala.Option.foreach(Option.scala:257)
    at org.apache.spark.scheduler.DAGScheduler.handleTaskSetFailed(DAGScheduler.scala:831)
    at org.apache.spark.scheduler.DAGSchedulerEventProcessLoop.doOnReceive(DAGScheduler.scala:1882)
    at org.apache.spark.scheduler.DAGSchedulerEventProcessLoop.onReceive(DAGScheduler.scala:1831)
    at org.apache.spark.scheduler.DAGSchedulerEventProcessLoop.onReceive(DAGScheduler.scala:1820)
    at org.apache.spark.util.EventLoop$$anon$1.run(EventLoop.scala:48)
    at org.apache.spark.scheduler.DAGScheduler.runJob(DAGScheduler.scala:642)
    tại org.apache.spark.SparkContext.runJob(SparkContext.scala:2034)
    tại org.apache.spark.sql.execution.datasources.FileFormatWriter$.write(FileFormatWriter.scala:194)
    ... 31 thêm

Nhiệm vụ dường như bị kẹt ở một mức độ cụ thể và thất bại nhiều lần nên người quản lý đã loại bỏ nó.

Bạn có biết làm thế nào tôi có thể giải quyết vấn đề này?

câu trả lời hay nhất

sử dụngnhật ký sợi -applicationId -containerId Sau khi điều tra nhật ký, vấn đề dường như xuất phát từ một tác vụ liên tục bị lỗi. Spark thực hiện khả năng chịu lỗi và các tác vụ bị lặp lại, dẫn đến không đủ dung lượng ổ đĩa cho nhân viên của tôi (hơn 90%). Nút trở nên không khỏe mạnh và công việc cuối cùng thất bại.

Lý do tại sao nhiệm vụ thất bại vẫn còn là một bí ẩn. Tôi sẽ cập nhật nếu tôi biết chuyện gì đang xảy ra ở đó.

Về python - Cách khắc phục lỗi 'Container đã thoát với mã thoát khác 0 143' trong pyspark, chúng tôi đã tìm thấy một câu hỏi tương tự trên Stack Overflow: https://stackoverflow.com/questions/56137435/

Bài viết khuyến nghị: html - liên kết mở trên trang web của tôi không hoạt động

Bài viết khuyến nghị: Phương thức giả trả về dựa trên tham số đối tượng

Bài viết khuyến nghị: Làm cách nào để chỉ định bí danh cột SQL là SqlParameter?

Bài viết khuyến nghị: Ifs có điều kiện với nhiều trường hợp trả về

php - exit, exit(), exit(0), die(), die(0) - cách thoát tập lệnh
Tôi tin rằng tất cả chúng (thậm chí die() hoặc die(0)) đều giống nhau. Nếu chúng không giống nhau, cái nào tốt hơn cho một kịch bản thoát thành công? Nếu chúng giống nhau, có tiêu chí ưu tiên nào cho biết tập lệnh đã hoàn tất thành công không? Tôi có xu hướng sử dụng lối ra;.
java - sự khác biệt của hệ thống exit(0), System.exit(-1), System.exit(1) trong Java
Tôi muốn biết sự khác biệt giữa các mã sau trong Java System.exit(0);System.exit(-1);System.exit(1); Khi nào tôi phải sử dụng mã trên một cách thích hợp?
Powershell: Sự khác biệt giữa thoát và thoát có giá trị
Tôi nhận thấy hành vi lạ trong Powershell. Có hai tệp .ps1: main.ps1: echo "running exit.ps1" $myexitcode = & ".\exit.p
Anylogic - "Khi thoát" và "Bật khi thoát" trong Anylogic
Có một số khối như "Nguồn" trong Thư viện mô hình hóa quy trình Anylogic có các hoạt động như "Khi thoát" và "Bật khi thoát". Sự khác biệt giữa hai là gì? Tôi cố gắng tạo ra
Tập lệnh Bash: `exit 0` không thoát được
Vì vậy, tôi có tập lệnh Bash này: #!/bin/bash PID=`ps -u ...` if [ "$PID" = "" ]; then echo $(date) Server off: no
exit - Sự khác biệt giữa exit và _exit trong libc.so là gì?
(gdb) biểu tượng thông tin thoát thoát trong phần .text của /lib64/libc.so.6 (gdb) biểu tượng thông tin _exit _exit in se
rung - Tại sao tôi gặp lỗi: ADB đã thoát với mã thoát 1
Nếu tôi muốn khởi chạy một ứng dụng đơn giản mà tôi đã sử dụng vài tuần trước mà không gặp lỗi, tôi sẽ nhận được thông báo lỗi. Đó là mô tả lỗi của anh ấy: Khởi chạy lib\main.dart trên SM J530F ở chế độ gỡ lỗi..
Sự khác biệt giữa System.exit(0); và Platform.exit();?
Câu hỏi này đã có câu trả lời: Sử dụng Platform.exit() và System.exit(int) cùng nhau (3 câu trả lời) Đã đóng 5 năm trước. Ai đó ở đây đã đề xuất sử dụng cái sau. Tôi mới làm quen với java
bash - `exit $?` có khác với `exit` trong bash không?
Tôi hiểu rằng trong bash, một lối thoát bình thường sẽ hoàn thành một tập lệnh với trạng thái thoát của lệnh cuối cùng. Nhưng tôi cũng đã thấy mọi người sử dụng exit $? và bị nghi ngờ khi tôi đề xuất nó có hành vi tương tự. Ý nghĩa giữa hai chữ viết này là gì
php - Sự khác biệt giữa echo ('exit' ); là gì? chết;và chết('exit');?
Tôi đã thấy một số mã thực hiện điều này: if(something){ echo 'exit from program'; } ...more code và những mã khác chỉ sử dụng die: if
Sự khác biệt giữa thoát và thoát trong Ruby là gì?
Sự khác biệt giữa thoát và thoát trong Ruby là gì? Câu trả lời hay nhất Một số điều: Trình xử lý thoát chạy dưới dạng "thoát" thay vì "thoát!" Điều này có nghĩa là bất kỳ mã nào được gán cho "Sạch" sẽ không chạy với "Thoát!"
powershell - Sự khác biệt giữa "|| exit/b" và "|| exit/b !errorlevel!"
Chúng tôi có một loạt các tập lệnh xây dựng .bat được gọi bởi trình chạy GitLab dựa trên PowerShell gần đây đã được tái cấu trúc từ: chương trình lập luận nếu !errorlevel 0 exit!
Sử dụng Platform.exit() và System.exit(int) cùng nhau
Tôi muốn đóng ứng dụng javafx bằng mã trả về được chỉ định. Duyệt qua các câu trả lời trên SO, tôi tìm thấy thành ngữ sau: Platform.exit(); Ví dụ ở đây: Stop thread be;
Sự khác biệt giữa lối ra và std::exit trong C++ là gì?
Sự khác biệt giữa lối ra và std::exit trong C++ là gì? Tôi đã nghiên cứu nó nhưng tôi không thể tìm thấy bất cứ điều gì. Sự khác biệt giữa hai mã này là gì: 1: if(SDL_Init(SDL_INIT_EVERYTHING)
python — Tại sao các phương thức sys.exit(), exit(), raise SystemExit không hoạt động?
Tôi cần một cách khác để chấm dứt tập lệnh python trong hàm luồng. Ý định của tôi là chấm dứt máy chủ khi máy khách nhập 0... Điều này không có tác dụng vì luồng chưa bị chấm dứt phải không? Đây là mã của tôi: socket = socket.socket(
android - Khi nào nên sử dụng System.exit(0) và System.exit(2)?
Tôi muốn khởi động lại ứng dụng sau sự cố. Tôi đang sử dụng mã bên dưới để thực hiện tác vụ. Ý định mStartActivity = ý định mới(HomeActivity.this, SplashScreen
Sự khác biệt giữa Thoát (1) hoặc Kết quả: = 1; Thoát ở Delphi là gì?
Trong Delphi, bạn có thể thoát khỏi một hàm và cung cấp cho nó một giá trị trả về, rất giống với từ khóa return trong C/C++/Java/C#, v.v. Tuy nhiên, tôi thường viết một cái gì đó như thế này: Result : = 1;
javascript - ExtJS: xử lý sự kiện thoát trình duyệt (nhấp vào thoát chéo)
Tôi tự hỏi liệu có cách nào để xử lý các sự kiện thoát trình duyệt hay không. Ví dụ: tôi muốn gửi truy vấn khi người dùng nhấp vào dấu chéo để thoát hoặc đóng trình duyệt. Câu trả lời hay nhất Tôi nghĩ tôi đã tìm ra giải pháp. Tôi chưa thử nó trên IE nhưng có vẻ như nó hoạt động trên Firefox
Bash: Lợi ích của việc sử dụng exit ${1:0} thay vì exit $1 là gì
Tôi tìm thấy đoạn mã sau trong tập lệnh mkinitcpio của Archlinux. cleanup() { if [[ $workdir ]] thì # khi PRESE
Cách khắc phục lỗi 'Container đã thoát với mã thoát khác 0 143' trong pyspark
Tôi sử dụng đoạn mã sau để tính toán độ tương tự cosine giữa tất cả các hàng của khung dữ liệu: from pyspark.ml.feature import Normalizer from pyspark.mllib.linalg.distrib

không gian vũ trụ

Hồ sơ

Tôi là một lập trình viên xuất sắc, rất giỏi!

Bài viết phổ biến của tác giả

Nhận phiếu giảm giá taxi Didi miễn phí

Các bài viết phổ biến trên toàn bộ trang web

trang đầu

đã học

6Ren·AI

Trung tâm mua sắm

Cách khắc phục lỗi 'Container đã thoát với mã thoát khác 0 143' trong pyspark