cuốn sách gpt4 ai đã làm

Điểm chuẩn của Hadoop: TestDFSIO

In lại Tác giả: Hồ Xil Thời gian cập nhật: 2023-11-01 16:34:22 26 4
mua khóa gpt4 Nike

Tôi đang kiểm tra cấu hình hadoop của mình bằng tệp chuẩn TestDFSIO do Apache cung cấp. Tôi đang chạy nó theo hướng dẫn này (Tài nguyên 1):

http://www.michael-noll.com/blog/2011/04/09/benchmarking-and-stress-testing-an-hadoop-cluster-with-terasort-testdfsio-nnbench-mrbench/#testdfsio

Cách sử dụng bài kiểm tra như sau:

Kiểm traDFSIO.0.0.4
Cách sử dụng: hadoop jar $HADOOP_HOME/hadoop-*test*.jar TestDFSIO
-đọc | -viết | -sạch
[-nrFiles N] [-fileSize MB]
[-resFile resultFileName] [-bufferSize Byte]

Tôi hơi bối rối về một số lá cờ, cụ thể là,Cờ kích thước bộ đệm làm gì?Ngoài ra, khi điều hướng các hdf khi công việc hoàn thành thành công (tôi đã viết TestDFSIO trước), tôi không thể tìm thấy tên tệp mà tôi phải tạo bằng cách chọn resultFileName. Tại sao tôi không thể tìm thấy tệp bằng resultFileName?

Tôi cũng đã xem trang này (Tài nguyên 2) (đặc biệtTrang 25):

../../../_media/research/labs/2009/2009-12-tien_duc_dinh-evaluierung_von_hadoop-report.pdf

Là một trong những tham số thử nghiệm, họ đã sử dụng kích thước khối là 64 MB và 128 MB. Tôi đã thử đặt "64MB" (được chuyển đổi thành byte) sau cờ bufferSize, nhưng điều này khiến công việc thất bại, điều này khiến tôi tin rằng tôi không hiểu mục đích của cờ buffersize và cách kiểm tra với các kích thước khối khác nhau. Làm cách nào để thay đổi kích thước khối của bài kiểm tra (theo tài nguyên 2)?

câu trả lời hay nhất

Cờ kích thước bộ đệm là gì?

Cờ kích thước bộ đệm mô tả độ dài của bộ đệm ghi tính bằng byte. Nhìn thấy Kiểm traDFSIO.java Hàm tạo WriteMapper trong:

công khai WriteMapper() {
for(int i=0; i < bufferSize; i++)
bộ đệm[i] = (byte)('0' + i % 50);
}

Ở đây, dữ liệu được tạo và ghi vào bộ đệm trong bộ nhớ trước khi được ghi vào đĩa. Khi ghi vào đĩa sau này, nó được ghi theo một bước chứ không phải một byte trong một bước. Viết ít hơn thường có nghĩa là hiệu suất tốt hơn, do đó bộ đệm lớn hơn có thể cải thiện hiệu suất.

Tại sao tôi không thể tìm thấy tệp bằng resultFileName?

Kết quả thường được tự động ghi vào /benchmarks/TestDFSIO. Nếu bạn không thể tìm thấy nó ở đó, hãy tìm kiếm mapred.output.dir trong nhật ký công việc của bạn.

Làm cách nào để thay đổi kích thước khối của bài kiểm tra (theo tài nguyên 2)?

Kích thước khối có thể được truyền dưới dạng tham số như tùy chọn chung Vượt qua. Hãy thử một cái gì đó như:

hadoop jar $HADOOP_HOME/hadoop-*test*.jar TestDFSIO -D dfs.block.size=134217728 -write

Về Điểm chuẩn của Hadoop: TestDFSIO, chúng tôi đã tìm thấy một câu hỏi tương tự trên Stack Overflow: https://stackoverflow.com/questions/11856236/

26 4 0
Chứng chỉ ICP Bắc Kinh số 000000
Hợp tác quảng cáo: 1813099741@qq.com 6ren.com
Xem sitemap của VNExpress