Tôi mất 368 giây hadoop jar $HADOOP_INSTALL/hadoop-test.jar testmapredsort -sortInput dữ liệu ngẫu nhiên -sortOutput dữ liệu được sắp xếp
Làm cách nào để biết cụm của tôi có được cấu hình đúng hay không? Mất bao lâu để cấu hình cụm - nút của tôi: CPU 4xIntel(R) Xeon(R) E5645 @ 2.40GHz (mỗi lõi 6 nhân) bộ nhớ 24Gb
Tôi gặp phải lỗi sau khi chạy ứng dụng terasort bằng cách sửa đổi các tham số. 05/15/24 21:41:42 LỖI terasort.TeraSort: Đường dẫn đầu vào không tồn tại
Như hiện tại, câu hỏi này không phù hợp với định dạng Hỏi & Đáp của chúng tôi. Chúng tôi mong đợi câu trả lời sẽ được hỗ trợ bởi các sự kiện, trích dẫn hoặc chuyên môn, nhưng câu hỏi có thể gây ra tranh luận, tranh luận, bỏ phiếu hoặc thảo luận mở rộng. Nếu bạn cảm thấy vấn đề này có thể được cải thiện và có thể mở lại, hãy truy cập
Tôi có cụm Cloudera Hadoop và tôi đang thực hiện một số điểm chuẩn chạy Terasort, nhưng tôi nhận được kết quả rất thất thường sau 105 - 150 phút. Đôi khi tôi thấy nó sao chép nhiều hơn bình thường hoặc thực hiện nhiều thao tác thu gom rác, nhưng
Tôi đang sử dụng nút đơn Hadoop và có thể chuyển sang nút đa nút sau này. Bây giờ, cùng một nút vừa là nút chính vừa là nút phụ, vì vậy nút tên, trình quản lý tài nguyên nút dữ liệu và trình quản lý nút là
Trong quá trình triển khai Terasort của Hadoop, có một bộ lập lịch tên là TeraScheduler. Sau khi đọc qua mã, về cơ bản, bộ lập lịch sẽ thực hiện như sau: Chọn máy chủ có ít phần chia nhất Đối với máy chủ đó, hãy chọn số lượng máy chủ
Tôi định chèn một số mã vào trình ánh xạ của lớp TeraSort trong Hadoop 0.20.2. Nhưng nhìn vào mã nguồn, tôi không thể tìm thấy phần triển khai trình ánh xạ. Thông thường chúng ta sẽ thấy một lớp tên là job.setMapperClass()
Tôi đang cố gắng phân tích chức năng nào tiêu tốn nhiều thời gian nhất trong công việc TeraSort Hadoop. Đối với hệ thống thử nghiệm của tôi, tôi đang sử dụng thiết lập phân phối giả một nút cơ bản. Điều này có nghĩa là NameNode, DataNode, Tasktracke
Tôi có một băng ghế dự bị với terasort, nó chạy tốt khi dữ liệu chỉ có vài trăm GB, nhưng khi tôi tạo thêm dữ liệu (giả sử là 1 TB) thì nó bị lỗi ở một số bước. Đây là mã của tôi: nhập hoặc
Tôi là một lập trình viên xuất sắc, rất giỏi!