Tôi hơi bối rối về khái niệm Hadoop.
Kích thước khối Hadoop, kích thước phân chia và kích thước khối
Sự khác biệt là gì?
Cảm ơn trước.
kích thước khối và kích thước khối相同。 chia kích thước có thể liên quan đến khối/khối Kích thước khác nhau.
Giảm bản đồ Thuật toán không áp dụng cho các khối tệp vật lý. Nó hoạt động tốt để phân chia đầu vào hợp lý. Việc phân tách đầu vào phụ thuộc vào nơi bản ghi được ghi. Một bản ghi có thể trải rộng trên hai người lập bản đồ.
HDFS Cách nó được thiết lập là nó chia các tệp rất lớn thành các phần lớn (ví dụ: có kích thước 128 MB) và lưu trữ ba bản sao của các khối này trên các nút khác nhau trong cụm. HDFS không biết nội dung của các tệp này.
Để giải quyết vấn đề này, Hadoop sử dụng cách biểu diễn logic dữ liệu được lưu trữ trong các khối tệp, được gọi là phân tách đầu vào. khi Bản đồGiảm Tính toán khách hàng công việcphân chia đầu vào, nó sẽ tìm ra bản ghi hoàn chỉnh đầu tiên trong khối bắt đầu từ đâu và bản ghi cuối cùng trong khối kết thúc ở đâu.
Nếu bản ghi cuối cùng trong một khối không đầy đủ thì phần phân tách đầu vào sẽ bao gồm thông tin vị trí cho khối tiếp theo và độ lệch byte của dữ liệu cần thiết để hoàn thành bản ghi.
看看这个bài báoTìm hiểu thêm.
Các câu hỏi SE liên quan:
Giới thiệu về chia tách tệp Hadoop/HDFS
Kích thước phân chia so với kích thước khối trong Hadoop
Tôi là một lập trình viên xuất sắc, rất giỏi!