cuốn sách gpt4 ai đã làm

31. Chỉ mục phụ HBase và đường dẫn truy vấn thay thế

In lại Tác giả: Đường đến ông chủ Thời gian cập nhật: 2024-01-07 13:06:53 26 4
mua khóa gpt4 Nike

Chỉ mục phụ HBase và đường dẫn truy vấn thay thế

Bạn cũng có thể đọc tiêu đề của phần này là "Điều gì sẽ xảy ra nếu khóa hàng trong bảng của tôi trông như thế này, nhưng tôi cũng muốn bảng truy vấn của mình trông như thế này." Một ví dụ phổ biến trên danh sách phân phối là khóa hàng có định dạng " user-timestamp ” nhưng có yêu cầu báo cáo về hoạt động của người dùng trong một khung thời gian cụ thể. Vì vậy, việc lựa chọn của người dùng rất dễ dàng vì nó nằm ở vị trí chủ đạo của phím nhưng thời gian thì không.

Không có cách nào tốt nhất để trả lời câu hỏi này vì nó phụ thuộc vào:

  • số lượng người dùng
  • Kích thước dữ liệu và tốc độ đến dữ liệu
  • Tính linh hoạt trong các yêu cầu báo cáo (ví dụ: lựa chọn ngày cụ thể đầy đủ so với phạm vi được định cấu hình trước)
  • Tốc độ thực hiện truy vấn mong muốn (ví dụ: 90 giây có thể hợp lý cho báo cáo đặc biệt nhưng có thể quá dài đối với các trường hợp khác)

Và giải pháp cũng bị ảnh hưởng bởi kích thước của cụm và khả năng xử lý mà giải pháp yêu cầu. Các kỹ thuật phổ biến được đề cập trong các phần dưới đây. Đây là danh sách đầy đủ nhưng chưa đầy đủ các phương pháp.

Không có gì đáng ngạc nhiên khi các chỉ mục phụ yêu cầu không gian và xử lý cụm bổ sung. Đây chính xác là những gì xảy ra trong RDBMS vì hoạt động tạo chỉ mục dự phòng yêu cầu không gian cập nhật và chu trình xử lý. Các sản phẩm RDBMS tiên tiến hơn về mặt này và có thể xử lý việc quản lý chỉ mục thay thế. Tuy nhiên, HBase có quy mô tốt hơn với khối lượng dữ liệu lớn hơn, vì vậy đây là một sự hoán đổi tính năng.

Vui lòng lưu ý điều chỉnh hiệu suất Apache HBase khi triển khai các phương pháp này.

Ngoài ra, hãy xem phản hồi của David Butler trong chuỗi danh sách phân phối này HBase, mail#user - Stargate + hbase.

Truy vấn bộ lọc HBase

Tùy thuộc vào tình huống, việc sử dụng bộ lọc yêu cầu của khách hàng có thể phù hợp. Trong trường hợp này, không có chỉ mục phụ nào được tạo. Tuy nhiên, vui lòng không thực hiện quét toàn bộ trên một bảng lớn như vậy trên một ứng dụng như máy khách đơn luồng.

HBase thường xuyên cập nhật các chỉ số phụ

Chỉ mục phụ có thể được tạo trên một bảng khác và được cập nhật định kỳ thông qua công việc MapReduce. Công việc có thể được thực hiện suốt cả ngày, nhưng tùy thuộc vào chiến lược tải, nó vẫn có thể không đồng bộ với bảng dữ liệu chính.

Chỉ số phụ ghi đôi HBase

Một chiến lược khác là xây dựng các chỉ mục phụ khi xuất bản dữ liệu lên cụm (ví dụ: ghi vào bảng dữ liệu, ghi vào bảng chỉ mục). Nếu việc này được thực hiện sau khi bảng dữ liệu đã tồn tại thì việc khởi động sẽ được yêu cầu cho chỉ mục phụ bằng công việc MapReduce.

Bảng tóm tắt HBase

Bảng tóm tắt là cách tiếp cận phổ biến khi khung thời gian rất rộng (ví dụ: báo cáo kéo dài cả năm) và khi lượng dữ liệu lớn. Chúng sẽ được tạo vào một bảng khác thông qua công việc MapReduce.

Chỉ số phụ của bộ đồng xử lý HBase

Bộ đồng xử lý hoạt động giống như trình kích hoạt RDBMS. Chúng tăng ở mức 0,92.

26 4 0
Chứng chỉ ICP Bắc Kinh số 000000
Hợp tác quảng cáo: 1813099741@qq.com 6ren.com
Xem sitemap của VNExpress