cuốn sách gpt4 ai đã làm

15 phương pháp hay nhất của Karpenter để dễ dàng thành thạo việc chia tỷ lệ đàn hồi

In lại Tác giả: Sahara Thời gian cập nhật: 27-12-2024 10:45:52 56 4
mua khóa gpt4 Nike

Karpenter là một công cụ mở rộng tự động cụm Kubernetes mã nguồn mở linh hoạt, hiệu suất cao, hiện hỗ trợ AWS và Alibaba Cloud. Nó có thể nhanh chóng khởi động các tài nguyên máy tính có kích thước phù hợp tùy theo tải ứng dụng thay đổi, từ đó cải thiện tính khả dụng của ứng dụng.

So với Cluster Autoscaler, tính linh hoạt, dễ sử dụng, kiểm soát chi tiết và mức độ tự động hóa cao của Karpenter là một nâng cấp lớn có thể giúp bạn điều chỉnh tài nguyên nhanh hơn, mở rộng kết quả mô hình và liên tục tối ưu hóa.

Giữa năm nay Karpenter tung ra phiên bản 1.0, nghĩa là dự án là GA.

Quá trình chuyển hướng chỉ mất trung bình 20 phút

Việc chuyển sang Karpenter bằng các nút nhóm do EKS quản lý và Fargate rất đơn giản và sẽ gây ra sự gián đoạn tối thiểu vì nó tương thích thích hợp với các cụm Kubernetes hiện có và tận dụng tiêu chuẩn Kubernetes tài nguyên.

"CloudPilot AI".

thợ mộc

CloudPilot AI được xây dựng trên Karpenter. chúng tôi biết khá rõ về Karpenter Sau đây là phương pháp hay nhất cho cấu hình Karpenter:

Use Fargate or group node chuyên dụng

bộ điều khiển đang chạy trên các nút mà nó không quản lý, nó có thể vô hiệu hóa các nút đó, gây mất ổn định hệ thống. Bằng cách sử dụng EKS Fargate, bộ điều khiển vẫn độc lập với các kho lưu trữ nút, đảm bảo tính năng và hiệu ứng ổn định. sức mạnh công việc của ứng dụng, ngăn chặn hơn nữa sự tranh chấp tài nguyên và cải thiện độ tin cậy.

Sử dụng nhóm đoạn ngân sách (PDB)

Karpenter yêu cầu lịch trình hủy bỏ các nút trong quá trình hoạt động bình thường của nó Cách duy nhất để đảm bảo độ tin cậy dịch vụ đáng tin cậy là thông báo cho người cài đặt lịch trình về nhu cầu của từng triển khai hoặc StatefulSet.

Lập trình đoạn ngân sách là rất quan trọng để duy trì tính năng ứng dụng trong quá trình cập nhật hoặc mở quy định mở rộng bằng cách giới hạn số lượng nhóm có thể bị gián đoạn bất kỳ lúc nào. Điều này giúp ngăn chặn thời gian. Ngoài ra, ngân sách hoạt động liên tục giúp cân bằng hoạt động và ở mức độ ổn định, đảm bảo rằng ít nhất một số nhóm tiếp tục chạy trong khi thực hiện Kubernetes.

Tránh sử dụng tùy chọn khởi động mẫu

Hướng dẫn của Karpenter khuyên bạn nên tránh các tùy chọn khởi động mẫu vì chúng không hỗ trợ nâng cấp tự động các nút, Hỗ trợ kiến ​​trúc đa dạng hoặc khám phá bảo mật nhóm.

Thay vì sử dụng mẫu khởi động, bạn có thể sử dụng tùy chỉnh người dùng dữ liệu trong nút AWS mẫu hoặc trực tiếp hơn tùy chỉnh AMI tiếp theo.

Định cấu hình hết hạn nút trong nút nhóm.

thợ mộc bất kỳ hoạt động nào liên tục. cải thiện tính năng bảo mật và ổn định của hệ thống.

Thiết lập nút nhóm dựa trên loại công việc khối lượng

Khối lượng công việc có khả năng chấp nhận thay đổi nút gần hơn, do đó, bạn nên thiết lập cấu hình chỉ use version Theo yêu cầu cho khối lượng công việc đó. có khả năng chịu lỗi, bạn có thể thiết lập nút nhóm chỉ bằng cách sử dụng phiên bản Spot.

Tạo nút nhóm có thể cho khối lượng công việc GPU hoặc tính toán chung

đối số với các tác vụ sử dụng nhiều GPU, nút nhóm được định cấu hình cho các phiên bản GPU sẽ đảm bảo khả năng sử dụng và sử dụng hiệu quả các tài nguyên chuyên sâu này.

Điều thú vị là phiên bản GPU trùng lặp nhanh hơn so với phiên bản điện toán thông thường. use GPU phiên bản cho khối công việc chung, miễn phí là nút nhóm và khối lượng công việc được định cấu hình chính xác thực. Phù hợp, tránh tranh chấp tài nguyên và quản lý công việc đơn giản hóa bằng cách cung cấp các chính sách và cấu hình mở rộng mô độc lập cho các loại công việc khối lượng khác nhau.

Tài nguyên chỉ định cho khai báo/Pod của bạn

Karpenter sẽ tính toán dựa trên yêu cầu tài nguyên của Pod nên tài nguyên phải được chỉ định cho Deployment/Pod. tài nguyên xác định có thể gây ra sự cố khi mở rộng cụm.

Phân phối Pod trên nhiều nút và vùng có sẵn

Việc phân phối Pod trên nhiều nút và vùng ứng dụng có thể nâng cao khả năng phục hồi và tính toán khả năng sử dụng của các ứng dụng Kubernetes. dịch vụ của mình vì nếu một nút hoặc vùng có sẵn bị lỗi thì khối lượng công việc vẫn có thể tiếp tục chạy trên các nút hoặc vùng khác có sẵn.

Karpenter tự động hóa hoạt động phân phối này bằng cách cung cấp các nút ở các khu vực sẵn có khác nhau, đảm bảo cân bằng bằng cách tải và tối ưu hóa công việc sử dụng tài nguyên. rằng Pod được phát triển theo các quy tắc cụ thể để tránh tranh chấp tài nguyên, cải thiện hiệu suất và độ tin cậy, đồng thời gian duy trì các dịch vụ không bị gián đoạn ngay khi các nút hoặc vùng có sẵn bị lỗi.

Ưu tiên các gói tiết kiệm hoặc phiên bản dự trữ

Quay lại đầu trang tiết kiệm chi phí hơn trước khi chuyển sang phiên bản Theo yêu cầu hoặc các loại phiên bản khác Chiến lược này giúp bạn tối ưu đa hóa công suất dự trữ và tiết kiệm chi phí trong khi vẫn duy trì tính linh hoạt cho việc mở rộng.

Phân chia phiên bản theo yêu cầu và phiên bản Spot

Cấu hình này cho phép bạn tạo một hợp nhất phiên bản cài đặt trong đó một phần trăm nút EKS được sử dụng theo Phiên bản yêu cầu và phần còn lại sử dụng Spot Session. tình trạng hoạt động liên tục và mang lại lợi ích về chi phí của phiên bản Spot.

Bạn hoàn tất cấu hình này bằng cách tạo riêng các nút nhóm cho phiên bản Spot và phiên bản Theo yêu cầu, đồng thời phân bổ các giá trị Sau đó, hãy định cấu hình thang đo bằng cách đặt giá trị của thẻ này. Nếu muốn chia 20/80, bạn có thể đặt giá trị ["2", "3", "4", "5"] cho nhóm nút Spot và giá trị ["1"] cho nút Theo yêu cầu bể bơi.

Bảo vệ các dịch vụ hàng loạt trong thời gian bị gián đoạn (hợp nhất)

Nhảy lò cò Tuy nhiên, quá This quy trình có thể làm gián đoạn các Pod đang chạy, bao gồm cả hàng loạt nhiệm vụ quan trọng.

Bằng cách sử dụng chú thích kapenter.sh/do-not-disrupt: “true”, bạn có thể bảo vệ các Pod này khỏi việc chuyển đổi hoặc gián đoạn cho đến khi Nhiệm vụ của họ đã hoàn thành, chắc chắn rằng họ thực hiện và hoàn thành.

Sau đó.

Bằng cách thiết lập gián đoạn, bạn sẽ cho Karpenter biết loại nút nào cần xem xét để hợp lý nhất. có thể tắt tính năng hoàn toàn hợp lý nhất bằng cách đặt chuỗi giá trị "Không bao giờ".

Các phương pháp nâng cao hay nhất

Update các nút bằng Drift

Sự kiện Trôi dạt có thể gây ra nhiều nguyên nhân gây ra, như thay đổi cấu hình NodePool hoặc cập nhật cơ sở hạ tầng (tiện ích) như thay đổi AMI phiên bản). các nút công nhân, đảm bảo chúng vẫn là duy nhất so với các phiên bản và cơ sở hạ tầng được điều khiển mới nhất.

Tự động hóa cấu hình nút với tùy chỉnh người dùng dữ liệu

Bằng cách sử dụng trường userData trong EC2NodeClass, người dùng có thể tự động thực hiện cấu hình bổ sung khi khởi chạy nút nhân mà không mất đi AMI được tối ưu hóa tiêu chuẩn AWS EKS. Kubernetes, gắn ổ đĩa hoặc chạy công cụ khởi động tập lệnh.

Cung cấp trước khả năng để cải thiện tốc độ phản hồi

Chiến lược này được thiết kế để đảm bảo rằng sức mạnh tính toán có sẵn ngay lập tức khi cần bằng cách cung cấp cấp trước quá trình bổ sung tính toán tài nguyên. Sẽ cần khởi động một số lượng Pod lớn cùng lúc, mặc dù cách cung cấp dữ liệu đường ống được xử lý. trước dung lượng quá trình, bạn có thể giảm đáng kể thời gian cần thiết để bắt đầu khối lượng công việc, cải tiến cải thiện hiệu suất và khả năng phản hồi tổng thể.

10-20%.

CloudPilot AI giúp bạn sử dụng Karpenter một cách dễ dàng

CloudPilot AI CloudPilot AI

1. Đơn giản hóa quá trình khai báo cài đặt và phát triển.

Đối với người dùng thông thường, phải mất từ ​​​​1 đến 2 tuần để cài đặt và phát triển khai Karpenter và yêu cầu các kỹ năng CloudPilot AI chỉ mất 5 phút để hoàn tất cài đặt và phát triển khai báo và đây là dịch vụ được thực hiện quản lý hoàn toàn mà không cần vận hành và bảo trì.

CloudPilot AI có thể giúp người dùng nâng cấp tự động và mượt mà. giảm từ vài ngày xuống vài giờ.

2. Vận hành và bảo trì thông tin các phiên bản Spot: dự đoán sự gián đoạn trước 120 phút và tự động khôi phục.

Hầu hết người dùng Karpenter đều sử dụng phiên bản Spot để giảm chi phí đám mây. phiên bản Spot thường tạo ra các kỹ sư mất cảnh giác. chỉ bắt đầu xử lý các nút sau khi nhận được thông báo ngừng hoạt động. Đối với các cụm quy tắc lớn, rủi ro là cực kỳ cao.

CloudPilot AI có thể dự đoán các đoạn sự kiện trong hơn 7.500 trường hợp máy học thuật toán và thông báo thông tin cho người dùng trước 120 phút. hơn và ổn định hơn. bảo trì.

3. Lựa chọn nút thông tin hơn.

thợ mộc Hiệu suất rất lớn, cuối cùng chỉ dẫn đến giảm chi phí một chút nhưng lại giảm hiệu suất rất lớn.

CloudPilot AI nâng cấp chức năng chọn nút một cách thông tin trên cơ sở dữ liệu này. tố chất băng thông mạng, I/O drive disk và các loại chip cũng được xem xét. phiên bản có tính năng chi phí và hiệu suất giảm tài nguyên và tăng cường tính ổn định của ứng dụng.


Reading Khuyến khích.

Spot Insights đang trực tuyến.

AIGC, một công ty sản xuất thiết bị 3D phục vụ hơn 600 khách hàng, có thể giảm 70% GPU chi phí không?

Giải pháp thực tế mở rộng quy mô đàn hồi phục của K8 dựa trên KEDA và Karpenter.

Cuối cùng, bài viết này về 15 phương pháp hay nhất của Karpenter để dễ dàng thành công chia tỷ lệ đàn hồi phục sẽ kết thúc end tại đây. support blog của tôi trong tương lai .

56 4 0
Chứng chỉ ICP Bắc Kinh số 000000
Hợp tác quảng cáo: 1813099741@qq.com 6ren.com
Xem sitemap của VNExpress