Trong thời đại của sức mạnh điện toán, video đám mây cần loại CPU nào?
Trong bối cảnh dữ liệu tăng trưởng bùng nổ và các thuật toán ngày càng tinh vi, kỷ nguyên của "sức mạnh điện toán" đã đến. Khi video trở thành trụ cột của lưu lượng truy cập Internet, tỷ lệ thâm nhập ngày càng bão hòa của các cảnh âm thanh và video, việc theo đuổi và đột phá "giới hạn giác quan" của con người, cùng với việc khám phá các cảnh đa dạng hơn và các yêu cầu kỹ thuật đã mang đến những thách thức lớn hơn cho khả năng mã hóa video, sức mạnh tính toán cơ bản và hỗ trợ phần cứng.
"Là cơ sở hạ tầng của ngành công nghiệp âm thanh và video, video cloud có thể đơn giản hóa đáng kể toàn bộ quá trình thu thập, xử lý, mã hóa, truyền tải và phân phối video." Như giám đốc kỹ thuật của Alibaba Cloud Video Cloud đã đề cập trong một cuộc phỏng vấn với Core Matters, Alibaba Cloud Video Cloud và Yitian 710 đang bắt đầu một hành trình mới để giúp video có thể tiếp cận được với mọi ngành công nghiệp.
Nhấp vào liên kết để xem video: https://www.eefocus.com/video/1462707.html .
Sự kết hợp của Video Cloud và Yitian 710
Đối với Thế vận hội mùa đông Bắc Kinh 2022, Alibaba Cloud đã đảm nhận một nhiệm vụ quan trọng, đó là hỗ trợ toàn bộ quá trình di chuyển lên đám mây của Thế vận hội mùa đông. Để đạt được mục đích này, Alibaba Cloud Video Cloud đã ra mắt giải pháp đổi mới đám mây mới - Alibaba Cloud ME. Đây cũng là lần đầu tiên trên thế giới, một cuộc họp toàn ảnh từ xa được thực hiện tại Thế vận hội Olympic. Đây là một cải tiến mang tính cách mạng phá vỡ khoảng cách thời gian và không gian. Trong khi ngạc nhiên trước sự tinh tế của hành trình đắm chìm trên đám mây, chúng ta không khỏi tự hỏi, sức mạnh nào giúp Alibaba Cloud Video có thể hoạt động hiệu quả trên đám mây? Ngoài tinh thần hoàn thành sứ mệnh và khả năng hỗ trợ phần mềm và thuật toán mạnh mẽ, Zhifan, người đứng đầu Alibaba Cloud Video Cloud Technology, cũng đề cập đến Yitian 710.
Khi chúng ta tập trung sự chú ý vào Yitian 710, chúng ta sẽ thấy rằng nó ra đời vào năm 2021. Đây là một chip đám mây do Pingtou Ge phát triển độc lập. Sau hơn một năm triển khai phần cứng và xác minh doanh nghiệp, các phiên bản Yitian 710 đã được áp dụng thành công vào hoạt động kinh doanh cốt lõi của Alibaba Group và phục vụ nhiều công ty công nghệ và Internet nổi tiếng. Dựa trên hiệu suất tuyệt vời trong giai đoạn đầu, Yitian 710 đã được triển khai tại các trung tâm dữ liệu Alibaba Cloud và quy mô triển khai sẽ tiếp tục mở rộng trong tương lai. Tất nhiên, không có con chip nào sinh ra đã mạnh mẽ như vậy. Người đứng đầu Video Cloud Technology cho biết: "Sự kết hợp giữa Video Cloud và Yitian 710 là một hành trình tuyệt vời, nhưng chúng tôi đã trải nghiệm rất nhiều điều ở giữa".
Nhớ lại hành trình này: "Do ngành kinh doanh video đang phát triển rất nhanh nên chu kỳ phát triển chip cũng rất dài. Cho dù là nghiên cứu và phát triển chip hay điều chỉnh chip cho phù hợp với sự phát triển của ngành kinh doanh đám mây video sau khi hạ cánh, thì đều vô cùng thách thức, nhưng chúng tôi đã sẵn sàng đối mặt với những thách thức và phá vỡ rào cản. Khi phiên bản đầu tiên của chip được tung ra, hiệu suất cơ bản của chip đã ổn định và do những lợi thế bản địa do kiến trúc Arm mang lại, và thực tế là Alibaba Cloud và các bạn cùng lớp của Pingtou Ge đã ngồi lại với nhau và thực hiện rất nhiều điều chỉnh thuật toán dựa trên sự hiểu biết về cấu trúc bên trong của chip, mã có thể chạy nhanh hơn trên chip.
Đồng thời, Yitian 710 cũng đã thực hiện tăng tốc và tối ưu hóa tập lệnh cho các kịch bản thuật toán cụ thể, chẳng hạn như các công nghệ điện toán vectơ như SVE. Trong số đó, lệnh BF16/INT8 mmla có thể thực hiện các phép nhân ma trận hiệu quả. Nó cũng hỗ trợ các lệnh tăng tốc như Hash và CRC32, có thể cho phép một lệnh duy nhất xử lý nhiều dữ liệu song song hơn, cải thiện đáng kể hiệu suất của các kịch bản như mã hóa và giải mã video, tăng cường mã hóa và giải mã AI, v.v. Đây là một quá trình lặp đi lặp lại ở cả hai bên. ”.
Do đó, từ thách thức hiệu suất ban đầu đối với CPU kiến trúc truyền thống cho đến hiện nay vượt xa CPU kiến trúc truyền thống, "sự chuyển đổi" của Yitian 710 đã đạt được từng bước. Giám đốc kỹ thuật của Video Cloud tin rằng: "Đây là một trường hợp rất tốt. Hoạt động kinh doanh của Alibaba Cloud Video Cloud và thiết kế chip của Pingtou Ge có thể kết hợp hoàn hảo. Bằng cách tận dụng lợi thế tương ứng của chúng, thiết kế chip sẽ đóng vai trò lớn hơn trong ngành công nghiệp video."
Khi nói đến sự hợp tác giữa Pingtou Ge và mảng kinh doanh video cloud của Alibaba Cloud, chúng ta không thể không nhắc đến một nền tảng công nghiệp lớn, đó là sự phát triển bùng nổ của video cloud. Vậy video cloud là gì? "Video cloud giống như nước và điện trong ngành công nghiệp âm thanh và video. Đây là cơ sở hạ tầng cơ bản có thể đơn giản hóa đáng kể chuỗi video từ khâu thu thập, xử lý, mã hóa, truyền tải đến phân phối." Ẩn dụ này rất phù hợp.
Video xã hội đang bùng nổ
Từ năm 2017, mức độ phổ biến của video ngắn liên tục tăng. Cùng với sự gia tăng của phát trực tiếp, hội nghị truyền hình, giảng dạy trực tuyến và các lĩnh vực khác trong thời kỳ dịch bệnh trong ba năm qua, việc video hóa xã hội đã trở thành một xu hướng chính. Theo "Báo cáo thống kê về sự phát triển Internet của Trung Quốc" lần thứ 50 do CNNIC công bố, tính đến tháng 6 năm 2022, lưu lượng truy cập Internet di động của nước ta đạt 124,1 tỷ GB, tăng 20,2% so với cùng kỳ năm trước; theo số liệu do Cisco công bố, nội dung video chiếm khoảng 90% tổng lưu lượng Internet và 64% tổng lưu lượng mạng di động. Kết hợp hai bộ dữ liệu này, chúng ta có thể kết luận rằng video đang trở thành nhân vật chính của lưu lượng truy cập Internet và lượng dữ liệu bùng nổ sẽ đặt ra những thách thức lớn hơn đối với sức mạnh tính toán và lưu trữ. .
Giá trị của video đám mây do đó được nhấn mạnh và thể hiện xu hướng phát triển không thể đảo ngược. Trong bối cảnh này, các công ty công nghệ trên toàn thế giới, chủ yếu là các công ty Internet, đã chuyển đổi và bắt đầu khám phá công nghệ đám mây video và triển khai nó trong các tình huống điển hình như giám sát an ninh, y tế từ xa, thương mại điện tử bán lẻ và các tổ chức tài chính. Hiện nay, ngành công nghiệp video đám mây đã hình thành một nhóm dẫn đầu tương đối ổn định, bao gồm các nhà cung cấp dịch vụ đám mây chính thống như Microsoft, AWS và Alibaba Cloud.
Về quy mô thị trường đám mây video trong nước, theo số liệu do IDC công bố, quy mô thị trường đám mây video của Trung Quốc đạt 5,05 tỷ đô la Mỹ trong nửa đầu năm 2022, tăng 15,7% so với cùng kỳ năm trước. Dự kiến đến năm 2026, quy mô thị trường sẽ đạt gần 30 tỷ đô la Mỹ. Điều đáng nói là báo cáo cho thấy Alibaba Cloud Video Cloud đã chiếm vị trí đầu tiên về thị phần đám mây video nói chung của Trung Quốc trong năm năm liên tiếp và tỷ lệ thâm nhập vẫn đang tăng lên.
Ngành công nghiệp video đang buộc phải lặp lại công nghệ
Đối với ngành công nghiệp đám mây video, lấy video trực tuyến làm ví dụ, từ Livestream nước ngoài sớm nhất và Douyu Live trong nước cho đến hiện tại, đã trải qua 25 năm lịch sử. Trên thực tế, từ góc độ kỹ thuật, tốc độ phát triển của toàn bộ ngành công nghiệp không nhanh như tưởng tượng. Ví dụ, mã hóa video đã phát triển từ H.264 lên H.265, rồi đến H.266, với tốc độ nâng cấp trung bình 10 năm một lần. Tại sao tốc độ lại không nhanh lắm? Bởi vì nó phải giải quyết nhiều vấn đề: sức mạnh tính toán, truyền dẫn mạng, tiêu chuẩn, v.v. Tuy nhiên, chúng ta thấy rằng ngành công nghiệp video ngày nay đang phát triển rất nhanh chóng, điều này cũng buộc công nghệ phải hoàn thiện quá trình lặp lại nhanh chóng. Những tác động ban đầu đã được nhìn thấy trong những năm gần đây. Ví dụ, tốc độ lặp lại nâng cấp của bộ mã hóa hiện là 5 năm, trước đây là 10 năm và dự kiến sẽ là 3 năm trong tương lai.
Tại sao mã hóa lại được nhấn mạnh ở đây? Trên thực tế, đám mây video là một ngành công nghiệp đòi hỏi nhiều máy tính. Lượng thông tin video rất lớn. Nếu sử dụng cùng chế độ nén như văn bản và hình ảnh, mức độ khôi phục sẽ không đủ, vì vậy video phải được mã hóa. Nếu mã hóa không tốt, không chỉ chất lượng video bị giảm mà còn dẫn đến khó khăn trong việc truyền tải. Bắt đầu từ MPEG2, tốc độ nén của mỗi thế hệ nâng cấp mã hóa video có thể được cải thiện khoảng 50%, thấp hơn nhiều so với tốc độ phân giải video tăng 4 lần mỗi thế hệ. Mặc dù vậy, nhu cầu về sức mạnh tính toán của CPU và độ phức tạp của thuật toán sẽ tăng ít nhất 10 lần với mỗi lần nâng cấp thế hệ, điều này sẽ mang đến những thách thức mới cho kiến trúc chip, tối ưu hóa bộ lệnh dưới cùng của chip, bộ nhớ chip và cấu trúc bộ đệm. Nhiều thuật toán cốt lõi cần được viết lại bằng các bộ lệnh mới, điều này có nghĩa là mã hóa video và sự phát triển của chip cần phải được đồng bộ hóa.
Video Cloud cần loại CPU nào?
Từ phần giới thiệu trước, chúng ta biết rằng mã hóa video đòi hỏi công suất tính toán cao. Vì chúng ta thường cố gắng trao đổi công suất tính toán để lưu trữ và công suất tính toán để truyền băng thông, chúng ta hy vọng rằng công suất tính toán càng cao càng tốt.
Vậy làm thế nào để cải thiện sức mạnh tính toán của CPU? Trước hết, chúng ta cần chọn một kiến trúc hạt nhân tốt. Trong lĩnh vực video, kiến trúc truyền thống đã có lịch sử hơn 30 năm và thị phần hiện tại vẫn vượt quá 90%, nhưng lại phải chịu gánh nặng tương thích ngược rất lớn. Là một bộ lệnh được sắp xếp hợp lý, Arm không chỉ không có hành lý lịch sử mà còn có thể thêm nhiều thanh ghi theo nhu cầu. Đồng thời, từ thiết kế cấu trúc bộ nhớ đệm và bộ lệnh, nó có thể đáp ứng tốt hơn nhu cầu xử lý video đòi hỏi công suất tính toán cao. Ngoài ra, dù là Hyper-Threading hay các loại khác, CPU có kiến trúc truyền thống đều đi theo con đường tăng tần số chính, điều này sẽ gặp phải một số vấn đề trong quá trình xử lý video. Ví dụ, khi video được nén, nó sẽ được chia thành khung I, khung P và khung B. Sức mạnh tính toán của mỗi khung không được phân bổ đều, điều này sẽ mang đến vấn đề về nhu cầu sức mạnh tính toán không ổn định.
Do đó, để ngăn chip ép xung, một số quá trình xử lý giảm tần số có thể được thực hiện và lúc này sức mạnh tính toán của nó có thể không đáp ứng được các yêu cầu mã hóa tương ứng. Trong kinh doanh thực tế, vì các dịch vụ video không chạy trên một máy duy nhất, nhiều cụm máy chủ sẽ được sử dụng để xử lý chúng. Để ngăn ngừa các tình huống phức tạp như tràn CPU, mực nước của cụm máy chủ phải được hạ xuống. Đây là một vấn đề lớn với các kiến trúc CPU truyền thống. Tuy nhiên, thiết kế tổng thể của Arm tương đối ổn định. Bất kể nhiệm vụ phức tạp đến đâu, nó đều có thể đạt được đầu ra ổn định, phân bổ tài nguyên và phân bổ mức nước tốt, mà không cần dành nhiều dự phòng để ngăn chip chạy quá mức, điều này rất quan trọng đối với doanh nghiệp B.
Ngoài tần số chính cao, CPU kiến trúc truyền thống có ít lõi, thường là hai vCPU/HT chia sẻ một lõi vật lý và 1 ALU, nhưng Arm có thể triển khai 128/256/512 lõi trở lên, tương tự như thiết kế GPU. Theo cách này, đối với các tình huống ứng dụng khác nhau, có thể sử dụng ít lõi hơn để đối phó với các tình huống có yêu cầu về công suất tính toán thấp và có thể sử dụng nhiều lõi hơn để đối phó với các tình huống có yêu cầu về công suất tính toán cao, để đạt được triển khai kinh doanh tốt hơn và giảm chi phí đầu tư. Lấy Yitian 710 làm ví dụ, nó có CPU 128 lõi với tần số chính là 2,75 GHz, có thể thích ứng với nhiều tình huống ứng dụng đám mây khác nhau.
Đồng thời, khi ngày càng nhiều dữ liệu được tải lên đám mây, hiệu suất tiêu thụ điện năng cũng rất quan trọng đối với các trung tâm dữ liệu. Đối với các nhà khai thác, mức tiêu thụ điện năng thấp có nghĩa là chi phí thấp. Ngoài việc tối ưu hóa ở cấp độ phần mềm, Yitian 710 có thể tính đến cả hiệu suất cao và mức tiêu thụ điện năng thấp.
Sự kết hợp của các yếu tố trên khiến cho sự kết hợp giữa Alibaba Cloud, công ty cung cấp dịch vụ đám mây video hàng đầu, và Yitian 710 có vẻ rất tự nhiên. Hiện tại, Yitian 710 đã được triển khai trên diện rộng và cung cấp dịch vụ đám mây. Theo phản hồi thực tế, Yitian 710 đã cải thiện hiệu quả chi phí của sức mạnh tính toán của Alibaba Cloud hơn 30% và giảm 60% mức tiêu thụ điện năng trên một đơn vị sức mạnh tính toán, đây là một cải thiện đáng kể.
Khám phá sự cân bằng
Nhìn vào toàn bộ ngành công nghiệp video đám mây, nhu cầu trải nghiệm của con người sẽ trở thành động lực thúc đẩy sự phát triển liên tục của video đám mây. Trong các tình huống ứng dụng đám mây, sự phát triển của CPU sẽ tiếp tục phát triển về mặt sức mạnh tính toán, I/O, khả năng thích ứng với giao thức mạng, khả năng suy luận và khả năng tạo ra thứ gì đó từ đầu. Trong tương lai, Arm sẽ trở thành một kiến trúc quan trọng trong đám mây video và thị phần chung của nó chắc chắn sẽ tăng lên, nhưng nó sẽ không phải là kiến trúc duy nhất. Các kiến trúc truyền thống, ASIC không đồng nhất và FPGA đều sẽ có chỗ đứng. Đối với kiến trúc Arm, hướng cải tiến trong tương lai là giảm mức tiêu thụ điện năng, tăng sức mạnh tính toán và tạo sự cân bằng giữa tính chuyên môn hóa và tính linh hoạt.
Đồng thời, chúng ta phải nhận ra rằng thách thức về sức mạnh tính toán của video trong tương lai là rất cao. Chỉ cần nâng cấp CPU không còn có thể đáp ứng được nhu cầu. Cần phải có một số xử lý đặc biệt, bao gồm ngày càng nhiều thuật toán AI và thuật toán đặc biệt, chẳng hạn như thuật toán tìm kiếm mô hình, v.v., sau đó củng cố một phần các mô-đun chung trong chip để cải thiện đáng kể hiệu quả xử lý video.
Do đó, trong thị trường đám mây video, mọi người luôn phải đánh đổi. Các nhà sản xuất chip đám mây phải xử lý mối quan hệ giữa hiệu suất năng lượng và tính linh hoạt của chip, và các nhà cung cấp dịch vụ đám mây phải sử dụng nhiều thuật toán nhanh với sức mạnh tính toán hạn chế. Như người đứng đầu Alibaba Cloud Video Cloud Technology đã nhấn mạnh: "Tầm nhìn của chúng tôi vẫn như vậy, đó là làm cho video có thể tiếp cận được với mọi tầng lớp xã hội, sau đó phản hồi lại ngành công nghiệp video để đạt được sự phát triển mạnh mẽ hơn".
Cuối cùng, bài viết này về việc liên tục nâng cấp codec và sức mạnh "cứng" để tạo ra giải pháp tối ưu cho đám mây video đã kết thúc. Nếu bạn muốn biết thêm về việc liên tục nâng cấp codec và sức mạnh "cứng" để tạo ra giải pháp tối ưu cho đám mây video, vui lòng tìm kiếm các bài viết của CFSDN hoặc tiếp tục duyệt các bài viết liên quan. Tôi hy vọng bạn sẽ ủng hộ blog của tôi trong tương lai! .
Tôi là một lập trình viên xuất sắc, rất giỏi!