[Đừng] Lặp lại chính mình* – Cách thiết kế thư viện nguồn mở cho máy học hiện đại

In lại Tác giả: Tôi là chú chim nhỏ Thời gian cập nhật: 2023-08-05 06:31:21

không muốn Lặp lại chính mình *

Cách thiết kế thư viện nguồn mở cho máy học hiện đại

Ý tưởng thiết kế máy biến áp

"Đừng lặp lại chính mình", hay DRY, là một nguyên tắc phát triển phần mềm nổi tiếng. Nguyên tắc này xuất phát từ "The Pragmatic Programmer" (tên tiếng Anh: The pragmatic Programming), cho đến nay đây là cuốn sách được đọc nhiều nhất trong lĩnh vực thiết kế mã. Nguyên tắc này rất đơn giản và toàn diện: tái sử dụng thay vì viết lại logic hiện có ở nơi khác. Điều này đảm bảo rằng mã luôn được đồng bộ hóa, giúp bảo trì dễ dàng hơn và mạnh mẽ hơn. Cách thực hành này làm cho bất kỳ thay đổi nào đối với logic mã chung đều ảnh hưởng thống nhất đến tất cả các mã phụ thuộc vào logic mã chung đó.

Thoạt nhìn, thiết kế của thư viện máy biến áp Ôm Mặt đi ngược lại nguyên tắc DRY. Mã cho cơ chế chú ý đã được sao chép sang các tệp mô hình khác nhau không dưới 50 lần. Đôi khi toàn bộ mã mô hình BERT được sao chép vào các tệp mô hình khác. Khi cộng tác viên thêm mô hình mới, nếu mô hình mới sử dụng mô hình có sẵn, chúng tôi thường bắt họ sao chép toàn bộ mã của mô hình hiện có vào mã mô hình mới, ngay cả một điều chỉnh logic nhỏ cũng không phải là ngoại lệ. Tại sao chúng tôi làm điều này? Có phải vì chúng ta quá lười biếng hay chỉ vì chúng ta không đủ khả năng gánh vác khối lượng công việc tập trung tất cả logic công khai vào một nơi?

Không, chúng tôi không lười biếng - việc sử dụng nguyên tắc DRY trong thư viện máy biến áp không phải là cố ý. Chúng tôi quyết định áp dụng nguyên tắc thiết kế khác với DRY mà chúng tôi gọi là chính sách tệp mô hình đơn. Chính sách tệp mô hình đơn yêu cầu tất cả mã cho bất kỳ mô hình nào chỉ được đặt trong một tệp, đó là tệp mô hình của chính mô hình đó. Nếu người đọc muốn hiểu cách BERT thực hiện suy luận, họ chỉ cần đọc tệp model_bert.py của BERT. Thông thường, chúng tôi từ chối mọi nỗ lực trừu tượng hóa và tập trung các mô hình con giống hệt nhau của các mô hình khác nhau vào một tệp mới. Chúng tôi không muốn một Chú ý_layer.py chứa tất cả các cơ chế chú ý có thể có.

Tại sao chúng tôi thực hiện thiết kế này? Chúng tôi tóm tắt lý do như sau

1. Transformers ra đời bằng mã nguồn mở và phục vụ mã nguồn mở
2. Sản phẩm của chúng tôi là mẫu mã và khách hàng của chúng tôi là người dùng đọc hoặc sửa đổi mã mẫu.
3. Lĩnh vực học máy đang phát triển cực kỳ nhanh chóng.
4. Mô hình học máy là mô hình tĩnh.

1. Ra đời từ nguồn mở, phục vụ nguồn mở

Transformers tích cực khuyến khích sự đóng góp từ bên ngoài. Đóng góp thường rơi vào hai loại: sửa lỗi và bổ sung mô hình mới. Nếu ai đó tìm thấy lỗi trong tệp mô hình, chúng tôi muốn người đó có thể sửa lỗi đó một cách dễ dàng. Không có gì bực bội hơn việc sửa một lỗi nhưng lại phát hiện ra rằng nó gây ra 100 lỗi trên các mẫu máy khác.

Bởi vì mỗi mã mô hình độc lập với nhau nên người chỉ biết mô hình mà mình đang làm việc sẽ dễ dàng sửa nó hơn nhiều. Tương tự như vậy, nếu bạn chỉ cần thêm một tệp mô hình mới, việc thêm mã mô hình mới và xem xét PR tương ứng sẽ dễ dàng hơn. Những người đóng góp không cần phải tìm ra cách thêm chức năng mới vào mã gây chú ý của công chúng mà không phá vỡ các mô hình hiện có và những người đánh giá mã ngầm biết rằng hoạt động PR này sẽ không phá vỡ bất kỳ mô hình hiện có nào.

2. Mã model là sản phẩm

Chúng tôi giả định rằng nhiều người dùng thư viện máy biến áp sẽ không chỉ đọc tài liệu mà còn xem mã mô hình thực tế và có khả năng sửa đổi nó. Xem xét rằng thư viện về máy biến áp đã được phân nhánh hơn 10.000 lần và bài báo về máy biến áp của chúng tôi đã được trích dẫn hơn 1.000 lần, giả định này có thể chấp nhận được.

Vì vậy, điều quan trọng nhất là giúp người đọc mã model máy biến áp lần đầu tiên dễ dàng hiểu và sửa đổi nó. Việc bao gồm tất cả các thành phần logic cần thiết của mô hình trong một tệp mô hình duy nhất giúp cải thiện khả năng đọc và sửa đổi. Với mục đích tương tự, chúng tôi cũng đặc biệt chú ý đến tính hợp lý của việc đặt tên biến và phương thức. Chúng tôi thích mã có tính biểu cảm/dễ đọc thay vì theo đuổi mã ngắn một cách mù quáng.

3. Học máy đang phát triển với tốc độ đáng kinh ngạc

Nghiên cứu trong lĩnh vực học máy, đặc biệt là lĩnh vực mạng lưới thần kinh, đang phát triển rất nhanh. Một mô hình tiên tiến cách đây một năm có thể đã lỗi thời ở thời điểm hiện tại. Chúng tôi thậm chí còn không biết cơ chế chú ý, nhúng vị trí hoặc kiến trúc nào sẽ phổ biến trong năm tới. Do đó, chúng tôi không thể xác định một mẫu chuẩn áp dụng cho tất cả các mô hình.

Ví dụ, hai năm trước, người ta có thể định nghĩa lớp tự chú ý của BERT là lớp chú ý tiêu chuẩn cho tất cả các mẫu máy biến áp. Về mặt logic, chức năng chú ý "tiêu chuẩn" có thể được chuyển vào tệp chú ý tập trung. Nhưng sau đó xuất hiện các lớp chú ý đã thêm các phần nhúng vị trí tương đối trong mỗi lớp (chẳng hạn như T5), nhiều dạng lớp chú ý được phân đoạn khác nhau (Reformer, Longformer, BigBird) và sự chú ý giúp tách biệt phần nhúng vị trí và Cơ chế nhúng từ (DeBERTa)… Bất cứ khi nào. điều gì đó như thế này xảy ra, chúng tôi phải tự hỏi liệu chúng tôi có nên điều chỉnh chức năng chú ý “tiêu chuẩn” hay tốt hơn là thêm chức năng chú ý mới vào chú ý.py. Nhưng nếu muốn thêm một chức năng chú ý mới thì nên đặt tên như thế nào? chú ý_with_positional_embd, cải cách_ chú ý và deberta_attention ?

Việc đặt tên chung cho các thành phần của mô hình học máy là rất nguy hiểm vì cách giải thích ý nghĩa của tên có thể nhanh chóng thay đổi hoặc trở nên lỗi thời. Ví dụ: sự chú ý được phân đoạn có đề cập đến sự chú ý được phân đoạn của GPTNeo, sự chú ý được phân đoạn của Reformer hay sự chú ý được phân đoạn của BigBird không? Lớp chú ý là lớp tự chú ý, lớp chú ý chéo hay cả hai? Nếu cuối cùng chúng ta quyết định đặt tên lớp chú ý theo tên mô hình, tại sao chúng ta không đặt chức năng chú ý này vào tệp mô hình tương ứng?

4. Mô hình học máy là tĩnh

Thư viện Transformers là tập hợp các mô hình học máy thống nhất và hoàn chỉnh được tạo bởi các nhóm nghiên cứu khác nhau. Mỗi mô hình học máy thường tương ứng với một bài báo và kho lưu trữ GitHub chính thức của nó. Khi một mô hình học máy được phát hành, nó hiếm khi được điều chỉnh hoặc thay đổi sau này.

Thay vào đó, các nhóm nghiên cứu có xu hướng tung ra các mô hình mới được xây dựng trên các mô hình trước đó, hiếm khi thực hiện những thay đổi đáng kể đối với mã đã phát hành. Đây là nhận thức quan trọng khi quyết định nguyên tắc thiết kế cho thư viện máy biến áp. Điều này có nghĩa là khi lược đồ mô hình được thêm vào máy biến áp thì các thành phần cơ bản của mô hình sẽ không thay đổi. Một số lỗi có thể được tìm thấy và sửa chữa, các phương thức hoặc biến có thể được đổi tên và định dạng đầu ra hoặc đầu vào của mô hình có thể được tinh chỉnh, nhưng các thành phần cốt lõi của mô hình nhìn chung sẽ không bị thay đổi. Do đó, nhu cầu thực hiện những thay đổi lớn trên toàn cầu đối với tất cả các mô hình trong máy biến áp đã giảm đi đáng kể, điều này khiến cho việc mỗi mô-đun logic chỉ tồn tại một lần ít quan trọng hơn vì chúng ta hiếm khi thay đổi nó.

Nhận thức thứ hai là không có sự phụ thuộc hai chiều giữa các mô hình. Các mô hình mới được phát hành có thể phụ thuộc vào các mô hình hiện có, nhưng rõ ràng là các mô hình hiện tại không phụ thuộc một cách hợp lý vào các mô hình trước đó. Ví dụ: T5 được xây dựng một phần trên BERT, do đó mã mô hình của T5 có thể phụ thuộc một cách hợp lý vào mã mô hình của BERT, nhưng BERT không bao giờ có thể phụ thuộc một cách hợp lý vào T5. Do đó, việc cấu trúc lại chức năng chú ý của BERT để đáp ứng các yêu cầu của T5 là không hợp lý về mặt logic - người đọc mã của lớp chú ý của BERT không cần phải có bất kỳ kiến thức nào về T5. Tương tự như vậy, điều này thúc đẩy chúng tôi không tập trung các thành phần như lớp chú ý vào một mô-đun chung mà tất cả các mô hình đều có thể truy cập được.

Mặt khác, mã cho một mô hình mới có thể có một số phụ thuộc logic vào mô hình trước đó. Ví dụ: mã của DeBERTa-v2 phụ thuộc vào mã của DeBERTa ở một mức độ nào đó. Khả năng bảo trì có thể được cải thiện đáng kể bằng cách đảm bảo rằng mã mẫu của DeBERTa-v2 vẫn được đồng bộ hóa với mã của DeBERTa. Về mặt lý thuyết, việc sửa lỗi trong DeBERTa cũng sẽ sửa được các lỗi tương tự trong DeBERTa-v2. Làm cách nào để chúng tôi duy trì một chiến lược tệp mô hình duy nhất trong khi vẫn đảm bảo rằng các mô hình mới luôn đồng bộ hóa với các mô hình mà chúng phụ thuộc vào?

Bây giờ, hãy giải thích lý do tại sao chúng tôi thêm dấu hoa thị $ {}^{\textbf{*}} $ sau "lặp lại chính mình". Chúng tôi không vô tình sao chép và dán mã tương ứng từ mô hình hiện có, ngay cả khi có vẻ như đó là điều chúng tôi đang làm. Sylvain Gugger, một trong những người bảo trì cốt lõi của Transformers, đã phát hiện ra một cơ chế tốt tôn trọng chính sách một tệp trong khi vẫn giữ chi phí bảo trì trong một phạm vi nhất định. Cơ chế này, hãy gọi nó là "cơ chế sao chép", cho phép chúng ta sử dụng câu lệnh #Copied from . để đánh dấu các thành phần logic nhất định (chẳng hạn như các chức năng của lớp chú ý), từ đó buộc mã hiện tại được đánh dấu phải nhất quán với Giống như . Ví dụ: dòng mã này trong lớp DeBERTa-v2 buộc toàn bộ lớp DebertaV2Layer phải giống hệt với lớp DebertaLayer ngoại trừ tiền tố tên lớp DeBERTav2. Như bạn có thể thấy, cơ chế sao chép làm cho mã mô hình rất dễ hiểu, đồng thời giảm đáng kể chi phí bảo trì. Nếu ai đó thay đổi chức năng của một mô hình, chúng ta có thể sử dụng công cụ tự động để sửa mã tương ứng cho tất cả các mô hình khác phụ thuộc vào chức năng đó của mô hình đó.

thiếu sót

Rõ ràng, chiến lược một tập tin cũng có những nhược điểm và chúng tôi sẽ đề cập ngắn gọn về hai nhược điểm ở đây.

Mục tiêu chính của Transformers là cung cấp API thống nhất để suy luận và đào tạo tất cả các mô hình để người dùng có thể nhanh chóng chuyển đổi giữa các mô hình khác nhau. Tuy nhiên, việc đảm bảo API nhất quán giữa các mô hình sẽ khó khăn hơn nhiều nếu tệp mô hình không được phép sử dụng mẫu thiết kế trừu tượng. Chúng tôi giải quyết vấn đề này bằng cách chạy một số lượng lớn thử nghiệm (khoảng 20.000 thử nghiệm mỗi ngày tính đến thời điểm viết bài này) để đảm bảo rằng mô hình tuân theo API nhất quán. Trong trường hợp này, chiến lược một tệp yêu cầu chúng tôi phải rất nghiêm ngặt khi xem xét các mô hình mới và trường hợp thử nghiệm mới.

Thứ hai, có nhiều nghiên cứu chỉ tập trung vào các thành phần riêng lẻ của mô hình học máy. Ví dụ: một số nhóm nghiên cứu sẽ nỗ lực phát triển một dạng cơ chế chú ý mới phù hợp với tất cả các mô hình được đào tạo trước hiện có, như đã thực hiện trong bài viết Suy nghĩ lại về sự chú ý với người biểu diễn. Chúng ta nên kết hợp nghiên cứu đó vào thư viện máy biến thế như thế nào? Nó thực sự khó để làm. Chúng ta có nên thay đổi tất cả các mô hình hiện có? Điều này sẽ vi phạm điểm 3 và 4 ở trên. Hay chúng ta nên thêm hơn 100 tệp mô hình mới, mỗi tệp có tiền tố là Trình biểu diễn...? Điều này cũng thật buồn cười. Thật không may, chúng tôi chưa có giải pháp tốt cho tình huống này và chúng tôi phải chọn không tích hợp kết quả của bài báo này vào máy biến áp. Khi bài viết này được chú ý nhiều hơn và có điểm kiểm tra đào tạo trước mạnh mẽ, chúng tôi có thể thêm tệp mô hình mới cho mô hình quan trọng nhất, ví dụ: chúng tôi hiện có modelling_performer_bert.py.

Tóm tắt

Nhìn chung, tại Ôm Mặt, chúng tôi tin chắc rằng chiến lược một tập tin là một khái niệm thiết kế mã phù hợp cho máy biến áp.

Bạn nghĩ gì? Chúng tôi rất muốn nghe ý kiến từ bạn! Nếu có điều gì muốn nói hãy để lại tin nhắn dưới bài viết này.

Văn bản gốc tiếng Anh: https://hf.co/blog/transformers-design-philosophy.

Tác giả gốc: Patrick von Platen.

Người phiên dịch: Matrix Yao (Yao Weifeng), Kỹ sư Deep Learning của Intel, đang nghiên cứu ứng dụng các mô hình dòng máy biến áp trên nhiều dữ liệu phương thức khác nhau cũng như đào tạo và suy luận về các mô hình quy mô lớn.

Người phản biện/sắp chữ: zhongdongy (阿东).

Cuối cùng, bài viết này về [Đừng] Lặp lại chính mình* - Cách thiết kế thư viện nguồn mở cho máy học hiện đại kết thúc tại đây. Nếu bạn muốn biết thêm về [Đừng] lặp lại chính mình* - Cách thiết kế nguồn mở. Thư viện dành cho máy học hiện đại Về nội dung của thư viện, vui lòng tìm kiếm các bài viết của CFSDN hoặc tiếp tục duyệt các bài viết liên quan. Tôi hy vọng bạn sẽ ủng hộ blog của tôi trong tương lai! .

Đề xuất bài viết: Hãy nói về == ở Golang từ một câu hỏi phỏng vấn

Đề xuất bài viết: Kênh G cho phép cải thiện hình ảnh trong điều kiện ánh sáng yếu

Đề xuất bài viết: Hướng dẫn cốt lõi về C++: Triết lý C++/Khái niệm cơ bản (Phần 2)

Đề xuất bài viết: Cơ sở dữ liệu NoSQL phổ biến là gì?

Học máy: Xây dựng mạng lưới thần kinh (Phần 2)
Giới thiệu Trong bài viết trước "Học máy: Xây dựng mạng thần kinh (Phần 1)", phương pháp xây dựng lớp tuyến tính, lớp chức năng kích hoạt và lớp chức năng mất mát đã được thảo luận sâu hơn về phương pháp xây dựng mạng và xây dựng hoàn chỉnh một mạng. mạng phân loại đơn giản. Mạng thư mục Nettwo
Học máy: Mạng lưới thần kinh được xây dựng như thế nào
Giới thiệu Trong bài viết này, chúng tôi sử dụng hồi quy logistic làm ví dụ để khám phá cách xây dựng mạng lưới thần kinh. Bài viết trình bày chi tiết về quy trình triển khai cấu trúc lớp giữa của mạng nơ-ron và đưa ra các định nghĩa (phương pháp thực hiện) của lớp tuyến tính, hàm kích hoạt và hàm mất mát. Giới thiệu nền thư mục
Học máy: Hồi quy logistic
Giới thiệu Trong hai bài viết trước, chúng tôi đã khám phá chi tiết cách ước tính đường cong hồi quy bằng cách sử dụng dữ liệu được lấy mẫu. Tiếp theo, trong phần này, chúng ta sẽ thảo luận sâu hơn về cách giải quyết các vấn đề phân loại. Chương sắp xếp nền giới thiệu phương pháp toán học thực hiện chương trình nền giới thiệu
Học máy: Hồi quy tuyến tính (Phần 2)
Giới thiệu Trong bài viết trước "Học máy: Hồi quy tuyến tính (Phần 1)", chúng tôi đã thảo luận về các phương pháp giải và hồi quy tuyến tính theo dữ liệu hai chiều. Trong phần này, chúng tôi sẽ tiếp tục mở rộng nó sang các tình huống nhiều chiều. Bối cảnh sắp xếp chương Giới thiệu về Chương trình Phương pháp giảm dần độ dốc bình phương nhỏ nhất
[Machine Learning] Hướng dẫn sử dụng công cụ machine learning low-code thư viện PyCaret
PyCaret là thư viện máy học Python mã nguồn mở, mã thấp giúp tự động hóa quy trình công việc máy học. Nó là một công cụ quản lý mô hình và học máy từ đầu đến cuối giúp tăng tốc đáng kể chu trình thử nghiệm và cải thiện hiệu quả công việc. PyCaret về cơ bản được xây dựng dựa trên một số công nghệ học máy
Học máy bằng Matlab?
Khi nghiên cứu của tôi tiến triển, giờ đây tôi đã tách ký sinh trùng ra khỏi hình ảnh. Ký sinh trùng trông giống như giun. Tôi muốn MATLAB đọc tất cả hình ảnh đầu vào, tìm kiếm những con sâu giống với hình ảnh màu tím đậm và nếu được phát hiện, hãy đưa ra phản hồi được phát hiện. Tôi đã thử sử dụng so sánh biểu đồ nhưng tôi nhận được
Python-Học máy
Tôi hiện đang cố gắng hiểu cách hoạt động của các thuật toán học máy, nhưng có một điều tôi không thực sự hiểu là sự khác biệt rõ ràng giữa độ chính xác tính toán của các nhãn được dự đoán và ma trận nhầm lẫn trực quan. Tôi sẽ cố gắng giải thích nó rõ ràng nhất có thể. Đây là một đoạn của tập dữ liệu (ở đây bạn có thể thấy 9 mẫu (lớn hơn trong tập dữ liệu thực)
Học máy-Zhou Zhihua
Chương 1 Giới thiệu Học máy: Cam kết nghiên cứu cách sử dụng kinh nghiệm để cải thiện hiệu suất của chính hệ thống thông qua các phương tiện tính toán. Trong các hệ thống máy tính, “trải nghiệm” thường tồn tại dưới dạng “dữ liệu”. Vì vậy, nội dung chính của nghiên cứu machine learning là về tính toán.
Thuật toán Machine Learning-KNN
1. Nguyên tắc thuật toán (K-Nearest Neighbor) Bản chất là đánh giá xem hai mẫu có giống nhau về khoảng cách hay không. Nếu khoảng cách đủ gần thì chúng được coi là đủ tương tự và thuộc cùng loại. chúng và gọi những mẫu này.
Học máy-Kmeans
Giới thiệu K-mean là một thuật toán học không giám sát cổ điển được sử dụng để phân cụm dữ liệu. Thuật toán K-mean xử lý tập dữ liệu dưới dạng không gian n chiều với n đặc điểm và cố gắng chia các điểm dữ liệu thành các cụm bằng cách giảm thiểu tổng sai số bình phương trong các cụm. Bài viết này sẽ giới thiệu Km
Machine Learning-Ensemble Learning LightGBM
Mục lục Lời tựa giới thiệu bối cảnh và nguồn gốc của LightGBM LightGBM L
Học máy – học gì
Lời nói đầu Có thể nói nếu bạn thành thạo machine learning, bạn sẽ có khả năng nói chuyện với máy móc và tận dụng tối đa máy móc để phục vụ con người. Trong thời đại trí tuệ nhân tạo, đây sẽ trở thành một kỹ năng cần thiết, giống như việc bạn là bậc thầy lập trình cách đây mười năm và tiếng Anh của bạn rất xuất sắc cách đây hai mươi năm. Vì vậy, dù bạn học chuyên ngành gì
Học máy--phong cách bắt đầu
Một số khái niệm xuyên suốt toàn bộ quá trình Khi chúng ta trừu tượng hóa quá trình học hỏi những điều đơn giản của con người thành nhiều giai đoạn, sau đó cụ thể hóa các giai đoạn này thành mã thông qua các phương pháp khác nhau, dựa vào khả năng cơ bản của máy tính. Chúng ta có thể cho phép máy móc "học" một số điều đơn giản.
Học máy - nhận dạng giới tính khuôn mặt
1. Bối cảnh lựa chọn chủ đề: Công nghệ nhận dạng khuôn mặt là một trong những chủ đề nghiên cứu thách thức nhất trong lĩnh vực nhận dạng mẫu và thị giác máy tính, đồng thời cũng là điểm nóng nghiên cứu trong những năm gần đây. Nhận dạng giới tính khuôn mặt như một công nghệ nhận dạng khuôn mặt.
[Big Data][Machine Learning] Giới thiệu về ModelCard (Thẻ mẫu)
Bất cứ khi nào chúng tôi phát hành một mô hình dữ liệu lớn đã được đào tạo trên đám mây công cộng hoặc đám mây riêng, để tạo điều kiện cho mọi người nhận dạng, hiểu và ứng dụng, chúng tôi tạo một trang hiển thị Thẻ mẫu dựa trên các tiêu chuẩn do ôm mặt đặt ra, đây là một màn hình mô hình rất tốt và hình thức tổ chức. Đây là một
[Machine Learning] 2. Máy vectơ hỗ trợ
2. Hỗ trợ tối ưu hóa kép máy vectơ Phương pháp nhân tử Lagrange có thể được sử dụng để giải các bài toán tối ưu hóa có điều kiện. Dạng cơ bản của nó là: \[\begin{gather} \min_w f(w),\\ \mathrm{st} \quad.
Mục đích của các tệp Zoo trong máy học/mã openVino là gì
Tôi đang cố chạy đoạn mã sau: https://github.com/opencv/opencv/blob/master/samples/dnn/classification.cpp Tôi đã tìm thấy ở đây tất cả các mã trước
python - Xây dựng mô hình hồi quy cây quyết định và dự đoán đầu ra mẫu - machine learning
Tôi mới làm quen với máy học. Khi tôi thực hành mô hình hồi quy cây quyết định với các tham số mặc định bằng cách sử dụng bộ dữ liệu Boston từ mô-đun scikit-learn. Giải pháp trong liên kết này ( Cách xây dựng cây quyết định Regre
matlab - machine learning - giới thiệu độ lệch trong dữ liệu huấn luyện
Tôi có dữ liệu cho đào tạo. Khi tôi đưa nó vào mạng thần kinh, dữ liệu có sai số 3%. Tôi biết có một số biểu hiện quá mức trong dữ liệu - ví dụ: lớp 5 có số lượng ví dụ bằng khoảng 1/10 so với các lớp khác. Bài tập về nhà của tôi nói rằng tôi có thể làm sai lệch dữ liệu huấn luyện (tức là xóa
python - Học máy - Phân loại nhiều nhãn SVM
Tôi gặp sự cố khi sử dụng SVM trong phân loại nhiều lớp trong Python. Trên thực tế, vấn đề là ở việc phân loại giới tính (từ hình ảnh), trong đó tập dữ liệu huấn luyện chỉ chứa "y=1" hoặc "y=-1" dưới dạng nhãn lớp (nhị phân). Tuy nhiên, trong dự đoán nếu là nam thì tôi phải dự đoán.

tôi là một con chim nhỏ

Hồ sơ

Tôi là một lập trình viên xuất sắc, rất giỏi!

Bài viết phổ biến của tác giả

Nhận phiếu giảm giá taxi Didi miễn phí

Các bài viết phổ biến trên toàn bộ trang web

trang đầu

đã học

6Ren AI

Trung tâm mua sắm