pytorch tinh chỉnh hoạt động mô hình được đào tạo trước-6ren

pytorch tinh chỉnh hoạt động mô hình được đào tạo trước

In lại Tác giả: qq735679552 Thời gian cập nhật: 27-09-2022 22:32:09

CFSDN nhấn mạnh vào giá trị tạo ra nguồn mở và chúng tôi cam kết xây dựng nền tảng chia sẻ tài nguyên để mọi nhân viên CNTT có thể tìm thấy thế giới tuyệt vời của bạn tại đây.

Bài viết trên blog CFSDN pytorch tinh chỉnh các thao tác mô hình được huấn luyện trước được tác giả sưu tầm và biên soạn. Nếu các bạn quan tâm đến bài viết này thì nhớ like nhé.

số 1

torchvision chứa nhiều mô hình được đào tạo trước, giúp việc tinh chỉnh trở nên rất dễ dàng. Bài viết này chủ yếu giới thiệu cách tinh chỉnh mô hình được đào tạo trước trong torchvision.

Cài đặt

 
    ? 
   
         pip cài đặt torchvision

Cách tinh chỉnh.

Lấy resnet18 làm ví dụ:

 
    ? 
   
         từ 
         tầm nhìn ngọn đuốc  
         nhập khẩu 
         mô hình 
        
         từ 
         ngọn đuốc  
         nhập khẩu 
         không 
        
         từ 
         ngọn đuốc  
         nhập khẩu 
         tối ưu 
        
         mô hình resnet  
         = 
         models.resnet18(đã được đào tạo trước 
         = 
         ĐÚNG VẬY 
         )  
        
         # Nếu tiền huấn luyện được đặt thành True, các trọng số tương ứng với mô hình sẽ được tự động tải xuống và tải vào mô hình. 
        
         # Bạn cũng có thể tự tải trọng số xuống rồi tải vào mô hình. Có địa chỉ trọng số trong mã nguồn. 
        
         # Giả sử nhiệm vụ phân loại của chúng ta chỉ cần chia thành 100 loại thì việc chúng ta nên làm là 
        
         #1. Xem mã nguồn của resnet 
        
         #2. Nhìn tên layer cuối cùng (trong resnet là self.fc = nn.Linear(512 * block.expansion, num_classes)) 
        
         #3. Thay thế lớp này ở bên ngoài 
        
         resnet_model.fc 
         = 
         nn.Linear(in_features 
         = 
         ..., tính năng ngoài 
         = 
         100 
         ) 
        
         # Vậy đó. Ngoại trừ các tham số của lớp đầu ra của mô hình đã sửa đổi được khởi tạo ngẫu nhiên, các lớp khác được khởi tạo với các tham số được huấn luyện trước. 
        
         # Nếu chỉ muốn huấn luyện lớp cuối cùng thì việc bạn nên làm là: 
        
         # 1. Đặt tham số require_grad của các lớp khác thành Sai 
        
         # 2. Xây dựng trình tối ưu hóa Các tham số được quản lý bởi trình tối ưu hóa chỉ là các tham số của lớp cuối cùng. 
        
         #3. Rồi lùi lại, bước là đủ 
        
         # Bước này có thể tiết kiệm rất nhiều thời gian, vì hầu hết các tham số không cần tính gradient 
        
         vì 
         ĐẾN  
         TRONG 
         danh sách 
         (resnet_model.parameters())[: 
         - 
         2 
         ]: 
        
         para.requires_grad 
         = 
         SAI 
        
         trình tối ưu hóa  
         = 
         optim.SGD(params 
         = 
         [resnet_model.fc.weight, resnet_model.fc.bias], lr 
         = 
         1e 
         - 
         3 
         ) 
        
         ...

Tại sao

Dưới đây là phần giới thiệu về những gì xảy ra trong khung khi chạy resnet_model.fc= nn.Linear(in_features=..., out_features=100).

Lúc này, bạn nên xem phần __setattr__ của mã nguồn nn.Module, vì phương thức này sẽ được gọi khi settingattr:

 
    ? 
   
         định nghĩa 
         __setattr__( 
         bản thân 
         , tên, giá trị): 
        
         định nghĩa 
         xóa_khỏi( 
         * 
         dict): 
        
         vì 
         ngày  
         TRONG 
         câu nói: 
        
         nếu như 
         tên  
         TRONG 
         ngày: 
        
         của 
         d[tên]

Điều đầu tiên xuất hiện là hàm Remove_from. Mục đích của hàm này là loại bỏ thuộc tính cũ nếu một thuộc tính có cùng tên xuất hiện. Sử dụng ví dụ vừa đưa ra, đây là:

Có một Mô-đun có tên fc trong mô hình được đào tạo trước.

Ngoài định nghĩa lớp, chúng ta gán lại một Mô-đun khác cho fc.

Mô-đun tương ứng với fc trong định nghĩa lớp sẽ bị xóa khỏi mô hình.

Phần 2

Lời nói đầu

Bài viết này là bản tóm tắt về khởi tạo và tinh chỉnh tham số từ Diễn đàn PyTorch và đây cũng là "cách thực hành tốt nhất" mà tôi sử dụng khi viết mã. Cuối cùng, tôi mong mọi người sẽ ghé thăm diễn đàn thường xuyên hơn và sẽ có nhiều câu trả lời chất lượng.

Khởi tạo tham số

Việc khởi tạo tham số thực chất là gán giá trị cho tham số. Các tham số chúng ta cần tìm hiểu thực chất là Variable. Nó thực chất là một gói của Tensor và cung cấp các lý do như data và grad. Điều này có nghĩa là chúng ta có thể trực tiếp thao tác và gán giá trị cho các tham số này. Đây là lúc PyTorch hoạt động đơn giản và hiệu quả.

pytorch tinh chỉnh hoạt động mô hình được đào tạo trước

Vì vậy, chúng ta có thể thực hiện các thao tác sau để khởi tạo. Tất nhiên, có những phương pháp khác, nhưng phương pháp này được tác giả của PyTorch khuyên dùng:

 
    ? 
   
         định nghĩa 
         trọng lượng khởi tạo(m): 
        
         # Sử dụng isinstance để xác định loại m thuộc về 
        
         nếu như 
         là trường hợp 
         (m, nn.Conv2d): 
        
         N  
         = 
         m.kích thước_hạt_nhân[ 
         0 
         ]  
         * 
         m.kích thước_hạt_nhân[ 
         1 
         ]  
         * 
         m.out_kênh 
        
         m.trọng lượng.dữ liệu.bình thường_( 
         0 
         , toán học.sqrt( 
         2. 
         / 
         N)) 
        
         Elif 
         là trường hợp 
         (m, nn.BatchNorm2d): 
        
         # Trọng số và độ lệch trong m thực tế là Biến, để tìm hiểu các tham số và truyền ngược 
        
         m.trọng lượng.dữ liệu.điền_( 
         1 
         ) 
        
         m.bias.data.zero_()

Tinh chỉnh

Thông thường sau khi tải các tham số của mô hình được huấn luyện trước, chúng ta cần tinh chỉnh mô hình, có thể tinh chỉnh theo nhiều cách khác nhau.

tinh chỉnh cục bộ

Đôi khi sau khi tải mô hình huấn luyện, chúng ta chỉ muốn điều chỉnh một vài lớp cuối cùng và không huấn luyện các lớp khác. Trên thực tế, không đào tạo có nghĩa là không tính toán độ dốc require_grad được cung cấp trong PyTorch khiến việc kiểm soát quá trình đào tạo trở nên rất đơn giản.

 
    ? 
   
         người mẫu  
         = 
         torchvision.models.resnet18(đã được đào tạo trước 
         = 
         ĐÚNG VẬY 
         ) 
        
         vì 
         tham số  
         TRONG 
         mô hình.tham số(): 
        
         param.requires_grad  
         = 
         SAI 
        
         # Thay thế lớp được kết nối đầy đủ cuối cùng và huấn luyện 100 danh mục 
        
         # Các tham số của mô-đun mới được xây dựng mặc định requirees_grad thành True. 
        
         model.fc  
         = 
         nn.Tuyến tính( 
         512 
         ,  
         100 
         ) 
        
         # Chỉ tối ưu hóa lớp phân loại cuối cùng 
        
         trình tối ưu hóa  
         = 
         optim.SGD(mô hình.fc.tham số(), lr 
         = 
         1e 
         - 
         2 
         , động lượng 
         = 
         0,9 
         )

tinh chỉnh toàn cầu

Đôi khi chúng tôi cần tinh chỉnh toàn bộ thế giới, nhưng chúng tôi muốn lớp đã thay đổi có tốc độ học khác với các lớp khác. Tại thời điểm này, chúng tôi có thể chỉ định các tốc độ học khác nhau cho các lớp khác và các lớp mới trong trình tối ưu hóa. Ví dụ:

 
    ? 
   
 
     
       
       
         bỏ qua_tham_số  
         = 
         danh sách 
         ( 
         bản đồ 
         ( 
         nhận dạng 
         , mô hình.fc.parameters())) 
        
 
         tham số cơ sở  
         = 
         lọc 
         ( 
         lambda 
         P:  
         nhận dạng 
         (P)  
         không 
         TRONG 
         bỏ qua các tham số, 
        
 
                               
         mô hình.tham số()) 
        
 
           
        
 
         trình tối ưu hóa  
         = 
         torch.optim.SGD([ 
        
 
                      
         { 
         'tham số' 
         : tham số cơ sở}, 
        
 
                      
         { 
         'tham số' 
         : model.fc.parameters(),  
         'lr' 
         :  
         1e 
         - 
         3 
         } 
        
 
                      
         ], lr 
         = 
         1e 
         - 
         2 
         , động lượng 
         = 
         0,9 
         ) 
        
 
     
 
   

Trong số đó, base_params sử dụng 1e-3 để huấn luyện, model.fc.parameters sử dụng 1e-2 để huấn luyện và động lượng là chung cho cả hai.

Số 3:

mô hình tinh chỉnh pytorch

Bài viết chủ yếu mô tả cách đọc tham số của các mô hình đã được huấn luyện trước đó trên pytorch và cách đọc một số tham số của mô hình khi tên mô hình đã thay đổi.

Lưu trữ và đọc mô hình pytorch

Trong quá trình lưu mô hình, mô hình và các tham số được lưu trữ cùng nhau và các tham số mô hình được lưu trữ riêng biệt.

Lưu trữ riêng các tham số mô hình

Khi lưu trữ sử dụng:

 
    ? 
   
         torch.save(the_model.state_dict(), PATH)

Khi đọc:

 
    ? 
   
         mô hình  
         = 
         Lớp mô hình( 
         * 
         các đối số,  
         * 
         * 
         kwargs) 
        
         the_model.load_state_dict(torch.load(PATH))

Lưu trữ mô hình và thông số

kho:

 
    ? 
   
         torch.save(mô hình, PATH)

Đọc:

 
    ? 
   
         mô hình  
         = 
         torch.load(PATH)

Thông số mô hình

Quá trình tinh chỉnh là đọc các tham số của mô hình gốc. Tuy nhiên, do các tập dữ liệu được mô hình xử lý khác nhau nên tổng số lớp ở lớp cuối cùng là khác nhau nên lớp cuối cùng của mô hình. cần phải sửa đổi để các tham số được mô hình đọc. Các tham số của mô hình có dạng khác với các tham số được tải xuống sau khi huấn luyện trên một tập dữ liệu lớn. Chúng ta cần viết hàm riêng để đọc các tham số.

Dạng tham số của mô hình pytorch

Các tham số của mô hình được lưu trữ dưới dạng từ điển.

 
    ? 
   
         mô hình_dict  
         = 
         mô hình_state_dict(), 
        
         vì 
         k, v  
         TRONG 
         model_dict.items(): 
        
         in 
         (tiếng Anh)

Bạn có thể thấy tất cả các giá trị quan trọng.

Nếu muốn sửa đổi các tham số của mô hình, chỉ cần gán giá trị cho các giá trị key tương ứng.

 
    ? 
   
         mô hình_dict[k]  
         = 
         giá trị mới

Cuối cùng, các tham số của mô hình được cập nhật.

 
    ? 
   
         mô hình.tải_trạng_thái_dict(mô_hình_dict)

Nếu giá trị khóa của mô hình giống với giá trị khóa khi huấn luyện trên tập dữ liệu lớn

Chúng ta có thể đọc mô hình thông qua thuật toán sau.

 
    ? 
   
         mô hình_dict  
         = 
         mô hình.state_dict()  
        
         pretrained_dict  
         = 
         torch.load(đường dẫn mô hình) 
        
         # 1. lọc ra các khóa không cần thiết 
        
         khác biệt  
         = 
         {k:v  
         vì 
         k, v  
         TRONG 
         model_dict.items()  
         nếu như 
         \ 
        
         tôi  
         TRONG 
         pretrained_dict  
         Và 
         pretrained_dict[k].kích thước()  
         = 
         = 
         v.kích thước()} 
        
         pretrained_dict  
         = 
         {k:v  
         vì 
         k, v  
         TRONG 
         pretrained_dict.items()  
         nếu như 
         tôi  
         TRONG 
         mô hình_dict  
         Và 
         mô hình_dict[k].kích thước()  
         = 
         = 
         v.kích thước()} 
        
         pretrained_dict.update(khác biệt) 
        
         # 2. ghi đè các mục trong dict trạng thái hiện tại 
        
         model_dict.update(pretrained_dict) 
        
         # 3. tải dict trạng thái mới 
        
         mô hình.load_state_dict(mô hình_dict)

Nếu giá trị khóa của mô hình khác với giá trị khóa khi huấn luyện trên tập dữ liệu lớn nhưng thứ tự giống nhau

 
    ? 
   
         mô hình_dict  
         = 
         mô hình.state_dict()  
        
         pretrained_dict  
         = 
         torch.load(đường dẫn mô hình) 
        
         chìa khóa  
         = 
         [] 
        
         vì 
         k, v  
         TRONG 
         pretrained_dict.items(): 
        
         keys.append(k) 
        
         Tôi  
         = 
         0 
        
         vì 
         k, v  
         TRONG 
         model_dict.items(): 
        
         nếu như 
         v.kích thước()  
         = 
         = 
         pretrained_dict[khóa[i]].kích thước(): 
        
         in 
         (k,  
         ',' 
         , phím[i]) 
        
         mô hình_dict[k] 
         = 
         pretrained_dict[khóa[i]] 
        
         Tôi  
         = 
         Tôi  
         + 
         1 
        
         mô hình.load_state_dict(mô hình_dict)

Nếu giá trị khóa của mô hình khác với giá trị khóa khi huấn luyện trên tập dữ liệu lớn nhưng thứ tự cũng khác nhau.

Hãy tự mình tìm ra mối quan hệ tương ứng, một phím tương ứng với việc gán một phím.

Trên đây là kinh nghiệm cá nhân của mình, hi vọng có thể cho các bạn tham khảo và mong các bạn có thể ủng hộ mình.

Liên kết gốc: https://blog.csdn.net/Scythe666/article/details/82809615.

Cuối cùng, bài viết về hoạt động của mô hình được đào tạo trước bằng pytorch kết thúc ở đây. Nếu bạn muốn biết thêm về hoạt động của mô hình được đào tạo trước bằng pytorch, vui lòng tìm kiếm các bài viết CFSDN hoặc tiếp tục duyệt các bài viết liên quan. ủng hộ blog của tôi trong tương lai! .

Đề xuất bài viết: Một số vấn đề cần chú ý khi sử dụng phép gán liên tục trong Python

Đề xuất bài viết: trình thu thập dữ liệu ngược python gọi chính xác logic mã hóa JAR

Đề xuất bài viết: Python gọi API Amap để thực hiện chức năng chuyển đổi địa chỉ batch thành kinh độ và vĩ độ và ghi chúng vào bảng

Đề xuất bài viết: Python thực hiện chuyển đổi byte thành số nguyên

c# - Mô hình xem mô hình Mvvm
Nó có thể được đặt tên là mô hình MVVM không? Bởi vì Xem dữ liệu mô hình lượt xem. View chỉ nên tương tác với ViewModelData? Tôi đã đọc ở đâu đó rằng mô hình MVVM chính xác phải ở Chế độ ViewModel chứ không phải Chế độ
javascript - Model->Người quan sát->Xem->Bộ điều khiển->Mô hình->
Tôi đang đọc một bài viết về các mẫu thiết kế và trong khi các tác giả đều cho rằng mẫu quan sát là tuyệt vời thì khi nói đến thiết kế, mọi người đều nói về MVC. Tôi hơi bối rối, sơ đồ MVC không có tính tuần hoàn, chẳng phải dòng mã có cấu trúc liên kết khép kín là điều tự nhiên sao? Sao không ai nói về mẫu này :mo
c# - Mục ghi chú trong WPF. Mô hình, Xem, Xem mô hình
Tôi đang làm việc trên dự án Sticky Notes và thực hiện giao diện người dùng trong WPF, rõ ràng là tôi chọn MVVM làm lựa chọn thiết kế kiến trúc. Tôi đang suy nghĩ lại về Mô hình, Chế độ xem và Chế độ xem của mình. Tôi có một tập tin có tên Không
C# Chuyển đổi danh sách dựa trên thuộc tính liệt kê trong mô hình<模型> Chuyển đổi sang từ điển<><模型>>?
Đừng nhầm lẫn: Làm cách nào tôi có thể chuyển đổi Danh sách thành Hashtable trong C#? Tôi có một danh sách các mô hình và tôi muốn sắp xếp chúng thành một bảng băm, với các enum làm khóa và một danh sách các mô hình (với các giá trị của enum) làm giá trị. công khai
c# - Thực thể so với Mô hình so với Mô hình xem
Tôi vừa dành chút thời gian để đọc những thuật ngữ này (tôi không sử dụng chúng thường xuyên vì chúng tôi không có bất kỳ ứng dụng MVC nào và tôi thường chỉ nói "mô hình"), nhưng tôi cảm thấy tùy thuộc vào ngữ cảnh, những thuật ngữ này có nghĩa khác nhau: Thực thể Điều này khá đơn giản, đó là một hàng trong cơ sở dữ liệu: 2) Trong
c# - Sử dụng MVVM trong một ứng dụng lớn - chia sẻ mô hình khung nhìn, mô hình, trạng thái, v.v.
Tôi tự hỏi liệu có ai trong số các bạn biết một số hướng dẫn hay giải thích MVVM cho các ứng dụng lớn không. Mọi hướng dẫn tôi tìm thấy về MVVM chỉ giải thích những điều cơ bản (cách triển khai Mô hình, Xem mô hình và Chế độ xem), nhưng tôi không biết gì về việc chuyển giữa các trang ứng dụng
Phương pháp xóa tất cả trừ một loại đối tượng (mô hình) trong Vương quốc
Tôi muốn real.delete() tất cả trừ một mô hình trong Vương quốc của tôi. Có cách nào để không liệt kê tất cả chúng? Có lẽ một cách để lặp qua tất cả các loại hiện có trong Vương quốc? Câu trả lời hay nhất bạn có thể nhận được từ R của bạn
php - Mô hình Mocking Laravel Eloquent - Mô hình mô phỏng được sử dụng trong AppServiceProvider
Tôi đang cố gắng mô phỏng một mô hình Eloquent bằng cách sử dụng lệnh bí danh như thế này: $transporter = \Mockery::mock('alias:' . Transporter::class)
R Stargazer với mô hình pglm - chuyển đổi mô hình pglm nhị thức thành mô hình plm
Tôi đang sử dụng stargazer để tạo bảng tóm tắt plm của mình. thư viện(plm) thư viện(pglm) data("Unions", package = "pglm") anb1 <- pl
ASP.NET MVC + EF 4.1 phân lớp, mô hình, xem mô hình
Tôi đã đọc một số bài viết và câu hỏi liên quan đến kiến trúc phân lớp ASP.NET, nhưng sau khi đọc quá nhiều tôi cảm thấy hơi bối rối. Lớp giao diện người dùng được phát triển trong ASP.NET MVC và để truy cập dữ liệu, tôi đang sử dụng EF trong dự án. Tôi muốn mô tả vấn đề của mình bằng một ví dụ
Mô hình ios -/ml/Mô hình V3.ml khởi đầu: không thể đọc tài liệu
Tôi gặp lỗi thông báo này: Inceptionv3.mlmodel: không thể đọc tài liệu Tôi đã tải xuống phiên bản xcode mới nhất. Phiên bản 9.4 beta (9Q1004a) Câu trả lời hay nhất mà bạn không có
c# - Xác thực chế độ xem mô hình/chế độ xem mô hình tự động ASP.NET MVC3
(Một lần nữa, vấn đề xác thực MVC. Tôi biết, tôi biết...) Tôi muốn sử dụng AutoMapper (http://automapper.codeplex.com/) để xác thực rằng Chế độ xem đã tạo của tôi không có trong
android - Cách chèn mô hình Chế độ xem có phạm vi bằng cách sử dụng mô hình chế độ xem chia sẻ koin android
Một điều cần làm rõ, hiện tại tôi đang thực hiện một quy trình trong đó tôi có hai mô hình Chế độ xem, một mô hình phụ thuộc vào mô hình Chế độ xem khác, để xử lý việc này. Tôi đã thử đưa cả hai Chế độ xem vào Mô hình hoạt động cơ sở của mình,
wpf - Làm cách nào để sử dụng View model, model, lớp lệnh với liên kết dữ liệu (bind) trong thẻ Window.Resources?
Nếu WPF MVVM được cho là không cần mã, tại sao tôi cần khởi tạo thuộc tính DataContext trong mã Window.xaml.cs khi sử dụng ICommand? Tôi đã xem cạnh nhau và theo dõi YouTube
asp.net - Model-Repository-Service-Validator-View - Xem mẫu thiết kế Model-Controller(?)
Khi lần đầu tiên tôi nghe về ASP.NET MVC, tôi nghĩ nó có nghĩa là một ứng dụng bao gồm ba phần: Model, View và Controller. Sau đó, tôi đọc NerdDinner và tìm hiểu về các phương thức Repository và View Model
python — Làm cách nào để sử dụng mmconvert để chuyển đổi mô hình tensorflow (tệp pb InceptionResnetV2) sang mô hình pytorch?
Nền tảng: Ubuntu 16.04 Phiên bản Python: 3.5.2 Phiên bản mmdnn: 0.2.5 Khung nguồn với phiên bản:
Swift - Sử dụng 'model' (thương hiệu: nhãn hiệu, model: model) trong quyền truy cập thuộc tính 'self' trước khi super.init khởi tạo self super.init
Tôi đang làm theo hướng dẫn này: https://www.raywenderlich.com/160728/object-orient-programming-swift... và cố gắng thực hiện một số điều chỉnh cá nhân đối với mã và xem
Mô hình AngularJS
Tôi đang cố gắng quấn đầu xung quanh AngularJS. Tôi thích nó, nhưng một khái niệm cốt lõi dường như đang thoát khỏi tôi - người mẫu ở đâu? Ví dụ: nếu tôi có một ứng dụng hiển thị nhiều danh sách giao dịch. Một danh sách truy vấn máy chủ về một tập hợp các giao dịch được phân trang phù hợp với các tiêu chí nhất định và danh sách còn lại sử dụng một danh sách khác.
Mô hình, quy tắc kinh doanh và sự kiên trì
Tôi đang gặp khó khăn khi tìm ra cách tiếp cận tốt nhất cho một ứng dụng nhất định. Tôi không quen với kiến trúc mới thay thế TLA (Kiến trúc ba lớp) cũ, vì vậy đó là nơi tôi bắt đầu. Trong khi thiết kế mô hình và DAL cho ứng dụng của tôi (lớp POCO, phải không ??) Tôi có các câu hỏi sau: Mô hình của tôi
Django - Models - Làm thế nào để mô tả mối quan hệ hai chiều cụ thể giữa hai mô hình?
Tôi có hai mô hình: Người và Phòng. Mọi người đều có thể làm việc trong một bộ phận. Các phòng ban có thể được quản lý bởi nhiều người. Tôi không chắc cách cấu trúc mối quan hệ này trong mô hình Django. Đây là một trong những nỗ lực không thành công của tôi [models.py]:

qq735679552

Hồ sơ

Tôi là một lập trình viên xuất sắc, rất giỏi!

Bài viết phổ biến của tác giả

Nhận phiếu giảm giá taxi Didi miễn phí

Các bài viết phổ biến trên toàn bộ trang web

trang đầu

đã học

6Ren AI

Trung tâm mua sắm