Giải thích mã chi tiết về cách sử dụng pypdf2 để hợp nhất, phân tách và mã hóa các tệp PDF trong Python-6ren

Giải thích mã chi tiết về cách sử dụng pypdf2 để hợp nhất, phân tách và mã hóa các tệp PDF trong Python

In lại Tác giả: qq735679552 Thời gian cập nhật: 28-09-2022 22:32:09

CFSDN nhấn mạnh vào giá trị tạo ra nguồn mở và chúng tôi cam kết xây dựng nền tảng chia sẻ tài nguyên để mọi nhân viên CNTT có thể tìm thấy thế giới tuyệt vời của bạn tại đây.

Bài viết blog CFSDN này sử dụng pypdf2 để hợp nhất, phân tách và mã hóa các tệp PDF trong Python. Các chi tiết mã được tác giả sưu tầm và biên soạn. Nếu bạn quan tâm đến bài viết này, hãy nhớ thích nó.

Một người bạn cần chia nhỏ một tệp pdf Sau khi tìm kiếm trên Internet, anh ấy thấy rằng pypdf2 có thể hoàn thành các thao tác này nên đã nghiên cứu thư viện này và lập một số hồ sơ. Trước hết, pypdf2 là phiên bản python3 Có thư viện pypdf tương ứng trong 2 phiên bản trước.

Bạn có thể cài đặt trực tiếp bằng pip:

pip cài đặt pypdf2 。

Tài liệu chính thức: pythonhosted.org/pypdf2/.

Chủ yếu có các loại sau:

。

trình đọc file pdf.

Lớp này chủ yếu cung cấp các thao tác đọc tệp PDF và phương pháp xây dựng của nó là:

 
    ? 
   
         pdffilereader(stream, nghiêm ngặt 
         = 
         đúng, cảnh báo nhất 
         = 
         không có, ghi đè cảnh báo 
         = 
         ĐÚNG VẬY)

Tham số đầu tiên có thể được truyền trong luồng tệp hoặc đường dẫn tệp. Ba tham số tiếp theo được sử dụng để đặt phương thức xử lý cảnh báo, chỉ sử dụng các tham số mặc định.

Sau khi lấy phiên bản, bạn có thể thực hiện một số thao tác trên pdf. Các hoạt động chính như sau:

giải mã (mật khẩu): Nếu tệp pdf được mã hóa, bạn có thể sử dụng phương pháp này để giải mã nó.
getdocumentinfo(): Lấy một số thông tin về file pdf. Giá trị trả về là loại thông tin tài liệu Nếu xuất trực tiếp, bạn sẽ nhận được thông tin tương tự như sau:

 
    ? 
   
 
     
       
       
         { 
         '/ngày sửa đổi' 
         :  
         "ngày:20150310202949-07'00'" 
         ,  
         '/tiêu đề' 
         : ' 
         ', ' 
         / 
         người sáng tạo 
         ': ' 
         latex với gói hyperref 
         ', ' 
         / 
         ngày tạo 
         ': "d:20150310202949-07' 
         00 
         "", 
         / 
         ptex.fullbanner 
         ': ' 
         cái này  
         là 
         pdftex, phiên bản  
         3.14159265 
         - 
         2.6 
         - 
         1,40 
         . 
         15 
         (tex trực tiếp  
         2014 
         / 
         macports  
         2014_6 
         ) phiên bản kpathsea  
         6.2 
         . 
         0 
         ', ' 
         / 
         nhà sản xuất 
         ': ' 
         pdftex 
         - 
         1,40 
         . 
         15 
         ', ' 
         / 
         từ khóa 
         ': ' 
         ', ' 
         / 
         bị mắc kẹt 
         ': ' 
         / 
         SAI 
         ', ' 
         / 
         author 
         ': ' 
         ', ' 
         / 
         chủ thể 
         ': ' 
         '} 
        
 
     
 
   

getnumpages(): Lệnh này sẽ lấy số trang trong file pdf.
getpage(pagenumber): sẽ lấy đối tượng trang tương ứng với số trang trong file pdf và giá trị trả về là thể hiện của pageobject. Sau khi lấy phiên bản pageobject, bạn có thể thêm, chèn và các thao tác khác.
getpagenumber(page): Ngược lại với phương pháp trên, bạn có thể chuyển vào phiên bản pageobject và sau đó lấy số trang của tệp pdf chứa phiên bản đó.
getoutlines(node=none, Outlines=none): Truy xuất các đường viền tài liệu xuất hiện trong tài liệu.
isencrypted: ghi lại xem pdf có được mã hóa hay không. Nếu bản thân tệp được mã hóa, true sẽ được trả về ngay cả sau khi sử dụng phương thức giải mã.
numpages: Tổng số trang trong pdf, tương đương với việc truy cập thuộc tính chỉ đọc của getnumpages().

trình soạn thảo pdf.

Lớp này hỗ trợ các thao tác ghi trên tệp pdf, thường sử dụng pdffilereader để đọc một số dữ liệu pdf và sau đó sử dụng lớp này để thực hiện một số thao tác.

Không có tham số nào được yêu cầu khi tạo một thể hiện của lớp này.

Các phương pháp chính là:

addattachment(fname, fdata): Thêm file vào pdf.
addblankpage(width=none, Height=none): Thêm một trang trống vào cuối pdf. Nếu kích thước không được chỉ định, kích thước của trang cuối cùng của pdf trong weiter hiện tại sẽ được sử dụng.
addpage(page): Thêm trang vào pdf. Thông thường, người đọc ở trên sẽ lấy được trang này.
appendpagesfromreader(reader, after_page_append=none): Sao chép dữ liệu trong trình đọc sang phiên bản trình ghi hiện tại và nếu after_page_append được chỉ định, cuối cùng trả về hàm và chuyển dữ liệu trong trình ghi vào đó.
Encrypt(user_pwd, owner_pwd=none, use_128bit=true): Mã hóa pdf. Về mặt chính thức, userpwd cho phép người dùng mở file pdf với một số quyền hạn chế. Tức là có thể có một số hạn chế khi sử dụng mật khẩu này, nhưng tôi thì không. quyền thiết lập trông giống như trong tài liệu. Ownerpwd cho phép người dùng sử dụng nó mà không bị hạn chế. Tham số thứ ba là có sử dụng mã hóa 128 bit hay không.
getnumpages(): Lấy số trang pdf.
getpage(pagenumber): Lấy trang tương ứng với số trang, là đối tượng pageobject Bạn có thể sử dụng phương thức addpage ở trên để thêm trang.
Insertpage(page, index=0): Thêm trang vào pdf, chỉ mục xác định vị trí được chèn.
write(stream): Ghi nội dung của writer này vào file.

pdffilemerger.

Lớp này được sử dụng để hợp nhất các tệp PDF. Phương thức xây dựng của lớp này có một tham số: pdffilemerger(strict=true). Lưu ý rằng các tham số ở đây sẽ được giới thiệu sau:

Các phương pháp thường được sử dụng:

addbookmark(title, pagenum, parent=none): Thêm dấu trang vào pdf, tiêu đề là tiêu đề của dấu trang và pagenum là trang được dấu trang trỏ đến.
chắp thêm(fileobj, bookmark=none, pages=none, import_bookmarks=true): Thêm tệp fileobj được chỉ định vào cuối tệp. Dấu trang trước khi các Trang có thể sử dụng (bắt đầu, dừng[, bước]) hoặc một phạm vi trang. . Đặt để thêm các trang trong phạm vi được chỉ định trong fileobj.
merge(position, fileobj, bookmark=none, pages=none, import_bookmarks=true): Tương tự như phương thức chắp thêm, nhưng bạn có thể sử dụng tham số vị trí để chỉ định vị trí đã thêm.
write(fileobj): Ghi dữ liệu vào file.

Khi sử dụng nó, bạn có thể tạo một phiên bản pdffilemerger, sau đó sử dụng chức năng chắp thêm hoặc hợp nhất để thêm các tệp pdf bạn muốn hợp nhất theo trình tự và cuối cùng sử dụng tính năng ghi để lưu nó.

 
    ? 
   
         định nghĩa 
         hợp nhất_pdf(): 
        
         #Tạo một phiên bản để hợp nhất các tệp 
        
         pdf_sáp nhập  
         = 
         pdffilemerger() 
        
         # Trước tiên hãy thêm tệp week1_1.pdf 
        
         pdf_merger.append( 
         'tuần1_1.pdf' 
         ) 
        
         # Sau đó thêm file ex1.pdf vào sau trang 0 
        
         pdf_merger. hợp nhất( 
         0 
         ,  
         'ex1.pdf' 
         ) 
        
         # Thêm dấu trang 
        
         pdf_merger.addbookmark( 
         'Đây là một dấu trang' 
         ,  
         1 
         ) 
        
         #Viết nó vào tập tin 
        
         pdf_merger.viết( 
         'merge_pdf.pdf' 
         )

Chúng ta hãy xem tham số này trong pdffilemerger(strict=true):

Giải thích chính thức về tham số này:

strict (bool) – xác định xem người dùng có nên được cảnh báo về tất cả các vấn đề hay không và cũng khiến một số vấn đề có thể khắc phục được trở nên nghiêm trọng. mặc định là true.

Xác định xem người dùng có nên được cảnh báo về tất cả các vấn đề và cũng có thể gây ra một số vấn đề có thể khắc phục được hay không.

Lúc đầu, tôi cảm thấy rằng tham số này được sử dụng để cảnh báo người dùng về một số lỗi và tôi chỉ có thể sử dụng mặc định. Tuy nhiên, khi tôi cố gắng hợp nhất các tệp PDF với ký tự tiếng Trung, đã xảy ra lỗi sau:

 
    ? 
   
         traceback (cuộc gọi gần đây nhất cuối cùng): 
        
         tài liệu 
         "i:\python3.5\lib\site-packages\pypdf2\generic.py" 
         , đường kẻ  
         484 
         ,  
         TRONG 
         đọctừdòng 
        
         trở lại 
         tênđối tượng(tên.giải mã( 
         'utf-8' 
         )) 
        
         unicodedecodeerror:  
         'utf-8' 
         codec không thể giải mã byte  
         0xc8 
         TRONG 
         chức vụ  
         10 
         : byte tiếp tục không hợp lệ 
        
         trong quá trình xử lý ngoại lệ trên, một ngoại lệ khác đã xảy ra: 
        
         pypdf2.utils.pdfreaderror: ký tự không hợp lệ  
         TRONG 
         tên  
         sự vật

Đã xảy ra lỗi khi sử dụng giải mã utf trong gói mã nguồn. Tôi đã cố sửa đổi mã nguồn ở đây để sử dụng gbk nhưng cũng xảy ra lỗi khác. Cuối cùng, tôi thấy rằng khi nghiêm ngặt được đặt thành sai trong hàm tạo, lỗi sau sẽ được in trên bảng điều khiển:

pdfreadwarning: ký tự không hợp lệ trong tên đối tượng [generic.py:489] 。

Nhưng hai tệp đã được hợp nhất thành công và tôi đã kiểm tra nhanh rằng tệp được hợp nhất đôi khi tốt hoặc xấu. Cùng một mã được chạy nhiều lần và đôi khi nó có thể xử lý tiếng Trung bình thường, nhưng đôi khi tiếng Trung bị cắt xén.

Ngoài các phương pháp được liệt kê, còn có các phương pháp khác, chẳng hạn như thêm dấu trang, thêm liên kết, v.v. Bạn có thể tham khảo tài liệu chính thức.

Hợp nhất, phân tách và mã hóa các tệp PDF.

Các ví dụ tích hợp về mã hóa, giải mã, hợp nhất, chia tách dựa trên số trang và chia tách dựa trên số lượng bản sao:

Lưu ý khi sử dụng: Nếu là file tiếng Trung thì kết quả chạy có thể bị sai lệch nhưng nếu chạy vài lần sẽ xảy ra vấn đề tiếng Trung hiển thị bình thường. Nguyên nhân cụ thể thì không rõ ràng nhưng lại rất bí ẩn. . .

Cổng mã.

 
    ? 
   
         # @time : 2018/3/26 23:48 
        
         # @tác giả: leafage 
        
         # @tệp : handlepdf.py 
        
         # @phần mềm: pycharm 
        
         # @describe: Thực hiện các thao tác gộp, tách, mã hóa trên file pdf. 
        
         từ 
         pypdf2  
         nhập khẩu 
         pdffilereader, pdffilemerger, pdffilewriter 
        
         định nghĩa 
         get_reader(tên tệp, mật khẩu): 
        
         thử 
         : 
        
         tập tin cũ  
         = 
         mở 
         (tên tệp,  
         'rb' 
         ) 
        
         ngoại trừ 
         ioerror là lỗi: 
        
         in 
         ( 
         'Mở tập tin không thành công! ' 
         + 
         đường 
         (lầm)) 
        
         trở lại 
         không có 
        
         #Tạo phiên bản đọc 
        
         trình đọc pdf  
         = 
         pdffilereader(tệp_cũ, nghiêm ngặt 
         = 
         SAI) 
        
         # Hoạt động giải mã 
        
         nếu như 
         pdf_reader.isencrypted: 
        
         nếu như 
         mật khẩu  
         là 
         không có: 
        
         in 
         ( 
         '%s file được mã hóa và yêu cầu mật khẩu! ' 
         % 
         tên tập tin) 
        
         trở lại 
         không có 
        
         khác 
         : 
        
         nếu như 
         pdf_reader.decrypt(mật khẩu) ! 
         = 
         1 
         : 
        
         in 
         ( 
         '%sMật khẩu sai! ' 
         % 
         tên tập tin) 
        
         trở lại 
         không có 
        
         nếu như 
         tập tin cũ  
         TRONG 
         người dân địa phương 
         (): 
        
         old_file. đóng() 
        
         trở lại 
         trình đọc pdf 
        
         định nghĩa 
         encrypt_pdf(tên_tệp, mật_khẩu_mới, mật_khẩu_cũ 
         = 
         không có, tên_tệp_được_mã_hóa 
         = 
         không có): 
        
         """ 
        
         Mã hóa tệp tương ứng với tên tệp và tạo tệp mới 
        
         :param filename: Đường dẫn tương ứng với file 
        
         :param new_password: Mật khẩu dùng để mã hóa file 
        
         :param old_password: Nếu file cũ được mã hóa thì cần phải có mật khẩu 
        
         :param mã hóa_filename: Tên tệp được mã hóa, sử dụng filename_encrypted khi bỏ qua; 
        
         :trở lại: 
        
         """ 
        
         #Tạo một phiên bản trình đọc 
        
         trình đọc pdf  
         = 
         get_reader(tên_tệp, mật_khẩu_cũ) 
        
         nếu như 
         trình đọc pdf  
         là 
         không có: 
        
         trở lại 
        
         #Tạo một thể hiện của thao tác ghi 
        
         pdf_writer  
         = 
         pdffilewriter() 
        
         # Ghi dữ liệu từ reader trước tới writer 
        
         pdf_writer.appendpagesfromreader(pdf_reader) 
        
         # Mã hóa lại bằng mật khẩu mới 
        
         pdf_writer.encrypt(mật_khẩu_mới) 
        
         nếu như 
         tên_tệp_đã_mã_hóa  
         là 
         không có: 
        
         # Sử dụng tên tệp cũ + được mã hóa thành tên tệp mới 
        
         tên_tệp_đã_mã_hóa  
         = 
         "".join(tên tệp.chia tách( 
         '.' 
         )[: 
         - 
         1 
         ])  
         + 
         '_' 
         + 
         'được mã hóa' 
         + 
         '.pdf' 
        
         pdf_writer.viết( 
         mở 
         (tên_tệp_được_mã_hóa,  
         'wb' 
         )) 
        
         định nghĩa 
         giải mã_pdf(tên_tệp, mật khẩu, tên_tệp đã giải mã 
         = 
         không có): 
        
         """ 
        
         Ngược dòng giải mã tệp được mã hóa và tạo tệp pdf không có mật khẩu 
        
         :param filename: tệp pdf được mã hóa gốc 
        
         :param pass: mật khẩu tương ứng 
        
         :param decrypted_filename: tên file được giải mã 
        
         :trở lại: 
        
         """ 
        
         # Tạo trình đọc và trình ghi 
        
         trình đọc pdf  
         = 
         get_reader(tên tệp, mật khẩu) 
        
         nếu như 
         trình đọc pdf  
         là 
         không có: 
        
         trở lại 
        
         nếu như 
         không 
         pdf_reader.isencrypted: 
        
         in 
         ( 
         'Tệp không được mã hóa, không cần thực hiện hành động nào! ' 
         ) 
        
         trở lại 
        
         pdf_writer  
         = 
         pdffilewriter() 
        
         pdf_writer.appendpagesfromreader(pdf_reader) 
        
         nếu như 
         tên_tệp_giải_giải_giải  
         là 
         không có: 
        
         tên_tệp_giải_giải_giải  
         = 
         "".join(tên tệp.chia tách( 
         '.' 
         )[: 
         - 
         1 
         ])  
         + 
         '_' 
         + 
         'đã giải mã' 
         + 
         '.pdf' 
        
         #Viết tập tin mới 
        
         pdf_writer.viết( 
         mở 
         (tên_tệp đã giải mã,  
         'wb' 
         )) 
        
         định nghĩa 
         split_by_pages(tên tệp, trang, mật khẩu 
         = 
         không có): 
        
         """ 
        
         Chia file đều theo số trang 
        
         :param filename: tên file cần chia 
        
         :param pages: Số trang tương ứng với mỗi file sau khi tách 
        
         :param pass: Nếu file bị mã hóa thì cần phải giải mã 
        
         :trở lại: 
        
         """ 
        
         # Nhận người đọc 
        
         trình đọc pdf  
         = 
         get_reader(tên tệp, mật khẩu) 
        
         nếu như 
         trình đọc pdf  
         là 
         không có: 
        
         trở lại 
        
         # Lấy tổng số trang 
        
         số trang  
         = 
         pdf_reader.numpages 
        
         nếu như 
         trang < 
         = 
         1 
         : 
        
         in 
         ( 
         'Mỗi tài liệu phải lớn hơn 1 trang! ' 
         ) 
        
         trở lại 
        
         # Lấy số trang của mỗi file pdf sau khi chia tách 
        
         pdf_num  
         = 
         số trang  
         / 
         / 
         trang  
         + 
         1 
         nếu như 
         số trang  
         % 
         trang  
         khác 
         số nguyên 
         (số trang  
         / 
         trang) 
        
         in 
         ( 
         'File pdf được chia thành %d phần, mỗi phần có %d trang! ' 
         % 
         (pdf_num, trang)) 
        
         # Tạo tập tin pdf theo trình tự 
        
         vì 
         tại sao_pdf_num  
         TRONG 
         phạm vi 
         ( 
         1 
         , pdf_num  
         + 
         1 
         ): 
        
         # Tạo một instance ghi mới 
        
         pdf_writer  
         = 
         pdffilewriter() 
        
         # Tạo tên file tương ứng 
        
         tách_tên_pdf  
         = 
         "".join(tên tệp)[: 
         - 
         1 
         ]  
         + 
         '_' 
         + 
         đường 
         (cur_pdf_num)  
         + 
         '.pdf' 
        
         # Tính vị trí bắt đầu hiện tại 
        
         bắt đầu  
         = 
         trang  
         * 
         (cur_pdf_num  
         - 
         1 
         ) 
        
         # Tính vị trí cuối cùng. Nếu là bản sao cuối cùng, hãy trả về trực tiếp số trang cuối cùng. Nếu không, hãy sử dụng số trang trên mỗi bản sao * số lượng tệp được chia. 
        
         kết thúc  
         = 
         trang  
         * 
         tại sao_pdf_num  
         nếu như 
         tại sao_pdf_num ! 
         = 
         pdf_num  
         khác 
         số trang 
        
         # in(chuỗi(bắt đầu) + ',' + chuỗi(kết thúc)) 
        
         # Đọc theo thứ tự số trang tương ứng 
        
         vì 
         Tôi  
         TRONG 
         phạm vi 
         (bắt đầu, kết thúc): 
        
         pdf_writer.addpage(pdf_reader.getpage(i)) 
        
         #Ghi vào tập tin 
        
         pdf_writer.viết( 
         mở 
         (tên_tách_pdf,  
         'wb' 
         )) 
        
         định nghĩa 
         split_by_num(tên tệp, số, mật khẩu 
         = 
         không có): 
        
         """ 
        
         Chia tập tin pdf thành nhiều phần 
        
         :param tên tệp: tên tệp 
        
         :param nums: số phần được chia thành 
        
         :param pass: Nếu cần giải mã thì nhập mật khẩu 
        
         :trở lại: 
        
         """ 
        
         trình đọc pdf  
         = 
         get_reader(tên tệp, mật khẩu) 
        
         nếu như 
         không 
         trình đọc pdf: 
        
         trở lại 
        
         nếu như 
         số <  
         2 
         : 
        
         in 
         ( 
         'Số lượng bản sao không thể ít hơn 2! ' 
         ) 
        
         trở lại 
        
         # Lấy tổng số trang trong pdf 
        
         trang  
         = 
         pdf_reader.numpages 
        
         nếu như 
         trang < số: 
        
         in 
         ( 
         'Số lượng bản sao không được lớn hơn tổng số trang trong pdf! ' 
         ) 
        
         trở lại 
        
         # Tính xem mỗi bản sẽ có bao nhiêu trang 
        
         mỗi_pdf  
         = 
         trang  
         / 
         / 
         con số 
        
         in 
         ( 
         'pdf có tổng cộng %d trang, chia thành %d phần, mỗi phần có %d trang! ' 
         % 
         (trang, số, each_pdf)) 
        
         vì 
         trong một  
         TRONG 
         phạm vi 
         ( 
         1 
         , con số  
         + 
         1 
         ): 
        
         pdf_writer  
         = 
         pdffilewriter() 
        
         # Tạo tên file tương ứng 
        
         tách_tên_pdf  
         = 
         "".join(tên tệp)[: 
         - 
         1 
         ]  
         + 
         '_' 
         + 
         đường 
         (số)  
         + 
         '.pdf' 
        
         # Tính vị trí bắt đầu hiện tại 
        
         bắt đầu  
         = 
         mỗi_pdf  
         * 
         (trong một  
         - 
         1 
         ) 
        
         # Tính vị trí cuối cùng. Nếu là bản sao cuối cùng, hãy trả về trực tiếp số trang cuối cùng. Nếu không, hãy sử dụng số trang trên mỗi bản sao * số lượng tệp được chia. 
        
         kết thúc  
         = 
         mỗi_pdf  
         * 
         trong một  
         nếu như 
         num! 
         = 
         con số  
         khác 
         trang 
        
         in 
         ( 
         đường 
         (bắt đầu)  
         + 
         ',' 
         + 
         đường 
         (kết thúc)) 
        
         vì 
         Tôi  
         TRONG 
         phạm vi 
         (bắt đầu, kết thúc): 
        
         pdf_writer.addpage(pdf_reader.getpage(i)) 
        
         pdf_writer.viết( 
         mở 
         (tên_tách_pdf,  
         'wb' 
         )) 
        
         định nghĩa 
         merge_pdf(tên_tệp, tên_đã_hợp_nhất, mật khẩu 
         = 
         không có): 
        
         """ 
        
         Chuyển danh sách các tệp và hợp nhất từng tệp một 
        
         :param tên tập tin: danh sách tập tin 
        
         :param mật khẩu: danh sách mật khẩu tương ứng 
        
         :trở lại: 
        
         """ 
        
         # Tính xem có bao nhiêu file 
        
         số tập tin  
         = 
         chỉ một 
         (tên tập tin) 
        
         # Lưu ý cần sử dụng tham số false 
        
         pdf_sáp nhập  
         = 
         pdffilemerger(sai) 
        
         vì 
         Tôi  
         TRONG 
         phạm vi 
         (số tập tin): 
        
         # Lấy mật khẩu 
        
         nếu như 
         mật khẩu  
         là 
         không có: 
        
         mật khẩu  
         = 
         không có 
        
         khác 
         : 
        
         mật khẩu  
         = 
         mật khẩu[i] 
        
         trình đọc pdf  
         = 
         get_reader(tên_tệp[i], mật khẩu) 
        
         nếu như 
         không 
         trình đọc pdf: 
        
         trở lại 
        
         # theo mặc định, phần bổ sung được thêm vào cuối 
        
         pdf_merger.append(pdf_reader) 
        
         pdf_merger.viết( 
         mở 
         (tên đã hợp nhất,  
         'wb' 
         )) 
        
         định nghĩa 
         insert_pdf(pdf1, pdf2, insert_num, merged_name, password1 
         = 
         không có, mật khẩu2 
         = 
         không có): 
        
         """ 
        
         Chèn tất cả các file của pdf2 vào trang Insert_num của pdf1 
        
         :param pdf1: tên tệp pdf1 
        
         :param pdf2: tên tệp pdf2 
        
         :param Insert_num: Số trang được chèn 
        
         :param merge_name: tên file đã hợp nhất 
        
         :param pass1: Mật khẩu tương ứng với pdf1 
        
         :param pass2: Mật khẩu tương ứng với pdf2 
        
         :trở lại: 
        
         """ 
        
         pdf1_đọc  
         = 
         lấy_trình_đọc(pdf1, mật khẩu1) 
        
         pdf2_đọc  
         = 
         lấy_trình_đọc(pdf2, mật_khẩu2) 
        
         # Trả lại nếu không mở được 
        
         nếu như 
         không 
         pdf1_đọc  
         hoặc 
         không 
         trình đọc pdf2: 
        
         trở lại 
        
         # Lấy tổng số trang trong pdf1 
        
         pdf1_trang  
         = 
         pdf1_reader.numpages 
        
         nếu như 
         chèn_số <  
         0 
         hoặc 
         chèn_số_trang > pdf1: 
        
         in 
         ( 
         'Vị trí chèn không bình thường. Số trang bạn muốn chèn là: %d. File pdf1 có tổng cộng: %d trang! ' 
         % 
         (insert_num, pdf1_pages)) 
        
         trở lại 
        
         # Lưu ý cần sử dụng tham số false vì có thể xuất hiện các ký tự tiếng Trung bị cắt xén. 
        
         m_pdf  
         = 
         pdffilemerger(sai) 
        
         m_pdf.append(pdf1) 
        
         m_pdf.merge(insert_num, pdf2) 
        
         m_pdf.viết( 
         mở 
         (tên đã hợp nhất,  
         'wb' 
         )) 
        
         nếu như 
         __tên__  
         = 
         = 
         '__chủ yếu__' 
         : 
        
         # mã hóa_pdf('ex1.pdf', 'lá') 
        
         # giải mã_pdf('ex1123_encrypted.pdf', 'lá') 
        
         # chia_bởi_trang('ex1.pdf', 5) 
        
         chia_theo_số( 
         'ex2.pdf' 
         ,  
         3 
         ) 
        
         # merge_pdf(['ex1.pdf', 'ex2.pdf'], 'merger.pdf') 
        
         # insert_pdf('ex1.pdf', 'ex2.pdf', 10, 'pdf12.pdf')

Tóm tắt.

Trên đây là phần giải thích mã chi tiết về cách sử dụng pypdf2 để hợp nhất, phân tách và mã hóa các tệp PDF trong Python được trình soạn thảo giới thiệu. Nếu bạn có bất kỳ câu hỏi nào, vui lòng để lại tin nhắn cho tôi và trình soạn thảo sẽ giải thích. trả lời bạn trong thời gian. Tôi cũng xin cảm ơn mọi người đã ủng hộ trang web của tôi! .

Nếu bạn thấy bài viết này hữu ích với bạn, vui lòng đăng lại, vui lòng ghi rõ nguồn, xin cảm ơn!

Link gốc: https://juejin.im/post/5ce0eca1e51d4510774a87a6.

Cuối cùng, bài viết này về giải thích mã chi tiết về cách sử dụng pypdf2 để hợp nhất, phân tách và mã hóa các tệp PDF trong Python có ở đây. Python, vui lòng Tìm kiếm các bài viết CFSDN hoặc tiếp tục duyệt các bài viết liên quan. Tôi hy vọng bạn sẽ ủng hộ blog của tôi trong tương lai! .

Đề xuất bài viết: Hướng dẫn sử dụng tham số pars_dates() trong hàm pandas pd.read_csv()

Đề xuất bài viết: Hoạt động khớp mờ của gấu trúc python để có được các chỉ số được chỉ định sau khi đọc Excel

Đề xuất bài viết: Giải quyết một cạm bẫy trong gấu trúc khi thực hiện truy vấn sql mờ

Đề xuất bài viết: Tổng hợp các phương pháp xác định phạm vi của một tập hợp trong python

Giải thích chi tiết: lập kế hoạch tổng thể của hệ thống khuyến mãi
Xin chào mọi người, tôi là anh Tang ~ Hôm nay tôi sẽ nói về kế hoạch tổng thể của hệ thống khuyến mãi. Quy trình hệ thống của các hoạt động quảng cáo khác nhau có thể được tóm tắt thành ba giai đoạn chính: Quản lý quảng cáo bên B: Người vận hành thương mại định cấu hình và quản lý các hoạt động quảng cáo trong hệ thống phụ trợ, bao gồm thiết lập thông tin cơ bản và quy tắc sử dụng của các hoạt động
Giải thích chi tiết về jstat
Tên đầy đủ là "Công cụ giám sát thống kê máy ảo Java" (thống kê thống kê; giám sát giám sát; công cụ công cụ).
Giải thích chi tiết về hoạt động chỉ mục MongoDB và kế hoạch thực hiện Giải thích()
Nó chủ yếu nói về việc xem, tạo, xóa và mô tả kiểu của chỉ mục Mongodb, cũng như giải thích về kế hoạch thực hiện Giải thích. Có thể sao chép nhưng vui lòng ghi rõ nguồn.
Các chế độ triển khai của một số máy chủ đồng thời trong Linux (giải thích chi tiết)
1>Một luồng hoặc một tiến trình tương đương với một liên kết ngắn. Sau khi chấp nhận, nó bắt đầu nhận và gửi dữ liệu, đồng thời không chấp nhận các kết nối mới, nghĩa là không có sự đồng thời giữa máy chủ và máy khách. 2>Máy chủ vòng lặp và máy chủ đồng thời
Giải thích chi tiết lệnh tắt máy và khởi động lại trong Linux
Giải thích chi tiết về lệnh tắt và khởi động lại trong Linux - lệnh tắt máy tắt [tùy chọn] Tùy chọn thời gian: ?
Phương pháp chuyển đổi chuỗi json thành đối tượng bằng Newtonsoft (giải thích chi tiết)
Đầu tiên, chuyển đổi chuỗi json thành đối tượng JObject: ?
Danh sách đầy đủ các lệnh thường dùng để vẽ Python (giải thích chi tiết)
Trang web chính thức của matplotlib Thư viện matplotlib Phông chữ tiếng Anh mặc định thêm chữ đậm ('SimHei') làm mã phông chữ vẽ: plt.rcParams['font.sans-serif']=['SimHei'
Giải thích chi tiết về từ khóa được đồng bộ hóa trong Java
Trong lập trình đồng thời, từ khóa được đồng bộ hóa là một vai trò phổ biến. Chúng tôi thường gọi khóa trọng lượng từ khóa được đồng bộ hóa, nhưng trong jdk1.6, đồng bộ hóa đã được tối ưu hóa và các khóa thiên vị cũng như khóa nhẹ đã được giới thiệu. bài viết này
Giải thích chi tiết về nhóm kết nối cơ sở dữ liệu .NET
Nói chung, 1 đến 2 cấu hình kết nối cơ sở dữ liệu sẽ được sử dụng trong các dự án của chúng tôi. Các cấu hình kết nối cơ sở dữ liệu của Tong Cheng Yilong được tập hợp thành một trung tâm cấu hình thống nhất, được DBA cấu hình và duy trì. .
Phương pháp thay thế Windows cho hàm gettimeofday trong Linux (giải thích chi tiết)
Ví dụ như sau: ? 1
Giải thích chi tiết về .Net cache MemoryCache
1. Bộ đệm trong MemoryCache NetCore rất giống với System.Runtime.Caching, nhưng đã được cải tiến về chức năng. Khóa bộ đệm hỗ trợ loại đối tượng cung cấp hỗ trợ chung có thể đọc bộ đệm và bộ đệm đơn;
Hướng dẫn cơ bản về Javascript - giải thích chi tiết về đối số
Đối số là một tham số đặc biệt của một hàm trong JavaScript. Ví dụ: bên dưới, sử dụng đối số để truy cập các tham số của hàm và xác định xem hàm có được thực thi hay không. Sao chép mã như sau: <>
Hoàn tất quá trình dọn dẹp sau khi Linux bị nhiễm minerd (giải thích chi tiết)
Tôi vô tình cài đặt dịch vụ Redis và mở một cổng mặc định cho toàn bộ mạng. Lúc đầu, tôi nghĩ rằng máy chủ này không có địa chỉ IP công cộng, nhưng tôi phát hiện ra rằng tôi đã hối hận. Một ngày nọ, tôi thấy rằng CPU bị tải. cao một cách đáng ngạc nhiên và tôi phát hiện ra một quy trình khai thác nó chiếm rất nhiều CPU, google.
Dựa trên thông số kỹ thuật lập trình PHP (giải thích chi tiết)
Tôi viết điều này hôm nay để nhắc nhở bản thân rằng quá trình lập trình không chỉ phải có ý tưởng logic mà còn phải chuẩn hóa mã sao cho có thể đọc được 1. Những điểm quan trọng nhất trong thông số kỹ thuật lập trình PHP và thói quen viết mã là như sau: 1 Mô tả tệp 2 funct
Cách dùng yum xem gói công cụ lspci và cài đặt (giải thích chi tiết)
Tóm tắt: Cài đặt tối thiểu thường được sử dụng khi cài đặt máy ảo và không có công cụ lspci theo mặc định. Máy ảo kiểm tra hiệu năng của card mạng ảo cần có công cụ lspci để kiểm tra loại card mạng. Bài viết này mô tả các bước cụ thể để cài đặt công cụ lspci trong máy ảo. Vì thử nghiệm
Các hạn chế khác nhau về số lượng kết nối ổ cắm đồng thời cao tối đa trong Linux (giải thích chi tiết)
1. Sửa đổi giới hạn về số lượng tệp mà quy trình người dùng có thể mở. Trên nền tảng Linux, cho dù bạn viết chương trình máy khách hay chương trình máy chủ, khi xử lý các kết nối TCP đồng thời cao, số lượng đồng thời tối đa bị giới hạn. bởi giới hạn của hệ thống về số lượng tệp mà một quy trình người dùng có thể mở cùng lúc (điều này là do hệ thống.
Bài viết giới thiệu các bạn về toán tử java (giải thích chi tiết)
Thư mục Toán tử số học Bốn toán tử số học cơ bản Toán tử gán lũy tiến Toán tử tăng/giảm Toán tử quan hệ Logic
Chế độ tập lệnh giao dịch hướng đối tượng PHP (giải thích chi tiết)
Như được hiển thị bên dưới: ? 1
Giải thích chi tiết về phương pháp chèn sqlSessionFactory của MapperScannerConfigurer
Giải thích về phương pháp tiêm sqlSessionFactory của MapperScannerConfigurer Trước hết, có một cấu hình trong Mybatis rất tiện lợi và giúp chúng ta tiết kiệm thời gian viết DaoImpl (lớp triển khai lớp Dao này).
Giải thích chi tiết: Công nghệ ảo hóa mạng Linux
Ảo hóa mạng Linux là một dự án con của dự án LXC bao gồm ảo hóa hệ thống tệp, ảo hóa không gian xử lý, ảo hóa người dùng, ảo hóa mạng, v.v. Ảo hóa mạng LXC được sử dụng ở đây để mô phỏng nhiều môi trường mạng. Bài viết này nói về thiết bị mạng cơ bản

qq735679552

Hồ sơ

Tôi là một lập trình viên xuất sắc, rất giỏi!

Bài viết phổ biến của tác giả

Nhận phiếu giảm giá taxi Didi miễn phí

Các bài viết phổ biến trên toàn bộ trang web

trang đầu

đã học

6Ren AI

Trung tâm mua sắm

Giải thích mã chi tiết về cách sử dụng pypdf2 để hợp nhất, phân tách và mã hóa các tệp PDF trong Python