cuốn sách gpt4 ai đã làm

Python: Lưu cục bộ những bức ảnh đẹp này theo từng đợt.

In lại Tác giả: Người biết Thời gian cập nhật: 2024-03-13 05:02:07 25 4
mua khóa gpt4 Nike

Khi du lịch khắp thế giới Internet, chúng ta nhìn thấy một số bức ảnh yêu thích và không khỏi nán lại nhìn chúng. Thậm chí, chúng ta muốn lưu lại tất cả nhưng việc lưu từng bức một thì quá rắc rối. Sau đó, chúng ta phải sử dụng con trăn của mình.

Như chúng ta đã biết, một trong những điểm đặc biệt của Python là tải xuống hàng loạt, vì vậy chúng ta hãy cùng thử ngay hôm nay.

1. Nếu bạn muốn làm tốt việc gì đó, trước tiên bạn phải mài giũa các công cụ của mình.

Điểm kiến ​​thức:

  • 1. Phân tích hệ thống các trang web mục tiêu
  • 2. Phương pháp phân tích dữ liệu thẻ HTML
  • 3. Lưu dữ liệu hình ảnh lớn chỉ bằng một cú nhấp chuột

phần mềm:

python 3.8 pycharm 2021 phiên bản chuyên nghiệp

Bạn bè chưa có phần mềm có thể tải xuống từ trang web chính thức hoặc quét bên trái để lấy.

Các module cần cài đặt:

yêu cầu # Phân tích mô-đun bên thứ ba # Phân tích dữ liệu

Nhấn win+r trên bàn phím và nhập cmd để mở cửa sổ nhắc lệnh. Phương pháp cài đặt cho hai mô-đun là giống nhau.

2. Ý tưởng của bài viết này

1. Phân tích website (phân tích ý tưởng)

①Xác định nội dung cần thu thập thông tin
Địa chỉ chứa dữ liệu là kanxiaojiejie. Vui lòng tự cải thiện địa chỉ, bao gồm địa chỉ trong mã bên dưới.

②Phân tích nội dung dữ liệu bằng cách xem mã nguồn của trang web

2. Quá trình thu thập thông tin

Gửi yêu cầu - Nhận dữ liệu - Phân tích dữ liệu - Lưu dữ liệu

  • Gửi yêu cầu mạng đến trang web mục tiêukanxiaojiejie
  • Lấy dữ liệu (mã nguồn trang web)
  • Phân tích dữ liệu (trích xuất dữ liệu) Tiêu đề trang chi tiết album
  • Gửi yêu cầu mạng đến trang chi tiết
  • Lấy dữ liệu (mã nguồn trang web)
  • Phân tích dữ liệu (trích xuất dữ liệu liên kết hình ảnh)
  • Gửi yêu cầu tới liên kết hình ảnh
  • lưu dữ liệu

3. Hiển thị mã

nhập mô-đun

yêu cầu nhập nhập phân tích cú pháp

Gửi yêu cầu

def get_response(html_url): headers = { 'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/90.0.4430.212 Safari/537.36' } # Tại sao lại ở đây Để yêu cầu.get() bài viết() Yêu cầu sẽ an toàn hơn... reply = request.get(url=html_url, headers=headers) trả về phản hồi

lưu dữ liệu

def save(img_url): img_data = request.get(img_url).content img_name = img_url.split('/')[-1] print("Đang tải xuống: " + img_name) với open("img\\" + img_name , mode='wb') dưới dạng f: f.write(img_data)

Phân tích dữ liệu

Lấy địa chỉ URL hình ảnh và dữ liệu trích xuất tiêu đề

def pars_1(html_data): selector = Parsel.Selector(html_data) link_list = selector.css('.entry-title a::attr(href)').getall() trả về link_list

Lấy địa chỉ và tiêu đề url của hình ảnh

ef parse_2(html_data): selector_1 = Parsel.Selector(html_data) img_list = selector_1.css('.entry.themeform p img::attr(src)').getall() trả về img_list

chức năng chính

def run(url): data_html = get_response(url).text link_list = Parse_1(data_html) cho liên kết trong link_list: data_html_1 = get_response(link).text img_list = Parse_2(data_html_1) cho img trong img_list: save(img)

Gọi hàm main để chạy

đối với trang trong phạm vi (1, 112): url = f'kanxiaojiejie/page/{page}' run(url)

Tôi sẽ không hiển thị hiệu ứng chạy, bạn có thể tự mình thử ~

25 4 0
Chứng chỉ ICP Bắc Kinh số 000000
Hợp tác quảng cáo: 1813099741@qq.com 6ren.com
Xem sitemap của VNExpress