cuốn sách gpt4 ai đã làm

linux - Cách trích xuất dữ liệu (tên người dùng) từ trang web

In lại Tác giả: Taklimakan Thời gian cập nhật: 2023-11-03 01:42:52 26 4
mua khóa gpt4 Nike

Tôi muốn thu thập tên người dùng từ trang danh sách thành viên như thế này: http://www.marksdailyapple.com/forum/memberslist/

Tôi muốn lấy từng tên người dùng từ tất cả các trang,

Tôi muốn làm điều này trong linux bằng bash

Tôi nên bắt đầu từ đâu, ai có thể cho tôi một số lời khuyên không?

câu trả lời hay nhất

đây là của tôi XidelĐược thiết kế cho:

xidel http://www.marksdailyapple.com/forum/memberslist/ -e 'a.username' -f '(//a[@rel="Next"])[1]'

Với dòng đơn giản này, nó sẽ phân tích trang bằng trình phân tích cú pháp html thích hợp, sử dụng bộ chọn css để tìm tất cả các liên kết có tên, sử dụng xpath để tìm trang tiếp theo và lặp lại cho đến khi tất cả các trang được xử lý

Bạn cũng có thể viết nó chỉ bằng cách sử dụng bộ chọn css:

xidel http://www.marksdailyapple.com/forum/memberslist/ -e 'a.username' -f 'div#pagination_top span.prev_next a'

Hoặc khớp mẫu. Về cơ bản, bạn chỉ cần sao chép phần tử html mà bạn đang tìm kiếm từ nguồn trang và thay thế nội dung văn bản bằng {.}:

xidel http://www.marksdailyapple.com/forum/memberslist/ -e '{.*' -f '

Về linux - cách trích xuất dữ liệu (tên người dùng) từ một trang web, chúng tôi tìm thấy một câu hỏi tương tự trên Stack Overflow: https://stackoverflow.com/questions/19610715/

26 4 0
Chứng chỉ ICP Bắc Kinh số 000000
Hợp tác quảng cáo: 1813099741@qq.com 6ren.com
Xem sitemap của VNExpress