cuốn sách gpt4 ai đã làm

python - 提取 标签的内容

In lại Tác giả: Vũ trụ không gian Thời gian cập nhật: 2023-11-03 12:58:12 29 4
mua khóa gpt4 Nike

Tôi đã viết mã để sử dụng Súp đẹp Trích xuất url và tiêu đề của sách từ trang.

nhưng nó không có ở đó > Trích xuất giữaNhững câu chuyện siêu khoa học đáng ngạc nhiên tháng 4 năm 1930Tên của cuốn sách này. Và Nhãn.

Làm thế nào để trích xuất tên sách?

tôi đã cố gắng tìm tiếp theoPhương pháp được đề xuất trong một câu hỏi khác nhưng tôi nhận được Lỗi thuộc tính

HTML:

    

  • Những câu chuyện đáng kinh ngạc về siêu khoa học tháng 4 năm 1930
    BookIcon.png
    (Tiếng Anh)

  • Mã này như sau:

    chắc chắn make_soup(BASE_URL):
    r = request.get(BASE_URL, verify = False)
    súp = BeautifulSoup(r.text, 'html.parser')
    súp trở lại

    def extract_text_urls(html):
    súp = make_soup(BASE_URL)

    cho li trong súp.findAll('li'):
    thử:
    thử:
    print li.a['href'], li.a['title']
    in "\n"
    ngoại trừKeyError:
    vượt qua
    ngoại trừTypeError:
    vượt qua

    extract_text_urls(tên tệp)

    câu trả lời hay nhất

    Bạn nên sử dụng phần tử text tài sản. Những điều sau đây có hiệu quả với tôi:

    chắc chắn make_soup(BASE_URL):
    r = request.get(BASE_URL)
    súp = BeautifulSoup(r.text, 'html.parser')
    súp trở lại

    def extract_text_urls(html):
    súp = make_soup(BASE_URL)

    cho li trong súp.findAll('li'):
    thử:
    thử:
    in li.a['href'], li.a.text
    in "\n"
    ngoại trừKeyError:
    vượt qua
    ngoại trừTypeError:
    vượt qua

    extract_text_urls('http://www.gutenberg.org/wiki/Science_Fiction_(Bookshelf)')

    Tôi nhận được kết quả đầu ra sau đây liên quan đến phần tử

    //www.gutenberg.org/ebooks/29390 siêu Câu chuyện kỳ ​​thú về khoa học Tháng 4 năm 1930

    29 4 0
    không gian vũ trụ
    Hồ sơ

    Tôi là một lập trình viên xuất sắc, rất giỏi!

    Nhận phiếu giảm giá taxi Didi miễn phí
    Phiếu giảm giá taxi Didi
    Chứng chỉ ICP Bắc Kinh số 000000
    Hợp tác quảng cáo: 1813099741@qq.com 6ren.com
    Xem sitemap của VNExpress