cuốn sách gpt4 ai đã làm

android — BeautifulSoup tìm lớp tiếp theo

In lại Tác giả: Walker 123 Thời gian cập nhật: 27-11-2023 23:29:37 26 4
mua khóa gpt4 Nike

Vì vậy, về cơ bản. Tôi có 2 lớp. Một là ngày phát hành của giày. Chiếc còn lại là một chiếc giày được phát hành vào ngày đó. Tuy nhiên, họ là hai lớp hoàn toàn khác nhau. Vì vậy, tôi đã cố gắng loại bỏ khỏi các lớp này. Chứa "tiêu đề tháng" cho tất cả các ngày. Danh mục tiếp theo là sneaker-post-main, chứa tất cả các đôi giày có ngày trong tiêu đề tháng. Nhưng họ là hai lớp khác nhau. Chúng không liên quan đến nhau. Vì vậy, tôi đã thử thực hiện .nextSibling từ lớp h4 để bắt lớp "một phần" của mình. Nó không hoạt động như vậy.

Ngày 15 tháng 4 năm 2016


...

...

...

Ngày 16 tháng 4 năm 2016


...

...

...

Ngày 17 tháng 4 năm 2016


...

...

...

Ngoài ra, nếu HTML của tôi không có ý nghĩa thì đây là trang web tôi đang tìm kiếm. http://sneakernews.com/air-jordan-release-dates/Tôi muốn kết quả đầu ra trông giống như ngày tháng là khóa của từ điển và giá trị là danh sách những đôi giày sẽ được phát hành vào ngày đó. Như hình dưới đây.

Ngày 16 tháng 4 năm 2015
{
Thông tin giày 1
Thông tin giày 2
Thông tin giày 3
}
Ngày 17 tháng 4 năm 2015
{
Thông tin giày 1
Thông tin giày 2
Thông tin giày 3
}

Tôi đang cố gắng sử dụng BeautifulSoup để hoàn thành nhiệm vụ này. Tôi dường như không thể tìm ra nó. Ngày 15 tháng 4 năm 2016 -> Đây là HTML ngày phát hành. ... -> Phần này chứa thông tin về giày etectra. (Giống như có một danh sách các đôi giày ở đó thay vì chỉ một chiếc giày)

từ nhập bs4 BeautifulSoup
yêu cầu nhập khẩu
nhập json


tiêu đề = {
#'Bánh quy': ' _ga=GA1.2.610207006.1459822661',
'Chấp nhận-Mã hóa': 'gzip, deflate, sdch',
'Tác nhân người dùng': 'Mozilla/5.0 (X11; Linux x86_64) AppleWebKit/537.36,(KHTML, like Gecko) Chrome/41.0.2272.101 Safari/537.36',
'Ngôn ngữ chấp nhận': 'en-US,en;q=0.8',
'Chấp nhận': '*/*',
'Kết nối': 'duy trì',
'Độ dài nội dung': 0
}
phản hồi = request.get('http://sneakernews.com/air-jordan-release-dates/',headers=headers).text
súp = BeautifulSoup(phản hồi)
cho thẻ trong súp.findAll('h4', attrs = {'class':'month-header'}):
in tag.nextSibling.nextSibling.nextSibling

Đây là mã của tôi cho đến nay!

câu trả lời hay nhất

Đảo ngược logic và nhận được tất cả phần.sneaker-post-main Sau đó tìm từng anh chị em trước đó và sử dụng nó làm khóa nhóm trong từ điển:

yêu cầu nhập khẩu
từ bộ sưu tập nhập defaultdict


cont = request.get(url, headers=ua).content

súp = BeautifulSoup(tiếp,"lxml")

d = defaultdict(danh sách)
phần = soup.select ("div.release-post-list phần.sneaker-post-main")
cho phần trong phần:
h4 =section.find_previous_sibling("h4",{"class:"month-header"})
d[h4.text.strip()].append(section)

print(d["Ngày 15 tháng 4 năm 2016"])

Sử dụng văn bản tiêu đề đầu tiên làm khóa, bạn có thể thấy rằng mình đã hiểu đúng ba văn bản đầu tiênsneaker-hậu-chính:

[
\n
\n
\n\n
\n
\n

\n< span>Jordan Ultra Fly \u201cHyper Turquoise\u201d

\n
\n

$ \n125

\n
\n(55 )
2,74 / 5 (55 VOTES)
ĐÁNH GIÁ ĐIỀU NÀY ĐÁNH GIÁ NÀYĐÁNH GIÁ ĐIỀU NÀYĐÁNH GIÁ NÀYĐÁNH GIÁ NÀYĐÁNH GIÁ ĐIỀU NÀYĐÁNH GIÁ ĐIỀU NÀYĐÁNH GIÁ ĐIỀU NÀYĐÁNH GIÁ NÀYĐÁNH GIÁ NÀY\xa0
\nĐang tải...Đang tải...
\n
\n
\n
\n
\n

Kích thước chạy: Nam

\n

Màu sắc: Đen/Ánh bạc-Hyper Turquoise

\n

Mã kiểu: 834268-006

\n
\n
\n
\nThêm vào:\n\n< của bạn Một href="https://www.google.com/calendar/render?action=TEMPLATE&text=Jordan+Ultra+Fly+\u201cHyper+Turquoise\u201d&dates=20160415/20160415&details=http://sneakernews.com / 2016/04/01/the-jordan-ultra-fly-hyper-turquoise-hits-stores-soon/&location=&sprop=website:http://sneakernews.com&pli=1&uid&sf= true&output=xml#eventpage_6" target="_blank">Lịch Google\nIcal\n< !-- Ical-->\n\n
\n
\n
\n
\n
\n
\n
,
\n
\n
\n
\n

Mua ngay trên EBAY

\n
\n
\n

\nJordan Ultra Fly< /span>

\n
\n

$\n125

\n
\ n(290)
2,24 / 5 (290 VOTES)
< /i> ĐÁNH GIÁ ĐIỀU NÀYĐÁNH GIÁ ĐIỀU NÀYĐÁNH GIÁ ĐIỀU NÀYĐÁNH GIÁ ĐIỀU NÀYĐÁNH GIÁ NÀYĐÁNH GIÁ NÀYĐÁNH GIÁ NÀYĐÁNH GIÁ ĐIỀU NÀYĐÁNH GIÁ ĐIỀU NÀYĐÁNH GIÁ ĐIỀU NÀY\xa0
\nĐang tải...Đang tải...
\n< /div>\n
\n
\n
\n

Size Run: Nam

\n

Màu sắc: Đen/Phản ánh Bạc-Trắng

\n

Mã kiểu: 834268-011

\n
\n
\n
\nThêm vào:\n\nLịch Google\nIcal\n< !-- Ical-->\n\n
\n
\n
\n
\n
\n
\n
,
\n
\n
\n\n
\n
\n

\nJordan Ultra Fly

\n
\n

$\n125

\n< div class="release-rated">\n(17)
2,47 / 5 (17 VOTES)
ĐÁNH GIÁ NÀYĐÁNH GIÁ NÀYĐÁNH GIÁ ĐIỀU NÀYĐÁNH GIÁ ĐIỀU NÀYĐÁNH GIÁ ĐIỀU NÀYĐÁNH GIÁ NÀYĐÁNH GIÁ ĐIỀU NÀYĐÁNH GIÁ ĐIỀU NÀYĐÁNH GIÁ ĐIỀU NÀYĐÁNH GIÁ ĐIỀU NÀY\xa0
\nĐang tải...Đang tải...
\n
\n
\n
\n
\n

Kích thước chạy: Nam

\n

Màu sắc:Đen/Trắng bạc phản chiếu

\n

Mã kiểu: 834268-004

\n
\n
\n
\nThêm vào:\n\nLịch Google\nIcal\n< !-- Ical-->\n\n
\n
\n
\n
\n
\n
\n
]

mỗi tiêu đề h4.tháng Có thể có nhiều phần.sneaker-post-main anh em nhưng mỗi phần.sneaker-post-main Trước đó chỉ có một tiêu đề h4.tháng anh trai.

Về python - BeautifulSoup để tìm lớp tiếp theo, chúng tôi tìm thấy một câu hỏi tương tự trên Stack Overflow: https://stackoverflow.com/questions/36540131/

26 4 0
Xem sitemap của VNExpress