sách gpt4 ai đã đi

python - 解析 HTML 内容时防止 etree 解析 HTML 实体

In lại 作者:行者123 更新时间:2023-12-05 06:45:42 36 4
mua khóa gpt4 Nike

有什么办法可以防止etree在解析HTML内容时解析HTML实体吗?

html = etree.HTML('&')
html.find('.//body').text

这给了我 '&' 但我想得到 '&'本身。

1 Câu trả lời

您始终可以对数据进行前/后处理。在提供给 HTML 解析器之前将 '&' 替换为 u'\xfe',并在输出时将 u'\xfe' 替换为 '&'。

from lxml import etree
html = etree.HTML('&'.replace('&',u'\xfe'))
html.find('.//body').text.replace(u'\xfe','&')
u'&'

关于python - 解析 HTML 内容时防止 etree 解析 HTML 实体,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/22263599/

36 4 0
Bài viết được đề xuất: php - redirect_status 的奇数 (44)
Bài viết được đề xuất: emacs - Elisp:让符号函数返回源代码?
Bài viết được đề xuất: mPDF:表 td 中的长文本缩小为小尺寸
Bài viết được đề xuất: asp.net - 如何排除 Controller 进行身份验证
行者123
Hồ sơ cá nhân

Tôi là một lập trình viên xuất sắc, rất giỏi!

Nhận phiếu giảm giá Didi Taxi miễn phí
Mã giảm giá Didi Taxi
Giấy chứng nhận ICP Bắc Kinh số 000000
Hợp tác quảng cáo: 1813099741@qq.com 6ren.com