sách gpt4 ai đã đi

python - 使用 urllib 获取标题

In lại 作者:行者123 更新时间:2023-12-01 04:24:52 27 4
mua khóa gpt4 Nike

我应该编写一个进入网站并获取其标题的代码,所以这是我的代码

import urllib.request
def findTitle(url):
urllib.request.Request(url)
#open url
urllib.request.urlopen(url)
urllib.request.urlopen(url).read().decode('utf-8')
#set same variable equal to the end of tag<br> endTitlePos = url.find("")<br> #set variable equal to starting position of tag<br> startTitlePos = url.find("", endTitlePos)<br> startTitlePos += len("")<br> #set new variable equal to
TitleContent=url.find("",startTitlePos)
#return slice of output between the two variables
title = url[startTitlePos:endTitlePos]
content_list=[]
content_list.append(title)
return content_list
định nghĩa main():
url="https://google.com/search"
print(findTitle(url))

主函数

我们以谷歌为例。现在它应该只打印“google”,但目前它打印“['//google.com/searchar']”我只是好奇我在这里缺少什么,我的意思是它看起来很简单,但我不知道为什么它打印url 而不是标题,我如何将其从列表转换为字符串?

1 Câu trả lời

有多种方法可以从网页获取数据。最好用BeautifulSoup。在您的情况下,字符串 split() 方法效果很好

import urllib.request

def findTitle(url):
webpage = urllib.request.urlopen(url).read()
title = str(webpage).split('')[1].split('')[0]
return title

>>>print(findTitle('http://www.google.com'))
Google

关于python - 使用 urllib 获取标题,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/33272548/

27 4 0
Bài viết được đề xuất: jquery - 为什么 .html() 在 Internet Explorer 7 中不起作用
Bài viết được đề xuất: jQuery CAD 软件
Bài viết được đề xuất: java - 删除 WebView 中的横幅?
Bài viết được đề xuất: jquery - 问题 | Jquery插件创建问题
行者123
Hồ sơ cá nhân

Tôi là một lập trình viên xuất sắc, rất giỏi!

Nhận phiếu giảm giá Didi Taxi miễn phí
Mã giảm giá Didi Taxi
Giấy chứng nhận ICP Bắc Kinh số 000000
Hợp tác quảng cáo: 1813099741@qq.com 6ren.com