我正在制作python链接验证程序,以便我可以取消给定网址中的所有链接并验证它们。python链接验证程序
我试图在for循环中使用re模块,事实证明这是无效的语法。
但我真的不能想出其他方式,可以拉出所有的链接,并检查其中每一个..所以我需要帮助它。
下面的代码:
import requests, bs4,webbrowser, re
from selenium import webdriver
url = str(input())
res = requests.get(url)
try:
res.raise_for_status()
except Exception as err:
print('There was a probelm with the first url: %s' % (err))
soup = bs4.BeautifulSoup(res.text, "html.parser")
linkElems = soup.select('a')
hrefRegex = re.compile(r'^"http(s)?://.*?"')
mo = hrefRegex.search(linkElems)
for i in range (len(linkElems[i])
mo = hrefRegex.search(linkElems[i])
res = requests.get(mo.group())
if res.status_code != requests.codes.ok:
print('%s is broken link. Response: 404 "Not Found"' % (mo.group()))
它说“莫”部分有无效的语法,所以我甚至不能测试它... :(
,并验证手段确保该链路中断,这意味着它们是有效的网址,这样我们就不会从他们那里404“未找到”消息
你是什么意思与验证?你会得到什么错误信息? – linusg
@linusg我没有收到错误消息,因为在循环中放置'mo'是无效的语法。并验证手段,以确保链接不被破坏,这意味着他们是有效的网址,以便我们不会从他们收到404“未找到”消息。 –