所以我已经花了一些时间去学习如何编写http请求正确的请求HTTP创建了一个Python HTML文件
我的目标是请求网页解析的HTML,并从那里提取数据
林无法理解我怎么能做到这一点,如果我没有该文件的具体路径和所有我已经是基本类似的URL的方式IM www.google.com
试图做的urllib .request可以在python中使用套接字编程手动执行
#Playing with Sockets
import socket
target_port=80
target_url ='www.google.com'
client=socket.socket(socket.AF_INET,socket.SOCK_STREAM)
client.connect((target_url,target_port))
request= "GET https://www.google.com HTTP/1.1\nHost:google.com\n\n"
message= request.encode()
client.send(message)
response=client.recv(4096)
print(response.decode())
目前还不清楚“我没有文件的确切路径”是什么意思。 URL *是确切的路径。 –