2017-02-23 60 views
-2

我该如何编写一个python程序,它从文本文件中读取短URL列表,并对其进行扩展,然后将它们转储到另一个文件中?Python:URL扩展器

我需要为每个链接找到最近的重定向(返回“200 OK”),并且不知道从哪里开始。

+0

开始做一个文本文件与URL,make和'openFile()'函数读取URL并将它们扩展到您喜欢的地方并将它们写入另一个文件。你必须展示你尝试过的东西的一些努力和代码。此网站用于帮助其他人使用他们的代码,而不是编写它;-) –

+0

当然!我只是无法入门,因为我对python知之甚少! –

+0

好吧,尝试编写一个函数,打开并读取文件,从那里谷歌和stackoverflow是你最好的朋友。也许尝试一些关于codeacademy的学习来让你开始? –

回答

0

可以使用requests模块解析URL重定向:

import requests 

url = '...' 
response = requests.head(url) 
if response.is_redirect: 
    print(response.headers['Location']) 
+0

我以前正在查看类似的示例,但它们似乎适用于逐个链接的基础。我不得不扩展1000个URL,并想知道我是否可以通过从文本文件中读取URL来制作循环?我知道我想做什么,只是不知道该怎么做,或者如果这是一个好主意。 –

+0

@ Blips-n-Chitz我认为你需要从一个Python教程开始,它将向你展示如何编写循环。 –

+0

非常感谢!我现在要找一个! –

0

一种方式做,这将是使用Mechanize库这样:

import mechanize 

br = mechanize.Browser() 
br.set_handle_robots(False) 

fLong = open("longURL.txt", 'w') 

with open("shortURL.txt",'r') as fShort: 
    for url in fShort: 
     br.open(url) 
     fLong.write(br.geturl() + '\n') 

fLong.close()