2016-04-29 131 views
0

我正试图从网站收集数据。我有一个包含网站所有不同扩展名的Excel文件。 F.i. www.example.com/example2。我有一个脚本可以从站点中成功提取HTML,但现在我想为所有扩展自动执行此操作。然而,当我说:如何向URL添加变量?

siteExtension = "example2" 
url = ("https://www.example.com/siteExtension") 
r = requests.get(url) 

代替:

url = ("https://www.example.com/example2") 
r = requests.get(url) 

我得到一个错误代码。你们有什么建议如何做到这一点?提前致谢!

回答

4

您需要将siteExtension的值连接到url字符串。您可以通过多种方式做到这一点,但这里有两个最常见的:

url = "https://www.example.com/" + siteExtension 

,或者在更普遍的形式:

url = "https://www.example.com/{}".format(siteExtension) 
+0

酷谢谢!如果我想添加两个扩展?我只是做:+ siteExtension1 + siteExtension2? – titusflex

+0

试一下,看看,最好的学习方式。 ;) –

0

您需要将字符串拼接在一起,而不是使siteExtension的你的文字字符串的一部分,就像这样:

siteExtension = "example2" 
url = ("https://www.example.com/" + siteExtension) 
r = requests.get(url) 
0

你有这样的错误,因为你不及格siteExtension变量的值到url,而是传递siteExtension字符串。

可以按如下方式解决这个问题:

siteExtension = "example2" 
url = ("https://www.example.com/" + siteExtension) 
r = requests.get(url) 

或者用这种方式:

siteExtension = "example2" 
url = ("https://www.example.com/%s" %(siteExtension)) 
r = requests.get(url)