经过整个HTML响应后,发现在一个脚本标记内嵌入javascript的youtube视频id 。 HTML响应的
部分(其给出视频Id)的:
import urllib2
import re
response = urllib2.urlopen("https://www.hopenglish.com/how-sugar-affects-the-brain?ref=category")
html_text = response.read()
# print html_text
m = re.search('vID = "(.*?)"', html_text)
print m.group(0)
其产生:
<script type="text/javascript" language="javascript">
var vID = "lEXBxijQREo";
var srt_name = "sugaraffectsbrain";
var user_id = 0;
var post_id = 8349;
var share_link = 'https://www.hopenglish.com/how-sugar-affects-the-brain';
var share_img_link = 'https://s3-ap-northeast-1.amazonaws.com/hopenglish/wp/wp-content/uploads/2014/10/how-sugar-affects-the-brain.jpg';
</script>
从以上的HTML响应,使用正则表达式如下检索vID
值
vID = "lEXBxijQREo"
您可以将vID值lEXBxijQREo
附加到youtube.com域名如下:
https://www.youtube.com/watch?v=lEXBxijQREo
非常感谢我即将安装硒...... – mel