-2
我正在过分复杂化这个简单的项目,但我想了解更多关于Python的知识,所以我想到了这个简单的应用程序,它涉及基于在Google展示时间上列出的电影来抓取所有当前电影的电影时间。数据抓取的正则表达式?
该位置是无关紧要的,因为它拉起所有当前的电影。我有代码取消<span class=info></span>
标记中的所有数据,但它显然会提取电影的长度以及大量其他html数据。我只想要电影时代。
我假设只提取电影时间,我需要某种正则表达式。
这里是长什么样的文本信息的一部分,就像
<span class=info>‎2hr 3min‎‎ - Rated PG-13
我需要小时和分钟,没有别的小片段。从这一行文本中解析这些数据的最佳方法是什么?
当我说电影放映时间,我只是说电影,而不是相关的电影放映时间的实际长度。 – user3650739