6
我有一个HTML文件集合。我希望一个一个地遍历它们,编辑特定类的标记。我想编辑的代码是以下形式,使用下面的类名称:用BeautifulSoup中的另一个标签替换一种标签
<td class='thisIsMyClass' colspan=4>
<a id='123' class='thisIsMyOtherClass' href='123'>Put me Elsewhere</a>
这可以在同一文档中出现多次,用不同的文本,而不是“把我在别处”,但始终不变类。
我想改变这是下面的形式:
<font SIZE="3" COLOR="#333333" FACE="Verdana" STYLE="background-color:#ffffff;font-weight: bold;">
<h2>Put Me Elsewhere</h2>
</font>
import os
for filename in os.listdir('dirname'):
replace(filename)
def replace(filename):
tags = soup.find_all(attrs={"thisIsMyClass"})
不太清楚在这之后去哪里或如何处理标签阵列?任何帮助将非常感激。谢谢:)
HTML对
回答
好得多,更漂亮将是一个占位符准备替换HTML字符串,找到所有
td
标签与thisIsMyClass
类,并使用.replace_with()
来代替每个:打印:
来源
2014-12-03 22:12:19 alecxe
这就像分配给
name
属性一样简单。另外documentation是你的朋友。这是相当全面的。
来源
2014-12-02 03:14:24 ento
相关问题