如何从HTML表格代码中删除/去除所有格式或样式信息?如何从HTML表格代码中删除/去除所有格式或样式信息?
我需要删除所有颜色,字体大小等。可能完全删除所有style
和class
属性。
也许我想删除一些标签和属性。通过删除标签我的意思是留下它的内容,但删除开始和结束标签名称。
如何从HTML表格代码中删除/去除所有格式或样式信息?如何从HTML表格代码中删除/去除所有格式或样式信息?
我需要删除所有颜色,字体大小等。可能完全删除所有style
和class
属性。
也许我想删除一些标签和属性。通过删除标签我的意思是留下它的内容,但删除开始和结束标签名称。
我在VB6中做了这样的事情。复制下面是代码。正如你所看到的,代码只是通过逐字符逐个HTML,并且移除(包括)<和>标签之间的所有内容。希望你可以在你使用的任何工具中做类似的事情。
Function CleanTags(HTML As String) As String
Dim result As String, b As Boolean, c As String, i As Long
b = False
For i = 1 To Len(HTML)
c = Mid(HTML, i, 1)
If c = "<" Then b = True
If b = False Then result = result & c
If c = ">" Then b = False
Next i
CleanTags = result
End Function
任何东西都会适合 – Dims
不仅'style'属性应该被删除。也可能是'class'属性。如果某些标签用'class'或'style'属性的'span'标签封装,则应删除整个'span'标签。 'table','td'和'tr'标签不应该被移除 – Dims