2014-01-23 92 views
0

如何从HTML表格代码中删除/去除所有格式或样式信息?如何从HTML表格代码中删除/去除所有格式或样式信息?

我需要删除所有颜色,字体大小等。可能完全删除所有styleclass属性。

也许我想删除一些标签和属性。通过删除标签我的意思是留下它的内容,但删除开始和结束标签名称。

+1

任何东西都会适合 – Dims

+0

不仅'style'属性应该被删除。也可能是'class'属性。如果某些标签用'class'或'style'属性的'span'标签封装,则应删除整个'span'标签。 'table','td'和'tr'标签不应该被移除 – Dims

回答

0

我在VB6中做了这样的事情。复制下面是代码。正如你所看到的,代码只是通过逐字符逐个HTML,并且移除(包括)<和>标签之间的所有内容。希望你可以在你使用的任何工具中做类似的事情。

Function CleanTags(HTML As String) As String 
    Dim result As String, b As Boolean, c As String, i As Long 
    b = False 
    For i = 1 To Len(HTML) 
    c = Mid(HTML, i, 1) 
    If c = "<" Then b = True 
    If b = False Then result = result & c 
    If c = ">" Then b = False 
    Next i 
CleanTags = result 
End Function 
+0

这将清除所有标签。我只需要清理格式化标记 – Dims

+0

在这种情况下,我认为这样做的唯一方法就是获得允许标记的白名单或不允许标记的黑名单。 – mti2935

相关问题