2013-05-15 142 views
0

如何在vb.Net的字符串中检测到无法识别的代码页字符?这些字符通常显示为默认字符,例如“?”或者当前代码页无法识别来自其​​他输出的原始字符时为正方形。检测字符串中无法识别的(codepage-unicode)字符

我有一个外部来源的文本字段,它显示了一些长破折号字符(不是字符(150))的“方形”字符,我希望能够用字符代码45(短划线)替换它以使它兼容,但我无法确定如何检查替换中的默认特殊“无法识别”的字符。我搜索了网络,但无法找到解决这个问题的办法!我玩System.Text.Encoding但仍然可以得到我想要的。任何想法如何做到这一点?

谢谢!

回答

1

我看到这个问题很久以前就问过了,我想你现在已经找到了答案。无论如何,这正是我目前所做的。我寻找要替换的特定字符,并在另一个阵列中放入我希望它们更改的字符。我希望这对你有用。

Private Function CleanText(TextToClean As String) As String 
    Dim CleanedText As String = TextToClean 
    Dim BadText(5) As Char 
    Dim GoodText(5) As String 

    BadText(0) = ChrW(169) ' © (alt 0169, copyright) 
    BadText(1) = ChrW(174) ' ® (alt 0174, registered trademark) 
    BadText(2) = ChrW(8482) ' ™ (alt 0153, trademark) 
    BadText(3) = ChrW(8364) ' € (alt 0128, Euro) 
    BadText(4) = ChrW(176) ' ° (alt 0176, degrees) 

    GoodText(0) = "(c)" 
    GoodText(1) = "(r)" 
    GoodText(2) = "(tm)" 
    GoodText(3) = "(euro)" 
    GoodText(4) = "o" 

    For i As Integer = 0 To BadText.GetUpperBound(0) 
     CleanedText = CleanedText.Replace(BadText(i), GoodText(i)) 
    Next 

    Return CleanedText 
End Function