检测字符串中无法识别的（codepage-unicode）字符

如何在vb.Net的字符串中检测到无法识别的代码页字符？这些字符通常显示为默认字符，例如“？”或者当前代码页无法识别来自其他输出的原始字符时为正方形。检测字符串中无法识别的（codepage-unicode）字符

我有一个外部来源的文本字段，它显示了一些长破折号字符（不是字符（150））的“方形”字符，我希望能够用字符代码45（短划线）替换它以使它兼容，但我无法确定如何检查替换中的默认特殊“无法识别”的字符。我搜索了网络，但无法找到解决这个问题的办法！我玩System.Text.Encoding但仍然可以得到我想要的。任何想法如何做到这一点？

谢谢！

来源

2013-05-15 Shaker42

我看到这个问题很久以前就问过了，我想你现在已经找到了答案。无论如何，这正是我目前所做的。我寻找要替换的特定字符，并在另一个阵列中放入我希望它们更改的字符。我希望这对你有用。

Private Function CleanText(TextToClean As String) As String 
    Dim CleanedText As String = TextToClean 
    Dim BadText(5) As Char 
    Dim GoodText(5) As String 

    BadText(0) = ChrW(169) ' © (alt 0169, copyright) 
    BadText(1) = ChrW(174) ' ® (alt 0174, registered trademark) 
    BadText(2) = ChrW(8482) ' ™ (alt 0153, trademark) 
    BadText(3) = ChrW(8364) ' € (alt 0128, Euro) 
    BadText(4) = ChrW(176) ' ° (alt 0176, degrees) 

    GoodText(0) = "(c)" 
    GoodText(1) = "(r)" 
    GoodText(2) = "(tm)" 
    GoodText(3) = "(euro)" 
    GoodText(4) = "o" 

    For i As Integer = 0 To BadText.GetUpperBound(0) 
     CleanedText = CleanedText.Replace(BadText(i), GoodText(i)) 
    Next 

    Return CleanedText 
End Function

来源

2014-05-14 14:05:41 RoadRacer

检测字符串中无法识别的（codepage-unicode）字符

回答

相关问题