Windows.Web.Http.HttpClient字符编码

所以我试图读取包含捷克字符（ř，š，š，ň等）的页面的HTML源代码。该页的字符集是windows-1250（Content-type = text/html; charset=windows-1250）。Windows.Web.Http.HttpClient字符编码

var hc = new Windows.Web.Http.HttpClient(); 
    var uri = new Windows.Foundation.Uri("http://rozvrhuni.hys.cz/150909.html"); 
    hc.defaultRequestHeaders.acceptLanguage.parseAdd("cs"); 
    hc.defaultRequestHeaders.acceptEncoding.parseAdd("windows-1250"); 
    hc.getStringAsync(uri).done(
     function complete(result) { 
      htmlText = result; 
     }, 
     function error(result) { 
      (new Windows.UI.Popups.MessageDialog("Non-existent content", "Error")).showAsync().done(); 
      return; 
     } 
    );

我的代码获取源代码，但继续错读一些字符（R = O，C = E等）

我该怎么做才能正确读取页面？

来源

2015-10-29 Keashi

我对JavaScript并不熟悉，但我相信C＃的概念是一样的。

以下代码在C＃中，但我希望它可以帮助你。

string retVal = ""; 
byte[] bodybytes = {0}; 

// This 'RegisterProvider' call is enough at once per process. 
var provider = System.Text.CodePagesEncodingProvider.Instance; 
System.Text.Encoding.RegisterProvider(provider); 

var enc = Encoding.GetEncoding("windows-1250"); 
... 
bodybytes = await response.Content.ReadAsByteArrayAsync(); 
... 
retVal = enc.GetString(bodybytes, 0, bodybytes.Length);

注 - 您可能需要将以下nuget包添加到您的项目中。 https://www.nuget.org/packages/System.Text.Encoding.CodePages/

来源

2015-10-30 00:04:53 pnp0a03

Windows.Web.Http.HttpClient字符编码

回答

相关问题