我正在使用HtmlSanitizer解析输入.NET Core
阻止XSS Injections
。 HtmlSanitizer实现AngleSharp - 我不知道什么角度夏普的做法,但它编码某些字符,像这样:消毒HTML - 获取一些未知的编码?
输入:
!@#$%^&*()_+{}:"<>?~
输出:
!@#$%^&*()_+{}:"<>?~
注意<
,>
和&
编码为<
,>
和分别为。我在这里有两个问题:
- 这是什么编码?
- (可选)有没有办法使用AngleSharp或其他库来撤消它?
旁注 - 为所需要的所有东西有害被剥离出来,这种格式的变化发生在“安全的” HTML反正,只是想指出,我不是撤销库的任何安全功能,所以我们不对此有长时间的讨论。
请提供[MCVE。 –
如果你知道什么是编码w ^因为,你可能会从所发布的信息中知道。 @AlanLarimer – VSO
Asp.Net内置了HTML编码/解码。请参阅[这个问题](https://stackoverflow.com/questions/33924496/where-is-htmlencode-in-asp-net-5)了解更多信息。 – Amy