2012-01-26 57 views
2

我正在使用HTMLUnit。我正在访问页面,但是特殊(马耳他语)字符显示错误。例如,ġuvni显示为?uvni显示错误字符的HTML单元

HtmlPage page = submit_button.click(); 
System.out.println(page.asText()); 

我怀疑这是一个编码的问题,虽然我没有找到任何page.setPageEndoding或一些类似的方法......有没有人收到这样的问题?

谢谢!

回答

2

确保你的网页是UTF-8通过把这个元标记在您的<head>

<meta http-equiv="Content-Type" content="text/html; charset=utf-8"> 
+0

嗯,当我得到它想出的“UTF-8”的页面编码。 –

+0

实际上发生的事情是Eclipse的控制台输出未设置为“UTF-8”。一旦我改变它,角色显示正常。控制台编码可以按如下所示进行更改:http://decoding.wordpress.com/2010/03/18/eclipse-how-to-change-the-console-output-encoding/ 10x! –