是否有比CGI for Ruby更好的HTML转义和转义工具？

CGI.escapeHTML非常糟糕，但CGI.unescapeHTML完全是borked。例如：是否有比CGI for Ruby更好的HTML转义和转义工具？

require 'cgi' 

CGI.unescapeHTML('&#8230;') 
# => "…"     # correct - an ellipsis 

CGI.unescapeHTML('&hellip;') 
# => "&hellip;"    # should be "…" 

CGI.unescapeHTML('&#162;') 
# => "\242"     # correct - a cent 

CGI.unescapeHTML('&cent;') 
# => "&cent;"    # should be "\242" 

CGI.escapeHTML("…") 
# => "…"     # should be "&#8230;"

看来，unescapeHTML知道所有的数字代码加&，<，>和"。而escapeHTML只知道最后四个 - 它不会执行任何数字代码。我明白，转义通常不需要像健壮的一样，因为HTML将允许大多数字符的字面版本，除了CGI.escapeHTML知道的四个以外。但是消遣应该真的会更好。

有没有更好的工具在那里，至少对于消除？

来源

2008-12-18 James A. Rosen

它不处理—无论是。 – Chloe 2014-03-15 01:32:41

的宝石ヶ辆应该做的伎俩：

require 'rubygems' 
require 'htmlentities' 

coder = HTMLEntities.new 

coder.decode('&#8230;') # => "…" 
coder.decode('&hellip;') # => "…" 
coder.decode('&#162;') # => "¢" 
coder.decode('&cent;') # => "¢" 
coder.encode("…", :named) # => "&hellip;" 
coder.encode("…", :decimal) # => "&#8230;"

来源

2008-12-20 18:17:41 titanous

require 'rubygems' 
require 'hpricot' 

Hpricot('&#8230;', :xhtml_strict => true).to_plain_text

虽然你可能不得不使用字符编码。

来源

2008-12-18 23:21:06

使用htmlentities gem而不是hpricot。 – 2009-01-02 02:35:29

是否有比CGI for Ruby更好的HTML转义和转义工具？

回答

相关问题