我的RSS的理解 “HTML逃脱” 是这样的:RSS逃脱HTML
HTML:
1 < 3
变(RSS):
1 &lt; 3
这样的话,应该此:
<img src="http://somehost/someimage?a=foo&b=bar" />
成为:
<img src="http://somehost/someimage?a=foo&amp;b=bar" />
(注意&amp;
如果是的话,这是无效的RSS?
<description>
...
<img src="http://d.yimg.com/a/p/ap/20110309/capt.f6...02-0.jpg?x=91&y=130&q=85&sig=6oI7fIgN0izc9olfgY56vw--" />
</description>
(此外,是一个事实,即关闭>不逃脱坏?)
上述<描述的是我有>的问题是,一旦你解码第一实体层(XML)到达<描述>标记的内容时,您会得到一个长的CDATA,它应该是HTML。问题是<img>只有一个&
,这是一个无效的实体。对于上面的大块,我得到类似<img src="....?x=1&y=2" />
,这是不合法的HTML。
我只是看着闯入RSS的糟糕的HTML,或者我在这里错过了什么?
''是无效的,但浏览器可以处理它,所以它是非常有可能的原始的HTML没有正确逃生的SRC属性中的&符号。非转义的'>'当然不是一件好事,但是再次,也许饲料读者不会窒息它。这两件事情都做得不好,但可以在宽容的客户中工作。 – 2011-03-09 20:32:24
这大部分是我的想法......我试图让页面在http://validator.w3.org/ – Thanatos 2011-03-09 20:44:49