2010-12-04 28 views
0

我的应用程序正在成功从Twitter搜索API中使用JSON。但是,我对我应该如何处理内容感到困惑。每个Tweet JSON对象都有一个“文本”属性,所以我认为它应该被视为这样。不过,我看到很多",&amp等内容中的废话。Twitter搜索API:Tweet文本应该包含XML还是HTML?

Twitter API是不是很糟糕,是通过它的XML错误地编码文本内容,或者Twitter API的用户应该以某种方式将Tweet文本处理为纯文本以外的内容?我意识到有一个标记约定,例如@username指示与其他Twitter用户的通信,并且http://指示链接。我们是否也应该期待XML或HTML实体?显然,我不想仅仅将Tweet文本作为HTML插入。

回答

0

文本字段返回的文本不是html既不是xml,但在文本中它使用特殊的html字符的东西,如" tjat是引号(因为它不能将它们包括在json中,而不会造成混乱),它也增加来自外语的特殊字符,比如“2011 \ u5e746 \ u6708 \ u767a \ u”,所以不要惊讶地发现这个东西。只需要了解最常见的marquer,以便在您想要对文本进行操作时替换它们。

+0

感谢您的回答。你知道他们的特殊编码是否记录在任何地方?我期望`\ u ####`东西,因为这是JSON标准的一部分,但我不确定我应该寻找哪些特定的HTML实体(双引号应该用反斜杠,并没有理由为什么`&`需要被转义)。 – Jacob 2010-12-06 18:18:30

相关问题