2013-03-07 24 views
2

我在查询MediaWiki API以将维基百科数据导入到我的Filemaker数据库中。当我将数据加载到浏览器中时,字符正确显示,但是当它进入Filemaker时,带有变音符的字符会转换为这些奇数字符:á转换为√°(平方根符号+度符号),é转换为√(平方根符号+版权符号),í转换为√≠(平方根符号+不等于符号)等等。那是什么字符编码?谢谢!!如何解码这些字符? √°√©√≠

+1

看起来像UTF-8曲解为Mac-Roman。 – Joni 2013-03-07 22:43:23

+0

查看在MediaWiki中看到的那个字符的原始字节,并将它们与Filemaker中的字符进行比较。另外,请查看本文,其中讨论了编写字符“é”的不同方式:https://dev.twitter.com/docs/counting-characters#Definition_of_a_Character – 2013-03-07 22:54:38

回答

0

你对所有被误解的字符都是正确的,我用来设置FMP的用户代理的Troi URL FMP插件(如MediaWiki API所要求的)负责提取乱码字符。解决方案是绕过插件:FMP脚本执行Applescript“do shell script curl -A”来设置用户代理和查询API并将响应反馈回FMP,并且所有字符都正确地通过!

1

由于@Joni表明在他的评论,这是UTF-8误解为的MacRoman。 Letter á为UTF-8中的C3 A1(十六进制),并且MacRoman中的C3为“√”,A1为“°”。所以你应该试着设置程序来将数据解释为UTF-8。