我运行的Ruby 1.9.2并试图修复一些破碎的UTF-8文本输入在文本字面上"\\354\\203\\201\\355\\221\\234\\353\\252\\205"
并把它变成它的正确韩国"상표명"
转换整数UTF-8(韩国)
然而在搜索了一段时间并尝试了几个方法之后,我仍然发现了一些乱码。 它作为转义字符例如混乱的3个线工程精细
# encoding: utf-8
puts "상표명" # Target string
# Output: "상표명"
puts "\354\203\201\355\221\234\353\252\205" # Works with escaped characters like this
# Output: "상표명"
# Real input is a string
input = "\\354\\203\\201\\355\\221\\234\\353\\252\\205"
# After some manipulation got it into an array of numbers
puts [354, 203,201,355,221,234,353,252,205].pack('U*').force_encoding('UTF-8')
# Output: ŢËÉţÝêšüÍ (gibberish)
我敢肯定,这一定是某个地方回答,但我没有设法找到它。
谢谢!我想我现在明白了。 –