删除不需要的文本,我想从一个大的字符串中提取只有少数信息,如正则表达式从字符串
[[["좋은","good","joh-eun",""]],[["adjective",[["좋은",["good","nice","pretty","admirable","canny","tenacious"],,0.38553435]],"good",4],["adverb",["훌륭하게",["wonderfully","good","nicely","beautifully","fine","finely"],,0.00029145498],"good",4]]]
我想提取这样
좋은 - good
좋은 - good,nice,pretty,admirable,canny,tenacious (basically adjectives)
훌륭하게 - wonderfully,good,nicely,beautifully,fine,finely (adverbs)
字符串,请帮助我试着使用SED和管道切割像
cut --delimiter='"' -f 1-2 and then use sed 's/\[\[\[\"//'
这是给我的第一个韩国좋은作为结果,我无法扩展此以获得所需的结果! 如果还有其他更好的方法来实现这一点,请提出建议。 在此先感谢。
是你的真实投入的例证吗? []的格式似乎不连贯... – Tensibai 2014-08-28 12:30:58
你能区分你想从你想要更精确地丢弃的东西中“提取”吗? (电脑(或我们)不能对“基本”做任何事情)。如果你不能 - 如果你想包括所有的副词和/或形容词,那么我们需要思考基于字典的解决方案 – drewmoore 2014-08-28 12:31:20
@Tensibai - 它的短版实际输入..我错过了方括号,我想编辑一次我可以访问计算机(现在打电话) – Magic 2014-08-28 12:37:36