我在文本数据库,中国在这个格式保存项工作:复杂的字符串解析
繁体简体[PIN1 jin]金/英语相当于1 /当量2/
我试图解析它使用分隔符(Java)。
这是我到目前为止有:
String delims = "[\\[\\]/]+";
String tokens[] = str.split(delims);
的问题是等价的英语形式也包含分隔符标记。
例如:
⿔⿔的龟[GUI1] /变异|龟[GUI1]/
人们如何解析字符串?
我想从字符串的以下信息:
简体:⿔
传统:⿔
拼音:GUI1
英语等效:龟的变体|龟[ gui1]
请详细说明,更多的,则该字符串是没有意义的。 – 2012-01-17 05:45:58
你的意思是说你有一个字符串'a/b/c /',其中b也可能包含分隔符'/'? a和c是否可以包含分隔符? – brianestey 2012-01-17 05:46:03
是CEDICT吗?你可能会错过什么。格式应该是“繁体简体[pin1 yin1] /英文等效1 /等效2 /.../等效n /” – wuliang 2012-05-08 22:00:44