现在这个对我来说是一个很大的挑战。正则表达式,ANTLR还是其他解决方案?
我大约1000个查询在一个文件中,所有类似的模式的是去为得到:
***\*XYZ#PQR#\****
现在,其中#表示任何号码非空白charecters。
我已经编写了一段代码,可以读取上面的代码并生成相应的正则表达式。
但是,大约有100,000名候选人,并且我提到了大约1000个这样的查询,以便对比赛进行评估。
这使得我的代码在计算上相当昂贵,因为它要达到m * n的数量级。
我已经经历了ANTLR,我发现学习曲线非常陡峭。虽然听起来很有希望,但在我脑海中的某个角落,如果可以通过使用Antlr实现,我仍然存在疑问。请让我知道您的意见或任何其他可行的解决方案。
能否请您详细解释一下哪些图案(长度相同,长度不同等),以及您需要怎样处理它们。 – 2012-04-08 20:13:38
这些模式旨在处理各种关键字,如'* * Telecom#Servic#\ *'将匹配'电信服务'。模式长度可以根据关键字而变化。我想识别每个变体及其相应的模式。 – 2012-04-08 20:15:42