2013-07-16 57 views
0

我必须通过正则表达式从电子邮件中提取密码,因为密码位置的xpath是动态的。需要为随机生成的密码生成正则表达式

下面是密码位置的XPath的:在这个位置

//*[@id=':k6']/div[1]/div/div[3]/div[3]/table/tbody/tr[3]/td 

样品密码:

QFYFV3WL$8H! 

这里id是动态的,所以第一个挑战是如何生成的正则表达式id。 其次,我们需要生成正则表达式来从密码字段中提取密码。 密码的每个字符都是动态的,可能包含任何字符。
任何帮助在这里赞赏。

+7

我们热爱挑战! ♥...但你有什么尝试? – hsz

+0

你的问题不完全清楚。什么是长度限制? –

+1

我不明白。如果XML两者的位置和密码本身是未知的,那么你就不能提取出来。或者你有没有任何额外的标准,你没有告诉我们? – Bergi

回答

3

你正在尝试做什么不能完成。在某些情况下,您可以使用正则表达式来分析html文档,但在以下情况下您不能这样做:您需要浏览DOM。正则表达式引擎没有文档结构的概念。 HTML不是常规语言,因此无法使用正则表达式进行分析。

的情况下,这是可以接受的是,当你试图解析的东西,就好像html文件只是一堆文字。如果你需要得到内部标签,你需要的是一个DOM解析器

引用一段famous answer关于这个话题在这里SO:

试图解析使用正则表达式HTML每一次, 邪恶的孩子哭处女的血,和俄罗斯的黑客PWN你 的webapp