2010-12-10 50 views
0

我正在使用正则表达式模式,我需要检查该字符串的开头是否为HTML简单文本并返回该字符串。因此,例如:Java中的正则表达式模式

Hello World!<TAG> &nsbp; 

应返回:

Hello World!

+0

如果您解析HTML,则应使用HTML解析器。 – 2010-12-10 23:58:33

+0

http://stackoverflow.com/questions/701166/can-you-provide-some-examples-of-why-it-is-hard-to-parse-xml-and-html-with-a-rege – 2010-12-11 01:33:38

+0

“拆分“需要一个正则表达式作为第一个参数 – thejh 2010-12-11 10:41:18

回答

3

请记住,如果您正在解析大段文本或整个文件,则应该强制字符串进入新的引用,否则可能会由于子字符串而导致内存泄漏。

new String("Hello World!<TAG> &nsbp;".split("<")[0]) 
+0

THANKs为响应,但我需要使用正则表达式 – 2010-12-11 01:19:24

+0

如果您检查String.split的API,技术上它是一个正则表达式:) – 2010-12-11 12:15:38

0
"Hello World!<TAG> &nsbp;".split("<")[0] 

应该返回Hello World!