正则表达式匹配#hashtag而不是#hashtag; （用分号）

/(?<=[\s>]|^)#(\w*[A-Za-z_]+\w*)/g

这我测试对字符串：

Here's a #hashtag and here is #not_a_tag; which should be different. Also testing: Mid#hash. #123 #[email protected]£ and <p>#hash</p>

对于我而言，应该只有在这串检测到两个主题标记。我不知道如何改变的表达，使得它不匹配井号标签与在我的例子一个;这到底是#not_a_tag;

干杯。

2016-07-21 Wex

如何执行以下操作：

\B(\#[a-zA-Z]+\b)(?!;)

2016-07-21 14:31:18 tk78

您的意思是'\ B'？ '\ W'需要在'＃'之前出现一个实际的字符。 –

接受答案的最少步骤。 \ B可能是我将要使用的。 – Wex

@TimPietzcker你说得对。发布编辑。 – tk78

可以使用负前瞻reegex：

/(?<=[\s>]|^)#(\w*[A-Za-z_]+\w*)\b(?!;)/

2016-07-21 14:15:08 anubhava

对于性能'\ B＃（\ d * [A-Za-z _] + \ w *）\ b（？！;）'应该是您的正则表达式。 '＃[a-zA-Z] +'不会匹配'＃123hashtag' – anubhava

到anubhava的答案相似，但交换的\w* 2个实例与\d*为\w和[A-Za-z_]之间的唯一区别是0-9字符

是减少了步数从588到90

效果

(?<=[\s>])#(\d*[A-Za-z_]+\d*)\b(?!;)

2016-07-21 14:43:12 garyh

回答