我有一个很长的HTML文件,其中包含组织及其URL的名称。代码中的每个组织的“部分”都由“组织”一词加上许多代码进行划分,其URL位于该代码内部,并以“组织”一词结尾。查找两个字符串内的URL正则表达式
例如:
组织 - 大量的代码(用URL位于某处内) - 组织
我曾尝试使用正则表达式搜索和提取URL,但无济于事。
organization(?<Protocol>\w+):\/\/(?<Domain>[\[email protected]][\w.:@]+)\/?[\w\.?=%&=\ @/$,]*organization
我怀疑我的问题在于我试图通过只使用单词“组织”划定为URL的搜索某个地方,但我不知道。
'organization。*?'... r如果你可以让'.'也匹配换行符,否则它可能是'organization(。| \ s)*?'等等。 – Wrikken
10你可以给我们看一个* actual *的例子?我们可以测试我们的解决方案吗? – ghoti