1
好吧,我有一个RSS源。每篇文章都包含多个HTML链接。他们都是同一个主机(例如youtube.com),并且有一个主机不同。 我想过滤这一个链接。使用RegEx过滤来自Feed的特定链接
因此,在这一刻,有我的最常见的主机规则(imgur,减,tumblr等)的列表,它看起来像这样:
(?i).*?href="(https?://[^"]*host1[^"]*).*
(?i).*?href="(https?://[^"]*host2[^"]*).*
(?i).*?href="(https?://[^"]*host3[^"]*).*
的问题是:有时总是与未知主机的链接。 所以我想要做的是将所有其他链接(都是相同的)“列入黑名单”。我读到(?!regex)
但它似乎不工作:
(?i).*?href="(https?://[^"]*(?!youtube)[^"]*).*
我希望你明白我的问题,我的(可能)的英语不好对不起!
你使用什么编程语言? –
我在Yahoo Pipes上使用Regex ... –