2013-01-23 78 views
1

我想过滤来自webcomic RSS提要的描述,并使用Yahoo Pipes提取具有特定链接文本的所有链接。例如,对于文本“这一章从这里开始”,并包含描述如下:使用Yahoo Pipes从RSS提要中提取超链接

<a href="http://example.com/1234.html">This chapter began here</a>. 
<a href="http://cuteoverload.com/">Here are some great kitten pictures</a> 

我希望可以将输出为

http://example.com/1234.html 

我最好的猜测是,这将涉及到一个正则表达式,但经过45分钟的研究后,我不确定从哪里开始。我没有看到如何使用正则表达式来提取文本,而不是仅仅替换它。

回答

1

一个正则表达式应该做的伎俩。

A)中的 “替换” 参数

削减在3份

(.*<a href=") 
(http://example\.com/[^"]*) 
(.*) 

B)的 “与” 参数的描述来替换与整个描述第二部分

$2