2012-08-27 137 views
0

我有一个项目搜索1400 +传统的asp网站搜索我们传递用户名和密码的所有地方。在这样做的时候,我需要检索所有的包含,因为这个逻辑大部分都是包含在内的。我已经构建了一个代码爬虫,但我很难用一个简单的正则表达式来返回给定文件中的所有包含。正则表达式检索包括从经典的ASP

的模式是这样的:

<!--#include file="includes/headers.inc"--> 

可能有人请帮助我。我需要的东西,将匹配这种模式,并返回之间的一切

任何帮助将不胜感激。

+1

什么是什么? – sQVe

+0

对不起。格式化由于某种原因删除了“<! - #include”和“ - >”。 – RockyMountainHigh

回答

2
var includes = new List<string>(); 
var regex = new Regex("#include\\W+file=\"([^\"]+)\""); 
var matchResult = regex.Match(fileContent); 
while (matchResult.Success) { 
    includes.Add(matchResult.Groups[1].Value); 
    matchResult = matchResult.NextMatch(); 
} 
+0

正是我需要的。谢谢! – RockyMountainHigh