首先:对不起我的英文不好!阅读字符串像StreamReader
我知道标题是不是最好的英语,但我真的不知道如何格式化这个问题...
我试图做的是逐行读取的HTML源代码行,以便当看到一个给定的单词(如http://)它会复制整个句子,因此我可以删除剩下的只保留该URL。
这是我已经试过:
using (var source = new StreamReader(TempFile))
{
string line;
while ((line = source.ReadLine()) != null)
{
if (line.Contains("http://"))
{
Console.WriteLine(line);
}
}
}
这工作完全,如果我想从外部文件中读取,但是当我想读一个字符串或StringBuilder的,怎么办这是行不通的你逐行阅读这些内容?
我同意。另外请确保使用ScrapySharp以及HtmlAgilityPack。让你用熟悉的jQuery语法来选择元素。从字面上提高你的生产力。 http://www.romcyber.com/post/2012/01/27/ScrapySharp-in-english-%29.aspx – 2012-07-10 22:30:31
@SergioTapia酷;我没有听说过那个;将尝试 – 2012-07-10 22:32:57
但这是另一个依赖项......并不是说它一定是坏的,只是一个需要考虑的事情。 – vines 2012-07-10 22:35:32