继我的previous question我一直试图解析HTML文件中的href字符串,以便将该字符串发送到我以前的问题的解决方案。计数并解析HTML文件中的所有href链接
这是我有什么,但它不工作...
void ParseUrls(char* Buffer)
{
char *begin = Buffer;
char *end = NULL;
int total = 0;
while(strstr(begin, "href=\"") != NULL)
{
end = strstr(begin, "</a>");
if(end != NULL)
{
char *url = (char*) malloc (1000 * sizeof(char));
strncpy(url, begin, 100);
printf("URL = %s\n", url);
if(url) free(url);
}
total++;
begin++;
}
printf("Total URLs = %d\n", total);
return;
}
基本上我需要提取到一个字符串中的href的信息,是这样的:
<a href="http://www.w3schools.com">Visit W3Schools</a>
任何帮助表示赞赏。
“它不起作用”对您的程序不是很有帮助的描述。它通过编译器吗?它是否提供任何输出? – 2010-12-02 20:35:18
不,它简单地得到它在'缓冲区'找到的任何随机字符串,而不是'' – Jessica 2010-12-02 20:39:56