C获取字符串中的字符串的一部分

我正在尝试编写解析HTTP GET请求并检查“主机”是否为www.bbc.co.uk的代码。C获取字符串中的字符串的一部分

这是我的工作代码：

char data[] = "GET /news/ HTTP/1.1\nHost: www.bbc.co.uk\nConnection: keep-alive"; 
    unsigned int size = strlen(data); 

    if (size>3 && data[0] == 'G' && data[1] == 'E' && data[2] == 'T'){ //If GET Request 
     int host_index = -1; 

     for (int i=4; i<size-4; i++){ 
      if (data[i] == 'H' && data[i+1] == 'o' && data[i+2] == 's' && data[i+3] == 't' 
        && data[i+4] == ':' && data[i+5] == ' '){ 
       host_index = i+6; 
      } 
     } 

     if (host_index != -1 && size > host_index+11 && 
       data[host_index] == 'w' && data[host_index+1] == 'w' && data[host_index+2] == 'w' && 
       data[host_index+3] == '.' && data[host_index+4] == 'b' && data[host_index+5] == 'b' && 
       data[host_index+6] == 'c' && data[host_index+7] == '.' && data[host_index+8] == 'c' && 
       data[host_index+9] == 'o' && data[host_index+10] == '.' && data[host_index+11] == 'u' && 
       data[host_index+12] == 'k') 
     { 
      printf("BBC WEBSITE!\n"); 
     } 

    }

我觉得这是不是很多很多的代码。我怎样才能使这个代码更紧凑？

[请随时给普通C.任何第三方库]

非常感谢！

来源

2014-12-04 Yahya Uddin

这取决于你想成为如何迂腐，这个细节完全是在帖子中丢失。需要多少字符串以预期的格式？如果你不在乎，只要做'if strstr（data，“www.bbc.co.uk”））printf（“BBC WEBSITE！\ n”）;' – chux 2014-12-04 21:02:32

你的代码可以更简洁的写成：

if (!strncmp(data, "GET ", 4) && strstr(data, "\nHost: www.bbc.co.uk\n")) 
     printf("BBC WEBSITE!\n");

不过，虽然这可能工作的99.9％的时间，它不冒号后处理任意空白。正则表达式会有所帮助，但这需要一个第三方库，这是您不可能拥有的。

一种解决方案是：

if (!strncmp(data, "GET ", 4)) { 
     const char *p = data; 
     char buf[99 + 1]; 
     buf[0] = 0; 
     while ((p = strchr(p, '\n')) && sscanf(++p, "Host: %99s", buf) != 1) 
      ; 
     if (!strcmp(buf, "www.bbc.co.uk")) 
      printf("BBC WEBSITE!\n"); 
    }

编辑：将上述溶液允许"Host:"后的任何数目的CR和/或LF类。我不清楚HTTP/1.1 LWS（线性空白空间）是否允许这样做。如果不是，并允许仅零个或多个空格和制表符，改变sscanf阅读：

(sscanf(++p, "Host:%*[ \t]%99[^ \t]", buf) == 1 || 
    sscanf(p, "Host:%99[^ \t]",  buf) == 1)

正如你可以看到，它开始变得混乱。

来源

2014-12-04 19:18:52

为什么不使用strstr（）？

拆分大串入使用的strstr（），然后块由单独的程序

来源

2014-12-04 19:09:26

char data[] = "GET /news/ HTTP/1.1\nHost: www.bbc.co.uk\nConnection: keep-alive"; 
unsigned int size = strlen(data); 
char buff[size]; 
sscanf(data, "%*[^:]:%s", buff); 
if(strcmp(buff, "www.bbc.co.uk")==0) 
    puts("BBC");

来源

2014-12-04 19:15:19 BLUEPIXY

也许'if（sscanf（data，“％* [^\ n]主持人：％s“，buff）== 1）'...'？ – chux 2014-12-04 19:40:38

@chux它由需要。 – BLUEPIXY 2014-12-04 19:59:25

你可以解释一下sscanf部分或注释就行 – 2014-12-04 20:45:34

只使用标准库函数解析更小的块，你可以这样做：

char data[] = 
    "GET /news/ HTTP/1.1\n" 
    "Host: www.bbc.co.uk\n" 
    "Connection: keep-alive"; 

char *found_host = strstr(data, "Host: "); 

if (found_host != NULL) { 
    found_host += sizeof("Host: ") - 1; 

    char *end_of_host = strpbrk(found_host, "\r\n"); 

    if (end_of_host != NULL) { 
     int equal = strncmp(found_host, "www.bbc.co.uk", end_of_host - found_host); 
    } 
}

注意这并不考虑冒号和值之间的任意数量的空白。

来源

2014-12-04 19:16:53

C获取字符串中的字符串的一部分

回答

相关问题