2011-03-16 63 views
2

我有一个服务器程序通过给定的套接字连接到另一个程序,在某些情况下,我需要关闭连接并几乎立即在同一个套接字上重新打开它。这大致可行,但我必须等待一分钟才能重置套接字。同时,netstat指出服务器在FIN_WAIT2中看到套接字,并且客户端将其视为CLOSE_WAIT。我已经在使用SO_REUSEADDR,我认为这样可以防止等待,但这并不是诀窍。将SO_LINGER设置为零也无济于事。我还能做些什么来解决这个问题?关闭套接字时防止FIN_WAIT2

下面是相关的代码片段:

SetUpSocket() 
{ 
    // Set up the socket and listen for a connection from the exelerate client. 
    // Open a TCP/IP socket. 
    m_baseSock = socket(PF_INET, SOCK_STREAM, IPPROTO_IP); 
    if (m_baseSock < 0) 
    { 
     return XERROR; 
    } 

    // Set the socket options to reuse local addresses. 
    int flag = 1; 
    if (setsockopt(m_baseSock, SOL_SOCKET, SO_REUSEADDR, &flag, sizeof(flag)) == -1) 
    { 
     return XERROR; 
    } 

    // Set the socket options to prevent lingering after closing the socket. 
    //~ linger li = {1,0}; 
    //~ if (setsockopt(m_baseSock, SOL_SOCKET, SO_LINGER, &li, sizeof(li)) == -1) 
    //~ { 
     //~ return XERROR; 
    //~ } 

    // Bind the socket to the address of the current host and our given port. 
    struct sockaddr_in addr; 
    memset(&addr, 0, sizeof(addr)); 
    addr.sin_family = AF_INET; 
    addr.sin_addr.s_addr = INADDR_ANY; 
    addr.sin_port = htons(m_port); 
    if (bind(m_baseSock, (struct sockaddr*)&addr, sizeof(addr)) != 0) 
    { 
     return XERROR; 
    } 

    // Tell the socket to listen for a connection from client. 
    if (listen(m_baseSock, 4) != 0) 
    { 
     return XERROR; 
    } 
    return XSUCCESS; 
} 

ConnectSocket() 
{ 
    // Add the socket to a file descriptor set. 
    fd_set readfds; 
    FD_ZERO(&readfds); 
    FD_SET(m_baseSock, &readfds); 

    // Set timeout to ten seconds. Plenty of time. 
    struct timeval timeout; 
    timeout.tv_sec = 10; 
    timeout.tv_usec = 0; 

    // Check to see if the socket is ready for reading. 
    int numReady = select(m_baseSock + 1, &readfds, NULL, NULL, &timeout); 
    if (numReady > 0) 
    { 
     int flags = fcntl(m_baseSock, F_GETFL, 0); 
     fcntl(m_baseSock, flags | O_NONBLOCK, 1); 

     // Wait for a connection attempt from the client. Do not block - we shouldn't 
     // need to since we just selected. 
     m_connectedSock = accept(m_baseSock, NULL, NULL); 
     if (m_connectedSock > 0) 
     { 
     m_failedSend = false; 
     m_logout = false; 

     // Spawn a thread to accept commands from client. 
     CreateThread(&m_controlThread, ControlThread, (void *)&m_connectedSock); 

     return XSUCCESS; 
     } 
    } 
    return XERROR; 
} 

ControlThread(void *arg) 
{ 
    // Get the socket from the argument. 
    socket sock = *((socket*)arg); 

    while (true) 
    { 
     // Add the socket to a file descriptor set. 
     fd_set readfds; 
     FD_ZERO(&readfds); 
     FD_SET(sock, &readfds); 

     // Set timeout to ten seconds. Plenty of time. 
     struct timeval timeout; 
     timeout.tv_sec = 10; 
     timeout.tv_usec = 0; 

     // Check if there is any readable data on the socket. 
     int num_ready = select(sock + 1, &readfds, NULL, NULL, &timeout); 
     if (num_ready < 0) 
     { 
     return NULL; 
     } 

     // If there is data, read it. 
     else if (num_ready > 0) 
     { 
     // Check the read buffer. 
     xuint8 buf[128]; 
     ssize_t size_read = recv(sock, buf, sizeof(buf)); 
     if (size_read > 0) 
     { 
      // Get the message out of the buffer. 
      char msg = *buf; 
      if (msg == CONNECTED) 
      { 
       // Do some things... 
      } 
      // If we get the log-out message, log out. 
      else if (msg == LOGOUT) 
      { 
       return NULL; 
      } 
     } 
     } 
    } // while 
    return NULL; 
} 

~Server() 
{ 
    // Close the sockets. 
    if (m_baseSock != SOCKET_ERROR) 
    { 
     close(m_baseSock); 
     m_baseSock = SOCKET_ERROR; 
    } 
    if (m_connectedSock != SOCKET_ERROR) 
    { 
     close(m_connectedSock); 
     m_connectedSock = SOCKET_ERROR; 
    } 
} 

SOCKET_ERROR等于-1。服务器对象被销毁,此时连接应该关闭,然后重新创建,此时会调用SetUpSocket()和ConnectSocket()例程。

那么,为什么我必须等待一分钟才能清除套接字呢?任何想法都会被理解。

编辑: 根据我的第一个海报的建议,我找到了一种方法让客户端从其结束关闭插座。不过,还是有些不对劲。现在,netstat从TIME_WAIT的服务器角度显示套接字,并且从客户端角度看没有条目。我所有的钱是:

TCP 0 0的localhost.localdomain:19876的localhost.localdomain:54598 TIME_WAIT

,并从周围的其他方式罢了。服务器和客户端仍然需要一分钟才能清除TIME_WAIT以重新连接。现在有什么不对 - 在客户端的套接字上使用close()是不正确的?

编辑2: 现在,如果我强制客户端重新连接,它将立即 - 但如果我只是让它做它自己的事情,它会等待TIME_WAIT清除的整整一分钟。我怀疑客户端代码中有些东西是狡猾的。我不能做太多的事情。

回答

10

服务器正在等待客户端发送FIN数据包。这应该通过关闭客户端的套接字来完成(或者关闭应用程序)。然后服务器应该进入TIME_WAIT状态,等待套接字超时。 SO_REUSEADDR使您可以绕过此状态。

enter image description here

在客户机上(来源http://upload.wikimedia.org/wikipedia/commons/0/08/TCP_state_diagram.jpg

+0

我同意你的意见,但我已经使用SO_REUSEADDR,它不工作。还有其他的东西还在造成问题。任何其他想法?我没有真正控制客户端,但它也应该适当关闭套接字。 (强调“应该是”,因为我不能真正知道这一点。) – patrickvacek 2011-03-16 16:30:17

+1

@patrickvacek:'CLOSE_WAIT'是一个非常强烈的指示,表示客户端没有关闭连接。如果你杀了客户并开始另一个,会发生什么? – LHMathies 2011-03-16 16:39:06

+0

@LMMathies:启动和停止客户端并不容易,需要一些时间(这是一个庞然大物的应用程序),但事实上,一旦它关闭,netstat就不会显示连接,并且一旦它重新启动服务器和客户端都能够连接。我能够将周转时间缩短到11秒,其中大部分只是等待客户关闭。 不知道如何进行,因为客户并不是我的领地。我将不得不进一步投资。 @ M'vy:这是一个很好的图表;谢谢! 任何人都知道如何最好地看到发送和接收FIN和ACKS? – patrickvacek 2011-03-16 17:51:13

2

CLOSE_WAIT意味着网络层正在等待应用程序来发送更多的数据或关闭套接字,因此它可以与启动关闭握手的其侧服务器。 TCP的工作方式是,一方不能强迫另一方“很好地关闭” - 两个方向独立工作,并且发送方拥有一切主动权 - 但服务器网络层可以超时并中止与一个RST的连接服务器程序已经关闭了那边的套接字(因为即使客户端发送了更多的数据,也没有人阅读它)。

我猜服务器网络层正在给客户端一分钟关闭,只是为了更好,或者客户端发送保持活动在那一刻,触发重置。

SO_LINGER不会影响这种情况,除非您在关闭连接时将数据未读取保留在客户端。