TCP 连接的建立与释放总结
一. TCP的连接建立
下图画出了TCP的建立连接的过程。假定主机A运行的是TCP客户程序,而B运行的是TCP服务器程序。最初两端的TCP进程都处于CLOSED状态。请注意,A主动打开连接,而B被动打开连接。
1.1 建立连接过程
- B的TCP服务器进程先创建传输控制块TCP(存储了每一个连接中的一些重要信息,比如TCP连接表,到发送和接受缓存的指针,到重传队列的指针,当前的发送和接收序号等等),准备接收客户进程的连接。然后服务器进程就进入LISTEN状态,等待客户的连接请求。
- A的TCP客户进程也是首先创建传输控制块TCB,然后想B发出连接请求报文段,这是首部中的同步为SYN=1,同时选择一个初始序号seq=x。TCP规定,SYN报文段(即SYN=1的报文段)不能携带数据,但是要消耗一个序号。这是TCP客户端进入了SYN-SENT状态。
- B收到连接请求后,如同意建立连接,则向A发送确认。在确认报文中应把SYN为和ACK位都置为1,确认号是ack=x+1,同时也为自己选择一个初始序号seq=y。请注意,这个报文段也不能携带数据,但同样也要消耗一个序号。这时TCP服务器进程进入SYN-RCVD状态。
- A收到B的确认后,还要向B给出确认。确认报文段的ACK置1,确认号ack=y+1,而自己的序号seq=x+1,TCP的标准规定,ACK报文段可以携带数据。但如果不携带数据则不消耗序号,即seq=x,下一个数据报文段的序号seq=x+1。这时TCP连接已经建立,A进入ESTABLISHED状态。
- 当B收到A的确认后,也就进入ESTABLISHED状态。
1.2 A最后一次确认
为什么 A 还要发送一次确认?这主要是防止已失效的连接请求报文段突然又传到了B,因而产生错误。
- 考虑一种正常情况。A发出连接请求,但因连接请求报文段丢失而未收到确认,于是A再重传一次连接请求,然后建立了连接。数据传输完毕后就释放了连接。A共发送了两个请求连接报文段,其中第一个丢失,第二个到达了B。
- 现在假定出现一种异常情况,即A发出的第一个连接请求报文段并没有丢失,而是在某些网络节点长时间滞留了,以致延误到连接释放以后的某个时间才到达B,本来这是一个早已失效的报文段,但是B收到此失效的连接请求报文段以后,就误认为是A又发出一次新的连接请求。于是就向A发出了确认报文段,同意建立连接。假定不采用三次握手,那么只要B发出确认,新的连接就建立了。由于现在A并没有建立连接的请求,因此并不会理财B的确认,也不会向B发送数据。但是B却以为新的运输连接已经建立了,并一直等待A发来数据。B的许多资源就这样白白浪费了。
- 采用了三次握手的办法可以防止上述现象的发生。例如在刚才的情况下,A不会向B的确认发出确认,B由于收不到确认,就知道A并没有要求建立连接。
二. TCP的连接释放
2.1 连接释放步骤
数据传输完毕以后,通信双方都需要释放连接。现在A和B都处于ESTABLISHED状态,下面是TCP连接释放的详细流程。
- A的应用进程先向其TCP发出连接释放报文段,并停止发送数据。主动关闭TCP连接,A把连接释放报文段的终止控制位FIN置1,其序号seq=u,它等于前面已传送过的数据的最后一个字节的序号加1,这时A进入FIN-WAIT-1(终止等待1)状态,等待B的确认,请注意,TCP规定,FIN报文段即使不携带数据也要消耗掉一个序号。
- B收到连接释放报文段后即发出确认,确认号ack=u+1,而这个报文段自己的序号是v,等于B前面已传送过的数据的最后一个字节序号加1,然后B就进入CLOSE-WAIT(等待关闭)状态。TCP服务器的进程这时应通知高层应用进程,因而从A到B这个方向的连接就释放了,这时的TCP连接处于瓣关闭(self-close)状态。即A已经没有数据要发送了,但是B若要发送数据,A任要接受。也就是说从B到A的方向的连接并未关闭,这个状态可能会持续一段时间。A收到来自B的确认后,A就进入了FIN-WAIT-2状态,等待B发出连接释放报文段
- 若B已经没有要向A发送的数据,其应用进程就通知TCP释放连接,这时B发出的连接释放报文段必须是FIN=1,。现在假定B的序号为w(在半关闭状态可能会发送一些数据)。B还必须重复上次已经发送过的确认好ack=u+1。这时B就进入了LAST-ACK状态,等待A的确认。
- A在收到B的连接释放报文段以后,必须对此发出确认。在报文段中把ACK置为1,却热号ack=w+1,而自己的序号seq=u+1(根据TCP标准规定,前面发送过的FIN报文段要消耗一个需要)。然后进入TIME-WAIT(时间等待)状态,请注意TCP连接还没有释放掉。必须要等待2MSL后,A才进入到CLOSED状态。
- B只要收到了A发出的确认,就进入了CLOSED状态。
2.2 MSL与保活计时器
MSL
- 时间MSL叫做最长报文段寿命(Maximum Segment Lifetime),RFC793建议设置为2分钟,但是以现在的网络速度来说,可能有点太长了,因此允许这个值根据具体情况来修改为合适的值。
- TIME-WAIT 要等待2MSL的原因1:为了保证A发送的最后一个ACK报文段能到达B。这个ACK报文段有可能会丢失,因而使处在LAST-ACK状态的B收不到对已发送的FIN+ACK报文段的确认。B会超时重传这个FIN+ACK报文段,而A就能在2MSL时间内收到这个重传的FIN+ACK报文段。接着A重传一次确认,重新启动2MSL计时器,最后A和B都能正常进入到CLOSED状态,反之不等的2MSL时间,B对自己发送的FIN+ACK收不到ACK时就不断的方法重传,B就无法正常进入CLOSED状态。
- TIME-WAIT 要等待2MSL的原因2:防止在三次握手中客户端“已失效的连接请求报文段”出现在本连接中。A在发送完最后一个ACK以后再经过2MSL时间,就可以使本连接持续的时间内所产生的所有报文段都从网络中消失。这样就可以使下一个新的连接中不会出现这种旧的连接请求报文段。
保活计时器(keepalive timer)
假定有这样一种情况:客户端已经与服务器建立了TCP连接。但后来客户端的主机突然出现故障。显然服务器以后就不能收到客户端发来的数据了,因此,应当有措施使服务器不要在白白等下去。这就是保活计时器。服务器每次收到一次客户的数据,就重新设置保活计时器,时间的设置通常是两小时。若两小时没有收到客户的数据,服务器就发送一个探测报文段,以后每个75分钟发送一次。若发送10个探测报文段后任无客户端的响应,服务器就认为客户端出了故障,服务器就断开此链接。