tcp
本文最后更新于308 天前,其中的信息可能已经过时,如有错误请发送邮件到3063503032@qq.com

三次握手四次挥手:

三次握手建立连接:

  • 第一次握手: 建立连接时,客户端 发送 SYN包 到 服务器,并且,客户端 进入 SYN_SEND 状态,等待 服务器 确认;
  • 第二次握手: 服务器 收到 SYN包 后,同时,发送一个 SYN+ACK包 给 客户端 ,此时,服务器进入SYN_RECV 状态;
  • 第三次握手: 客户端 收到服务器的 SYN+ACK包 后,向 服务器 发送确认的 ACK包 。此包发送完毕,客户端服务器 进入ESTABLISHED 状态,完成三次握手。

四次挥手,断开连接:

  • 第1次挥手:主动关闭方被动关闭方 发送一个 FIN包 。也就是主动关闭方 告诉 被动关闭方 :我已经不会再给你发数据了。
  • 第2次挥手:被动关闭方 收到 FIN包 后,发送一个 ACK包 给 主动关闭方 。 就告诉 主动关闭方 已收到通知 。

(在 被动关闭方 发送 FIN包 之前,被动关闭方 还是可以向 主动关闭方 发送数据的。)

  • 第3次挥手:被动关闭方 又发送一个 FIN包,给 主动关闭方,用来关闭 被动关闭方主动关闭方 的数据传送。 也就是告诉主动关闭方,我的数据也发送完了,不会再给你发数据了。
  • 第4次挥手:主动关闭方 收到 FIN包后,发送一个 ACK包 给 被动关闭方 ,至此,完成四次挥手。

重要字段:

标志位含义说明
SYN发起建立连接当SYN=1,ACK=0,表明是连接请求报文,若同意连接,则响应报文中应该有 SYN=1,ACK=1。
ACK确认标识当ACK=1,确认标识才有效。 (为了与 确认号ack 区分开,我们一定要用大写字母)
FIN断开连接当FIN=1,表明此报文的发送方的数据已经发送完毕,并且要求断开连接。
PSH读取数据当PSH=1,提示接收端应用程序立即从TCP缓存区把数据读走。
RST重置连接当RST=1,表时TCP连接出现严重差错,必须释放连接,在后再重新连接。
URG紧急指针当URG=1,表明紧急指针字段有效,告诉系统此报文段中有紧急数据。

三次握手的报文变化

请添加图片描述
名称数据发送方向SYN (建立连接)seq (自己的数据)ACK (收到了请求)ack (接收到的对方的数据)
第1次握手客户端—> 服务端1x
第2次握手服务端—> 客户端1y1x+1
第3次握手客户端—> 服务端x+11y+1

通俗理解图,如下。 请添加图片描述

四次挥手的报文变化

请添加图片描述
名称数据发送方向FIN (断开连接)seq (自己的数据)ACK (收到了请求)ack (接收到的对方的数据) ack=seq+1
第1次挥手主动方 —> 被动方1u
第2次挥手被动方 —> 主动方v1u+1
被动方 —> 主动方 存在数据传输
第3次挥手被动方 —> 主动方1w1u+1
第4次挥手主动方 —> 被动方u+11w+1

面试题

1.为什么建立连接协议是三次握手,而关闭连接却是四次握手呢?

建立连接时,ACK和SYN可以放在一个报文里来发送。

而关闭连接时,被动关闭方可能数据没有接收完毕,再发送 FIN报文 表示同意现在可以关闭连接了,

所以它这里的 ACK报文 和 FIN报文 多数情况下都是分开发送的。

2.为什么必须是三次握手,不能用两次握手进行连接?

记住服务器的资源宝贵不能浪费 !

TCP 建立连接时,通过 三次握手 能防止历史连接的建立,能减少双方不必要的资源开销,能帮助双方同步初始化序列号。序列号能够保证数据包不重复、不丢弃和按序传输。

不使用「两次握手」和「四次握手」的原因:

「两次握手」:无法防止历史连接的建立,会造成双方资源的浪费,也无法可靠的同步双方序列号; 「四次握手」:三次握手就已经理论上最少可靠连接建立,所以不需要使用更多的通信次数。

3.三次握手、四次挥手的目的

三次握手 是为了保证双方都准备好了资源。

四次挥手 是为了保证双方把资源都释放掉了。

4.为什么四次挥手,不能把第二次挥手 和 第三次挥手合并在一起变成三次挥手?

第二次挥手的目的是 被动关闭方 告诉 主动关闭方 ,我被动关闭方 已经收到你的发送包。 第三次挥手的目标是 被动关闭方 通知 主动关闭方,我被动关闭方 的数据也发送完了,不会再给你发数据了 。

因为,第二次的挥手 是 对第一次挥手响应,第三次是 被动关闭方 通知 主动关闭方 ,我已经没有消息发送了, 但是在第二次挥手和第三次挥手中间,被动关闭方 还是可以向 主动关闭方 发送数据的,所以第二次和第三次无法合并。

5.第三次挥手什么时候发?

被动关闭方 调用了close之后才能发。

6.在服务器收到第4次挥手的数据包之前,服务器会释放资源吗?

不会,即便服务器调用了close(),仍然会保留资源,保留到客户端发来第4次挥手的数据包到了为止。 什么时候收到,什么时候才释放资源。

7.为什么客户端先调close(),而服务器不能先调?

1、因为先调close()的一方最终要等2分钟之后才能释放资源,这段期间是不允许用bind的方式重新绑定端口的,就会出现端口被占用的情况。

2、而客户端的端口是操作系统随机分配的,被占用之后会再分配一个 ,

3、若服务端先调,则需要设定套接字选项,配置重复利用端口资源才可以。

8.四次挥手,为什么TIME_WAIT状态还需要等2MSL后才能返回到CLOSED状态?

两个存在的理由:

1、无法保证最后发送的ACK报文会一定被对方收到,所以需要重发可能丢失的ACK报文。

2、关闭链接一段时间后可能会在相同的IP地址和端口建立新的连接,为了防止旧连接的重复分组在新连接已经终止后再现。2MSL足以让分组最多存活msl秒 被丢弃。

9.TCP 短连接和长连接的区别**

短连接:Client 向 Server 发送消息,Server 回应 Client,然后一次读写就完成了,这时候双方任何一个都可以发起 close 操作,不过一般都是 Client 先发起 close 操作。短连接一般只会在 Client/Server 间传递一次读写操作。

短连接的优点:管理起来比较简单,建立存在的连接都是有用的连接,不需要额外的控制手段。

长连接:Client 与 Server 完成一次读写之后,它们之间的连接并不会主动关闭,后续的读写操作会继续使用这个连接。

在长连接的应用场景下,Client 端一般不会主动关闭它们之间的连接,Client 与 Server 之间的连接如果一直不关闭的话,随着客户端连接越来越多,Server 压力也越来越大,这时候 Server 端需要采取一些策略,如关闭一些长时间没有读写事件发生的连接,这样可以避免一些恶意连接导致 Server 端服务受损;如果条件再允许可以以客户端为颗粒度,限制每个客户端的最大长连接数,从而避免某个客户端连累后端的服务。

长连接和短连接的产生在于 Client 和 Server 采取的关闭策略,具体的应用场景采用具体的策略。

10.TCP粘包、拆包及解决办法**

为什么常说 TCP 有粘包和拆包的问题而不说 UDP ?

由前两节可知,UDP 是基于报文发送的,UDP首部采用了 16bit 来指示 UDP 数据报文的长度,因此在应用层能很好的将不同的数据报文区分开,从而避免粘包和拆包的问题。

而 TCP 是基于字节流的,虽然应用层和 TCP 传输层之间的数据交互是大小不等的数据块,但是 TCP 并没有把这些数据块区分边界,仅仅是一连串没有结构的字节流;另外从 TCP 的帧结构也可以看出,在 TCP 的首部没有表示数据长度的字段,基于上面两点,在使用 TCP 传输数据时,才有粘包或者拆包现象发生的可能。

什么是粘包、拆包?

假设 Client 向 Server 连续发送了两个数据包,用 packet1 和 packet2 来表示,那么服务端收到的数据可以分为三种情况,现列举如下:

第一种情况,接收端正常收到两个数据包,即没有发生拆包和粘包的现象。

img

第二种情况,接收端只收到一个数据包,但是这一个数据包中包含了发送端发送的两个数据包的信息,这种现象即为粘包。这种情况由于接收端不知道这两个数据包的界限,所以对于接收端来说很难处理。

img

第三种情况,这种情况有两种表现形式,如下图。接收端收到了两个数据包,但是这两个数据包要么是不完整的,要么就是多出来一块,这种情况即发生了拆包和粘包。这两种情况如果不加特殊处理,对于接收端同样是不好处理的。

img
img

为什么会发生 TCP 粘包、拆包?

  • 要发送的数据大于 TCP 发送缓冲区剩余空间大小,将会发生拆包。
  • 待发送数据大于 MSS(最大报文长度),TCP 在传输前将进行拆包。
  • 要发送的数据小于 TCP 发送缓冲区的大小,TCP 将多次写入缓冲区的数据一次发送出去,将会发生粘包。
  • 接收数据端的应用层没有及时读取接收缓冲区中的数据,将发生粘包。

粘包、拆包解决办法

由于 TCP 本身是面向字节流的,无法理解上层的业务数据,所以在底层是无法保证数据包不被拆分和重组的,这个问题只能通过上层的应用协议栈设计来解决,根据业界的主流协议的解决方案,归纳如下:

  • 消息定长:发送端将每个数据包封装为固定长度(不够的可以通过补 0 填充),这样接收端每次接收缓冲区中读取固定长度的数据就自然而然的把每个数据包拆分开来。
  • 设置消息边界:服务端从网络流中按消息边界分离出消息内容。在包尾增加回车换行符进行分割,例如 FTP 协议。
  • 将消息分为消息头和消息体:消息头中包含表示消息总长度(或者消息体长度)的字段。
  • 更复杂的应用层协议比如 Netty 中实现的一些协议都对粘包、拆包做了很好的处理。

11.TCP 可靠传输

TCP 使用超时重传来实现可靠传输:如果一个已经发送的报文段在超时时间内没有收到确认,那么就重传这个报文段。

一个报文段从发送再到接收到确认所经过的时间称为往返时间 RTT,加权平均往返时间 RTTs 计算如下:

img

其中,0 ≤ a < 1,RTTs 随着 a 的增加更容易受到 RTT 的影响。超时时间 RTO 应该略大于 RTTs,TCP 使用的超时时间计算如下:

img

其中 RTTd 为偏差的加权平均值。

12.TCP 滑动窗口

窗口是缓存的一部分,用来暂时存放字节流。发送方和接收方各有一个窗口,接收方通过 TCP 报文段中的窗口字段告诉发送方自己的窗口大小,发送方根据这个值和其它信息设置自己的窗口大小。

发送窗口内的字节都允许被发送,接收窗口内的字节都允许被接收。如果发送窗口左部的字节已经发送并且收到了确认,那么就将发送窗口向右滑动一定距离,直到左部第一个字节不是已发送并且已确认的状态;接收窗口的滑动类似,接收窗口左部字节已经发送确认并交付主机,就向右滑动接收窗口。

接收窗口只会对窗口内最后一个按序到达的字节进行确认,例如接收窗口已经收到的字节为 {31, 34, 35},其中 {31} 按序到达,而 {34, 35} 就不是,因此只对字节 31 进行确认。发送方得到一个字节的确认之后,就知道这个字节之前的所有字节都已经被接收。

img

13.TCP 流量控制

流量控制是为了控制发送方发送速率,保证接收方来得及接收。

接收方发送的确认报文中的窗口字段可以用来控制发送方窗口大小,从而影响发送方的发送速率。将窗口字段设置为 0,则发送方不能发送数据。

实际上,为了避免此问题的产生,发送端主机会时不时的发送一个叫做窗口探测的数据段,此数据段仅包含一个字节来获取最新的窗口大小信息。

14.TCP 拥塞控制

如果网络出现拥塞,分组将会丢失,此时发送方会继续重传,从而导致网络拥塞程度更高。因此当出现拥塞时,应当控制发送方的速率。这一点和流量控制很像,但是出发点不同。流量控制是为了让接收方能来得及接收,而拥塞控制是为了降低整个网络的拥塞程度。

img

TCP 主要通过四个算法来进行拥塞控制:

慢开始、拥塞避免、快重传、快恢复。

发送方需要维护一个叫做拥塞窗口(cwnd)的状态变量,注意拥塞窗口与发送方窗口的区别:拥塞窗口只是一个状态变量,实际决定发送方能发送多少数据的是发送方窗口。

为了便于讨论,做如下假设:

  • 接收方有足够大的接收缓存,因此不会发生流量控制;
  • 虽然 TCP 的窗口基于字节,但是这里设窗口的大小单位为报文段。
img

慢开始与拥塞避免

发送的最初执行慢开始,令 cwnd = 1,发送方只能发送 1 个报文段;当收到确认后,将 cwnd 加倍,因此之后发送方能够发送的报文段数量为:2、4、8 …

注意到慢开始每个轮次都将 cwnd 加倍,这样会让 cwnd 增长速度非常快,从而使得发送方发送的速度增长速度过快,网络拥塞的可能性也就更高。设置一个慢开始门限 ssthresh,当 cwnd >= ssthresh 时,进入拥塞避免,每个轮次只将 cwnd 加 1。

如果出现了超时,则令 ssthresh = cwnd / 2,然后重新执行慢开始。

快重传与快恢复

在接收方,要求每次接收到报文段都应该对最后一个已收到的有序报文段进行确认。例如已经接收到 M1 和 M2,此时收到 M4,应当发送对 M2 的确认。

在发送方,如果收到三个重复确认,那么可以知道下一个报文段丢失,此时执行快重传,立即重传下一个报文段。例如收到三个 M2,则 M3 丢失,立即重传 M3。

在这种情况下,只是丢失个别报文段,而不是网络拥塞。因此执行快恢复,令 ssthresh = cwnd / 2 ,cwnd = ssthresh,注意到此时直接进入拥塞避免。

慢开始和快恢复的快慢指的是 cwnd 的设定值,而不是 cwnd 的增长速率。慢开始 cwnd 设定为 1,而快恢复 cwnd 设定为 ssthresh。

img

15.提供网络利用率

1、Nagle 算法

发送端即使还有应该发送的数据,但如果这部分数据很少的话,则进行延迟发送的一种处理机制。具体来说,就是仅在下列任意一种条件下才能发送数据。如果两个条件都不满足,那么暂时等待一段时间以后再进行数据发送。

  • 已发送的数据都已经收到确认应答。
  • 可以发送最大段长度的数据时。

2、延迟确认应答

接收方收到数据之后可以并不立即返回确认应答,而是延迟一段时间的机制。

  • 在没有收到 2*最大段长度的数据为止不做确认应答。
  • 其他情况下,最大延迟 0.5秒 发送确认应答。
  • TCP 文件传输中,大多数是每两个数据段返回一次确认应答。

3、捎带应答

在一个 TCP 包中既发送数据又发送确认应答的一种机制,由此,网络利用率会提高,计算机的负荷也会减轻,但是这种应答必须等到应用处理完数据并将作为回执的数据返回为止。

udp

udp 是一个面向无连接的,不安全的,报式传输层协议,udp 的通信过程默认也是阻塞的。

  • UDP通信不需要建立连接 ,因此不需要进行 connect () 操作
  • UDP通信过程中,每次都需要指定数据接收端的IP和端口,和发快递差不多
  • UDP不对收到的数据进行排序,在UDP报文的首部中并没有关于数据顺序的信息
  • UDP对接收到的数据报不回复确认信息,发送端不知道数据是否被正确接收,也不会重发数据。
  • 如果发生了数据丢失,不存在丢一半的情况,如果丢当前这个数据包就全部丢失了

1. 通信流程

使用 UDP 进行通信,服务器和客户端的处理步骤比 TCP 要简单很多,并且两端是对等的 (通信的处理流程几乎是一样的),也就是说并没有严格意义上的客户端和服务器端。UDP 的通信流程如下:

tcp和udp的特点和区别

udp特点:

1、无连接的传输层协议; 2、可靠性差,速度快(尽最大努力交付,不保证可靠交付) 3、面向报文,对应用层交下来的报文,不拆分,不合并,保留报文边界; 4、支持一对一,一对多,多对多通信; 5、没有拥塞控制,即使出现拥塞也不会降低发送速率; 6、首部开销小,只有8字节

区别:

1、TCP面向连接,UDP无连接; 2、TCP面向字节流,UDP面向报文; 3、TCP是可靠传输,UDP传输不可靠; 4、UDP传输速度比TCP更快; 5、TCP不保留报文边界,UDP保留报文边界; 6、TCP首部大,有20字节,UDP首部只有8字节; 7、TCP有流量控制和拥塞控制,UDP没有; 8、TCP是重量级协议,UDP是轻量级协议; 发视频都是udp,聊天都是tcp

暂无评论

发送评论 编辑评论


				
|´・ω・)ノ
ヾ(≧∇≦*)ゝ
(☆ω☆)
(╯‵□′)╯︵┴─┴
 ̄﹃ ̄
(/ω\)
∠( ᐛ 」∠)_
(๑•̀ㅁ•́ฅ)
→_→
୧(๑•̀⌄•́๑)૭
٩(ˊᗜˋ*)و
(ノ°ο°)ノ
(´இ皿இ`)
⌇●﹏●⌇
(ฅ´ω`ฅ)
(╯°A°)╯︵○○○
φ( ̄∇ ̄o)
ヾ(´・ ・`。)ノ"
( ง ᵒ̌皿ᵒ̌)ง⁼³₌₃
(ó﹏ò。)
Σ(っ °Д °;)っ
( ,,´・ω・)ノ"(´っω・`。)
╮(╯▽╰)╭
o(*////▽////*)q
>﹏<
( ๑´•ω•) "(ㆆᴗㆆ)
😂
😀
😅
😊
🙂
🙃
😌
😍
😘
😜
😝
😏
😒
🙄
😳
😡
😔
😫
😱
😭
💩
👻
🙌
🖕
👍
👫
👬
👭
🌚
🌝
🙈
💊
😶
🙏
🍦
🍉
😣
Source: github.com/k4yt3x/flowerhd
颜文字
Emoji
小恐龙
花!
上一篇
下一篇