1. 背鍋俠 TCP
在前面介紹套接字通信的時候說到了 TCP 是傳輸層協(xié)議,它是一個面向連接的、安全的、流式傳輸協(xié)議。因為數據的傳輸是基于流的所以發(fā)送端和接收端每次處理的數據的量,處理數據的頻率可以不是對等的,可以按照自身需求來進行決策。TCP 協(xié)議是優(yōu)勢非常明顯,但是有時也會給我們造成困擾,正所謂:成也蕭何敗蕭何。假設我們有如下需求:
客戶端和服務器之間要進行基于 TCP 的套接字通信- 通信過程中客戶端會每次會不定期給服務器發(fā)送一個不定長度的有特定含義的字符串。
- 通信的服務器端每次都需要接收到客戶端這個不定長度的字符串,并對其進行解析。
根據上面的描述,服務器在接收數據的時候有如下幾種情況:
- 一次接收到了客戶端發(fā)送過來的一個完整的數據包
- 一次接收到了客戶端發(fā)送過來的 N 個數據包,由于每個包的長度不定,無法將各個數據包拆開
- 一次接收到了一個或者 N 個數據包 下一個數據包的一部分,還是很悲劇,無法將數據包拆開
- 一次收到了半個數據包,下一次接收數據的時候收到了剩下的一部分 下個數據包的一部分,更悲劇,頭大了
- 另外,還有一些不可抗拒的因素:比如客戶端和服務器端的網速不一樣,發(fā)送和接收的數據量也會不一致
對于以上描述的現象很多時候我們將其稱之為 TCP的粘包問題,但是這種叫法不太對的,本身 TCP 就是面向連接的流式傳輸協(xié)議,特性如此,我們卻說是 TCP 這個協(xié)議出了問題,這只能說是使用者的無知。多個數據包粘連到一起無法拆分是我們的需求過于復雜造成的,是程序猿的問題而不是協(xié)議的問題,TCP 協(xié)議表示這鍋它不想背。現在問題來了,服務器端如果想保證每次都能接收到客戶端發(fā)送過來的這個不定長度的數據包,程序猿應該如何解決這個問題呢?下面給大家提供幾種解決方案:
- 使用標準的應用層協(xié)議(比如:http、https)來封裝要傳輸的不定長的數據包
- 在每條數據的尾部添加特殊字符,如果遇到特殊字符,代表當條數據接收完畢了
- 有缺陷:效率低,需要一個字節(jié)一個字節(jié)接收,接收一個字節(jié)判斷一次,判斷是不是那個特殊字符串
- 在發(fā)送數據塊之前,在數據塊最前邊添加一個固定大小的數據頭,這時候數據由兩部分組成:數據頭 數據塊
- 數據頭:存儲當前數據包的總字節(jié)數,接收端先接收數據頭,然后在根據數據頭接收對應大小的字節(jié)
- 數據塊:當前數據包的內容
2. 解決方案
如果使用
TCP 進行套接字通信,如果發(fā)送的數據包粘連到一起導致接收端無法解析,我們通常使用添加包頭的方式輕松地解決掉這個問題。關于數據包的包頭大小可以根據自己的實際需求進行設定,這里沒有啥特殊需求,因此規(guī)定包頭的固定大小為4個字節(jié),用于存儲當前數據塊的總字節(jié)數。
2.1 發(fā)送端
對于發(fā)送端來說,數據的發(fā)送分為 4 步:
- 根據待發(fā)送的數據長度 N 動態(tài)申請一塊固定大小的內存:N 4(4 是包頭占用的字節(jié)數)
- 將待發(fā)送數據的總長度寫入申請的內存的前四個字節(jié)中,此處需要將其轉換為網絡字節(jié)序(大端)
- 將待發(fā)送的數據拷貝到包頭后邊的地址空間中,將完整的數據包發(fā)送出去(字符串沒有字節(jié)序問題)
- 釋放申請的堆內存。
由于發(fā)送端每次都需要將這個數據包完整的發(fā)送出去,因此可以設計一個發(fā)送函數,如果當前數據包中的數據沒有發(fā)送完就讓它一直發(fā)送,處理代碼如下:
/*
函數描述:?發(fā)送指定的字節(jié)數
函數參數:
????-?fd:?通信的文件描述符(套接字)
????-?msg:?待發(fā)送的原始數據
????-?size:?待發(fā)送的原始數據的總字節(jié)數
函數返回值:?函數調用成功返回發(fā)送的字節(jié)數,?發(fā)送失敗返回-1
*/
int?writen(int?fd,?const?char*?msg,?int?size)
{
????const?char*?buf?=?msg;
????int?count?=?size;
????while?(count?>?0)
????{
????????int?len?=?send(fd,?buf,?count,?0);
????????if?(len?==?-1)
????????{
????????????close(fd);
????????????return?-1;
????????}
????????else?if?(len?==?0)
????????{
????????????continue;
????????}
????????buf? =?len;
????????count?-=?len;
????}
????return?size;
}
有了這個功能函數之后就可以發(fā)送帶有包頭的數據塊了,具體處理動作如下:
/*
函數描述:?發(fā)送帶有數據頭的數據包
函數參數:
????-?cfd:?通信的文件描述符(套接字)
????-?msg:?待發(fā)送的原始數據
????-?len:?待發(fā)送的原始數據的總字節(jié)數
函數返回值:?函數調用成功返回發(fā)送的字節(jié)數,?發(fā)送失敗返回-1
*/
int?sendMsg(int?cfd,?char*?msg,?int?len)
{
???if(msg?==?NULL?||?len?<=?0?||?cfd?<=0)
???{
???????return?-1;
???}
???//?申請內存空間:?數據長度? ?包頭4字節(jié)(存儲數據長度)
???char*?data?=?(char*)malloc(len 4);
???int?bigLen?=?htonl(len);
???memcpy(data,?