在类Unix平台实现TCP客户端

我们这个TCP客户端将从命令行接收两个参数，一个是IP地址或域名，另一个是端口，并尝试连接在这个IP地址的TCP服务端。

WongKyunban

1198人浏览 · 2024-03-17 18:55:39

WongKyunban · 2024-03-17 18:55:39 发布

我们这个TCP客户端将从命令行接收两个参数，一个是IP地址或域名，另一个是端口，并尝试连接在这个IP地址的TCP服务端。

TCP端的创建流程：

判断命令行参数个数，够不够
利用getaddrinfo()函数和命令行传递的参数来配置远程地址
创建socket
连接socket
进入循环等待本地terminal或socket来的新数据
5.1 创建fd_set集合
5.2 调用select(), 阻塞在这里，直到有socket已准备好
5.3 在select()返回，检查远程socket是否有数据回来
5.4 在select()返回，检查terminal输入

判断命令的参数对不对

因为加上命令本身所以，main函数接收到参数个数是3个，小于3个，我们就认为不对。

	if(argc < 3) {
		fprintf(stderr,"usage: client hostname port\n");
		return 1;
	}

配置远程地址

我们用getaddrinfo()函数来完成远程地址的配置。

	struct addrinfo hints;
	memset(&hints,0,sizeof(hints));
	hints.ai_socktype = SOCK_STREAM;
	struct addrinfo *peer_address;
	if(getaddrinfo(argv[1],argv[2],&hints,&peer_address)){
		fprintf(stderr,"getaddrinfo() failed. (%d) \n",errno);
		return 1;
	}

getaddrinfo的函数原型：

int getaddrinfo(const char *restrict node,
                       const char *restrict service,
                       const struct addrinfo *restrict hints,
                       struct addrinfo **restrict res);

指定它的node和service参数就可以识别出一个远程主机和它的一个服务。我们传了ip地址或域名给node参数，这个可以定位到互联网上一台主机，对于service参数我们传了端口号，这个可以定位到这个台主机上的服务，addrinfo类型参数，我们构造了一个给它：

	struct addrinfo hints;
	memset(&hints,0,sizeof(hints));
	hints.ai_socktype = SOCK_STREAM;

构造这个参数时，我们用memset函数将其内存内容全部初始化为0，然后对它的ai_socktype指定为SOCK_STREAM，这表示我们要创建TCP连接。在这里我们并没有设置ai_family的值（AF_INET 或 AF_INET6），也就是说我们不指定使用IPv4或IPv6,我们让getaddrinfo()决定使用哪一个。getaddrinfo()配置完成后，会返回0，失败则会返回非0值。如果是成功的话，那么配置好的远程套接字回通过getaddrinfo()的最后一个参数res返回。在上述例子中，远程套接字的信息就保存在peer_address中。

打印配置好的远程套接字信息（可选）

	printf("Remote address is :\n");
	char address_buffer[100];
	char service_buffer[100];
	getnameinfo(peer_address->ai_addr,peer_address->ai_addrlen,address_buffer,sizeof(address_buffer),service_buffer,sizeof(service_buffer),NI_NUMERICHOST);
	printf("%s %s \n",address_buffer,service_buffer);

这里解释一下getnameinfo函数：

int getnameinfo(const struct sockaddr *restrict addr, socklen_t addrlen,
                       char host[_Nullable restrict .hostlen],
                       socklen_t hostlen,
                       char serv[_Nullable restrict .servlen],
                       socklen_t servlen,
                       int flags);

addr： socket的地址信息，从我们刚刚得到的peer_address->ai_addr来提供，
addrlen： socket地址的长度，peer_address->ai_addrlen
host：用于存放主机名称的字符数组
hostlen：主机名对应的长度
serv：用于存放端口的字符数组
servlen：端口对应的长度
flags：是用来指定getnameinfo的行为的，如指定为NI_NUMERICHOST就是返回数字形式的主机名称。如93.184.216.34

创建Socket

利用配置好的远程socket信息来创建socket。

	printf("Creating socket...\n");
	int socket_peer;
	socket_peer = socket(peer_address->ai_family,peer_address->ai_socktype,peer_address->ai_protocol);
	if(socket_peer < 0) {
		fprintf(stderr,"socket() failed. (%d)\n",errno);
		return 1;	
	}

socket()函数的原型：

int socket(int domain, int type, int protocol);

domain就是域，简单就是socket要用的协议簇，再简单点来说，就是要用IPv4还是IPv6，这个在前面配置socket信息时，已经准备好了，所以直接用peer_address->ai_family来赋值。
type：指定socket的类型，因为我们要的是TCP连接，那么这里的类型就是SOCK_STREAM，即在前面配置的类型信息，直接赋peer_address->ai_socktype，即可。
protocol：指定socket通信使用的协议，SOCK_STREAM使用的就是TCP。getaddrinfo里已经帮忙配置好了，直接使用peer_address->ai_protocol即可。

如果创建成功，socket函数会返回对应的socket文件描述符，否则返回-1.

连接socket

	printf("Connecting...\n");
	if(connect(socket_peer,peer_address->ai_addr,peer_address->ai_addrlen)){
		fprintf(stderr,"connect() failed. (%d)\n",errno);
		return 1;
	}
	freeaddrinfo(peer_address);

connect函数原型：

int connect(int sockfd, const struct sockaddr *addr,
                   socklen_t addrlen);

sockfd：socket文件描述符，当我们拿到socket文件描述符时，意味着我们的系统一定有资源（如内存）来处理这个socket。
addr： socket地址，这地址会负责接收我们通过socket发送的数据。
addrlen： socket地址的长度

如果连接成功，函数返回0，否则返回-1.
在连接成功后，我们用freeaddrinfo(peer_address)释放掉peer_address的内存。成功就意味着这些内存不需要再使用到。

进入循环等待

while(1){
		fd_set reads;
		FD_ZERO(&reads);
		FD_SET(socket_peer,&reads);
		FD_SET(0,&reads);
		struct timeval timeout;
		timeout.tv_sec = 0;
		timeout.tv_usec = 10000;
		
		if(select(socket_peer+1,&reads,0,0,&timeout) < 0){
			fprintf(stderr,"select() failed.(%d).\n",errno);
			return 1;
		}
		if(FD_ISSET(socket_peer,&reads)){
			char read[4096];
			int bytes_received = recv(socket_peer,read,4096,0);
			if(bytes_received < 1){
				printf("Connection closed by peer.\n");
				break;
			}
			printf("Received (%d bytes): %.*s",bytes_received,bytes_received,read);
		}
		if(FD_ISSET(0,&reads)){
			char read[4096];
			if(!fgets(read,4096,stdin)) break;
			printf("Sending: %s",read);
			int bytes_sent = send(socket_peer,read,strlen(read),0);
			printf("Sent %d bytes.\n",bytes_sent);
		}
	}

while(1)就让我们的程序进入循环了。这样的我们的程序才不会退出。我们在循环中会使用select()函数。我们来简单描述一下为会要用select()函数。使用select()函数的目的是为了解决多个TCP连接，虽然我们现在实现的是TCP客户端，连接的数量会比TCP服务端要少很多，也容易控制很多，甚至在这里都可以不用select()，但是我们使用好的实践总不会差。所以这里我用服务端的例子来解释为会要用select()函数，这样大家会比较好理解。
首先，TCP服务端的socket连接不会少于一个，甚至更多。在服务端accept函数是一个阻塞的函数，意味着没有新连接来的时候，它就卡在accept函数调用那里。这是其中一个原因。另外当我们使用recv()读取数据时，我们的程序也会阻塞在recv()这里，直到数据准备好。作为一个服务端当然不能只接受一个连接，也不能只在连接那一会读取数据。所以对于一个服务端来说，在一般情况下，是不应该阻塞I/O的。它必须为多个客户端服务。如果我们的服务端正阻塞在recv()调用这里，那么其他客户端尝试连接到服务端这边明显必须等待，这显然也是不可接受的。为了解决这些问题，我们有几个办法：

方法一：轮询，不断地一个接一个地检查socket的状态，有数据要处理的就马上处理，否则直接忽略。这样虽然实现了同时处理socket的目的，但是在大多数据时间里都在浪费计算资源。而且还可能使用程序在一定程度上变得复杂。比如说处理recv()返回的数据就会比阻塞式的socket来复杂。
方法二：启动多进程或多线程来处理非阻塞的socket，这种情况下，阻塞是可接受的，因为socket的阻塞都发生在各自的进程或线程里，不会阻塞其他的socket。这种方法虽然是个不错的选择，但是它也有一个比较明显的缺点，如线程的使用，当它们需要共享一些状态时，就很容易出错，维护这些状态是不容易的。而且在不同平台上的进程或线程机制也不尽相同，这给可移植性带来挑战。比如说在类Unix系统上，创建一个新进程是很容易的,fork()就搞掂了，我们用下面的例子来说明：

while(1) {
	int socket_client = accept(sock_listen,&client,&len);
	int pid = fork()
	if(pid == 0) {// 孩子进程
		close(sock_listen);
		recv(socket_client,...);
		send(socket_client,...);
		close(socket_client);
		exit(0);
	}
	// 父进程
	close(socket_client);
}

accept()建立了一个到客户端的新连接。然后马上调用fork()创建一个新的进程，新创建的进程也父进程是一模一样的，所以当CPU执行到子程时，它会判断pid的值，如果是0，就意味着是自己，也就是这个子进程里，那么它就要把监听socket（sock_listen）关掉，因为在它自己的进程里，它唯一关心的是自己，所以它马上执行recv()和send()函数做自己的事，如果这些调用出现了阻塞，也无所谓，反正在自己家。在创建这个子进程的父进程，它得到fork()的返回值就是子进程的id，对于父进程，它要做的事就是把创建出来的客户端socket关掉，因为这个socket不需要在父进程里工程，它已经在子进程中去做它自己的事了。
各位编程的小伙伴，在理父进程与子进程的关系，尤其是那些实例的使用时，不要想着它们在共享着同一个对象，那是在高级编程里的想法，在这里要认识到这是一个内存的变化，使它们独立了，是内核帮助完成这种分离的。

上面就是在类Unix系统上创建进程的，在windows上这就会变得复杂起来。所以这种方法也不怎么推荐用来解决多个socket连接的场景

方法三：select()函数，这个就是我们推荐用来解决我们多socket连接场景的方法。我们可以给select()一个socket的集合，select()就会告诉我们哪一个socket已经准备好了。select()不仅没有计算资源的浪费，而且在类Unix和Windows系统上都可以使用，因为select()都支持Berkeley socket和WinSock，所以移植问题就就迎刃而解了。顺便说一下关于socket的一些事，我们都知道在系统间通信的端点就是socket，我们的应用程序收发各种来自网络的数据都是通过socket。其实存在好一些socket应用编程接口。最出名的就是Berkeley sockets，它在1983发布，Berkeley sockets的API很快就被业界接受，它做了一些小改动后便被接纳为POSIX标准。Linux和MacOS上提供的socket API都是Berkeley sockets的一个实现。Berkeley sockets、BSD sockets、Unix sockets、Portable Operating System Interface （POSIX）sockets这些术语都可以互相使用，它们都指的是Berkeley sockets。Windows上的socket API叫Winsock。

回归我们的主题。循环里我们用select()来解决同步多路复用的问题。我们给它一个socket的集合，它就会阻塞在select()调用处，直到当中有一个socket已准备好可以被读，我们也可以配置它返回有socket准备好被写入或遇到了错误。我们也可以配置在一个指定的时间，如果没有任务事件，就返回。其实，我们就可以复用这样的超时去读取我们terminal的输入。select()函数原型：

int select(int nfds, fd_set *_Nullable restrict readfds,
                  fd_set *_Nullable restrict writefds,
                  fd_set *_Nullable restrict exceptfds,
                  struct timeval *_Nullable restrict timeout);

nfds：这个值是三个文件描述符集合参数中最大文件描述加1（文件描述符是一个整型）。
fd_set是文件描述符集合的结构体，在类Unix系统中，几乎所有操作都与文件描述符有关，无论操作的对象是外部设备还是文件，这也是为什么说在类Unix系统中，一切皆文件的原因。
readfds：在这个集合中的文件描述符会被观察，看它们是否为读操作准备好了。如果一个读操作没有阻塞，那么文件描述符就准备好读了。如果到达了文件尾，就是到了文件结束的位置，那么文件描述符也是准备好读的状态。在select()返回后，readfds就只剩下准备好读的文件描述符，其他的文件描述符都被清掉。
writefds：在这个集合中的文件描述符会被观察，看它们是否为写操作准备好了。如果一个写操作没有阻塞，那么文件描述符就处于准备好的状态。然而，对一个大量写的操作仍然会阻塞，即使用文件描述符已是可写的状态。在select()返回后，writefds就只剩下为写操作准备好的文件描述符，其他的文件描述符都被清掉。
exceptfds：在这个集合中的文件描述符会被观察，看它们是否发生了异常。在select()返回后，exceptfds就只剩下发生了异常的文件描述符，其他的文件描述符都被清掉。
timeout：指定一个时间间隔（超时时间），这个时间是给select()等待文件描述符变成准备好用的。当一个文件描述符变成准备好的状态，那么select()返回；或者被信号处理中断select()的调用；或者超时，select()返回。如果这个超时值是0，那么select()调用就会马上返回。如果这个超时值设置为NULL，则select()将会无限期地阻塞，直到等到一个文件描述符变成准备好了。

如果select()调用失败会返回-1，如果成员则返回文件描述符的数量，如果超时则返回0 。

上面讲完了select()函数的原型，还有三个函数经常一起用的：

void FD_ZERO(fd_set *set); 这个函数用于清空文件描述符集合，常在初始化文件描述符集合时使用
void FD_SET(int fd, fd_set *set);添加文件描述符到集合中，如果已存在，则不做任何操作，也不会产生错误。
int FD_ISSET(int fd, fd_set *set);用于测试给定的文件描述符是否在集合中。

创建文件描述符集合

在我们的循环中，创建fd_set集合：

		fd_set reads;
		FD_ZERO(&reads);
		FD_SET(socket_peer,&reads);
		FD_SET(0,&reads);
		struct timeval timeout;
		timeout.tv_sec = 0;
		timeout.tv_usec = 100000;
		
		if(select(socket_peer+1,&reads,0,0,&timeout) < 0){
			fprintf(stderr,"select() failed.(%d).\n",errno);
			return 1;
		}

我们将远程socket加入集合中：

FD_SET(socket_peer,&reads);

同时我们也把terminal的输入加入集合，terminal的输入的文件描述符是0，即stdin标准输入：

FD_SET(0,&reads);

在我们的这个实例中，我们只观察读，所以代码写和异常的两个文件描述符集合的参数我们传0即可。

检查远程socket是否有响应

只要有变化，select()就会返回，那么我们可以用FD_ISSET测试，我们想要处理的socket是否在已准备好的文件描述符列表中，有，则可以做进一步操作。

if(FD_ISSET(socket_peer,&reads)){
			char read[4096];
			int bytes_received = recv(socket_peer,read,4096,0);
			if(bytes_received < 1){
				printf("Connection closed by peer.\n");
				break;
			}
			printf("Received (%d bytes): %.*s",bytes_received,bytes_received,read);
		}

recv()函数原型：

ssize_t recv(int sockfd, void buf[.len], size_t len,
                        int flags);

sockfd：有数据输入的文件描述符
buf：用于存储输入的数据的数组
len：数组的长度
flags：设置0即可，直接读入数据，否则会根据相应的flags做相应处理。

termineral的输入

if(FD_ISSET(0,&reads)){
			char read[4096];
			if(!fgets(read,4096,stdin)) break;
			printf("Sending: %s",read);
			int bytes_sent = send(socket_peer,read,strlen(read),0);
			printf("Sent %d bytes.\n",bytes_sent);
		}

fgets函数原型：

char *fgets(char *restrict s, int n, FILE *restrict stream);

s：接收字符的指针，传字符数组名即可
n：字符数组的大小即可。这个是决定一次最大可以接收最大的字符长度
stream：这个是数据源。

我们用这个例子说清楚了一些我们想交流的内容。

完整代码

到此就把整个TCP客户端的一个简单例子讲完了。下面是完成的代码：

#include <sys/types.h>
#include <sys/socket.h>
#include <netinet/in.h>
#include <arpa/inet.h>
#include <netdb.h>
#include <unistd.h>
#include <errno.h>
#include <stdio.h>
#include <string.h>

int main(int argc,char *argv[]){
	if(argc < 3) {
		fprintf(stderr,"usage: client hostname port\n");
		return 1;
	}
	struct addrinfo hints;
	memset(&hints,0,sizeof(hints));
	hints.ai_socktype = SOCK_STREAM;
	struct addrinfo *peer_address;
	if(getaddrinfo(argv[1],argv[2],&hints,&peer_address)){
		fprintf(stderr,"getaddrinfo() failed. (%d) \n",errno);
		return 1;
	}
	printf("Remote address is :\n");
	char address_buffer[100];
	char service_buffer[100];
	getnameinfo(peer_address->ai_addr,peer_address->ai_addrlen,address_buffer,sizeof(address_buffer),service_buffer,sizeof(service_buffer),NI_NUMERICHOST);
	printf("%s %s \n",address_buffer,service_buffer);
	
	printf("Creating socket...\n");
	int socket_peer;
	socket_peer = socket(peer_address->ai_family,peer_address->ai_socktype,peer_address->ai_protocol);
	if(socket_peer < 0) {
		fprintf(stderr,"socket() failed. (%d)\n",errno);
		return 1;	
	}
	
	printf("Connecting...\n");
	if(connect(socket_peer,peer_address->ai_addr,peer_address->ai_addrlen)){
		fprintf(stderr,"connect() failed. (%d)\n",errno);
		return 1;
	}
	freeaddrinfo(peer_address);
	printf("Connected.\n");
	printf("To send data,enter text followed by enter.\n");

	while(1){
		fd_set reads;
		FD_ZERO(&reads);
		FD_SET(socket_peer,&reads);
		FD_SET(0,&reads);
		struct timeval timeout;
		timeout.tv_sec = 0;
		timeout.tv_usec = 100000;
		
		if(select(socket_peer+1,&reads,0,0,&timeout) < 0){
			fprintf(stderr,"select() failed.(%d).\n",errno);
			return 1;
		}
		if(FD_ISSET(socket_peer,&reads)){
			char read[4096];
			int bytes_received = recv(socket_peer,read,4096,0);
			if(bytes_received < 1){
				printf("Connection closed by peer.\n");
				break;
			}
			printf("Received (%d bytes): %.*s",bytes_received,bytes_received,read);
		}
		if(FD_ISSET(0,&reads)){
			char read[4096];
			if(!fgets(read,4096,stdin)) break;
			printf("Sending: %s",read);
			int bytes_sent = send(socket_peer,read,strlen(read),0);
			printf("Sent %d bytes.\n",bytes_sent);
		}
	}
	printf("Closing socket...\n");
	close(socket_peer);
	printf("Finished.\n");
	return 0;
}

编译：

chat % gcc client.c -o client

运行例子：

chat % ./client example.com 80
Remote address is :
93.184.216.34 http 
Creating socket...
Connecting...
Connected.
To send data,enter text followed by enter.
Hello
Sending: Hello
Sent 6 bytes.
Received (516 bytes): HTTP/1.0 501 Not Implemented
Content-Type: text/html
Content-Length: 357
Connection: close
Date: Sun, 17 Mar 2024 10:46:24 GMT
Server: ECSF (sac/2512)

<?xml version="1.0" encoding="iso-8859-1"?>
<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN"
         "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd">
<html xmlns="http://www.w3.org/1999/xhtml" xml:lang="en" lang="en">
        <head>
                <title>501 - Not Implemented</title>
        </head>
        <body>
                <h1>501 - Not Implemented</h1>
        </body>
</html>
Connection closed by peer.
Closing socket...
Finished.
chat %