标签 socket 下的文章

Python Socket 编程

Socket (套接字)是进程通信的一种方式,主要应用于不同主机的进程之间的数据交换。

Unix/Linux 的基本哲学之一是:一切皆文件。遵循以下模式:

open -> write/read -> close

而 Socket 就是上述模式的一种实现方式。

一、如何标识进程

用一个三元组标识进程:(IP地址, 协议, 端口)。我们称之为半相关,它指定一个连接的半个部分。

一个完整的网间通信由两个进程组成,并且只能使用同一种高层协议,称之为全相关:(协议, 本地IP地址, 本地端口, 远程IP地址, 远程端口)。

操作系统的端口号,是一个 16 位的编号(2^16 = 65536),范围是 0~65535。一个进程在通讯时均会占用一个端口号。

1~255 知名端口、默认端口,如 80 是 Web 服务的端口,21 是 FTP 服务的端口。
256~1023 Unix 系统占用的端口,普通用户无权使用。
1024~5000 临时端口,一般客户端随机分配的端口在此范围。

协议包括地址族(Address Family)和套接字类型。

Address Family:

AF_UNIX / AF_LOCAL  本地进程间通信,以绝对路径作为地址
AF_INET / AF_INET6  网络间进程通信,用 ipv4/6 和端口号组合成地址
AF_NS
AF_ROUTE

套接字类型:

SOCK_STREAM  TCP流式套接字,面向连接,提供可靠的数据传输服务。
SOCK_DGRAM  UDP,数据报式套接字,无连接的,数据包以独立形式发送,可能丢失或重复,且不按顺序。
SOCK_RAW  原始套接字,允许使用较低层次协议,如 ICMP/IGMP 等。
SOCK_PACKET
SOCK_SEQPACKET  可靠的连续数据包服务。

二、相关函数

以下是 C 语言相关函数:

socket() 创建一个 socket
bind() 绑定本地地址
listen() 监听连接
accept() 接受连接,返回收到的套接字
send() 发送数据
recv() 接收数据
select() 输入输出多路复用
closesocket() 关闭套接字
connect() 与远程进程建立连接,它会自动给本地 socket 分配端口号

三、Python Socket 编程

Python 提供了两个基本的模块:

socket 提供了标准的 BSD Sockets API。
socketserver 提供了服务器相关方法,如开发网络服务器。

创建 socket 函数:

socket(family,type[,protocal]) # 使用给定的地址族、套接字类型、协议编号(默认为0)来创建套接字。

创建 TCP socket:

s = socket.socket(socket.AF_INET, socket.SOCK_STREAM)

创建 UDP socket:

s = socket.socket(socket.AF_INET, socket.SOCK_DGRAM)

1. 服务端 socket 函数

s.bind(address)
将套接字绑定到地址, 在AF_INET下,以元组(host,port)的形式表示地址。

s.listen(backlog)
开始监听TCP传入连接。backlog指定在拒绝连接之前,操作系统可以挂起的最大连接数量。该值至少为1,一般设为 5。

s.accept()
接受TCP连接并返回(conn,address),其中conn是新的套接字对象,可以用来接收和发送数据。address是连接客户端的地址。如果没有收到连接,则会挂起,一直等待下去。

2. 客户端 socket 函数

s.connect(address)
连接到address处的套接字。一般address的格式为元组(hostname,port),如果连接出错,返回socket.error错误。hostname 可以是域名或者IP地址。

s.connect_ex(adddress)
功能与connect(address)相同,但是成功返回0,失败返回errno的值。

3. 公共 socket 函数

s.recv(bufsize[,flag])
接收TCP套接字的数据。数据以字符串形式返回,bufsize指定要接收的最大数据量。flag提供有关消息的其他信息,通常可以忽略。

s.send(string[,flag])
发送TCP数据。将string中的数据发送到连接的套接字。返回值是要发送的字节数量,该数量可能小于string的字节大小。

s.sendall(string[,flag])
完整发送TCP数据。将string中的数据发送到连接的套接字,但在返回之前会尝试发送所有数据。成功返回None,失败则抛出异常。

s.recvfrom(bufsize[,flag])
接收UDP套接字的数据。与recv()类似,但返回值是(data,address)。其中data是包含接收数据的字符串,address是发送数据的套接字地址。

s.sendto(string[,flag],address)
发送UDP数据。将数据发送到套接字,address是形式为(ipaddr,port)的元组,指定远程地址。返回值是发送的字节数。

s.close()
关闭套接字。

s.getpeername()
返回连接套接字的远程地址。返回值通常是元组(ipaddr,port)。

s.getsockname()
返回套接字自己的地址。通常是一个元组(ipaddr,port)

s.setsockopt(level,optname,value)
设置给定套接字选项的值。

s.getsockopt(level,optname[,buflen])
返回套接字选项的值。

s.settimeout(timeout)
设置套接字操作的超时时间,timeout 是一个浮点数,单位是秒。值为None表示没有超时时间。一般,超时时间应该在刚创建套接字时设置,因为它们可能用于连接的操作(如connect())

s.gettimeout()
返回当前超时时间的值,单位是秒,如果没有设置,则返回None。

s.fileno()
返回套接字的文件描述符。

s.setblocking(flag)
如果flag为0,则将套接字设为非阻塞模式,否则将套接字设为阻塞模式(默认值)。非阻塞模式下,如果调用recv()没有发现任何数据,或send()调用无法立即发送数据,那么将引起socket.error异常。

s.makefile()
创建一个与该套接字相关连的文件。

说明:
TCP 发送数据时,已建立好连接,所以不需要指定地址。
UDP 是无连接的,因此每次发送数据都要指定地址。

参考文档:Python Socket 网络编程