1.概述
在Linux系统中一切皆可以看成是文件,文件又可分为:普通文件、目录文件、链接文件和设备文件。文件描述符(filedescriptor)是内核为了高效管理已被打开的文件所创建的索引,其是一个非负整数(一般是小整数),用于指代被打开的文件,所有执行I/O操作的系统调用都通过文件描述符。程序刚才启动的时侯,0是标准输入,1是标准输出,2是标准错误。若果此时去打开一个新的文件,它的文件描述符会是3。POSIX标准要求每次打开文件时(含socket)必须使用当前进程中最小可用的文件描述符号码,因而,在网路通讯过程中稍不注意就有可能导致串话。标准文件描述符图如下:
文件描述与打开的文件对应模型如右图:
2.文件描述限制
在编撰文件操作的或则网路通讯的软件时,初学者通常可能会碰到“Toomanyopenfiles”的问题。这主要是由于文件描述符是系统的一个重要资源,即使说系统显存有多少就可以打开多少的文件描述符linux为只读文件系统,然而在实际实现过程中内核是会做相应的处理的,通常最大打开文件数会是系统显存的10%(以KB来估算)(称之为系统级限制),查看系统级别的最大打开文件数可以使用sysctl-a|grepfs.file-max命令查看。与此同时,内核为了不让某一个进程消耗掉所有的文件资源,其也会对单个进程最大打开文件数做默认值处理(称之为用户级限制),默认值通常是1024,使用ulimit-n命令可以查看。在Web服务器中,通过修改系统默认值文件描述符的最大值来优化服务器是最常见的形式之一,如CentOS6.6系统下的文件描述符优化:
##查看默认文件描述符的大小
[root@bo ~]# ulimit -n 1024
临时更改文件描述符的大小
[root@bo scripts]# ulimit -SHn 65535 [root@bo scripts]# ulimit -n 65535
永久更改文件描述符的大小:
[root@bo ~]# echo '* - nofile 65535' >>/etc/security/limits.conf [root@bo ~]# tail -n1 /etc/security/limits.conf * - nofile 65535
3.文件描述符合打开文件之间的关系
每一个文件描述符会与一个打开文件相对应,同时,不同的文件描述符也会指向同一个文件。相同的文件可以被不同的进程打开也可以在同一个进程中被多次打开。系统为每一个进程维护了一个文件描述符表,该表的值都是从0开始的,所以在不同的进程中你会看见相同的文件描述符,这种情况下相同文件描述符有可能指向同一个文件,也有可能指向不同的文件。具体情况要具体剖析,要理解具体其概况怎样linux操作系统简介,须要查看由内核维护的3个数据结构。
1.进程级的文件描述符表
2.系统级的打开文件描述符表
3.文件系统的i-node表
进程级的描述符表的每一条目记录了单个文件描述符的相关信息。
1.控制文件描述符操作的一组标志。(目前,这种标志仅定义了一个,即close-on-exec标志)
2.对打开文件句柄的引用
内核对所有打开的文件的文件维护有一个系统级的描述符表格(openfiledescriptiontable)。有时,亦称之为打开文件表(openfiletable),并将表格中各条目称为打开文件句柄(openfilehandle)。一个打开文件句柄储存了与一个打开文件相关的全部信息,如下所示:
1.当前文件偏斜量(调用read()和write()时更新,或使用lseek()直接更改)
2.打开文件时所使用的状态标示(即,open()的flags参数)
3.文件访问模式(如调用open()时所设置的只读模式、只写模式或读写模式)
4.与讯号驱动相关的设置
5.对该文件i-node对象的引用
6.文件类型(譬如:常规文件、套接字或FIFO)和访问权限
7.一个表针,指向该文件所持有的锁列表
8.文件的各类属性,包括文件大小以及与不同类型操作相关的时间戳
右图展示了文件描述符、打开的文件句柄以及i-node之间的关系,图中,两个进程拥有众多打开的文件描述符。
文件描述符、打开文件句柄和inode之间的关系
在进程A中,文件描述符1和30都指向了同一个打开的文件句柄(标号23)。这可能是通过调用dup()、dup2()、fcntl()或则对同一个文件多次调用了open()函数而产生的。
进程A的文件描述符2和进程B的文件描述符2都指向了同一个打开的文件句柄(标号73)。这些情形可能是在调用fork()后出现的(即,进程A、B是兄妹进程关系),或则当某进程通过UNIX域套接字将一个打开的文件描述符传递给另一个进程时,也会发生。此外是不同的进程只身去调用open函数打开了同一个文件,此时进程内部的描述符恰好分配到与其他进程打开该文件的描述符一样。
据悉,进程A的描述符0和进程B的描述符3分别指向不同的打开文件句柄,但这种句柄均指向i-node表的相同条目(1976),换言之,指向同一个文件。发生此类情况是由于每位进程各自对同一个文件发起了open()调用。同一个进程两次打开同一个文件,也会发生类似情况。
4.总结
1.因为进程级文件描述符表的存在,不同的进程中会出现相同的文件描述符,它们可能指向同一个文件linux为只读文件系统,也可能指向不同的文件
2.两个不同的文件描述符,若指向同一个打开文件句柄,将共享同一文件偏斜量。为此,假若通过其中一个文件描述符来更改文件偏斜量(由调用read()、write()或lseek()所致),这么从另一个描述符中也会观察到变化,无论这两个文件描述符是否属于不同进程linux命令ls,还是同一个进程,情况都是这么。
3.要获取和更改打开的文件标志(比如:O_APPEND、O_NONBLOCK和O_ASYNC),可执行fcntl()的F_GETFL和F_SETFL操作,其对作用域的约束与上一条颇为类似。
4.文件描述符标志(即,close-on-exec)为进程和文件描述符所私有。对这一标志的更改将不会影响同一进程或不同进程中的其他文件描述符
前面会分享更多devops和DBA方面的内容,感兴趣的同学可以关注下!!