UNIX环境编程学习笔记19——进程管理之fork 函数的深入学习

在“进程控制三部曲”中,我们学习到了 fork 是三部曲的第一部,用于创建一个新进程。但是关于 fork 的更深入的一些的东西我们还没有涉及到,例如,fork 创建的新进程与调用进程之间的关系、父子进程的数据共享问题等。fork 是否可以无限制的调用?如果不行的话,最大限制是多少?另外,我们还将学习一个 fork 的变体 vfork。

1 fork 创建的新进程与调用进程之间的关系

UNIX 操作系统中的所有进程之间的关系呈现一个树形结构。除了进程 ID 为 0(swapper 进程)和 1(init 进程)的进程之外的其他进程,都会存在一个父进程。

fork 函数调用产生的新进程的父进程默认即为调用进程。fork 函数调用产生的父子进程各自的运行时间是不确定的。如果子进程先于父进程终止,这样没有什么问题。但,如果父进程先于子进程终止,那么子进程是不是就没有了父进程,进程树形结构就被破坏了?对于这个问题,UNIX 系统这么处理的:如果某个进程终止了,则将该进程的所有尚未结束的子进程的父进程设置为 init 进程(init 进程是绝不会终止的)。其操作过程大致为:在一个进程终止时,内核逐个检查所有活动进程(因为 UNIX 没有提供一个获取某个进程所有子进程的接口),如果是正在终止的进程的子进程,则将其父进程设置为 init 进程。

2 父子进程的数据共享问题

fork 函数创建的子进程会获得父进程的数据空间、堆和栈的副本。但是,大多数情况下,fork 之后都会紧接着调用 exec 执行新程序,从而覆盖了从父进程拷贝的这些副本,这就造成了内核做了很多无用功。

现在很多的实现都采用写时复制(Copy-On-Write,COW)技术。fork函数调用之后,父子进程共享这些区域,而且内核将这些区域的权限改为只读的。如果父、子进程中任何一个试图修改这些区域,则内核只为要修改的区域做一份拷贝给该进程。

下面我们来看一个共享数据的例子,

#include <stdlib.h>
#include <stdio.h>
#include <unistd.h>
#include <string.h>
#include <errno.h>
int glob = 0;
int
main(void)
{
    int var;
    pid_t pid;
    var = 0;
    if ((pid = fork()) < 0) {
        printf("fork error: %s\n",strerror(errno));
        exit(-1);
    } else if (pid == 0) {
        var++;
        glob++;
        printf(child: glob=%d,var=%d\n",glob,var);
        exit(0);
    }
    wait(NULL);
    printf(parent: glob=%d,255); line-height:1.5!important">var);
    exit(0);
}

该程序在 fork 之后的父进程等待子进程结束,而子进程将整型变量glob 和 var 都加了 1. 编译该程序,生成并执行 forkdemo. 从下面的运行结果,我们看到子进程修改的 glob 和 var 变量对父进程没有任何影响。

lienhua34:demo$ gcc -o forkdemo forkdemo.c
lienhua34:demo$ ./forkdemo
child: glob=1,var=1
parent: glob=0,128); line-height:1.5!important">0

虽说子进程享用的是父进程的数据副本,子进程的修改对父进程没有任何影响。但有个比较特殊的情况:文件 I/O。fork 会将父进程的所有打开文件描述符都复制到子进程。父子进程中相同的文件描述符则共享同一个文件表项(关于文件描述符和文件表项的关系请参考文档“内核 I/O 数据结构”)。下面我们看一个例子,255); line-height:1.5!important">void) { pid_t pid; printf(before fork\n"); in child process\n"); exit(in parent process\n"); exit( 编译该程序,生成并执行文件 forkdemo,209); border:none!important">

lienhua34:demo$ gcc -o forkdemo forkdemo.c
lienhua34:demo$ ./forkdemo
before fork
in child process
in parent process
lienhua34:demo$ ./forkdemo > foo
lienhua34:demo$ cat foo
before fork
in child process
before fork
in parent process
在没有对标准输出重定向之前,运行 forkdemo 看不出啥问题。当重定向标准输出到一个文件(./forkdemo > foo)时,我们可以看到父进程打印的字符串在子进程打印的字符串之后。这是因为父子进程标准输出共享了同一个文件表项,也即共享了同一个文件偏移量。

另外,我们注意到在标准输出没有重定向时,字符串“before fork”只输出一次,但是在标准输出重定向到文件之后输出了两次。这是因为标准I/O 库函数 printf 在标准输出连接到终端设备时是行缓冲的,于是在 fork函数之后,缓冲区中的数据已经被冲洗了。而当标准输出重定向文件之后,printf 函数就变成了全缓冲了,在 fork 之前调用 printf 函数将字符串“before fork”写到缓冲区中,fork 时该字符串还在缓冲区中,于是便拷贝一份给子进程。当父子进程都调用 exit 函数之后,缓冲区中的数据都被冲洗到文件中,于是被出现了两份“before fork”。

3 fork 典型应用场景

fork 有两种典型的应用场景:

• 创建一个新进程执行新的程序。即调用 fork 之后子进程立即调用 exec函数执行一个新程序,例如文档“进程控制三部曲”中的示例 2.

父进程希望复制自己,使父、子进程同时执行不同的代码段。这在网络服务进程中比较常见:父进程等待客户端的服务请求,当接收到一个请求之后,父进程调用 fork,然后让子进程处理该请求,而父进程继续等待下一个服务请求。其代码框架如下所示:

void serve(int sockfd)
{
    int clfd;
    pid_t pid;
    for (;;) {
        clfd = accept(sockfd,NULL,NULL);
        if (clfd < 0) {
            /* print error message */
            continue;
        }
         fork error continue;
        }  deal with clfd in child process */
            close(clfd);
            exit(0);
        } else {
             in parent process,close the accepted socket "clfd",then continues to listen next socket connection. */
        } 
    }
}

4 fork 函数调用次数的最大限制是多少

每个实际用户 ID 具有一个在任何时刻的最大进程数。CHILD_MAX 规定了每个实际用户 ID 在任一时刻可具有的最大进程数。我们看下面一个例子,255); line-height:1.5!important">void) { pid_t pid; int count; printf(CHILD_MAX: %ld\n1; for (;;) { 0) { printf(break; } 0) { sleep(3); exit(0); } count++; } printf(count: %d\n

lienhua34:demo$ gcc -o forkdemo forkdemo.c
lienhua34:demo$ ./forkdemo
CHILD_MAX: 15969
fork error: Resource temporarily unavailable
count: 15737

从上面的运行结果可以看出我的系统规定了每个实际用户 ID 在任一时刻可具有的最大进程数为 15969。而在 for 循环中 fork 创建了 15737 个进程(包括调用进程本身)之后,fork 就因为没有可用资源而创建新进程失败。

5 fork 的变体vfork

vfork 函数是 fork 函数的一个变体,其调用序列和返回值与 fork 函数一致,不过两者的语义不同。维基百科上关于 vfork 的说明如下(参考fork(system_call))。

Vfork is a variant of fork with the same calling convention and much the same semantics; it originated in the 3BSD version of Unix,[citation needed] the first Unix to support virtual memory. It was standardized by POSIX,which permitted vfork to have exactly the same behavior as fork,but marked obsolescent in the 2004 edition,[4] and has disappeared from subsequent editions.

我们看到在 POSIX 2004 版本中已经将 vfork 函数注为过时的,而且在之后的版本中已经不再出现 vfork 函数了。但是,既然《APUE》中讲到了这个,那我们就来看一下 vfork 函数跟 fork 函数到底有什么区别吧。

vfork 函数和 fork 函数的区别有两点:

1. fork 会将父进程的地址空间拷贝给子进程;而 vfork 没有,子进程在父进程的地址空间中运行。

2. fork 无法确保父子进程的执行顺序;而 vfork 保证子进程先执行,父进程会一直阻塞直到子进程调用 exit 或 exec。(注:vfork 的这个特征可能会导致死锁,若子进程在调用 exit 或 exec 之前依赖于父进程的进一步动作,而父进程也正在等待子进程,于是出现了循环等待的问题。)

我们来对比一下 vfork 和 fork 在处理数据方面有什么不同,255); line-height:1.5!important">if ((pid = vfork()) < 0); } printf( 上面程序拷贝了上面 fork 函数处理共享数据的示例程序,将 fork 改成vfork,并且去掉了 wait(NULL) 语句。保存为 vforkdemo.c,编译该程序,生成并执行 vforkdemo 文件,245)">

lienhua34:demo$ gcc -o vforkdemo vforkdemo.c
lienhua34:demo$ ./vforkdemo
child: glob=1,var=1
parent: glob=1,var=1

从上面的运行结果,我们看到 vfork 创建的子进程修改了 glob 和 var变量之后,父进程也看到了这个修改。

vfork 函数的出现原因可能是早期系统的 fork 没有实现写时复制技术,导致每次 fork 调用做了很多无用功(大多数情况下都是 fork 之后调用 exec执行新程序)且效率不高,于是便创造了 vfork 函数。而现在的实现基本都是采用写时复制技术,而且 vfork 函数使用不当还会出现死锁,于是 vfork函数也便没有了存在的必要性。

(done)

版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。

相关推荐


用的openwrt路由器,家里宽带申请了动态公网ip,为了方便把2280端口映射到公网,发现经常被暴力破解,自己写了个临时封禁ip功能的脚本,实现5分钟内同一个ip登录密码错误10次就封禁这个ip5分钟,并且进行邮件通知使用步骤openwrt为19.07.03版本,其他版本没有测试过安装bashmsmtpopkg
#!/bin/bashcommand1&command2&wait从Shell脚本并行运行多个程序–杨河老李(kviccn.github.io)
1.先查出MAMP下面集成的PHP版本cd/Applications/MAMP/bin/phpls-ls 2.编辑修改.bash_profile文件(没有.bash_profile文件的情况下回自动创建)sudovim~/.bash_profile在文件的最后输入以下信息,然后保存退出exportPATH="/Applications/MAMP/bin/php/php7.2.20/b
1、先输入locale-a,查看一下现在已安装的语言2、若不存在如zh_CN之类的语言包,进行中文语言包装:apt-getinstalllanguage-pack-zh-hans3、安装好后我们可以进行临时修改:然后添加中文支持: locale-genzh_CN.UTF-8临时修改> export LC_ALL='zh_CN.utf8'> locale永久
BashPerlTclsyntaxdiff1.进制数表示Languagebinaryoctalhexadecimalbash2#[0~1]0[0~7]0x[0~f]or0X[0~f]perl0b[0~1]0[0~7]0x[0~f]tcl0b[0~1]0o[0~7]0x[0~f]bashdifferentbaserepresntationreference2.StringlengthLanguageStr
正常安装了k8s后,使用kubect工具后接的命令不能直接tab补全命令补全方法:yum-yinstallbash-completionsource/usr/share/bash-completion/bash_completionsource<(kubectlcompletionbash)echo"source<(kubectlcompletionbash)">>~/.bashrc 
参考这里启动jar包shell脚本修改过来的#!/bin/bash#默认应用名称defaultAppName='./gadmin'appName=''if[[$1&&$1!=0]]thenappName=$1elseappName=$defaultAppNamefiecho">>>>>>本次重启的应用:$appName<
#一个数字的行#!/bin/bashwhilereadlinedon=`echo$line|sed's/[^0-9]//g'|wc-L`if[$n-eq1]thenecho$linefidone<1.txt#日志切割归档#!/bin/bashcd/data/logslog=1.logmv_log(){[-f$1]&&mv$1$2
#文件增加内容#!/bin/bashn=0cat1.txt|whilereadlinedon=[$n+1]if[$n-eq5]thenecho$lineecho-e"#Thisisatestfile.\n#Testinsertlineintothisfile."elseecho$linefidone#备份/etc目录#
# su - oraclesu: /usr/bin/ksh: No such file or directory根据报错信息:显示无法找到文件 /usr/bin/ksh果然没有该文件,但是发现存在文件/bin/ksh,于是创建了一个软连接,可以规避问题,可以成功切换到用户下,但无法执行系统自带命令。$. .bash_profile-ksh: .: .b
history显示历史指令记录内容,下达历史纪录中的指令主要的使用方法如果你想禁用history,可以将HISTSIZE设置为0:#exportHISTSIZE=0使用HISTIGNORE忽略历史中的特定命令下面的例子,将忽略pwd、ls、ls-ltr等命令:#exportHISTIGNORE=”pwd:ls:ls-ltr:”使用HIS
一.命令历史  1.history环境变量:    HISTSIZE:输出的命令历史条数,如history的记录数    HISTFILESIZE:~/.bash_history保存的命令历史记录数    HISTFILLE:历史记录的文件路径    HISTCONTROL:     ignorespace:忽略以空格开头的命令
之前在网上看到很多师傅们总结的linux反弹shell的一些方法,为了更熟练的去运用这些技术,于是自己花精力查了很多资料去理解这些命令的含义,将研究的成果记录在这里,所谓的反弹shell,指的是我们在自己的机器上开启监听,然后在被攻击者的机器上发送连接请求去连接我们的机器,将被攻击者的she
BashOne-LinersExplained,PartI:Workingwithfileshttps://catonmat.net/bash-one-liners-explained-part-oneBashOne-LinersExplained,PartII:Workingwithstringshttps://catonmat.net/bash-one-liners-explained-part-twoBashOne-LinersExplained,PartII
Shell中变量的作用域:在当前Shell会话中使用,全局变量。在函数内部使用,局部变量。可以在其他Shell会话中使用,环境变量。局部变量:默认情况下函数内的变量也是全局变量#!/bin/bashfunctionfunc(){a=99}funcecho$a输出>>99为了让全局变量变成局部变量
1、多命令顺序执行;  命令1;命令2  多个命令顺序执行,命令之间没有任何逻辑联系&&  命令1&&命令2  逻辑与,当命令1正确执行,才会执行命令2||  命令1||命令2  逻辑或,当命令1执行不正确,才会执行命令2例如:ls;date;cd/home/lsx;pwd;who ddif=输入文件of=输
原博文使用Linux或者unix系统的同学可能都对#!这个符号并不陌生,但是你真的了解它吗?首先,这个符号(#!)的名称,叫做"Shebang"或者"Sha-bang"。Linux执行文件时发现这个格式,会把!后的内容提取出来拼接在脚本文件或路径之前,当作实际执行的命令。 Shebang这个符号通常在Unix系统的脚本
1、历史命令history[选项][历史命令保存文件]选项:-c:  清空历史命令-w:  把缓存中的历史命令写入历史命令保存文件 ~/.bash_historyvim/etc/profile中的Histsize可改存储历史命令数量历史命令的调用使用上、下箭头调用以前的历史命令使用“!n”重复执行第n条历史
目录1.Shell脚本规范2.Shell脚本执行3.Shell脚本变量3.1环境变量3.1.1自定义环境变量3.1.2显示与取消环境变量3.1.3环境变量初始化与对应文件的生效顺序3.2普通变量3.2.1定义本地变量3.2.2shell调用变量3.2.3grep调用变量3.2.4awk调用变量3.3
   http://www.voidcn.com/blog/wszzdanm/article/p-6145895.html命令功能:显示登录用户的信息命令格式:常用选项:举例:w显示已经登录的用户及正在进行的操作[root@localhost~]#w 11:22:01up4days,21:22, 3users, loadaverage:0.00,0.00,0.00USER