Linux下的多进程编程

2008-02-23 05:41:30来源:互联网 阅读 ()

新老客户大回馈,云服务器低至5折

  (一) 理解Linux下进程的结构

   Linux下一个进程在内存里有三部份的数据,就是“数据段”,“堆栈段”和“代码段”,其实学过汇编语言的人一定知道,一般的CPU象I386,都有上述三种段寄存器,以方便操作系统的运行。“代码段”,顾名思义,就是存放了程式代码的数据,假如机器中有数个进程运行相同的一个程式,那么他们就能够使用同一

  个代码段。

   堆栈段存放的就是子程式的返回地址、子程式的参数连同程式的局部变量。而数据段则存放程式的全局变量,常数连同动态数据分配的数据空间(比如用malloc之类的函数取得的空间)。这其中有许多细节问题,这里限于篇幅就不多介绍了。系统假如同时运行数个相同的程式,他们之间就不能使用同一个堆栈段和数据 段。

  (二) 如何使用fork

   在Linux下产生新的进程的系统调用就是fork函数,这个函数名是英文中“分叉”的意思。为什么取这个名字呢?因为一个进程在运行中,假如使用了fork,就产生了另一个进程,于是进程就“分叉”了,所以这个名字取得很形象。下面就看看如何具体使用fork,这段程式演示了使用fork的基本框架:

  void main(){

  int i;

  if ( fork() == 0 ) {

  /* 子进程程式 */

  for ( i = 1; i < 1000; i )

  printf("This is child process\n");

  }

  else {

  /* 父进程程式*/

  for ( i = 1; i < 1000; i )

  printf("This is process process\n");

  }

  }

   程式运行后,您就能看到屏幕上交替出现子进程和父进程各打印出的一千条信息了。假如程式还在运行中 ,您用ps命令就能看到系统中有两个他在运行了。

   那么调用这个fork函数时发生了什么呢?一个程式一调用fork函数,系统就为一个新的进程准备了前述三个段,首先,系统让新的进程和旧的进程使用同一个代码段,因为他们的程式还是相同的,对于数据段和堆栈段,系统则复制一份给新的进程,这样,父进程的任何数据都能够留给子进程,但是,子进程一旦开始运行,虽然他继承了父进程的一切数据,但实际上数据却已分开,相互之间不再有影响了,也就是说,他们之间不再共享任何数据了。而假如两个进程要共享什么数据的话,就要使用另一套函数(shmget,shmat,shmdt等)来操作。现在,已是两个进程了,对于父进程,fork函数返回了子程式的进程号,而对于子程式,fork函数则返回零,这样,对于程式,只要判断fork函数的返回值,就知道自己是处于父进程还是子进程中。

   读者也许会问,假如一个大程式在运行中,他的数据段和堆栈都很大,一次fork就要复制一次,那么fork 的系统开销不是很大吗?其实UNIX自有其解决的办法,大家知道,一般CPU都是以“页”为单位分配空间的,象INTEL的CPU,其一页在通常情况下是4K字节大小,而无论是数据段还是堆栈段都是由许多“页”构成的, fork函数复制这两个段,只是“逻辑”上的,并非“物理”上的,也就是说,实际执行fork时,物理空间上两个进程的数据段和堆栈段都还是共享着的,当有一个进程写了某个数据时,这时两个进程之间的数据才有了区别,系统就将有区别的“页”从物理上也分开。系统在空间上的开销就能够达到最小。

  一个小幽默:下面演示一个足以"搞死"Linux的小程式,其源代码很简单:

  void main()

  {

  for(;;) fork();

  }

   这个程式什么也不做,就是死循环地fork,其结果是程式不断产生进程,而这些进程又不断产生新的进程,很快,系统的进程就满了,系统就被这么多不断产生的进程"撑死了"。用不着是root,任何人运行上述程式都足以让系统死掉。哈哈,但这不是Linux不安全的理由,因为只要系统管理员足够聪明,他(或她)就能够预先给每个用户配置可运行的最大进程数,这样,只要不是root,任何能运行的进程数也许不足系统总的能运行和进程数的十分之一,这样,系统管理员就能对付上述恶意的程式了。

  (三) 如何启动另一程式的执行

   下面我们来看看一个进程如何来启动另一个程式的执行。在Linux中要使用exec类的函数,exec类的函数不止一个,但大致相同,在Linux中,他们分别是:execl,execlp,execle,execv,execve和execvp,下面我只以execlp为例,其他函数究竟和execlp有何区别,请通过manexec命令来了解他们的具体情况。

   一个进程一旦调用exec类函数,他本身就“死亡”了,系统把代码段替换成新的程式的代码,废弃原有的数据段和堆栈段,并为新程式分配新的数据段和堆栈段,唯一留下的,就是进程号,也就是说,对系统而言,还是同一个进程,但是已是另一个程式了。(但是 exec类函数中有的还允许继承环境变量之类的信息。)

   那么假如我的程式想启动另一程式的执行但自己仍想继续运行的话,怎么办呢?那就是结合fork和exec的 使用。下面一段代码显示如何启动运行其他程式:

  char command[256];

  void main()

  {

  int rtn; /*子进程的返回数值*/

  while(1) {

  /* 从终端读取要执行的命令 */

  printf( ">" );

  fgets( command, 256, stdin );

  command[strlen(command)-1] = 0;

  if ( fork() == 0 ) {

  /* 子进程执行此命令 */

  execlp( command, command );

  /* 假如exec函数返回,表明没有正常执行命令,打印错误信息*/

  perror( command );

  exit( errorno );

  }

  else {

  /* 父进程, 等待子进程结束,并打印子进程的返回值 */

  wait ( &rtn );

  printf( " child process return %d\n",. rtn );

  }

  }

  }

   此程式从终端读入命令并执行之,执行完成后,父进程继续等待从终端读入命令。熟悉DOS和WINDOWS系统调用的朋友一定知道DOS/WINDOWS也有exec类函数,其使用方法是类似的,但DOS/WINDOWS更有spawn类函数,因为DOS是单任务的系统,他只能将“父进程”驻留在机器内再执行“子进程”,这就是spawn类的函数。 WIN32已是多任务的系统了,但还保留了spawn类函数,WIN32中实现spawn函数的方法同前述UNIX中的方法差不多,开设子进程后父进程等待子进程结束后才继续运行。UNIX在其一开始就是多任务的系统,所以从核 心角度上讲无需spawn类函数。

标签:

版权申明:本站文章部分自网络,如有侵权,请联系:west999com@outlook.com
特别注意:本站所有转载文章言论不代表本站观点,本站所提供的摄影照片,插画,设计作品,如需使用,请与原作者联系,版权归原作者所有

上一篇: Linux 编程之C和脚本的混合编程

下一篇: Linux 编程之生成静态连接库