目录

深入理解Linux进程程序替换从原理到实践

深入理解Linux进程程序替换:从原理到实践


前言:一个司空见惯的现象

当我们打开终端,输入 ls -la 并按下回车时,发生了什么? bash 进程并没有消失,而是 ls 程序神奇地运行了起来并显示了结果。这背后正是 进程程序替换的魔法。

本文将深入探讨Linux中进程程序替换的机制,带你理解这个强大而重要的概念。

一、什么是进程程序替换?

 用fork创建子进程,父进程需要子进程调执行另外的代码,当子进程往往要调用exec函数,以执行另一个程序

1. 当进程调用exec函数时,对进程有什么影响?

该进程的代码和数据完全被新程序替换,替换完之后,运行成功,原代码之后的代码不会运行,运行失败,原代码之后的代码任然会运行,并且子进程的pid并不会改变

原理:

将磁盘中的内存,加载入内存结构。

重新建立页表映射,谁执行程序替换,就重新建立谁的映射(下图为子进程建立)。

效果:让父进程和子进程彻底分离,并让子进程执行一个全新的程序。 

https://i-blog.csdnimg.cn/direct/705bbb39b8c644e784ed35b729482a39.png

这里左边基本不发生变化,右边将磁盘的上的程序加载到内存,并和当前进程的页表,重新建立映射,这就是进程替换。

这个过程有没有创建新的进程呢?

没有,因为子进程的内核数据结构根本没变,只是重新建立了虚拟地址和物理地址之间的映射关系。内核数据结构没有发生任何变化,包括进程的pid都没变,说明没有创建子进程

2.验证执行exec函数之后,代码不会继续后续的原代码

linux代码:

#include <stdio.h>
#include <unistd.h>

int main() 
{
    printf("pid: %d, exec command begin\n", getpid());
    // 用 execl 这个函数来调用系统的命令
    execl("/usr/bin/ls", "ls", "-a", "-l", NULL);
    printf("pid: %d, exec command end\n", getpid());
    return 0;
}

结果:

https://i-blog.csdnimg.cn/direct/bdadf65e499e4d92b8a76d7e40cfa106.png

!!!原代码并没有输出 printf(“pid: %d, exec command end\n”, getpid());

3.验证子进程的替换并不会创建新的进程

代码:

#include <stdio.h>
#include <unistd.h>
#include <sys/types.h>
#include <sys/wait.h>
#include <stdlib.h>
int main()
{
    pid_t id = fork(); // 创建子进程
    if (id == 0)
    {
        // 这里是子进程
        printf("pid: %d, exec command begin\n", getpid());
        sleep(3);
        // 用 execl 这个函数来调用系统的命令
        execl("/usr/bin/ls", "ls", "-a", "-l", NULL);
        printf("pid: %d, exec command end\n", getpid());
        exit(1); // execl 这个函数如果执行成功,就不会来到这下面的语句,如果执行失败才会来到这里,所以我们这里就直接退出
    }
    else 
    {
        // 这里是父进程
        pid_t rid = waitpid(-1, NULL, 0);
        if (rid > 0)
        {
            printf("wait scuess, rid: %d\n", rid);
        }
    }
    return 0;
}

结果:

https://i-blog.csdnimg.cn/direct/8809ad37c097447fbe33e3bc028c5a43.png

由父进程等待子进程,获取子进程pid可以知道,子进程的pid并没有变化,所以程序替换不会改变子进程的pid

二、为什么需要进程程序替换?

父进程创建子进程的目的有两种:

1.子进程执行父进程代码的一部分 

2.让子进程运行一个全新的程序

允许程序在运行时决定要加载和执行哪些其他程序。

三、exec函数族:替换的利器

Linux提供了exec系列函数来完成程序替换,它们都定义在<unistd.h>头文件中。

1.函数家族概览

https://i-blog.csdnimg.cn/direct/02c0c4fc5cfe470f8bc6ba62bdcc6fd7.png

2.函数命名规律:

l (list):参数以列表形式传递

v (vector):参数以数组形式传递

p(path):在PATH环境变量中查找程序

e (environment):可自定义环境变量

四、实战演示:各种exec函数的使用

小编用相近的函数来输出

1.execl 与execv

1.1execl

列表参数

int execl(const char *path, const char *arg0, ..., (char *)NULL);

示例:

!!!需要以NULL结尾

// 执行 /bin/ls -l -a
execl("/bin/ls", "ls", "-l", "-a", NULL);
1.2execv

列表参数

int execv(const char *path, char *const argv[]);

示例:

!!!char * argv[]这个数组需要以NULL结尾

char *argv[] = {"ls", "-l", "-a", NULL};
execv("/bin/ls", argv);

2.execlp与execvp

这里只比execl和execv多了个p,p有啥用呢?简化!有了p之后,原本第一参数需要输入完整的路径,现在只需要输入那个程序(环境变量中有的)

2.1execlp

列表参数:

int execlp(const char *file, const char *arg0, ..., (char *)NULL);

示例:

// 执行 ls -l -a(自动在PATH中查找ls)
execlp("ls", "ls", "-l", "-a", NULL);
2.2 ececvp

列表参数

int execvp(const char *file, char *const argv[]);

示例:

char *argv[] = {"ls", "-l", "-a", NULL};
execvp("ls", argv);

3.execle 与execve

这里只比execl和execv多了个e,e有啥用呢?有了e,便可自己创建的环境变量,如果没有创建自己的环境变量,子进程会默认继承父进程的环境变量,父进程的环境变量是全局性的

3.1ececle

列表参数:

int execle(const char *path, const char *arg0, ..., (char *)NULL, char *const envp[]);

示例:

char *envp[] = {"MY_VAR=hello", "PATH=/usr/bin", NULL};
execle("/bin/bash", "bash", "-c", "echo $MY_VAR", NULL, envp);
3.2execve

列表参数:

int execvpe(const char *file, char *const argv[], char *const envp[]);

示例:

char *argv[] = {"bash", "-c", "echo $CUSTOM_VAR", NULL};
char *envp[] = {"CUSTOM_VAR=test_value", "PATH=/bin", NULL};
execvpe("bash", argv,envp);

4.验证父进程的环境变量是原封不懂传给子进程

例子是网上找的!!!
代码:

#define _POSIX_C_SOURCE 200112L
#define _GNU_SOURCE

#include <stdio.h>
#include <stdlib.h>
#include <unistd.h>
#include <string.h>
#include <sys/wait.h>
#include <sys/types.h>

extern char **environ;

// 打印环境变量的函数
void print_environment(const char *title) {
    printf("=== %s ===\n", title);
    for (char **env = environ; *env != NULL; env++) {
        printf("%s\n", *env);
    }
    printf("====================\n\n");
}

int main() {
    // 1. 先打印父进程的原始环境变量
    print_environment("父进程原始环境变量");
    
    // 2. 添加一个新的环境变量到父进程
    setenv("PARENT_VAR", "parent_value", 1);
    setenv("SHARED_VAR", "original_value", 1);
    
    printf("在父进程中设置环境变量后:\n");
    printf("PARENT_VAR=%s\n", getenv("PARENT_VAR"));
    printf("SHARED_VAR=%s\n", getenv("SHARED_VAR"));
    printf("\n");
    
    // 3. 再次打印父进程环境变量
    print_environment("父进程设置变量后环境变量");
    
    pid_t pid = fork();
    if (pid == 0) {
        // 子进程
        printf("子进程开始执行...\n");
        
        // 4. 打印子进程继承的环境变量
        print_environment("子进程继承的环境变量");
        
        printf("子进程中读取环境变量:\n");
        printf("PARENT_VAR=%s\n", getenv("PARENT_VAR"));
        printf("SHARED_VAR=%s\n", getenv("SHARED_VAR"));
        printf("\n");
        
        // 5. 在子进程中修改环境变量
        setenv("CHILD_VAR", "child_value", 1);
        setenv("SHARED_VAR", "modified_by_child", 1);
        
        printf("子进程修改环境变量后:\n");
        printf("PARENT_VAR=%s\n", getenv("PARENT_VAR"));
        printf("SHARED_VAR=%s\n", getenv("SHARED_VAR"));
        printf("CHILD_VAR=%s\n", getenv("CHILD_VAR"));
        printf("\n");
        
        // 6. 使用execvpe执行env命令,显示最终环境变量
        char *argv[] = {"env", NULL};
        char *envp[] = {
            "CUSTOM_VAR=custom_value",
            "PATH=/usr/bin:/bin",
            "TERM=xterm",
            NULL
        };
        
        printf("使用execvpe执行env命令...\n");
        execvpe("env", argv, envp);
        
        // 如果execvpe失败
        perror("execvpe failed");
        exit(1);
        
    } else if (pid > 0) {
        // 父进程
        wait(NULL); // 等待子进程结束
        
        printf("\n父进程在子进程结束后:\n");
        printf("PARENT_VAR=%s\n", getenv("PARENT_VAR"));
        printf("SHARED_VAR=%s\n", getenv("SHARED_VAR"));
        
        // 检查CHILD_VAR是否存在
        char *child_var = getenv("CHILD_VAR");
        printf("CHILD_VAR=%s\n", child_var ? child_var : "(null)");
        
        printf("\n验证:子进程的环境修改不影响父进程\n");
    } else {
        perror("fork failed");
        return 1;
    }
    
    return 0;
}

结果:

https://i-blog.csdnimg.cn/direct/8798984f691840289b7c208596b17276.png

配置后,我们能在环境变量找到它吗?能

https://i-blog.csdnimg.cn/direct/97053e35b3fe4081b28c5e239f121e6e.png

父进程修改后子进程会继承吗?答案是会!!!

https://i-blog.csdnimg.cn/direct/98c628a9d7124f849f5c4fa74e28afd4.png

子进程环境变量的改变会影响父进程吗?不会!!!

https://i-blog.csdnimg.cn/direct/5e537f962811456bbde17a5b265137ae.png

当我们进行程序替换的时候,子进程的环境变量是从父进程继承过来的,父进程的换将变量是从哪里来的呢?是从shell来的