【Linux】1w详解如何实现一个简单的shell
目录
4.lastcode = WEXITSTATUS(status);
实现思路
1. 交互 获取命令行
显示提示符和获取用户输入
Shell本质是一个死循环,不断地显示提示符和获取用户输入。
memset 函数
memset 函数用于将一段内存区域设置为指定的值。它的原型是:
void *memset(void *s, int c, size_t n);参数说明:
s:指向要填充的内存区域的指针。
c:要设置的值(以无符号字符形式传递,但实际存储在内存中的每个字节的值是该无符号字符的值)。
n:要设置的字节数。
示例用法:
这里的代码表示将 command_line 数组的每个字节都设置为 \0(空字符),确保初始化整个数组。
fgets 函数
fgets 函数用于从指定的输入流读取字符串。它的原型是:
char *fgets(char *s, int n, FILE *stream);参数说明:
n:要读取的最大字符数(包括终止字符 \0)。
stream:输入流,通常是 stdin 用于标准输入。
示例用法:
fgets(command_line, NUM, stdin);这行代码表示从标准输入读取最多 NUM-1 个字符(预留一个字符用于终止字符 \0)到 command_line 数组中。
综合示例
结合起来,代码片段如下所示:
这段代码的作用是:
使用 memset 函数将 command_line 数组的所有字节都设置为 \0,即初始化数组。
使用 fgets 函数从标准输入读取最多 NUM-1 个字符并存储在 command_line 数组中。
这样处理后,command_line 数组会包含从输入读取的字符串,并且如果字符串的长度小于 NUM,数组中剩余的字节会保持为 \0。
以下是实现这两个步骤的代码:
注意点:
执行发现有空行怎么办
我们利用 fgets 函数从键盘上获取,标准输入 stdin,获取到 C 风格的字符串,
注意默认会添加 \0 ,我们先把获取到的结果 command_line 打印出来看看:
因为 command_line 里有一个 \n,我们把它替换成 \0 即可:
command_line[strlen(command_line) - 1] = \0; // 消除 \0
2. 子串分割 解析命令行
获取用户输入后,我们需要将接收到的字符串拆分为命令及其参数。
将接收到的字符串拆开
通过 strtok 函数,我们可以将一个字符串按照特定的分隔符打散,依次返回子串:
通过这段代码,我们可以将输入的命令行字符串拆分成多个子字符串,并打印出来。
strtok 函数的原型为:
char *strtok(char *str, const char *delim);参数说明:
str:要进行分割的字符串,第一次调用时传入要分割的字符串,后续调用时传入 NULL 即可。
delim:分隔符,用于指定分割字符串的字符。
示例用法
在代码中,使用了 strtok 函数将 command_line 字符串按照 SEP 分隔符进行切割,并将每个子字符串存储在 command_args 数组中。
这里的代码首先将 command_line 字符串按照 SEP 分隔符切割成子字符串,并将第一个子字符串的指针存储在 command_args[0] 中。然后,
利用循环逐个获取剩余的子字符串,并将它们存储在 command_args 数组中(使用 idx 来索引)。
3. 指令的判断 内建命令
为了实现一些特定功能,如路径切换,我们需要在Shell中实现内建命令。
内建命令:实现路径切换
这段代码通过判断输入的命令是否为 cd 来执行路径切换,而无需创建子进程。
getcwd用于获取当前工作目录(当前目录)的路径。该函数的声明如下:
char *getcwd(char *buf, size_t size);
函数参数说明:
buf:指向存储当前工作目录路径的缓冲区size:缓冲区的大小函数返回值: 如果函数调用成功,则返回指向存储当前工作目录路径的缓冲区的指针;如果函数调用失败,则返回NULL。
通过调用getcwd函数,可以获取当前程序所在的工作目录路径。
chdir用于改变当前工作目录(当前目录)的路径。该函数的声明如下:
int chdir(const char *path);
函数参数说明:
path:要设置为当前工作目录的路径函数返回值: 如果函数调用成功,则返回0;如果函数调用失败,则返回-1,并设置errno来指示错误的类型。
4. 普通命令的执行
最后,我们实现普通命令的执行,包括创建子进程并执行用户输入的命令。
通过上述代码,我们可以创建一个进程来执行用户输入的命令,并等待子进程结束。
给命令带颜色
为了增强Shell的用户体验,可以给一些常用命令添加颜色,例如 ls 命令:
以上实现了一个简单的Shell,具备了基本的提示符显示、用户输入获取、命令解析、内建命令和普通命令的执行功能。
内建命令 环境变量
保存环境变量的字符串,不能是易变的,所以 strcpy mycommand,实现与argv的分离
补充:vim 文本替换
如何快速将mycmd换为myshell呢
通过如下操作
: %s/mycmd/myshell/g
就可以啦
细节设置的思考,在最后一部分,让我们先来看一下整体
整体代码
重点思考
1.getenv和putenv是什么意思
getenv函数用于获取指定环境变量的值。它的函数定义如下:
char *getenv(const char *name);参数:
name:要获取的环境变量的名称。
返回值:
如果指定的环境变量存在,那么返回一个指向该环境变量值的指针。
如果指定的环境变量不存在,则返回NULL。
以下是一个使用getenv函数的示例:
成功实现对环境变量的调用啦
putenv函数
int putenv(char *string);参数:
string:形式为"name=value"的字符串,用于设置具体的环境变量及其值。
返回值:
成功时返回0。
失败时返回非零值。
以下是一个使用putenv函数的示例:
注意事项
内存管理:
getenv返回的指针指向的是环境变量的值,不能直接修改此值,否则可能导致未定义行为。
putenv函数参数所指向的字符串在函数调用后仍需存在,因为putenv不会复制这个字符串。因此传递给putenv的字符串应始终位于可修改的全局或堆内存中,而不是局部变量中。
线程安全性:
getenv和putenv函数在某些实现中不是线程安全的,特别是当修改同一个环境变量时。建议在多线程环境中使用setenv和unsetenv函数,它们是现代C库中提供的线程安全的替代函数。
总结
getenv和putenv是C语言中用于获取和设置环境变量的基本函数。通过了解并正确使用它们,可以更好地管理进程环境。
2.代码extern char **environ;
extern char **environ; 是C语言中的全局变量声明,用于访问当前进程的环境变量。为了理解这一行代码,我们需要理清以下几个关键概念:
在Unix和类Unix操作系统(如linux)中,环境变量是一组键值对(例如PATH=/usr/bin),用于向进程传递配置信息。每个环境变量项以字符串的形式存储在一个全局变量数组中。这个数组在进程启动时由操作系统初始化,并且每个程序都可以访问和修改它。
环境变量在内存中的表示
在内存中,环境变量通常表示为一个字符串数组,每个字符串保存一个环境变量。例如:
这些字符串指针存储在一个全局变量数组中,即char **environ。
extern关键字
extern关键字用于声明一个全局变量,但不定义它。它告诉编译器这个变量是在别处(比如另一个源文件或由操作系统提供)定义的。因此,extern char **environ; 仅仅是一个声明,用来告知编译器这个变量在别处已经定义过,可以在当前文件中使用它。
为什么这样写?
在标准C库中,environ变量实际上在系统库中已经定义,我们只需要在我们的程序中声明一下即可使用。这种方式使我们能够访问和操作环境变量。
这里是extern char **environ;的具体含义:
声明:它声明了一个外部变量environ,是一个指向字符指针的指针。
外部定义:实际的环境变量数组由操作系统初始化,并定义在某个系统库中。
全局访问:通过这个声明,我们可以在任何源文件中访问和操作环境变量。
示例
下面是一个具体的例子,展示了如何使用environ来访问并打印所有环境变量:
就可以成功调用所有环境变量啦
总结
extern char **environ; 这一行代码的作用是声明一个指针数组,用于访问当前进程的环境变量。通过这种方式,我们可以在C程序中方便地读取和操作环境变量。
3.内建命令是什么
内建命令是指直接内置在操作系统内核中的一些命令,与普通的外部命令(外部程序文件)不同。这些内建命令是直接由shell解释器(如Bash、Zsh等)所处理,而不需要通过外部文件的方式来执行。这些内建命令通常在操作系统的shell环境中被频繁使用,并且执行速度更快,因为它们不需要创建新的进程来执行。
在Unix和类Unix操作系统中,通常会有一些内建命令,比如cd、echo、exit等。这些命令不需要单独的可执行文件,而是直接由shell内核提供支持。当用户在shell中输入这些命令时,shell会直接处理它们,而不需要通过搜索系统路径来找到可执行文件。
值得一提的是,某些shell也允许用户通过自定义的方式添加新的内建命令,这样用户可以根据自己的需求来扩展shell的内建功能。
4.lastcode = WEXITSTATUS(status);
在C语言中,WEXITSTATUS(status) 是一个宏,用于从wait或waitpid返回的状态信息中提取子进程的退出状态。这个宏主要用于处理子进程的退出状态信息。
具体来说,WEXITSTATUS(status) 用于提取子进程在终止时传递给exit或_exit函数的退出状态。这个宏将状态信息进行适当的位操作,以获取子进程的退出状态值。
一般情况下,status 是由wait或waitpid函数返回的子进程状态,其中包含了有关子进程终止的信息,包括退出状态。通过使用WEXITSTATUS(status),可以将状态转换为子进程的退出状态,以便于后续处理和判断子进程的终止情况。
具体的用法示例如下:
在这个例子中,WEXITSTATUS(status) 会从 status 中提取子进程的退出状态,并将其赋值给 lastcode。然后这个退出状态可以被用来进行一些处理,比如根据不同的退出状态进行不同的操作。
需要注意的是,使用 WEXITSTATUS(status) 的前提是要确保传入的 status 参数是一个子进程终止的状态,因为该宏只能提取终止进程的退出状态信息。
5.execvp(_argv[0], _argv);的调用
在代码中,execvp(_argv[0], _argv) 是一个执行函数 execvp 的调用,用于执行磁盘文件上的程序。这个函数会用指定的程序文件(由 _argv[0] 指定)来覆盖当前进程的镜像,并且用 _argv 数组中的参数替换掉原来的程序参数。
相对路径执行指令
路径搜索:根据 PATH 环境变量,execvp 会在指定路径中查找可执行文件。内存映射:找到可执行文件后,将其映射到当前进程地址空间。替换镜像:用新程序的数据、堆栈、代码段替换当前进程的相应部分。执行:新程序从其入口点开始执行,覆盖原进程的代码。下面是对 execvp 函数调用的解释:
_argv[0] 表示要执行的程序文件的路径或名称。如果是一个程序的名称而没有路径,execvp 会在 $PATH 环境变量指定的路径中搜索这个程序。_argv 是一个以空指针结尾的字符串数组,用于传递给新程序的命令行参数。数组的第一个元素(_argv[0])通常是被执行的程序的名称,随后的元素是程序的参数。当调用 execvp 时,操作系统会加载并执行指定的程序文件,并用 _argv 数组中的参数来替换当前进程的参数。(因为默认会在PATH中查询,就和系统连接上了)如果 execvp 调用成功,则当前进程的镜像将被新程序替换,并且新程序开始执行。原来的程序代码和数据都会被新程序的代码和数据取代。如果 execvp 调用失败,它会返回-1,并且当前进程的状态不会改变。在简单的C代码中,execvp 函数通常与 fork 函数一起使用,例如:
需要注意的是,execvp 在执行成功后,原进程的代码和数据将会被新进程替换。这就意味着,如果 execvp 后面还有代码,那么这些代码将不会被执行,因为当前的程序已经不再存在。
实现shell, 一行一行的运行,先判断是否为内建命令
6._argc&_argv
_argv:是一个字符指针数组,用于存储命令和参数。_argc:是整型变量,用于存储命令和参数的数量。splitstring 函数将命令行字符串分割成多个子字符串,存储在 _argv 中,并返回子字符串的数量 _argc。NormalExcute 函数使用 _argv 数组创建子进程并执行命令。buildCommand 函数使用 _argv 和 _argc 处理内建命令。Ongwu博客 版权声明:以上内容未经允许不得转载!授权事宜或对内容有异议或投诉,请联系站长,将尽快回复您,谢谢合作!