国内最全IT社区平台 联系我们 | 收藏本站
华晨云阿里云优惠2
您当前位置:首页 > php框架 > 框架设计 > Linux下1号进程的前世(kernel_init)今生(init进程)----Linux进程的管理与调度(六)

Linux下1号进程的前世(kernel_init)今生(init进程)----Linux进程的管理与调度(六)

来源:程序员人生   发布时间:2016-06-25 08:42:39 阅读次数:8417次
日期 内核版本 架构 作者 GitHub CSDN
2016-05⑵9 Linux⑷.5 X86 & arm gatieme LinuxDeviceDrivers Linux进程管理与调度-之-进程的创建

前言


Linux下有3个特殊的进程,idle进程(PID=0), init进程(PID=1)和kthreadd(PID=2)


* idle进程由系统自动创建, 运行在内核态

idle进程其pid=0,其前身是系统创建的第1个进程,也是唯逐一个没有通过fork或kernel_thread产生的进程。完成加载系统后,演化为进程调度、交换


* init进程由idle通过kernel_thread创建,在内核空间完成初始化后, 加载init程序, 并终究用户空间

由0进程创建,完成系统的初始化. 是系统中所有其它用户进程的先人进程
Linux中的所有进程都是有init进程创建并运行的。首先Linux内核启动,然后在用户空间中启动init进程,再启动其他系统进程。在系统启动完成完成后,init将变成守护进程监视系统其他进程。


* kthreadd进程由idle通过kernel_thread创建,并始终运行在内核空间, 负责所有内核线程的调度和管理

它的任务就是管理和调度其他内核线程kernel_thread, 会循环履行1个kthread的函数,该函数的作用就是运行kthread_create_list全局链表中保护的kthread, 当我们调用kernel_thread创建的内核线程会被加入到此链表中,因此所有的内核线程都是直接或间接的以kthreadd为父进程

我们下面就详解分析1号进程的前世(kernel_init)今生(init进程)

Linux系统中的init进程(pid=1)是除idle进程(pid=0,也就是init_task)以外另外一个比较特殊的进程,它是Linux内核开始建立起进程概念时第1个通过kernel_thread产生的进程,其开始在内核态履行,然后通过1个系统调用,开始履行用户空间的/sbin/init程序,期间Linux内核也经历了从内核态到用户态的特权级转变,/sbin/init极有可能产生出了shell,然后所有的用户进程都有该进程派生出来

1号进程


前面我们了解到了0号进程是系统所有进程的先祖, 它的进程描写符init_task是内核静态创建的, 而它在进行初始化的时候, 通过kernel_thread的方式创建了两个内核线程,分别是kernel_init和kthreadd,其中kernel_init进程号为1

start_kernel在其最后1个函数rest_init的调用中,会通过kernel_thread来生成1个内核进程,后者则会在新进程环境下调 用kernel_init函数,kernel_init1个让人感兴趣的地方在于它会调用run_init_process来履行根文件系统下的 /sbin/init等程序:

kernel_init


0号进程创建1号进程的方式以下

kernel_thread(kernel_init, NULL, CLONE_FS);

我们发现1号进程的履行函数就是kernel_init, 这个函数被定义init/main.c中,以下所示

kernel_init函数将完成装备驱动程序的初始化,并调用init_post函数启动用户空间的init进程。

由0号进程创建1号进程(内核态),1号内核线程负责履行内核的部份初始化工作及进行系统配置,并创建若干个用于高速缓存和虚拟主存管理的内核线程。

init进程


随后,1号进程调用do_execve运行可履行程序init,并演化成用户态1号进程,即init进程。

init进程是linux内核启动的第1个用户级进程。init有许多很重要的任务,比如像启动getty(用于用户登录)、实现运行级别、和处理孤立进程。

它依照配置文件/etc/initab的要求,完成系统启开工作,创建编号为1号、2号…的若干终端注册进程getty。

每一个getty进程设置其进程组标识号,并监视配置到系统终真个接口线路。当检测到来自终真个连接信号时,getty进程将通过函数do_execve()履行注册程序login,此时用户便可输入注册名和密码进入登录进程,如果成功,由login程序再通过函数execv()履行shell,该shell进程接收getty进程的pid,取代原来的getty进程。再由shell直接或间接地产生其他进程。

上述进程可描写为:0号进程->1号内核进程->1号用户进程(init进程)->getty进程->shell进程

注意,上述进程描写中提到:1号内核进程调用履行init函数并演化成1号用户态进程(init进程),这里前者是init是函数,后者是进程。二者容易混淆,区分以下:

  1. kernel_init函数在内核态运行,是内核代码

  2. init进程是内核启动并运行的第1个用户进程,运行在用户态下。

  3. 1号内核进程调用execve()从文件/etc/inittab中加载可履行程序init并履行,这个进程并没有使用调用do_fork(),因此两个进程都是1号进程。

当内核启动了自己以后(已被装入内存、已开始运行、已初始化了所有的装备驱动程序和数据结构等等),通过启动用户级程序init来完成引导进程的内核部份。因此,init总是第1个进程(它的进程号总是1)。

当init开始运行,它通过履行1些管理任务来结束引导进程,例如检查文件系统、清算/tmp、启动各种服务和为每一个终端和虚拟控制台启动getty,在这些地方用户将登录系统。

在系统完全起来以后,init为每一个用户已退出的终端重启getty(这样下1个用户就能够登录)。init一样也搜集孤立的进程:当1个进程启动了1个子进程并且在子进程之前终止了,这个子进程立刻成为init的子进程。对各种技术方面的缘由来讲这是很重要的,知道这些也是有好处的,由于这便于理解进程列表和进程树图。init的变种很少。绝大多数Linux发行版本使用sysinit(由Miguel van Smoorenburg著),它是基于System V的init设计。UNIX的BSD版本有1个不同的init。最主要的不同在于运行级别:System V有而BSD没有(最少是传统上说)。这类区分其实不是主要的。在此我们仅讨论sysvinit。 配置init以启动getty:/etc/inittab文件

关于init程序


1号进程通过execve履行init程序来进入用户空间,成为init进程,那末这个init在哪里呢

内核在几个位置上来查寻init,这几个位置之前经常使用来放置init,但是init的最适当的位置(在Linux系统上)是/sbin/init。如果内核没有找到init,它就会试着运行/bin/sh,如果还是失败了,那末系统的启动就宣布失败了。

因此init程序是1个可以又用户编写的进程, 如果希望看init程序源码的朋友,可以参见

init包 说明 学习链接
sysvinit 初期1些版本使用的初始化进程工具, 目前在逐步淡出linux历史舞台, sysvinit 就是 system V 风格的 init 系统,顾名思义,它源于 System V 系列 UNIX。它提供了比 BSD 风格 init 系统更高的灵活性。是已盛行了几10年的 UNIX init 系统,1直被各类 Linux 发行版所采取。 浅析 Linux 初始化 init 系统(1):sysvinit
upstart debian, Ubuntu等系统使用的initdaemon 浅析 Linux 初始化 init 系统(2): UpStart
systemd Systemd 是 Linux 系统中最新的初始化系统(init),它主要的设计目标是克服 sysvinit 固有的缺点,提高系统的启动速度 浅析 Linux 初始化 init 系统(3) Systemd

Ubuntu等使用deb包的系统可以通过dpkg -S查看程序所在的包

这里写图片描述

CentOS等使用rpm包的系统可以通过rpm -qf查看系统程序所在的包

旧版CentOS

新版CentOS

参见

Linux下查看并下载命令源码包(根据命令/利用程序逆向获得并且安装其所属源码包)

附录


kernel_init_freeable流程分析


static noinline void __init kernel_init_freeable(void) { /* * Wait until kthreadd is all set-up. */ wait_for_completion(&kthreadd_done); /* Now the scheduler is fully set up and can do blocking allocations */ gfp_allowed_mask = __GFP_BITS_MASK; /* * init can allocate pages on any node */ set_mems_allowed(node_states[N_MEMORY]); /* * init can run on any cpu. */ set_cpus_allowed_ptr(current, cpu_all_mask); cad_pid = task_pid(current); smp_prepare_cpus(setup_max_cpus); do_pre_smp_initcalls(); lockup_detector_init(); smp_init(); sched_init_smp(); page_alloc_init_late(); do_basic_setup(); /* Open the /dev/console on the rootfs, this should never fail */ if (sys_open((const char __user *) "/dev/console", O_RDWR, 0) < 0) pr_err("Warning: unable to open an initial console.\n"); (void) sys_dup(0); (void) sys_dup(0); /* * check if there is an early userspace init. If yes, let it do all * the work */ if (!ramdisk_execute_command) ramdisk_execute_command = "/init"; if (sys_access((const char __user *) ramdisk_execute_command, 0) != 0) { ramdisk_execute_command = NULL; prepare_namespace(); } /* * Ok, we have completed the initial bootup, and * we're essentially up and running. Get rid of the * initmem segments and start the user-mode stuff.. * * rootfs is available now, try loading the public keys * and default modules */ integrity_load_keys(); load_default_modules(); }
履行流程 说明
wait_for_completion 实例在kernel/sched/completion.c中, 等待Kernel Thread kthreadd (PID=2)创建终了
gfp_allowed_mask __GFP_BITS_MASK;设置bitmask, 使得init进程可使用PM并且允许I/O阻塞操作
set_mems_allowed(node_states[N_MEMORY]); init进程可以分配物理页面
set_cpus_allowed_ptr 通过设置cpu_bit_mask, 可以限定task只能在特定的处理器上运行, 而initcurrent进程此时必定是init进程,设置其cpu_all_mask即便得init进程可以在任意的cpu上运行
task_pid 设置到目前运行进程init的pid号给cad_pid(cad_pid是用来接收ctrl-alt-del reboot signal的进程, 如果设置C_A_D=1就表示可以处理来自ctl-alt-del的动作), 最后会调用 ctrl_alt_del(void)并确认C_A_D是不是为1,确认完成后将履行cad_work=deferred_cad,履行kernel_restart
smp_prepare_cpus 体系结构相干的函数,实例在arch/arm/kernel/smp.c中,调用smp_prepare_cpus时,会以全局变量setup_max_cpus为函式参数max_cpus,以表示在编译核心时,设定支援的最大CPU数量
do_pre_smp_initcalls 实例在init/main.c中, 会透过函式do_one_initcall,履行Symbol中 __initcall_start与__early_initcall_end之间的函数
smp_init 实例在kernel/smp.c中, 函数主要是由Bootstrap处理器,进行Active多核心架构下其它的处理器. 如果产生Online的处理器个数(from num_online_cpus)超过在核心编译时,所设定的最大处理器个数 setup_max_cpus (from NR_CPUS),就会终止流程.如果该处理器目前属於Present (也就是存在系统中),但还没有是Online的状态,就会呼唤函式cpu_up(in kernel/cpu.c)来啟动该处理器.
sched_init_smp 实例在kernel/sched.c中, (1), 呼唤get_online_cpus,如果目前CPU Hotplug Active Write行程是自己,就直接返回.反之就把 cpu_hotplug.refcount加1 (表示多1个Reader)
(2),获得Mutex Lock “sched_domains_mutex”
(3),呼唤arch_init_sched_domains,设定scheduler domains与groups,参考Linux Documentation/scheduler/sched-domains.txt文件,1个Scheduling Domain会包括1个或多个CPU Groups,排程的Load-Balance就会根据Domain中的Groups来做调剂.
(4),释放Mutex Lock “sched_domains_mutex”
(5),呼唤put_online_cpus,如果目前CPU Hotplug Active Writer行程是自己,就直接返回.反之就把 cpu_hotplug.refcount减1,如果 cpu_hotplug.refcount减到為0,表示没有其他Reader,此时如果有CPU Hotplug Active Writer行程在等待,就会透过wake_up_process唤醒该行程,以便让等待中的Writer可以被履行下去.(也能够参考_cpu_up中对於函式cpu_hotplug_begin的说明).
(6)注册CPU Notifier cpuset_cpu_active/cpuset_cpu_inactive/update_runtime
(7),呼唤set_cpus_allowed_ptr,透过这函式可以设定CPU bitmask,限定Task只能在特定的处理器上运作.在这会用参数”non_isolated_cpus”,也就是会把init指定给non-isolated CPU. Linux Kernel可以在啟动时,透过Boot Parameters “isolcpus=“指定CPU编号或是范围,让这些处理器不被包括在Linux Kernel SMP balancing/scheduling算法内,可以在啟动后指派给特定的Task运作.而不在 “isolcpus=“ 指定范围内的处理器就算是non-isolated CPU.
(8),呼唤sched_init_granularity,透过函式update_sysctl,让sysctl_sched_min_granularity=normalized_sysctl_sched_min_granularity,sysctl_sched_latency=normalized_sysctl_sched_latency,sysctl_sched_wakeup_granularity=normalized_sysctl_sched_wakeup_granularit
do_basic_setup 实例在init/main.c中,
1,diaousermodehelper_init (in kernel/kmod.c),产生khelper workqueue.
2,调用init_tmpfs (in mm/shmem.c),对VFS注册Temp FileSystem.
3,呼唤driver_init (in drivers/base/init.c),初始化Linux Kernel Driver System Model.
4,呼唤init_irq_proc(in kernel/irq/proc.c),初始化 “/proc/irq”与其下的File Nodes.
5,呼唤do_ctors (in init/main.c),履行位於Symbol __ctors_start 到 __ctors_end间属於Section “.ctors” 的Constructor函式.
6,透过函式do_initcalls,履行介於Symbol __early_initcall_end与__initcall_end之间的函式呼唤,
sys_open 实例在fs/fcntl.c中,”SYSCALL_DEFINE1(dup, unsigned int, fildes)”,在这会连续履行两次sys_dup,复制两个sys_open开啟/dev/console所產生的档案描写0 (也就是会多生出两个1与2),只是都对应到”/dev/console”,我们在System V streams下的Standard Stream1般而言会有以下的对应
0:Standard input (stdin)
1:Standard output (stdout)
2:Standard error (stderr)
(為方便大家参考,附上Wiki URL http://en.wikipedia.org/wiki/Standard_streams )
ramdisk_execute_command与prepare_namespace 1,如果ramdisk_execute_command為0,就设定ramdisk_execute_command = “/init”
2,如果sys_access确认档案ramdisk_execute_command 失败,就把ramdisk_execute_command 设定為0,然后呼唤prepare_namespace去mount root FileSystem.
integrity_load_keys 至此我们初始化工作完成, 文件系统也已准备好了,那末接下来加载 load integrity keys hook
load_default_modules 加载基本的模块

kernel_init分析


static int __ref kernel_init(void *unused) { int ret; kernel_init_freeable(); /* need to finish all async __init code before freeing the memory */ async_synchronize_full(); free_initmem(); mark_rodata_ro(); system_state = SYSTEM_RUNNING; numa_default_policy(); flush_delayed_fput(); rcu_end_inkernel_boot(); if (ramdisk_execute_command) { ret = run_init_process(ramdisk_execute_command); if (!ret) return 0; pr_err("Failed to execute %s (error %d)\n", ramdisk_execute_command, ret); } /* * We try each of these until one succeeds. * * The Bourne shell can be used instead of init if we are * trying to recover a really broken machine. */ if (execute_command) { ret = run_init_process(execute_command); if (!ret) return 0; panic("Requested init %s failed (error %d).", execute_command, ret); } if (!try_to_run_init_process("/sbin/init") || !try_to_run_init_process("/etc/init") || !try_to_run_init_process("/bin/init") || !try_to_run_init_process("/bin/sh")) return 0; panic("No working init found. Try passing init= option to kernel. " "See Linux Documentation/init.txt for guidance."); }
履行流程 说明
kernel_init_freeable 调用kernel_init_freeable完成初始化工作,准备文件系统,准备模块信息
async_synchronize_full 用以同步所有非同步函式呼唤的履行,在这函数中会等待List async_running与async_pending都清空后,才会返回. Asynchronously called functions主要设计用来加速Linux Kernel开机的效力,避免在开机流程中等待硬体反应延迟,影响到开机完成的时间
free_initmem free_initmem(in arch/arm/mm/init.c),释放Linux Kernel介於__init_begin到 __init_end属于init Section的函数的所有内存.并会把Page个数加到变量totalram_pages中,作为后续Linux Kernel在配置记忆体时可使用的Pages. (在这也可把TCM范围(__tcm_start到__tcm_end)释放加入到总Page中,但TCM比外部记忆体有效力,合适多媒体,中断,…etc等对效能要求高的履行需求,放到总Page中,成为可供1般目的配置的存储范围
system_state 设置运行状态SYSTEM_RUNNING
加载init进程,进入用户空间 a,如果ramdisk_execute_command不為0,就履行该命令成為init User Process.
b,如果execute_command不為0,就履行该命令成為init User Process.
c,如果上述都不成立,就依序執行以下指令
run_init_process(“/sbin/init”);
run_init_process(“/etc/init”);
run_init_process(“/bin/init”);
run_init_process(“/bin/sh”);
也就是说会依照顺序从/sbin/init, /etc/init, /bin/init 與 /bin/sh依序履行第1个 init User Process.
如果都找不到可以執行的 init Process,就會進入Kernel Panic.以下所示panic(“No init found. Try passing init= option to kernel. ”“See Linux Documentation/init.txt for guidance.”);
生活不易,码农辛苦
如果您觉得本网站对您的学习有所帮助,可以手机扫描二维码进行捐赠
程序员人生
------分隔线----------------------------
分享到:
------分隔线----------------------------
关闭
程序员人生