当前位置: 首页 > news >正文

Linux调度(三)——抢占式调度

目录

抢占式场景一:

抢占式场景二

抢占的时机

用户态的抢占时机

抢占式机一:

抢占时机二: 

内核态的抢占时机

时机一

时机二

总结


之前讲了主动式调度,就是进程运行到一半,因为等待I/O等操作而主动让出CPU,然后就进入了我们的“进程调度第一定律”。所有进程的调用最终都会走__schedule函数。本篇文章主要讲解的是第二种调度方式——抢占式调度。

抢占式场景一:

抢占式调度发生的场景:一个进程执行时间太长了,是时候切换到另一个进程了。

那怎么衡量一个进程的运行时间呢?在计算机里面有一个时钟,会过一段时间触发一次时钟中断,通知操作系统,时间又过去一个时钟周期,这是个很好的方式,可以查看是否是需要抢占的时间点。

时间中断处理函数会调用scheduler_tick(),它的代码如下:

void scheduler_tick(void)
{
    int cpu = smp_processor_id();
    struct rq *rq = cpu_rq(cpu);
    struct task_struct *curr = rq->curr;
......
    curr->sched_class->task_tick(rq, curr, 0);
    cpu_load_update_active(rq);
    calc_global_load_tick(rq);
......
}

这个函数先取出当然cpu的运行队列,然后得到这个队列上当前正在运行中的进程的 task_struct,然后调用这个task_struct的调度类的task_tick函数,顾名思义这个函数就是来处理时钟事件的。

如果当前运行的进程是普通进程,调度类为fair_sched_class,调用的处理时钟的函数为 task_tick_fair,实现如下:

static void task_tick_fair(struct rq *rq, struct task_struct *curr, int queued)
{
    struct cfs_rq *cfs_rq;
    struct sched_entity *se = &curr->se;//当前运行对应的对象实体
    for_each_sched_entity(se) {
        cfs_rq = cfs_rq_of(se);//队列
        entity_tick(cfs_rq, se, queued);
    }
......
}

根据当前进程的task_struct,找到对应的调度实体sched_entity和cfs_rq队列,调用 entity_tick。

entity_tick的实现如下:

static void
entity_tick(struct cfs_rq *cfs_rq, struct sched_entity *curr, int queued)
{
    update_curr(cfs_rq);
    update_load_avg(curr, UPDATE_TG);
    update_cfs_shares(curr);
.....
    if (cfs_rq->nr_running > 1)
    check_preempt_tick(cfs_rq, curr);
}

在entity_tick里面,有熟悉的update_curr。它会更新当前进程的vruntime,然后调用check_preempt_tick。顾名思义就是,检查是否是时候被抢占了。

check_preempt_tick实现如下:

static void
check_preempt_tick(struct cfs_rq *cfs_rq, struct sched_entity *curr)
{
    unsigned long ideal_runtime, delta_exec;
    struct sched_entity *se;
    s64 delta;
    ideal_runtime = sched_slice(cfs_rq, curr);
    delta_exec = curr->sum_exec_runtime - curr->prev_sum_exec_runtime;
    if (delta_exec > ideal_runtime) {
        resched_curr(rq_of(cfs_rq));
        return;
    }
......
    se = __pick_first_entity(cfs_rq);
    delta = curr->vruntime - se->vruntime;
    if (delta < 0)
        return;
    if (delta > ideal_runtime)
        resched_curr(rq_of(cfs_rq));
}

check_preempt_tick先是调用sched_slice函数计算出的ideal_runtime,他是一个调度周期中,这个进程应该运行的实际时间

sum_exec_runtime指进程总共执行的实际时间prev_sum_exec_runtime上次该进程被调度时已经占用的实际时间。每次在调度一个新的进程时都会把它的se->prev_sum_exec_runtime = se->sum_exec_runtime,所以sum_exec_runtime-prev_sum_exec_runtime就是这次调度占用实际时间。如果这个时间大于ideal_runtime,则应该被抢占了。

除了这个条件之外,还会通过__pick_first_entity取出红黑树中最小的进程。如果当前进程的 vruntime大于红黑树中最小的进程的vruntime,且差值大于ideal_runtime,也应该被抢占了。

当发现当前进程应该被抢占,不能直接把它踢下来,而是把它标记为应该被抢占。为什么呢?因 为进程调度第一定律呀,一定要等待正在运行的进程调用__schedule才行啊,所以这里只能先标 记一下。

标记一个进程应该被抢占,都是调用resched_curr,它会调用set_tsk_need_resched,标记进程应该被抢占,但是此时此刻,并不真的抢占,而是打上一个标签TIF_NEED_RESCHED。

set_tsk_need_resched实现如下:

static inline void set_tsk_need_resched(struct task_struct *tsk)
{
    set_tsk_thread_flag(tsk,TIF_NEED_RESCHED);
}

抢占式场景二

另外一个可能抢占的场景是当一个进程被唤醒的时候

我们前面说过,当一个进程在等待一个I/O的时候,会主动放弃CPU。但是当I/O到来的时候,进程往往会被唤醒。这个时候是一个时机。当被唤醒的进程优先级高于CPU上的当前进程,就会触发抢占。try_to_wake_up()调用ttwu_queue将这个唤醒的任务添加到队列当中ttwu_queue 再调用ttwu_do_activate激活这个任务ttwu_do_activate调用ttwu_do_wakeup。这里面调用了check_preempt_curr检查是否应该发生抢占。如果应该发生抢占,也不是直接踢走当然进程,而也是将当前进程标记为应该被抢占

static void ttwu_do_wakeup(struct rq *rq, struct task_struct *p, int wake_flags,
 struct rq_flags *rf)
{
    check_preempt_curr(rq, p, wake_flags);
    p->state = TASK_RUNNING;
    trace_sched_wakeup(p);

到这里,抢占问题只做完了一半。就是标识当前运行中的进程应该被抢占了,但是真正的抢占动作并没有发生。

抢占的时机

真正的抢占还需要时机,也就是需要那么一个时刻,让正在运行中的进程有机会调用一下 __schedule。 不可能某个进程代码运行着,突然要去调用__schedule,代码里面不可能这么写, 所以一定要规划几个时机,这个时机分为用户态和内核态。

用户态的抢占时机

抢占式机一:

对于用户态的进程来讲,从系统调用中返回的那个时刻,是一个被抢占的时机。 

64位的系统调用的链路位do_syscall_64->syscall_return_slowpath- >prepare_exit_to_usermode->exit_to_usermode_loop。其中exit_to_usermode_loop这个函数实现如下:

static void exit_to_usermode_loop(struct pt_regs *regs, u32 cached_flags)
{
    while (true) {
        /* We have work to do. */
    local_irq_enable();
    if (cached_flags & _TIF_NEED_RESCHED)
        schedule();
......
    }
}

exit_to_usermode_loop函数中,上面打的标记起了作用,如果被打了 _TIF_NEED_RESCHED,调用schedule进行调度,调用的过程和上一节解析的一样,会选择一个进程让出CPU,做上下文切换。

抢占时机二: 

从中断中返回的那个时刻,也是一个被抢占的时机。 

中断处理调用的是do_IRQ函数,中断完毕后分为两种情况,一个是返回用户态,一个是返回内核态。

 返回用户态这一部分retint_user会调用 prepare_exit_to_usermode,最终调用exit_to_usermode_loop,和上面的逻辑一样,发现有 标记则调用schedule()。

内核态的抢占时机

时机一

对内核态的执行中,被抢占的时机一般发生在在preempt_enable()中。 

在内核态的执行中,有的操作是不能被中断的,所以在进行这些操作之前,总是先调用 preempt_disable()关闭抢占当再次打开的时候,就是一次内核态代码被抢占的机会。

就像下面代码中展示的一样,preempt_enable()会调用preempt_count_dec_and_test(),判断 preempt_count和TIF_NEED_RESCHED看是否可以被抢占。如果可以,就调用 preempt_schedule->preempt_schedule_common->__schedule进行调度。还是满足进程调度第一定律的。

#define preempt_enable() \
do { \
    if (unlikely(preempt_count_dec_and_test())) \
        __preempt_schedule(); \
} while (0)

#define preempt_count_dec_and_test() \
    ({ preempt_count_sub(1); should_resched(0); })
static __always_inline bool should_resched(int preempt_offset)
{
    return unlikely(preempt_count() == preempt_offset &&
        tif_need_resched());
}
#define tif_need_resched() test_thread_flag(TIF_NEED_RESCHED)
static void __sched notrace preempt_schedule_common(void)
{
    do {
......
        __schedule(true);
......
    } while (need_resched())

时机二

在内核态也会遇到中断的情况,当中断返回的时候,返回的仍然是内核态。这个时候也是一个执 行抢占的时机,现在我们再来上面中断返回的代码中返回内核的那部分代码,调用的是 preempt_schedule_irq。

asmlinkage __visible void __sched preempt_schedule_irq(void)
{
......
    do {
        preempt_disable();
        local_irq_enable();
        __schedule(true);
        local_irq_disable();
        sched_preempt_enable_no_resched();
    } while (need_resched());
......
}

preempt_schedule_irq调用__schedule进行调度。还是满足进程调度第一定律的。

总结

相关文章:

  • vue2须知
  • SpringBoot基础之声明式事务和切面事务和编程式事务
  • Kernel:里的某某某;xxx
  • Android背景和音乐
  • Proxmox VE 修改集群名称
  • jsp 上传文件及实体信息,ajax post 请求(formdata)报错400<======>前后端代码示例
  • java swing(GUI) MySQL实现的飞机票预定系统源码带视频运行教程
  • Redis 事务
  • LeetCode刷题复盘笔记—一文搞懂纯完全背包问题(动态规划系列第十一篇)
  • python隶属关系图模型:基于模型的网络中密集重叠社区检测方法
  • 【C++】set/multiset/map/multimap
  • Nginx学习总结(目录)
  • 【pen200-lab】10.11.1.8
  • 文件操作及IO
  • 精品基于Javaweb的酒店民宿管理推荐平台SSM
  • [附源码]计算机毕业设计二次元信息分享平台的设计及实现
  • [附源码]Python计算机毕业设计Django勤工助学管理系统
  • Request和Response基础知识入门
  • Lottie 动画导出为 GIF/MP4 以及与 QML 集成演示
  • 前端问题解决方法
  • 测牛学堂:软件测试开发python学习之循环判断综合小案例
  • Vue3商店后台管理系统设计文稿篇(六)
  • Jupyter使用详解
  • 基于android的网络选课系统
  • Python数据可视化(二)使用统计函数绘制简单图形
  • nodejs+vue高校网上报名系统