留言板

尊敬的读者、作者、审稿人, 关于本刊的投稿、审稿、编辑和出版的任何问题, 您可以本页添加留言。我们将尽快给您答复。谢谢您的支持!

姓名
邮箱
手机号码
标题
留言内容
验证码

一种能耗约束的多核系统任务调度算法

谢盈 陈建英 吴尽昭 丁旭阳

谢盈, 陈建英, 吴尽昭, 丁旭阳. 一种能耗约束的多核系统任务调度算法[J]. 电子科技大学学报, 2019, 48(2): 247-252. doi: 10.3969/j.issn.1001-0548.2019.02.014
引用本文: 谢盈, 陈建英, 吴尽昭, 丁旭阳. 一种能耗约束的多核系统任务调度算法[J]. 电子科技大学学报, 2019, 48(2): 247-252. doi: 10.3969/j.issn.1001-0548.2019.02.014
XIE Ying, CHEN Jian-ying, WU Jin-zhao, DING Xu-yang. A Energy-Constraint Task Scheduling Algorithm on Multi-Processor System[J]. Journal of University of Electronic Science and Technology of China, 2019, 48(2): 247-252. doi: 10.3969/j.issn.1001-0548.2019.02.014
Citation: XIE Ying, CHEN Jian-ying, WU Jin-zhao, DING Xu-yang. A Energy-Constraint Task Scheduling Algorithm on Multi-Processor System[J]. Journal of University of Electronic Science and Technology of China, 2019, 48(2): 247-252. doi: 10.3969/j.issn.1001-0548.2019.02.014

一种能耗约束的多核系统任务调度算法

doi: 10.3969/j.issn.1001-0548.2019.02.014
基金项目: 

国家社科基金重大项目 17ZDA160

国家自然科学基金 11461006

国家自然科学基金 61772006

广西科技计划 AB17129012

广西科技重大专项 AA17204096

广西科技基地和人才专项 2016AD05050

详细信息
    作者简介:

    谢盈(1984-), 女, 博士生, 主要从事嵌入式系统与形式化方法的研究.E-mail:xieying33@163.com

  • 中图分类号: TP301

A Energy-Constraint Task Scheduling Algorithm on Multi-Processor System

图(6)
计量
  • 文章访问数:  5560
  • HTML全文浏览量:  1547
  • PDF下载量:  103
  • 被引次数: 0
出版历程
  • 收稿日期:  2017-12-29
  • 修回日期:  2018-06-19
  • 刊出日期:  2019-03-30

一种能耗约束的多核系统任务调度算法

doi: 10.3969/j.issn.1001-0548.2019.02.014
    基金项目:

    国家社科基金重大项目 17ZDA160

    国家自然科学基金 11461006

    国家自然科学基金 61772006

    广西科技计划 AB17129012

    广西科技重大专项 AA17204096

    广西科技基地和人才专项 2016AD05050

    作者简介:

    谢盈(1984-), 女, 博士生, 主要从事嵌入式系统与形式化方法的研究.E-mail:xieying33@163.com

  • 中图分类号: TP301

摘要: 不同的任务调度算法将任务分配在不同的处理单元,会产生不同的能耗。在基于片上网络的多核系统中,将任务分摊到所有处理器核能提高系统利用率,但导致大量的簇间通信,增加数据传输能耗。本文在对系统能耗进行建模的基础上,提出一种能耗约束的任务调度算法。该算法结合任务间依赖关系,动态计算任务分配时产生通信开销最小的簇和系统利用率最大的簇,通过计算在相应簇上产生的系统能耗,选择产生系统能耗小的分配方案以平衡系统利用率和簇间通信开销。仿真实验结果证明,算法在减少了簇间通信开销并提高系统利用率的同时,降低了系统能耗。

English Abstract

谢盈, 陈建英, 吴尽昭, 丁旭阳. 一种能耗约束的多核系统任务调度算法[J]. 电子科技大学学报, 2019, 48(2): 247-252. doi: 10.3969/j.issn.1001-0548.2019.02.014
引用本文: 谢盈, 陈建英, 吴尽昭, 丁旭阳. 一种能耗约束的多核系统任务调度算法[J]. 电子科技大学学报, 2019, 48(2): 247-252. doi: 10.3969/j.issn.1001-0548.2019.02.014
XIE Ying, CHEN Jian-ying, WU Jin-zhao, DING Xu-yang. A Energy-Constraint Task Scheduling Algorithm on Multi-Processor System[J]. Journal of University of Electronic Science and Technology of China, 2019, 48(2): 247-252. doi: 10.3969/j.issn.1001-0548.2019.02.014
Citation: XIE Ying, CHEN Jian-ying, WU Jin-zhao, DING Xu-yang. A Energy-Constraint Task Scheduling Algorithm on Multi-Processor System[J]. Journal of University of Electronic Science and Technology of China, 2019, 48(2): 247-252. doi: 10.3969/j.issn.1001-0548.2019.02.014
  • 随着片上处理单元数量不断增加,片上网络(network on chips, NoC)所占芯片面积的比例不断提高,在提供高扩展性、高带宽、低延迟等性能的同时限制了多核系统性能的进一步提高[1-2]。特别是针对通信密集型应用和在电池供电的设备中,NoC带来的能耗开销已成为系统能耗的重要组成部分。

    合适的任务调度算法能显著降低基于NoC的多核系统的整体能耗,并在一定程度上提高系统的利用率。在基于NoC的多核系统任务调度算法中,文献[3]提出了一种位置感知的实时任务调度算法,利用处理器核的物理位置将任务调度在相邻的处理器核中以降低核间的通信距离,从而达到节能的目的,但是该算法没有考虑在能耗约束下的系统利用率问题。文献[4]针对软实时任务提出了一种能耗约束的任务调度算法,利用动态电压/频率调节技术(dynamic voltage frequency scaling, DVFS)实现软实时任务的节能调度,但没有考虑数据在NoC延迟及传输过程中产生的能耗。文献[5]提出了一个多核处理器时间/事件触发通信系统模型,并将该模型映射为混合整数线性规划问题,用于将任务分配给处理单元。模型将任务间的依赖关系、片上路由间的有限连通性和系统能耗作为约束条件,在给定的多核架构上优化应用任务的计算和通信延迟。文献[6]提出一种非线性规划算法,为采用DVFS技术的多核系统提供一种连续频率模型,用于为每个任务分配最优的频率和通信链路以降低总能耗,但算法只关注独立任务,没有考虑依赖任务的分配。文献[7]结合动态功耗管理(dynamic power management, DPM)技术和DVFS技术,以系统能耗为约束对系统任务进行调度,该方法不基于任何先验知识,在任务到达后再获取任务具体属性,没有充分考虑任务间的依赖关系及系统利用率。

    本文针对基于NoC的多核系统提出一种能耗约束的任务调度算法ECTSA(energy-constraint task scheduling algorithm on NoC-based multi-processor system)。该算法在对系统能耗进行建模的基础上,结合任务间前驱后续关系,动态计算任务分配时产生通信开销最小的簇和系统利用率最大的簇,引入能耗作为约束因子,通过计算在相应簇上产生的系统能耗,选择产生系统能耗小的分配方案在通信开销最小化和系统利用率最大化间进行适应性选择。

    • 目标平台采用$M \times N \times C$的NoC结构。其中,路由器和链路构成的网络规模为$M \times N$,每个路由器通过网络接口连接一个含有p个处理单元的簇,$0 < p \le C$。一个$3 \times 3 \times 2$的NoC平台如图 1所示。

      图  1  $3 \times 3 \times 2$的NoC的平台示意图

      $M \times N \times C$的NoC目标平台可表示为:

      $$ {\rm{Cluster = }}\{ {\rm{Cl}}{{\rm{u}}^{\rm{1}}}{\rm{, Cl}}{{\rm{u}}^{\rm{2}}}{\rm{, }} \cdots {\rm{, Cl}}{{\rm{u}}^{M \times N}}\} $$

      式中,${\rm{Cl}}{{\rm{u}}^i} = ({S^i}, {\rm{ }}{P^i}{\rm{, }}{Q^i})$表示第i个簇,簇${\rm{Cl}}{{\rm{u}}^i}$的计算能力抽象为${S^i}$,${P^i} = \{ p_1^i, p_2^i, \cdots, p_{{c_i}}^i\} $表示簇${\rm{Cl}}{{\rm{u}}^i}$中的${c_i}$个处理单元集合,$p_j^i$表示簇${\rm{Cl}}{{\rm{u}}^i}$中的第j个处理单元,目标平台处理单元集合为$\bigcup\limits_{i = 1}^{M \times N} {\bigcup\limits_{j = 1}^{{c_i}} {p_j^i} } $,${Q^i} = \{ q_1^i, q_2^i, \cdots, q_{{c_i}}^i\} $是簇${\rm{Cl}}{{\rm{u}}^i}$中各处理单元对应的等待队列的集合,$q_j^i$表示处理单元$p_j^i$上排队等待执行的任务队列,$|q_j^i|$为队列长度。

    • 并行依赖任务集(parallel dependent tasks, PDT)由二元组${\rm{PDT}} = (T, E)$描述的DAG图表示。其中$T = \{ {T_0}, {T_1}, \cdots, {T_n}\} $表示任务节点集合,${T_0}$为虚拟起始节点;$E = \{ {e_{i, j}}|{T_i} \to {T_j}, i \le n, j \le n\} $是节点间的有约束关系的边集合,${e_{i, j}}$表示任务${T_i}$是任务${T_j}$的直接前驱,任务${T_j}$需要等待其所有前驱任务都运行结束后才能开始运行。${\rm{Calc}}({T_i})$表示任务${T_i}$的计算量,${\rm{Comm}}({e_{i, j}})$表示边${e_{i, j}}$上的通信数据量。${\rm{pred}}({T_i})$表示任务${T_i}$的直接前驱结点集。具有前驱后续关系的任务序列称为路径,路径的权重W定义为路径上所有任务节点的计算量和节点间边的通信数据量之和。关键路径${\rm{C}}{{\rm{P}}_{i, j}}$是任务节点${T_i}$到${T_i}$的所有路径中权重最大的路径。

    • $M \times N \times C$的NoC目标平台中,每个簇上采用独立的DVFS技术动态调节处理单元供电电压/时钟频率。大多数采用DVFS技术的处理器功耗近似表示为静态功耗和动态功耗之和:

      $$ {\rm{Power}} = {P_{{\rm{dynamic}}}} + {P_{{\rm{static}}}} $$ (1)

      式中,静态功耗由漏电电流造成,跟电路逻辑器件的出厂状态有关,是电路稳定状态下的功耗,可设为常量$\theta $。动态功耗是电路充放电引起的功耗,由电路的负载电容${C_L}$、供电电压V和时钟频率f决定[8]

      $$ {P_{{\rm{dynamic}}}} = {C_L}{V^2}f $$ (2)

      当前待调度任务${T_i}$被分配到簇${\rm{Cl}}{{\rm{u}}^k}$中产生的计算能耗$E_{i, k}^{({\rm{calc}})}$表示为:

      $$ \begin{array}{c} E_{i, k}^{({\rm{calc}})} = \int_{{\rm{ }}0}^{{\rm{ }}{t_i}} {P_{{\rm{dynamic}}}^{({\rm{Cl}}{{\rm{u}}^k})}{\rm{d}}{t_i}} + {\theta ^{({\rm{Cl}}{{\rm{u}}^k})}}{t_i} = \\ \int_{{\rm{ }}0}^{{\rm{ }}{t_i}} {(C_L^{({\rm{Cl}}{{\rm{u}}^k})}{V^{({\rm{Cl}}{{\rm{u}}^k})2}}{f^{({\rm{Cl}}{{\rm{u}}^k})}}){\rm{ d}}{t_i}} + {\theta ^{({\rm{Cl}}{{\rm{u}}^k})}}{t_i} \end{array} $$ (3)

      式中,${t_i} = {\rm{Calc}}({T_i})/{S^k}$是簇${\rm{Cl}}{{\rm{u}}^k}$处理单元$p_j^k$执行任务${T_i}$所需时间;$C_L^{({\rm{Cl}}{{\rm{u}}^k})}$,${V^{({\rm{Cl}}{{\rm{u}}^k})}}$,${f^{({\rm{Cl}}{{\rm{u}}^k})}}$是簇${\rm{Cl}}{{\rm{u}}^k}$处理单元的负载电容、供电电压和时钟频率。

      虫孔交换机制能大大降低了报文的传输延迟,是NoC中最常用的路由交换方法[9]。在虫孔机制中,一个微片flit从簇${\rm{Cl}}{{\rm{u}}^{k1}}$到簇${\rm{Cl}}{{\rm{u}}^{k2}}$的传输过程中产生的能耗$E_{k1, k2}^{({\rm{flit}})}$包括传输路径上所有路由器产生的能耗和传输链路上产生的能耗:

      $$ \left\{ \begin{array}{l} {E_{{\rm{router}}}} = \int_{{\rm{ }}0}^{{\rm{ }}{t^{(r)}}} {(C_L^{(r)}{V^{(r)}}^2{f^{(r)}}){\rm{ d}}{t^{(r)}}} + {\theta ^{(r)}}{t^{(r)}}\\ {E_{{\rm{link}}}} = \int_{{\rm{ }}0}^{{\rm{ }}{t^{(l)}}} {(C_L^{(l)}{V^{(l)}}^2{f^{(l)}}){\rm{ d}}} {t^{(l)}} + {\theta ^{(l)}}{t^{(l)}}\\ E_{k1, k2}^{({\rm{flit}})} = ({M_{k1, k2}} + 1){E_{{\rm{router}}}} + {M_{k1, k2}}{E_{{\rm{link}}}} \end{array} \right. $$ (4)

      式中,${M_{k1, k2}}$是簇${\rm{Cl}}{{\rm{u}}^{k1}}$到簇${\rm{Cl}}{{\rm{u}}^{k2}}$的曼哈顿距离;$C_L^{(r)}$、${V^{(r)}}$、${f^{(r)}}$及${t^{(r)}}$是路由器的负载电容、供电电压、频率及一个flit在路由器上的传输时间;$C_L^{(l)}$、${V^{(l)}}$、${f^{(l)}}$及${t^{(l)}}$是两个路由器之间的链路的负载电容、供电电压、频率及一个flit在两个路由器之间的链路上的传输时间。

      任务以指数分布延迟到达主节点的任务队列。主节点按照任务调度算法将任务分配到合适的计算节点。令本文主节点位于簇${\rm{Cl}}{{\rm{u}}^{k'}}$。将任务${T_i}$分配到簇${\rm{Cl}}{{\rm{u}}^k}$上产生的通信数据量为${\rm{Comm}}_i^{{\rm{Cl}}{{\rm{u}}^k}}$。令一个flit的位宽为B,则将任务${T_i}$从主节点所在簇${\rm{Cl}}{{\rm{u}}^{k'}}$分配到簇${\rm{Cl}}{{\rm{u}}^k}$产生的传输能耗$E_{i, k}^{({\rm{comm}})}$为:

      $$ E_{i, k}^{({\rm{comm}})} = \frac{{{\rm{Comm}}_i^{{\rm{Cl}}{{\rm{u}}^k}}}}{B}E_{k', k}^{({\rm{flit}})} $$ (5)

      式中,${\rm{Comm}}_i^{{\rm{Cl}}{{\rm{u}}^k}} \in \{ {\rm{Comm}}({e_{j, i}})|{e_{j, i}} \in E, {T_j} \in {\rm{pred}}({T_i})\} $。

      根据以上分析,系统能耗包括处理单元产生的计算能耗和数据传输过程中路由器和链路产生的传输能耗。由式(3)和式(5),将当前待调度任务${T_i}$分配到簇${\rm{Cl}}{{\rm{u}}^k}$中产生的总能耗为:

      $$ {E_{i, k}} = E_{i, k}^{({\rm{calc}})} + E_{i, k}^{({\rm{comm}})} $$ (6)
    • 从减小簇间通信开销的角度出发,将所有任务都调度到同一个簇中,簇间通信开销达到最小;从提高系统利用率的角度出发,将任务分摊到多个处理单元,让每个处理器单元都有充分的任务执行以加强系统的数据处理能力,从而提高系统利用率。对于依赖任务而言,最小化簇间通信开销和最大化系统利用率是反相关的两个目标,ECTSA算法引入能耗作为决策因子,通过动态计算任务分配在相应簇上产生的系统能耗,选择产生系统能耗小的分配方案以平衡系统利用率和簇间通信开销。

    • 在任务调度过程中,已调度的任务和未调度的任务都会和当前待调度任务产生数据交互关系。在图 2所示的PDT中,若当前待调度任务为${T_6}$,则PDT被${T_6}$划分为3个子集PFO。其中子集P为已经调度了的任务,子集FT6T6的直接和间接后续任务,剩余的任务构成子集O

      图  2  并行依赖任务集PDT的划分

      ${T_i}$为当前待调度任务,从考虑最小化簇间通信开销的角度出发,${T_i}$应该被划分到和其具有最大通信数据量的直接前驱${T_r}$所在的簇。子集F中的任务为${T_i}$的后续任务,故${T_i}$的调度结果会直接影响子集F中的所有任务。子集O中的任务都是未调度任务,且不会受到${T_i}$调度结果的影响,因此在对${T_i}$进行调度时不考虑子集O中的任务。通过以上分析,在对当前待调度任务${T_i}$进行调度时,最小化当前簇间通信开销的问题就转化为最小化当前子集P与子集F的簇间通信开销。

      为了量化子集P与子集F的簇间通信开销,ECTSA算法为每个任务${T_i}$引入通信负载数组${\rm{CommLoa}}{{\rm{d}}_i}[R]$,$R = M \times N$为目标结构中簇的数目。其中,分量${\rm{CommLoa}}{{\rm{d}}_i}[k]$表示当前待分配任务${T_i}$对应的子集P到子集F的所有数据交互中,在簇${\rm{Cl}}{{\rm{u}}^k}$上产生的数据交互量:

      $$ {\rm{CommLoa}}{{\rm{d}}_i}[k] = \sum\limits_{{e_{r, {\rm{ }}s}}} {\delta \max (W({\rm{C}}{{\rm{P}}_{r, s}}{\rm{), }}W{\rm{(C}}{{\rm{P}}_{i, s}}{\rm{))}}} $$ (7)

      式中,${T_r} \in P$;${T_s} \in F$;${e_{r, s}}$表示任务${T_i}$对应子集P到子集F的所有数据交互,若${T_r}$被调度在簇${\rm{Cl}}{{\rm{u}}^k}$上,则$\delta = 1$,否则$\delta = 0$。

    • 算法通过将任务分配给目标平台中利用率最低的簇执行从而最大化系统利用率。为了量化簇利用率,对当前待调度任务${T_i}$,ECTSA算法引入计算负载数组${\rm{CalcLoa}}{{\rm{d}}_i}[R]$,$R = M \times N$为目标结构中簇的数目。其中,分量${\rm{CalcLoa}}{{\rm{d}}_i}[k]$表示对于当前待分配任务${T_i}$,簇${\rm{Cl}}{{\rm{u}}^k}$内所有处理单元等待队列上的任务的计算负载之和:

      $$ {\rm{CalcLoa}}{{\rm{d}}_i}[k] = \sum\limits_{r = 1}^{{c_k}} {\sum\limits_{s = 1}^{|q_r^k|} {{\rm{Calc}}({T_s})} } $$ (8)

      式中,${T_s} \in P$是已经调度到簇${\rm{Cl}}{{\rm{u}}^k}$内处理单元的任务;$q_r^k$是簇${\rm{Cl}}{{\rm{u}}^k}$中处理单元的个数;$p_r^k$是处理单元$p_r^k$所维护的等待队列。

    • 图 3给出了针对基于NoC的多核系统的能耗约束的任务调度算法ECTSA的总体流程图。

      图  3  ECTSA算法流程图

      1) 由于任务间的数据依赖关系,任务要等到其所有直接前驱都执行结束后才能开始执行,因此算法采用可调度任务列表STL来存放当前所有可被调度的任务。

      2) STL中的任务往往不止一个,算法优先调度在PDT中关键路径上的任务;当有多个关键路径上的任务时选择主优先级高的任务调度;否则,选择次优先级高的任务调度。

      任务${T_i}$的主优先级定义为:

      $$ {\rm{MP}}({T_i}) = \left\{ \begin{array}{l} 1{\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} {\rm{pred}}({T_i}) = \emptyset \\ \mathop {\max }\limits_{{T_j} \in {\rm{pred}}({T_i})} ({\rm{MP}}({T_j})) + 1{\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} 其他 \end{array} \right. $$

      任务主优先级越大说明该任务离叶子节点的距离越远,后续任务对当前任务的数据依赖越大,应优先调度。

      任务${T_i}$的次优先级为定义为最晚启动时间${\rm{LST}}({T_i})$和最早启动时间${\rm{EST}}({T_i})$之差的倒数:

      $$ {\rm{SP}}({T_i}) = \frac{1}{{{\rm{LST}}({T_i})-{\rm{EST}}({T_i})}} $$
      $$ \begin{array}{c} {\rm{EST}}({T_i}) = \\ \left\{ \begin{array}{l} 0{\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} {\rm{pred}}({T_i}) = \emptyset \\ \mathop {\max }\limits_{{T_j} \in {\rm{pred}}({T_i})} \{ {\rm{ECT}}({T_j}) + {\rm{Comm}}({e_{j, i}})/{S^L}\} \;\;\;其他 \end{array} \right. \end{array} $$
      $$ {\rm{ECT}}({T_i}) = {\rm{EST}}({T_i}) + {\rm{Calc}}({T_i})/{S^k}\;\;({\psi _{i, k}} = 1) $$
      $$ {\rm{LST}}({T_i}) = {\rm{LCT}}({T_i})-{\rm{Calc}}({T_i})/{S^k}\;\;({\psi _{i, k}} = 1) $$

      式中,${S^L}$为链路通信速率;${\psi _{i, k}} = 1$表示任务${T_i}$分配在簇${\rm{Cl}}{{\rm{u}}^k}$上;${\rm{ECT}}({T_i})$和${\rm{LCT}}({T_i})$分别表示任务的最早完成时间和最晚完成时间。

      最晚启动时间和最早启动时间越接近的任务,紧迫程度越大,该类任务对PDT调度长度的影响也越大,需要尽可能早地进行调度。

      3) 利用当前待调度任务子集P、子集F间的数据交互计算当前待调度任务${T_i}$通信负载数组${\rm{CommLoa}}{{\rm{d}}_i}[R]$,找出最大通信负载分量所对应的簇${\rm{Cl}}{{\rm{u}}^{k1}}$。

      4) 计算当前待调度任务${T_i}$的计算负载数组${\rm{CalcLoa}}{{\rm{d}}_i}[R]$,找出最小计算负载分量所对应的簇${\rm{Cl}}{{\rm{u}}^{k2}}$。

      5) 计算任务${T_i}$分配到簇${\rm{Cl}}{{\rm{u}}^{k1}}$产生的系统能耗${E_{i, k1}}$,分配到簇${\rm{Cl}}{{\rm{u}}^{k2}}$产生的系统能耗${E_{i, k2}}$,以能耗作为决策因子,选择产生较小系统能耗的分配方案,即选择$\min ({E_{i, k1}}, {E_{i, k2}})$所对应的簇。

      6) 将任务${T_i}$分配到$\min ({E_{i, k1}}, {E_{i, k2}})$所对应的簇上,若可调度任务列表STL不为空,转步骤2),否则,等待一个调度周期后转步骤1)。

    • 本节从系统利用率、簇间数据交互次数、系统能耗三个维度将ECTSA算法GEDF-OLEASA算法进行了对比。

      仿真实验使用Noxim[10]模拟$4 \times 4 \times 3$的NoC多核系统。任务集由TGFF[11]生成,TGFF能对包括任务数、任务计算开销、任务间依赖关系及任务间通信数据量等属性进行模拟。Noxim中的流量表由TGFF模拟的任务间通信数据量构成。

      仿真实验中,片上网络采用$4 \times 4 \times 3$的目标平台,片上网络频率为100 MHz,链路带宽为6 400 Mbs-1,路由算法为确定性XY路由算法。TGFF[11]产生任务节点规模分别为25、50、75、100、125、150的并行依赖任务集PDT;处理单元工作电压$V \in [1.5, 2.5]$ V,阈值电压${V_{{\rm{th}}}} \in [0.3, 0.6]$ V,静态功耗$\theta \in [0.16, 0.45]$ W。

      图 4为PDT规模为25、50、75、100、125、150时在同一目标平台下ECTSA算法和GEDF-OLEASA算法的簇间数据交互次数对比图。从图 4可以看出,通过同时考虑已调度任务和会受到调度结果影响的未调度任务,ECTSA算法能够明显降低任务调度过程中的数据交互次数,降低簇间通信开销。

      图  4  不同任务数的簇间数据交互次数

      图 5为PDT规模为100时在同一目标平台下ECTSA算法和GEDF-OLEASA算法的系统利用率对比图。从图 5可以看出ECTSA算法对应系统利用率相对提高,增强了系统的数据处理能力。也说明ECTSA算法通过将任务分配给利用率最低的簇以提高系统整体利用率是可行的。

      图  5  系统利用率比较

      为了对比不同算法所产生的系统能耗,引入任务平均调度长度(average scheduling length, ASL)与任务最坏情况下调度长度(worst scheduling length, WSL)之比,刻画任务运行时属性。系统能耗以GEDF-OLEASA的能耗作为标准进行归一化处理。图 6为PDT规模为100个任务时,ECTSA算法和GEDF-OLEASA在不同ASL/WSL下系统能耗的比较。当ASL远低于WSL时,ECTSA算法比GEDF-OLEASA算法节能达到20%以上,随着ASL/WSL比值的增大,ECTSA算法的节能效果有所降低,但始终优于GEDF-OLEASA算法。

      图  6  不同ASL/WSL下系统能耗比较

    • 本文提出了一种能耗约束的基于NoC的多核系统任务调度算法,该算法在对目标平台系统能耗进行建模的基础上,动态计算任务分配在最大通信负载分量所对应的簇上产生的系统能耗及任务分配在最小计算负载分量所对应的簇上产生的系统能耗,并选择产生系统能耗小的分配方案以平衡系统利用率和处理单元间通信开销。仿真实验结果证明,本文所提出的ECTSA算法相较于GEDF-OLEASA算法在减少了核间通信开销并提高系统利用率的同时,降低了系统能耗。

      本文研究工作得到西南民族大学中央高校基本科研业务费(2015NZYQN28)的资助,在此表示感谢。

参考文献 (11)

目录

    /

    返回文章
    返回