留言板

尊敬的读者、作者、审稿人, 关于本刊的投稿、审稿、编辑和出版的任何问题, 您可以本页添加留言。我们将尽快给您答复。谢谢您的支持!

姓名
邮箱
手机号码
标题
留言内容
验证码

考虑处理机下线时间的可分任务调度优化模型

王晓丽 王宇平 蔡坤 赖俊凡

王晓丽, 王宇平, 蔡坤, 赖俊凡. 考虑处理机下线时间的可分任务调度优化模型[J]. 电子科技大学学报, 2017, 46(1): 88-95. doi: 10.3969/j.issn.1001-0548.2017.01.014
引用本文: 王晓丽, 王宇平, 蔡坤, 赖俊凡. 考虑处理机下线时间的可分任务调度优化模型[J]. 电子科技大学学报, 2017, 46(1): 88-95. doi: 10.3969/j.issn.1001-0548.2017.01.014
WANG Xiao-li, WANG Yu-ping, CAI Kun, LAI Jun-fan. Off-Line Time Aware Divisible-Load Scheduling Optimization Model[J]. Journal of University of Electronic Science and Technology of China, 2017, 46(1): 88-95. doi: 10.3969/j.issn.1001-0548.2017.01.014
Citation: WANG Xiao-li, WANG Yu-ping, CAI Kun, LAI Jun-fan. Off-Line Time Aware Divisible-Load Scheduling Optimization Model[J]. Journal of University of Electronic Science and Technology of China, 2017, 46(1): 88-95. doi: 10.3969/j.issn.1001-0548.2017.01.014

考虑处理机下线时间的可分任务调度优化模型

doi: 10.3969/j.issn.1001-0548.2017.01.014
基金项目: 

国家自然科学基金 61402350,61472297,61572391

中央高校基本科研业务费专项资金 JB150307

详细信息
    作者简介:

    王晓丽(1987-),女,博士,主要从事并行与分布式系统下的任务调度方面的研究

  • 中图分类号: TP393

Off-Line Time Aware Divisible-Load Scheduling Optimization Model

  • 摘要: 随着科学应用逐渐趋于数据密集型计算,为并行与分布式系统寻求高效的任务调度策略成了研究的热点问题。已有的可分任务调度模型均假设所有处理机都能100%的完成子任务的计算,即处理机在完成任务计算之前一直保持在线状态。实际上,并行与分布式系统中不同处理机的在线时间可能不同。若忽略处理机的在线时间,为其分配的任务量过大,则任务的完成时间可能超出处理机的下线时间,从而造成任务的计算无法按时完成。因此,为处理机分配任务时应充分考虑处理机下线时间的限制。为解决上述问题,该文提出了一种新的考虑处理机下线时间的可分任务调度优化模型,并设计了全局优化遗传算法求解该模型。最后,通过仿真实验结果验证了模型和算法的有效性。
  • 图  1  所有处理机不受下线时间的影响

    图  2  部分处理机受下线时间的影响

    图  3  交叉示意图

    图  4  一种不满足模型约束的可分任务调度时序图

    图  5  修正算子的迭代过程示意图

    图  6  局部搜索算子执行过程示意图

    图  7  两种算法的任务完成时间随任务大小的变化趋势

    图  8  GA的任务完成时间随下线时间平均值的变化趋势

    图  9  TSA的任务完成时间随下线时间平均值的变化趋势

    表  1  不同任务量情况下两种算法对比的实验结果

    算法 任务量/MB 完成时间/s
    GA10080.09
    TSA 80.09
    GA 200 160.10
    TSA 160.10
    GA 300 240.10
    TSA 240.10
    GA 400 320.11
    TSA 320.11
    GA 500 400.11
    TSA 400.11
    GA 600 480.11
    TSA 787.49
    GA 700 560.12
    TSA 918.70
    GA 800 640.14
    TSA 1197.49
    GA 900 720.17
    TSA 1384.61
    GA 1000 800.21
    TSA 1538.43
    下载: 导出CSV
  • [1] BHARDWAJ V, GHOSE D, MANI V, et al. Scheduling divisible loads in parallel and distributed systems[M]. Los Alamitos CA:IEEE Computer Society Press, 1996.
    [2] MANI V, GHOSE D. Distributed computation in linear networks:Closed-form solutions[J]. IEEE Transactions on Aerospace and Electronic Systems, 1994, 30(2):471-483. doi:  10.1109/7.272269
    [3] GHOSE D, MANI V. Distributed computation with communication delays:Asymptotic performance analysis[J]. Journal of Parallel and Distributed Computing, 1994, 23(3):293-305. doi:  10.1006/jpdc.1994.1141
    [4] BHARADWAJ V, GHOSE D, MANI V. Optimal sequencing and arrangement in distributed single-level tree networks with communication delays[J]. IEEE Transactions on Parallel and Distributed Systems, 1994, 5(9):968-976. doi:  10.1109/71.308534
    [5] KIM H J, JEE G I, LEE J G. Optimal load distribution for tree network processors[J]. IEEE Transactions on Aerospace and Electronic Systems, 1996, 32(2):607-612. doi:  10.1109/7.489505
    [6] SURESH S, MANI V, OMKAR S N. The effect of start-up delays in scheduling divisible loads on bus networks:an alternate approach[J]. Computers & Mathematics with Applications, 2003, 46(10):1545-1557.
    [7] VEERAVALLI B, LI X, KO C C. On the influence of start-up costs in scheduling divisible loads on bus networks[J]. IEEE Transactions on Parallel and Distributed Systems, 2000, 11(12):1288-1305. doi:  10.1109/71.895794
    [8] MURUGESAN G, CHELLAPPAN C. Multi-source task scheduling in grid computing environment using linear programming[J]. International Journal of Computational Science and Engineering, 2014, 9(1):80-85.
    [9] LIN W, LIANG C, WANG J Z, et al. Bandwidth aware divisible task scheduling for cloud computing[J]. Software:Practice and Experience, 2014, 44(2):163-174. doi:  10.1002/spe.v44.2
    [10] HOSEINYFARAHABADY M R, LEE Y C, ZOMAYA A Y. Randomized approximation scheme for resource allocation in hybrid-cloud environment[J]. The Journal of Supercomputing, 2014, 69(2):576-592. doi:  10.1007/s11227-014-1094-0
    [11] SHI H, WANG W, KWOK N M, et al. Adaptive indexed divisible load theory for wireless sensor network workload allocation[J]. International Journal of Distributed Sensor Networks, 2013(1):1-18.
    [12] DAI L, SHEN Z, CHEN T, et al. Analysis and modeling of task scheduling in wireless sensor network based on divisible load theory[J]. International Journal of Communication Systems, 2014, 27(5):721-731. doi:  10.1002/dac.v27.5
    [13] HU M, VEERAVALLI B. Dynamic scheduling of hybrid real-time tasks on clusters[J]. IEEE Transactions on Computers, 2014, 63(12):2988-2997. doi:  10.1109/TC.2013.170
    [14] HU M, VEERAVALLI B. Requirement-aware strategies for scheduling real-time divisible loads on clusters[J]. Journal of Parallel and Distributed Computing, 2013, 73(8):1083-1091. doi:  10.1016/j.jpdc.2013.03.013
    [15] ROSAS C, SIKORA A, JORBA J, et al. Improving performance on data-intensive applications using a load balancing methodology based on divisible load theory[J]. International Journal of Parallel Programming, 2013, 42(1):94-118. http://cn.bing.com/academic/profile?id=e39ee1cc950291ce62dbb175d24bcafb&encoded=0&v=paper_preview&mkt=zh-cn
  • [1] 李龚亮, 敬思远, 郭兵, 沈艳.  基于图形处理器的并行遗传过程挖掘 . 电子科技大学学报, 2019, 48(6): 918-924. doi: 10.3969/j.issn.1001-0548.2019.06.017
    [2] 张民, 贾海涛, 沈震.  基于遗传算法改进的粒子滤波重采样模型 . 电子科技大学学报, 2015, 44(3): 344-349. doi: 10.3969/j.issn.1001-0548.2015.03.005
    [3] 薛羽, 庄毅, 朱浩, 张友益礻禹.  求解协同干扰问题的高效免疫遗传算法 . 电子科技大学学报, 2013, 42(3): 452-458. doi: 10.3969/j.issn.1001-0548.2013.03.026
    [4] 郑世明, 高志年, 韦伟, 苗壮, 邵荣明.  基于云模型的网格任务调度遗传算法研究 . 电子科技大学学报, 2012, 41(6): 911-915. doi: 10.3969/j.issn.1001-0548.2012.06.018
    [5] 熊彦铭, 毛凌, 杨战平.  基于遗传算法的时间决策系统标定优化方法 . 电子科技大学学报, 2012, 41(1): 80-84. doi: 10.3969/j.issn.1001-0548.2012.01.016
    [6] 王江安, 庄奕琪, 周清军.  遗传算法抑制BOC(1,1)信号多径研究 . 电子科技大学学报, 2010, 39(1): 45-49. doi: 10.3969/j.issn.1001-0548.2010.01.011
    [7] 刘洪武, 冯全源.  MC-CDMA系统中基于遗传算法的多用户检测 . 电子科技大学学报, 2008, 37(4): 485-488.
    [8] 王瑞平, 万柏坤, 高上凯.  使用遗传算法的乳腺微钙化点特征优化 . 电子科技大学学报, 2007, 36(1): 137-139,153.
    [9] 李向阳, 张亚非.  一种基于遗传算法的语义标注 . 电子科技大学学报, 2007, 36(1): 86-89.
    [10] 王志红, 杜平安, 郭志龙, 梁山虎.  基于遗传算法与动态规划法的工艺过程优化 . 电子科技大学学报, 2007, 36(1): 146-149.
    [11] 吴传信, 倪明放, 陈鸣.  路由选择的一种新遗传算法 . 电子科技大学学报, 2006, 35(5): 744-747.
    [12] 沈艳, 郭兵, 古天祥.  粒子群优化算法及其与遗传算法的比较 . 电子科技大学学报, 2005, 34(5): 696-699.
    [13] 黄羽, 黄迪明, 何险峰, 武明.  遗传算法在入侵检测中的应用 . 电子科技大学学报, 2003, 32(6): 679-682.
    [14] 王忠, 柴贺军, 刘浩吾.  关于进化遗传算法的几点改进 . 电子科技大学学报, 2002, 31(1): 76-79.
    [15] 张宇, 郭晶, 周激流.  动态变异遗传算法 . 电子科技大学学报, 2002, 31(3): 234-239.
    [16] 王海枚, 游志胜.  基于遗传算法与模糊控制的建模方法 . 电子科技大学学报, 2002, 31(3): 266-269.
    [17] 饶克谨, 苟益.  电路模拟吸收体的遗传算法设计 . 电子科技大学学报, 2000, 29(1): 54-60.
    [18] 王勇, 陈光.  面向时滞测试生成的改进遗传算法 . 电子科技大学学报, 1999, 28(2): 157-161.
    [19] 吴斌, 吴坚, 涂序彦.  快速遗传算法研究 . 电子科技大学学报, 1999, 28(1): 49-53.
    [20] 潘中良, 陈光.  测试图形生成的遗传算法研究 . 电子科技大学学报, 1997, 26(5): 511-514.
  • 加载中
图(9) / 表(1)
计量
  • 文章访问数:  6118
  • HTML全文浏览量:  2254
  • PDF下载量:  63
  • 被引次数: 0
出版历程
  • 收稿日期:  2015-07-13
  • 修回日期:  2016-05-31
  • 刊出日期:  2017-01-01

考虑处理机下线时间的可分任务调度优化模型

doi: 10.3969/j.issn.1001-0548.2017.01.014
    基金项目:

    国家自然科学基金 61402350,61472297,61572391

    中央高校基本科研业务费专项资金 JB150307

    作者简介:

    王晓丽(1987-),女,博士,主要从事并行与分布式系统下的任务调度方面的研究

  • 中图分类号: TP393

摘要: 随着科学应用逐渐趋于数据密集型计算,为并行与分布式系统寻求高效的任务调度策略成了研究的热点问题。已有的可分任务调度模型均假设所有处理机都能100%的完成子任务的计算,即处理机在完成任务计算之前一直保持在线状态。实际上,并行与分布式系统中不同处理机的在线时间可能不同。若忽略处理机的在线时间,为其分配的任务量过大,则任务的完成时间可能超出处理机的下线时间,从而造成任务的计算无法按时完成。因此,为处理机分配任务时应充分考虑处理机下线时间的限制。为解决上述问题,该文提出了一种新的考虑处理机下线时间的可分任务调度优化模型,并设计了全局优化遗传算法求解该模型。最后,通过仿真实验结果验证了模型和算法的有效性。

English Abstract

王晓丽, 王宇平, 蔡坤, 赖俊凡. 考虑处理机下线时间的可分任务调度优化模型[J]. 电子科技大学学报, 2017, 46(1): 88-95. doi: 10.3969/j.issn.1001-0548.2017.01.014
引用本文: 王晓丽, 王宇平, 蔡坤, 赖俊凡. 考虑处理机下线时间的可分任务调度优化模型[J]. 电子科技大学学报, 2017, 46(1): 88-95. doi: 10.3969/j.issn.1001-0548.2017.01.014
WANG Xiao-li, WANG Yu-ping, CAI Kun, LAI Jun-fan. Off-Line Time Aware Divisible-Load Scheduling Optimization Model[J]. Journal of University of Electronic Science and Technology of China, 2017, 46(1): 88-95. doi: 10.3969/j.issn.1001-0548.2017.01.014
Citation: WANG Xiao-li, WANG Yu-ping, CAI Kun, LAI Jun-fan. Off-Line Time Aware Divisible-Load Scheduling Optimization Model[J]. Journal of University of Electronic Science and Technology of China, 2017, 46(1): 88-95. doi: 10.3969/j.issn.1001-0548.2017.01.014
  • 随着大数据时代的来临,数据的规模呈爆炸式增长,如何高效快速处理并分析数据成了研究的重点和难点问题。大数据应用问题,如大规模矩阵运算、DNA测序分析、卫星图像处理等,虽然数据规模庞大,但是大都可以抽象为可分任务,即任务可以被划分为任意大小的子任务,子任务间相互独立且没有优先级关系[1]。并行与分布式系统下可分任务调度问题的目标是寻求最优的任务分配方案使得任务的完成时间最短。

    针对并行与分布式系统下常见的线型拓扑结构、总线型拓扑结构和树型拓扑结构,已有很多文献对可分任务的最优调度策略进行了研究。文献[2]给出了同构线型网络下最优任务分配方案的紧式耦合解,文献[3]给出了同构树型网络与总线型网络下任务分配方案的渐近解。文献[4]给出了异构星型网络下任务分配方案的紧式耦合解,并且证明了处理机调度顺序在遵循通信速率递减的情况下任务的完成时间最短。对于异构树型网络,文献[5]的研究表明处理机的调度顺序只依赖于其通信速率而非计算速率。然而,这些研究成果都没有考虑处理机的计算启动开销和网络的通信启动开销。文献[6-7]在调度模型中引入了启动开销,分析了总线型网络下启动开销和处理机的调度顺序对任务完成时间的影响,证明了当处理机遵循计算速率递减的顺序时任务的完成时间最短。为了使可分任务调度模型更符合分布式平台的实际网络环境,文献[8]将可分任务调度模型扩展到多源网格环境中,文献[9]研究了云平台下处理机带宽受限的可分任务调度问题,文献[10]将其扩展到混合云计算平台环境中,文献[11-12]将其扩展到无线传感器网络中,文献[13-14]将其扩展到实时环境中。

    但是,已有的可分任务调度模型均假设所有处理机都能100%的完成所分配的子任务,即处理机在完成所分配的子任务之前一直保持在线状态[15]。然而在实际的网络环境下这个假设并不成立,不同处理机的下线时间可能不同。若为处理机分配的任务量过大,则任务的完成时间可能超出处理机的下线时间,从而造成任务的计算无法按时完成。若处理机未完成计算就已下线,则为其分配的任务需要等待其他处理机完成计算空闲后,调度到其他仍在线的处理机上重新开始计算,从而导致任务的总完成时间增大。鉴于此,本文提出了一种新的考虑处理机下线时间的可分任务调度优化模型,并且设计了新的遗传算法对模型进行求解。

    • N+1台处理机通过星型网络(单层树网络)互连,其中,P0是主处理机,$\{{{P}_{i}}|i\in \{1,2,\cdots ,N\}\}$是从处理机,所有处理机的计算速率相同。任务位于主处理机P0上,任务大小记为${{W}_{\text{total}}}$。处理机Pi的下线时间记为oi,其中$i=1,2,\cdots ,N$。${{l}_{i}}$是连接P0Pi的通信链路,所有链路的传输速率相同。值得注意的是,并不是所有处理机都必须参与任务的计算,记参与计算的处理机数目为n($n\le N$)。主处理机P0负责将总任务划分为n个子任务$A=({{\alpha }_{1}},{{\alpha }_{2}},\cdots ,{{\alpha }_{n}})$,然后按次序依次调度到从处理机${{P}_{1}},{{P}_{2}},\cdots ,{{P}_{n}}$上完成并行计算。所有处理机分配的任务量之和应为总任务量,即:

      $$\sum\limits_{i=1}^{n}{{{\alpha }_{i}}}={{W}_{\text{total}}}$$ (1)

      主处理机P0向从处理机Pi传输大小为ai的子任务所需的传输时间为$C+z{{\alpha }_{i}}$,其中,C为通信启动开销,z为通讯链路传输单位大小的任务所花费的时间。处理机Pi计算子任务ai所需的时间为$B+w{{\alpha }_{i}}$,其中,B为计算启动开销,w为处理机计算单位任务所需的时间。

    • 记处理机Pi完成所分配的子任务ai的时间为Ti,则总任务的完成时间$T=\max \{{{T}_{1}},{{T}_{2}},\cdots ,{{T}_{n}}\}$。文献[3]证明了只有当所有处理机同时完成计算时,任务的完成时间最短,否则完全可以将后完成计算的处理机上的部分任务调度到先完成计算的处理机上执行。但是,由于处理机受下线时间的限制,不能保证所有参与计算的处理机同时完成计算。下面分两种情况来讨论处理机的下线时间对任务完成时间的影响。

      情况1 $T\text{=}\max \left\{ {{T}_{1}},{{T}_{2}},\cdots ,{{T}_{n}} \right\}\le {{o}_{i}}$,其中$\text{ }i=1,2,\cdots ,n$,${{T}_{i}}=iC+z\sum\limits_{j=1}^{i}{{{\alpha }_{j}}}+B+w{{\alpha }_{i}}$,即任务的完成时间小于所有处理机的下线时间,即所有处理机均不受下线时间的影响。图 1给出了满足该约束的一种可能的任务调度时序图。由于处理机不受下线时间的约束,因此所有处理机同时完成计算时总任务的完成时间最短,由此可得:

      $$B+w{{\alpha }_{i}}=C+z{{\alpha }_{i+1}}+B+w{{\alpha }_{i+1}},\text{ }i=1,2,\cdots ,n-1$$ (2)

      则${{\alpha }_{i\text{+}1}}$可以写成${{\alpha }_{i}}$的表达式:

      $${{\alpha }_{i\text{+}1}}=\frac{w}{z\text{+}w}\left( {{\alpha }_{i}}-\frac{C}{w} \right),\text{ }i=1,2,\cdots ,n-1$$ (3)

      记$\text{ }q=w/(z+w)$,递推可得:

      $${{\alpha }_{i}}={{q}^{i-1}}{{\alpha }_{1}}-\frac{q-{{q}^{i}}}{1-q}\frac{C}{w}\text{ ,}i=1,2,\cdots ,n$$ (4)

      将式(4)带入式(1)可得:

      $$\frac{1-{{q}^{n}}}{1-q}{{\alpha }_{1}}-\frac{C}{w}\frac{nq-n{{q}^{2}}-q+{{q}^{n+1}}}{{{(1-q)}^{2}}}={{W}_{\text{total}}}$$ (5)

      整理可得${{\alpha }_{i}}$的解为:

      $${{\alpha }_{1}}=\frac{1-q}{1-{{q}^{n}}}{{W}_{\text{total}}}\text{+}\frac{C}{w}\frac{nq-n{{q}^{2}}-q+{{q}^{n+1}}}{(1-q)(1-{{q}^{n}})}$$ (6)

      图 1可知,总任务的完成时间T满足:

      $$T=(z+w){{\alpha }_{1}}+C+B\text{ }=C+B+(z+w)\times \frac{1-q}{1-{{q}^{n}}}{{W}_{\text{total}}}\text{+}\frac{C}{w}\frac{nq-n{{q}^{2}}-q+{{q}^{n+1}}}{(1-q)(1-{{q}^{n}})}$$ (7)

      图  1  所有处理机不受下线时间的影响

      式中,$q=w/(z+w)$。可以看出,对于情况1,可以直接推导${{\alpha }_{i}}$的紧式耦合解式,将式(6)带入式(4)可得所有处理机的任务分配方案,进而求得任务的最短完成时间。

      情况2 $\exists {{o}_{i}}\text{}\,T\text{=}\max \left\{ {{T}_{1}},{{T}_{2}},\cdots ,{{T}_{n}} \right\}$,其中,$i=1,2,\cdots ,n$,即存在处理机Pi受其下线时间oi的约束,只能完成既定大小的任务。图 2给出了满足该约束的一种可能的任务调度时序图。处理机Pi的任务完成时间必须满足:

      $${{T}_{i}}=iC+z\sum\limits_{j=1}^{i}{{{\alpha }_{j}}}+B+w{{\alpha }_{i}}={{o}_{i}}$$

      图  2  部分处理机受下线时间的影响

      因此,若处理机Pi受其下线时间的约束,其任务分配量为:

      $${{\alpha }_{i}}=({{o}_{i}}-iC-z\sum\limits_{j=1}^{i}{{{\alpha }_{j}}}-B)/w,\text{ }i=1,2,\cdots n$$ (8)

      与情况1不同的是,对于情况2,无法直接通过计算得到所有处理机的最优任务分配方案,也就无法直接得到总任务的完成时间。这主要是因为可能只有部分处理机受下线时间的约束,因此无法通过

      式(7)得到所有处理机的最优任务分配方案。鉴于此,本文建立了以下考虑处理机下线时间的可分任务调度优化模型:

      $$\underset{n,A}{\mathop{\min }}\,T=\underset{n,A}{\mathop{\min }}\,\left( \underset{1\le i\le n}{\mathop{\max }}\,{{T}_{i}} \right)=\underset{n,A}{\mathop{\min }}\,\left( \underset{1\le i\le n}{\mathop{\max }}\,\left( iC+z\sum\limits_{j=1}^{i}{{{\alpha }_{j}}}+B+w{{\alpha }_{i}} \right) \right)$$

      s.t. 1) $0<n\le N$,其中N为处理机总数,n为参与计算的处理机数目;

      2)$0<{{\alpha }_{i}}\le {{W}_{\text{total}}}\text{ , }i=1,2,\cdots ,n$;

      3)$\sum\limits_{i=1}^{n}{{{\alpha }_{i}}}={{W}_{\text{total}}}$;

      4)$iC+z\sum\limits_{j=1}^{i}{{{\alpha }_{j}}}+B+w{{\alpha }_{i}}\le {{o}_{i}}\text{ , }i=1,2,\cdots ,n$。

      模型的目标是总任务的完成时间最短,变量是参与计算的最优处理机数目n和处理机的最优任务分配方案$A=({{\alpha }_{1}},{{\alpha }_{2}},\cdots ,{{\alpha }_{n}})$。模型的约束条件1)表示并非所有的处理机都必须参与计算;约束条件2)表示每个处理机所分配的任务量必须非负,且不能超过总任务量${{W}_{\text{total}}}$;约束条件3)表示所有处理机分配的任务量之和为总任务量${{W}_{\text{total}}}$;约束条件4)表示所有处理机完成所分配任务的时间必须小于等于其下线时间。

    • 为了求解建立的优化模型,本文设计了新的全局优化遗传算法,包括编码与解码规则、交叉与变异算子、修正算子和局部搜索算子。

    • 本文采用实数编码方式,个体用N维向量$I=({{\alpha }_{1}},{{\alpha }_{2}},\cdots ,{{\alpha }_{N}})$表示,其中,N表示处理机总数,${{\alpha }_{i}}$表示分配给处理机${{P}_{i}}$的任务量大小,因此$0\le {{\alpha }_{i}}\le {{W}_{\text{total}}}$且$\sum\limits_{i=1}^{n}{{{\alpha }_{i}}={{W}_{\text{total}}}}$。举例说明:设$N=5$,任务总量${{W}_{\text{total}}}=1$,则一种可能的编码方案为:$I=(0.3,0.3,0.2,0.2,0)$。由该编码方案可知,共有$n=4$台处理机参与计算,因为${{\alpha }_{5}}=0$,即处理机${{P}_{5}}$分配的任务量为零,即该处理机没有参与计算。而其他4台处理机${{P}_{1}},{{P}_{2}},{{P}_{3}},{{P}_{4}}$所分配的任务量分别为$0.3,0.3,0.2$和$0.2$。

      对个体解码时,统计个体$I=({{\alpha }_{1}},{{\alpha }_{2}},\cdots ,{{\alpha }_{N}})$中非零元素的个数,并将其作为参与计算的处理机数目n。值得注意的是,并不是所有符合上述编码方案构成的个体都是有效的个体。若解码后,个体不满足模型的全部约束条件,则需要按照修正算子对个体进行修正,2.3节将给出修正算子的具体算法思想和步骤。

    • 交叉算子采用三三交叉的方式,即3个父代两两交叉生成3个子代。具体操作步骤如下:首先,按照交叉概率${{p}_{\text{cros}}}$从交叉池中选择3个个体作为父代,然后随机生成3个整数low、mid和high满足$0\le \text{low}<\text{mid}<\text{high}\le N$,按照图 3所示的方法进行交叉,使得每个子代个体都包含3个父代个体的部分基因。通过三三交叉可以更大程度地增加种群的多样性,较常用的两两交叉而言,可以加快算法收敛于全局最优解,从而提高整个算法的执行效率。

      图  3  交叉示意图

      本文采用两点变异的方式。对于个体$I=({{\alpha }_{1}},{{\alpha }_{2}},\cdots ,{{\alpha }_{N}})$,随机生成两个整数pq,满足$0\le p<q\le N$,互换${{\alpha }_{p}}$和${{\alpha }_{q}}$的值,生成新的子代个体。值得注意的是,通过交叉和变异算子所产生的子代不一定满足模型的全部约束条件,此时需要按照修正算子对子代进行修正。

    • 如前文所述,不论是种群的初始化,还是交叉及变异产生的新个体,都不能保证个体满足模型的全部约束条件,因此需要对个体进行修正。修正算子的主要思想如下:若处理机${{P}_{i}}$完成所分配的任务量${{\alpha }_{i}}$的时间超出了其下线时间,则将超出下线时间的部分(又称为冲突部分)调整到相邻的下一台处理机${{P}_{i+1}}$上执行。若第一轮调整过后,处理机${{P}_{i+1}}$的完成时间也超出了其下线时间,则继续将${{P}_{i+1}}$的冲突部分调整到相邻的下一台处理机${{P}_{i+2}}$上执行,循环此过程,直至冲突完全消除。可见,修正的过程是一个迭代的过程。

      图 4给出了一种不满足模型约束的可分任务调度时序图。从该图可以看出,处理机P2完成任务a2所需要的时间超出了该处理机的下线时间o2,图中灰色部分即为冲突部分。因此,需要对处理机P2的任务量a2进行调整。首先,将冲突部分对应的任务量分配给处理机P3图 5给出了调整后的可分任务调度时序图。选择分配给相邻的下一台处理机是考虑到每台处理机的开始时间与其前面的所有处理机的任务分配量直接相关。如果将冲突部分调整到前面的处理机,调整后将推迟后续所有处理机的开始时间,导致新的冲突产生。从图 5可以看出,将处理机P2的冲突部分调整给处理机P3后,处理机P2产生了新的冲突部分,因此需要继续迭代修正过程,直至冲突全部消除。

      图  4  一种不满足模型约束的可分任务调度时序图

      图  5  修正算子的迭代过程示意图

    • 为了增强算法的局部搜索能力,提高算法的收敛速度,本文为遗传算法引入了局部搜索算子。

      算子的设计思想如下:由于所有处理机是同构的,因此若不考虑处理机的下线时间,为达到总任务的完成时间最短,调度顺序靠前的处理机其分配的任务量应大于调度顺序靠后的处理机。鉴于此,可以通过置换相邻两台处理机的任务分配量来寻求更优的个体。局部搜索算子的具体执行过程如下:对所有处理机的任务量从后向前逐个进行比较,如相邻两个处理机中,前面处理机的任务完成时间小于其下线时间且后面处理机所分配的任务量大于前面处理机的任务量,那么将两个处理机的任务量进行交换。图 6给出了一种可能的局部搜索执行过程。

      图  6  局部搜索算子执行过程示意图

    • 基于前文设计的编码与解码规则、交叉与变异算子、修正算子和局部搜索算子,下面给出考虑处理机下线时间的可分任务调度遗传算法整体框架。

      算法1 考虑处理机下线时间的可分任务调度遗传算法。

      1) (初始化)令进化代数$t=0$,根据编码规则随机生成$\text{Popsize}$个个体构成初始种群$P(t)$。对种群$P(t)$中的每个个体进行解码,计算任务的完成时间并将其倒数作为个体的适应度。

      2) (交叉)通过轮盘赌操作从种群$P(t)$中选择$\text{Popsize}$个个体进入交叉池,然后按照交叉算子从交叉池中选择父代个体进行交叉,交叉后得到的子代集合记为${{O}_{1}}(t)$。3) (变异)根据变异概率${{p}_{\text{mut}}}$从集合${{O}_{1}}(t)$中选择父代个体按照变异算子进行变异,变异后得到的子代集合记为${{O}_{2}}(t)$。

      4) (修正)对集合${{O}_{1}}(t)\bigcup {{O}_{2}}(t)$中不满足约束的子代个体进行修正,修正后的个体集合记为${{O}_{3}}(t)$。

      5) (局部搜索)对集合${{O}_{3}}(t)$中的个体进行局部搜索,更新后的个体集合记为${{O}_{4}}(t)$。

      6) (选择)从集合$P(t)\bigcup {{O}_{4}}(t)$中选择适应度最大的E个个体直接进入下一代种群$P(t+1)$。然后通过轮盘赌操作从集合$P(t)\bigcup {{O}_{4}}(t)$中继续选择$\text{PopSize}-E$个个体到$P(t+1)$中。令$t=t+1$。

      7) (终止条件)若算法达到终止条件,则终止;否则,转至2)。

    • 为了验证本文提出的算法的有效性,将其与已有算法[15]进行了多组对比实验,其中并行与分布式系统的参数设置如下:$N=20$,$z=0.8$,$w=1.2$,$C=0.005$,$B=0.002$;遗传算法的参数设置如下:种群大小$\text{PopSize}=100$,交叉概率${{p}_{\text{cros}}}=0.6$,变异概率${{p}_{\text{mut}}}=0.02$,精英保留个数$E=5$,终止条件为进化代数$t=10\ 000$。

      实验1 固定处理机的下线时间,对比两个算法在不同任务量情况下求得的任务完成时间。20台处理机的下线时间分别为:

      ${{o}_{1}}$~${{o}_{1}}$:431.85,467.44,570.58,599.36

      ${{o}_{5}}$~${{o}_{8}}$:669.31,813.82,881.45,922.11

      ${{o}_{9}}$~${{o}_{12}}$:1 055.85,1 086.29,1 164.82,1200.71

      ${{o}_{13}}$~${{o}_{16}}$:1 275.66,1 299.45,1 474.28,1763.75

      ${{o}_{17}}$~${{o}_{20}}$:1 768.40,1 813.13,1 911.18,1943.74

      表 1给出了不同任务量(${{W}_{\text{total}}}=\ 100$~1000)下两种算法对比的实验结果,其中,GA代表本文的全局优化遗传算法,TSA代表文献[15]的传统调度策略。

      表 1  不同任务量情况下两种算法对比的实验结果

      算法 任务量/MB 完成时间/s
      GA10080.09
      TSA 80.09
      GA 200 160.10
      TSA 160.10
      GA 300 240.10
      TSA 240.10
      GA 400 320.11
      TSA 320.11
      GA 500 400.11
      TSA 400.11
      GA 600 480.11
      TSA 787.49
      GA 700 560.12
      TSA 918.70
      GA 800 640.14
      TSA 1197.49
      GA 900 720.17
      TSA 1384.61
      GA 1000 800.21
      TSA 1538.43

      表 1的左半部分可以看出,当任务量${{W}_{\text{total}}}=\ 100$~500时,由于处理机不受下线时间的影响(任务的完成时间小于所有处理机的下线时间),两个算法求得的任务完成时间相同。从表 1的右半部分可以看出,当任务量${{W}_{\text{total}}}=\ 600$~1000时,由于部分处理机受到下线时间的影响(任务的完成时间大于部分处理机的下线时间),两个算法求得的任务完成时间不同,而且本文算法GA求得的任务完成时间要远小于算法TSA求得的任务完成时间。

      为了更直观地反应表 1中两种算法的对比结果,图 7给出了两种算法的任务完成时间随任务大小的变化趋势。由图 7可以看出,随着任务量的增大,两个算法求得的任务完成时间的差距越来越大。这主要是因为本文的算法在任务调度前充分考虑到各个处理机下线时间的限制,为下线时间较早的处理机分配合理的任务量,避免了任务的重新分配和重新计算,从而减少了总任务的完成时间。随着任务量的增大,处理机下线时间的影响越来越明显,因此两个算法求得的任务完成时间的差距就越来越大。

      图  7  两种算法的任务完成时间随任务大小的变化趋势

      实验2 固定任务量,对比两个算法在不同下线时间情况下求得的任务完成时间。任务量${{W}_{\text{total}}}=1\ 000$,处理机P1P20的下线时间o1o20是指数分布的随机数。图 8图 9分别给出了算法GA和TSA的任务完成时间随处理机下线时间的平均值(300~1 200)的变化趋势。

      图  8  GA的任务完成时间随下线时间平均值的变化趋势

      图  9  TSA的任务完成时间随下线时间平均值的变化趋势

      图 8图 9可以看出,随着处理机下线时间平均值的增大,两个算法求得的任务完成时间趋于平稳,结果趋于一致。这主要是因为针对固定大小的任务,随着下线时间的增大,处理机不再受下线时间的影响,当所有处理机同时完成计算时任务的完成时间最短,因此两个算法求得的任务完成时间相同。当下线时间的平均值较小时,部分处理机开始受到下线时间的影响,两个算法求得的任务完成时间不同且GA求得的任务完成时间要远小于对比算法TSA求得的任务完成时间。而且,针对固定大小的任务,处理机下线时间的平均值越小,对任务完成时间的影响越大,本文提出的算法GA相较于TSA的优势就越明显。

    • 本文在考虑实际并行与分布式环境中处理机存在下线时间的基础上,分析了两种不同时间约束下的任务调度过程,提出了一种新的考虑处理机下线时间的可分任务优化调度模型,并设计了高效的全局优化遗传算法对其进行求解。实验结果表明本文提出的算法能够针对不同处理机的下线时间有针对性的为其分配任务,使得总任务的完成时间最短。

参考文献 (15)

目录

    /

    返回文章
    返回