考虑处理机下线时间的可分任务调度优化模型

王晓丽; 王宇平; 蔡坤; 赖俊凡

doi:10.3969/j.issn.1001-0548.2017.01.014

考虑处理机下线时间的可分任务调度优化模型

doi: 10.3969/j.issn.1001-0548.2017.01.014

西安电子科技大学计算机学院西安 710071

基金项目:

国家自然科学基金 61402350，61472297，61572391

中央高校基本科研业务费专项资金 JB150307

详细信息

作者简介:
王晓丽(1987-),女,博士,主要从事并行与分布式系统下的任务调度方面的研究

中图分类号: TP393

Off-Line Time Aware Divisible-Load Scheduling Optimization Model

School of Computer Science and Technology, Xidian University Xi'an 710071

摘要: 随着科学应用逐渐趋于数据密集型计算，为并行与分布式系统寻求高效的任务调度策略成了研究的热点问题。已有的可分任务调度模型均假设所有处理机都能100%的完成子任务的计算，即处理机在完成任务计算之前一直保持在线状态。实际上，并行与分布式系统中不同处理机的在线时间可能不同。若忽略处理机的在线时间，为其分配的任务量过大，则任务的完成时间可能超出处理机的下线时间，从而造成任务的计算无法按时完成。因此，为处理机分配任务时应充分考虑处理机下线时间的限制。为解决上述问题，该文提出了一种新的考虑处理机下线时间的可分任务调度优化模型，并设计了全局优化遗传算法求解该模型。最后，通过仿真实验结果验证了模型和算法的有效性。
- 可分任务调度 /
- 遗传算法 /
- 下线时间 /
- 并行与分布式系统
Abstract: As scientific applications become more data intensive, finding an efficient scheduling strategy for massive computing in parallel and distributed systems has drawn increasingly attention. Most existing scheduling models assume that all processors can 100% finish computing, that is, they keep online during the completion of assigned workload fractions. In fact, in the real parallel and distributed environments, different processors have different off-line time. Therefore, off-line time constraints of processors should be taken into account before distributing of the workload fractions; otherwise, some processors may not be able to fish computing their assignments. To solve the above issue, this paper proposes an off-line time aware divisible-load scheduling model and designs an effective global optimization genetic algorithm to solve it. Finally, experimental results illustrate the effectiveness of the proposed model and the efficiency of the proposed algorithm.
- divisible-load scheduling /
- genetic algorithm /
- off-line time /
- parallel and distributed systems

图 1 所有处理机不受下线时间的影响

下载: 全尺寸图片幻灯片

图 2 部分处理机受下线时间的影响

下载: 全尺寸图片幻灯片

图 3 交叉示意图

下载: 全尺寸图片幻灯片

图 4 一种不满足模型约束的可分任务调度时序图

下载: 全尺寸图片幻灯片

图 5 修正算子的迭代过程示意图

下载: 全尺寸图片幻灯片

图 6 局部搜索算子执行过程示意图

下载: 全尺寸图片幻灯片

图 7 两种算法的任务完成时间随任务大小的变化趋势

下载: 全尺寸图片幻灯片

图 8 GA的任务完成时间随下线时间平均值的变化趋势

下载: 全尺寸图片幻灯片

图 9 TSA的任务完成时间随下线时间平均值的变化趋势

下载: 全尺寸图片幻灯片

表 1 不同任务量情况下两种算法对比的实验结果

算法	任务量/MB	完成时间/s
GA	100	80.09
TSA	100	80.09
GA	200	160.10
TSA	200	160.10
GA	300	240.10
TSA	300	240.10
GA	400	320.11
TSA	400	320.11
GA	500	400.11
TSA	500	400.11
GA	600	480.11
TSA	600	787.49
GA	700	560.12
TSA	700	918.70
GA	800	640.14
TSA	800	1197.49
GA	900	720.17
TSA	900	1384.61
GA	1000	800.21
TSA	1000	1538.43

下载: 导出CSV

[1]	BHARDWAJ V, GHOSE D, MANI V, et al. Scheduling divisible loads in parallel and distributed systems[M]. Los Alamitos CA:IEEE Computer Society Press, 1996.
[2]	MANI V, GHOSE D. Distributed computation in linear networks:Closed-form solutions[J]. IEEE Transactions on Aerospace and Electronic Systems, 1994, 30(2):471-483. doi: 10.1109/7.272269
[3]	GHOSE D, MANI V. Distributed computation with communication delays:Asymptotic performance analysis[J]. Journal of Parallel and Distributed Computing, 1994, 23(3):293-305. doi: 10.1006/jpdc.1994.1141
[4]	BHARADWAJ V, GHOSE D, MANI V. Optimal sequencing and arrangement in distributed single-level tree networks with communication delays[J]. IEEE Transactions on Parallel and Distributed Systems, 1994, 5(9):968-976. doi: 10.1109/71.308534
[5]	KIM H J, JEE G I, LEE J G. Optimal load distribution for tree network processors[J]. IEEE Transactions on Aerospace and Electronic Systems, 1996, 32(2):607-612. doi: 10.1109/7.489505
[6]	SURESH S, MANI V, OMKAR S N. The effect of start-up delays in scheduling divisible loads on bus networks:an alternate approach[J]. Computers & Mathematics with Applications, 2003, 46(10):1545-1557.
[7]	VEERAVALLI B, LI X, KO C C. On the influence of start-up costs in scheduling divisible loads on bus networks[J]. IEEE Transactions on Parallel and Distributed Systems, 2000, 11(12):1288-1305. doi: 10.1109/71.895794
[8]	MURUGESAN G, CHELLAPPAN C. Multi-source task scheduling in grid computing environment using linear programming[J]. International Journal of Computational Science and Engineering, 2014, 9(1):80-85.
[9]	LIN W, LIANG C, WANG J Z, et al. Bandwidth aware divisible task scheduling for cloud computing[J]. Software:Practice and Experience, 2014, 44(2):163-174. doi: 10.1002/spe.v44.2
[10]	HOSEINYFARAHABADY M R, LEE Y C, ZOMAYA A Y. Randomized approximation scheme for resource allocation in hybrid-cloud environment[J]. The Journal of Supercomputing, 2014, 69(2):576-592. doi: 10.1007/s11227-014-1094-0
[11]	SHI H, WANG W, KWOK N M, et al. Adaptive indexed divisible load theory for wireless sensor network workload allocation[J]. International Journal of Distributed Sensor Networks, 2013(1):1-18.
[12]	DAI L, SHEN Z, CHEN T, et al. Analysis and modeling of task scheduling in wireless sensor network based on divisible load theory[J]. International Journal of Communication Systems, 2014, 27(5):721-731. doi: 10.1002/dac.v27.5
[13]	HU M, VEERAVALLI B. Dynamic scheduling of hybrid real-time tasks on clusters[J]. IEEE Transactions on Computers, 2014, 63(12):2988-2997. doi: 10.1109/TC.2013.170
[14]	HU M, VEERAVALLI B. Requirement-aware strategies for scheduling real-time divisible loads on clusters[J]. Journal of Parallel and Distributed Computing, 2013, 73(8):1083-1091. doi: 10.1016/j.jpdc.2013.03.013
[15]	ROSAS C, SIKORA A, JORBA J, et al. Improving performance on data-intensive applications using a load balancing methodology based on divisible load theory[J]. International Journal of Parallel Programming, 2013, 42(1):94-118. http://cn.bing.com/academic/profile?id=e39ee1cc950291ce62dbb175d24bcafb&encoded=0&v=paper_preview&mkt=zh-cn

[1]	李龚亮, 敬思远, 郭兵, 沈艳. 基于图形处理器的并行遗传过程挖掘 . 电子科技大学学报, 2019, 48(6): 918-924. doi: 10.3969/j.issn.1001-0548.2019.06.017
[2]	张民, 贾海涛, 沈震. 基于遗传算法改进的粒子滤波重采样模型 . 电子科技大学学报, 2015, 44(3): 344-349. doi: 10.3969/j.issn.1001-0548.2015.03.005
[3]	薛羽, 庄毅, 朱浩, 张友益礻禹. 求解协同干扰问题的高效免疫遗传算法 . 电子科技大学学报, 2013, 42(3): 452-458. doi: 10.3969/j.issn.1001-0548.2013.03.026
[4]	郑世明, 高志年, 韦伟, 苗壮, 邵荣明. 基于云模型的网格任务调度遗传算法研究 . 电子科技大学学报, 2012, 41(6): 911-915. doi: 10.3969/j.issn.1001-0548.2012.06.018
[5]	熊彦铭, 毛凌, 杨战平. 基于遗传算法的时间决策系统标定优化方法 . 电子科技大学学报, 2012, 41(1): 80-84. doi: 10.3969/j.issn.1001-0548.2012.01.016
[6]	王江安, 庄奕琪, 周清军. 遗传算法抑制BOC(1,1)信号多径研究 . 电子科技大学学报, 2010, 39(1): 45-49. doi: 10.3969/j.issn.1001-0548.2010.01.011
[7]	刘洪武, 冯全源. MC-CDMA系统中基于遗传算法的多用户检测 . 电子科技大学学报, 2008, 37(4): 485-488.
[8]	王瑞平, 万柏坤, 高上凯. 使用遗传算法的乳腺微钙化点特征优化 . 电子科技大学学报, 2007, 36(1): 137-139,153.
[9]	李向阳, 张亚非. 一种基于遗传算法的语义标注 . 电子科技大学学报, 2007, 36(1): 86-89.
[10]	王志红, 杜平安, 郭志龙, 梁山虎. 基于遗传算法与动态规划法的工艺过程优化 . 电子科技大学学报, 2007, 36(1): 146-149.
[11]	吴传信, 倪明放, 陈鸣. 路由选择的一种新遗传算法 . 电子科技大学学报, 2006, 35(5): 744-747.
[12]	沈艳, 郭兵, 古天祥. 粒子群优化算法及其与遗传算法的比较 . 电子科技大学学报, 2005, 34(5): 696-699.
[13]	黄羽, 黄迪明, 何险峰, 武明. 遗传算法在入侵检测中的应用 . 电子科技大学学报, 2003, 32(6): 679-682.
[14]	王忠, 柴贺军, 刘浩吾. 关于进化遗传算法的几点改进 . 电子科技大学学报, 2002, 31(1): 76-79.
[15]	张宇, 郭晶, 周激流. 动态变异遗传算法 . 电子科技大学学报, 2002, 31(3): 234-239.
[16]	王海枚, 游志胜. 基于遗传算法与模糊控制的建模方法 . 电子科技大学学报, 2002, 31(3): 266-269.
[17]	饶克谨, 苟益. 电路模拟吸收体的遗传算法设计 . 电子科技大学学报, 2000, 29(1): 54-60.
[18]	王勇, 陈光. 面向时滞测试生成的改进遗传算法 . 电子科技大学学报, 1999, 28(2): 157-161.
[19]	吴斌, 吴坚, 涂序彦. 快速遗传算法研究 . 电子科技大学学报, 1999, 28(1): 49-53.
[20]	潘中良, 陈光. 测试图形生成的遗传算法研究 . 电子科技大学学报, 1997, 26(5): 511-514.

点击查看大图

图(9) / 表(1)

计量

文章访问数: 4065
HTML全文浏览量: 1434
PDF下载量: 58
被引次数: 0

全文HTML

随着大数据时代的来临，数据的规模呈爆炸式增长，如何高效快速处理并分析数据成了研究的重点和难点问题。大数据应用问题，如大规模矩阵运算、DNA测序分析、卫星图像处理等，虽然数据规模庞大，但是大都可以抽象为可分任务，即任务可以被划分为任意大小的子任务，子任务间相互独立且没有优先级关系^[1]。并行与分布式系统下可分任务调度问题的目标是寻求最优的任务分配方案使得任务的完成时间最短。

针对并行与分布式系统下常见的线型拓扑结构、总线型拓扑结构和树型拓扑结构，已有很多文献对可分任务的最优调度策略进行了研究。文献^[2]给出了同构线型网络下最优任务分配方案的紧式耦合解，文献^[3]给出了同构树型网络与总线型网络下任务分配方案的渐近解。文献^[4]给出了异构星型网络下任务分配方案的紧式耦合解，并且证明了处理机调度顺序在遵循通信速率递减的情况下任务的完成时间最短。对于异构树型网络，文献^[5]的研究表明处理机的调度顺序只依赖于其通信速率而非计算速率。然而，这些研究成果都没有考虑处理机的计算启动开销和网络的通信启动开销。文献^[6-7]在调度模型中引入了启动开销，分析了总线型网络下启动开销和处理机的调度顺序对任务完成时间的影响，证明了当处理机遵循计算速率递减的顺序时任务的完成时间最短。为了使可分任务调度模型更符合分布式平台的实际网络环境，文献^[8]将可分任务调度模型扩展到多源网格环境中，文献^[9]研究了云平台下处理机带宽受限的可分任务调度问题，文献^[10]将其扩展到混合云计算平台环境中，文献^[11-12]将其扩展到无线传感器网络中，文献^[13-14]将其扩展到实时环境中。

但是，已有的可分任务调度模型均假设所有处理机都能100%的完成所分配的子任务，即处理机在完成所分配的子任务之前一直保持在线状态^[15]。然而在实际的网络环境下这个假设并不成立，不同处理机的下线时间可能不同。若为处理机分配的任务量过大，则任务的完成时间可能超出处理机的下线时间，从而造成任务的计算无法按时完成。若处理机未完成计算就已下线，则为其分配的任务需要等待其他处理机完成计算空闲后，调度到其他仍在线的处理机上重新开始计算，从而导致任务的总完成时间增大。鉴于此，本文提出了一种新的考虑处理机下线时间的可分任务调度优化模型，并且设计了新的遗传算法对模型进行求解。

4. 结束语

本文在考虑实际并行与分布式环境中处理机存在下线时间的基础上，分析了两种不同时间约束下的任务调度过程，提出了一种新的考虑处理机下线时间的可分任务优化调度模型，并设计了高效的全局优化遗传算法对其进行求解。实验结果表明本文提出的算法能够针对不同处理机的下线时间有针对性的为其分配任务，使得总任务的完成时间最短。

参考文献 (15)

姓名
邮箱
手机号码
标题
留言内容
验证码

留言板

考虑处理机下线时间的可分任务调度优化模型

doi: 10.3969/j.issn.1001-0548.2017.01.014

作者简介:
王晓丽(1987-),女,博士,主要从事并行与分布式系统下的任务调度方面的研究

Off-Line Time Aware Divisible-Load Scheduling Optimization Model

计量

考虑处理机下线时间的可分任务调度优化模型

doi: 10.3969/j.issn.1001-0548.2017.01.014

西安电子科技大学计算机学院西安 710071

作者简介:
王晓丽(1987-),女,博士,主要从事并行与分布式系统下的任务调度方面的研究

English Abstract

Off-Line Time Aware Divisible-Load Scheduling Optimization Model

School of Computer Science and Technology, Xidian University Xi'an 710071

全文HTML

1.1. 问题描述

1.2. 可分任务调度优化模型

2.1. 编码与解码

2.2. 交叉和变异算子

2.3. 修正算子

2.4. 局部搜索算子

2.5. 可分任务调度遗传算法整体框架

目录

期刊在线

编辑办公

友情链接

留言板

考虑处理机下线时间的可分任务调度优化模型

doi: 10.3969/j.issn.1001-0548.2017.01.014

作者简介: 王晓丽(1987-),女,博士,主要从事并行与分布式系统下的任务调度方面的研究

Off-Line Time Aware Divisible-Load Scheduling Optimization Model

计量

出版历程

考虑处理机下线时间的可分任务调度优化模型

doi: 10.3969/j.issn.1001-0548.2017.01.014

西安电子科技大学计算机学院 西安 710071

作者简介: 王晓丽(1987-),女,博士,主要从事并行与分布式系统下的任务调度方面的研究

English Abstract

Off-Line Time Aware Divisible-Load Scheduling Optimization Model

School of Computer Science and Technology, Xidian University Xi'an 710071

全文HTML

1.1. 问题描述

1.2. 可分任务调度优化模型

2.1. 编码与解码

2.2. 交叉和变异算子

2.3. 修正算子

2.4. 局部搜索算子

2.5. 可分任务调度遗传算法整体框架

目录

期刊在线

编辑办公

友情链接

作者简介:
王晓丽(1987-),女,博士,主要从事并行与分布式系统下的任务调度方面的研究

西安电子科技大学计算机学院西安 710071

作者简介:
王晓丽(1987-),女,博士,主要从事并行与分布式系统下的任务调度方面的研究