-
云计算模式中,云数据中心具有大规模软硬件资源,通过网络服务的方式向多用户提供强大的计算能力。因此,云计算平台中面临大量动态的计算任务请求。这些特点使得云计算环境中的任务调度比传统分布式环境中的任务调度要面临更多更复杂的问题[1]。特别是随着网络功能虚拟化 (network function virtualization, NFV) 等技术的发展,云环境中的工作流任务越来越多,其调度成为云计算领域的一个研究热点[2-3]。并且,云环境中用户按资源使用进行付费,如何权衡性能和成本成为一个普遍问题。越来越多的混合云环境下存在更复杂的资源使用成本和性能规格。这些都给云工作流调度提出了更多的挑战[3]。典型的需求场景如公安系统需要对跨地域分布存储的多源数据进行多层关联分析。为了提高计算效率,完整业务被设计成多个计算步骤,构成了工作流任务。各个任务节点之间有先后关系和数据交换,通常单个任务节点还需要加载存量历史数据。在可以实现就近资源征用的基础上,如何从大规模资源中为完整工作流计算任务选择合适的资源、降低整体计算成本并提高响应时间具有重要的应用价值。
本文主要针对云工作流调度中如何实现时间和成本的约束问题开展算法研究。满足时间约束是指确保工作流在用户指定截止时间前完成,成本约束则要求工作流的执行要在一定的成本预算范围内。造成任务整体调度时间和成本提高的原因多种多样,包括工作流中多任务的调度顺序、资源规模以及算法本身的执行效率等。针对已有的工作流调度算法存在的搜索成本高等问题,本文提出了基于资源分组的多约束云工作流调度算法,利用模糊聚类的方法对云资源进行预处理,并将列表调度和任务调度机制相结合,在为任务搜索合适的资源时,降低搜索成本。同时为了实现任务调度过程中最小化完成时间和最小化执行成本这两个目标,采用有向无环图方法求解资源分配策略。该算法在资源聚类的基础上对工作流中的任务进行调度,考虑任务执行的时间与成本预算,有效地降低任务执行时间和执行成本,实现了最小化完成时间和最小化执行成本两个目标。
-
云工作流是由一系列关联的任务构成的,将工作流调度转换成具有依赖关系的任务拓扑,而工作流调度的核心就是计算任务到资源的映射策略。调度目标主要关注两方面:1) 从任务提交到任务执行完成所花费的时间最小化,即最小化完成时间;2) 从任务提交到任务执行完成所花费的成本最小化,即最小化执行成本。本文着重讨论基于资源预处理的任务调度模型。假设向云计算系统提交一个工作流WF,其包含n个任务,系统内存在m个空闲资源。其中,对于提交的n个任务,用户规定了成本预算B和任务执行完成时间限制D。
工作流任务调度问题可以描述为:将n个任务分配到m个资源调度执行,并确保在时间限制D范围内取得任务的最小完成时间,在预算B范围内取得任务的最小执行成本。若预测任务执行完成后,最小完成时间大于时间限制D或最小执行成本大于预算B,则任务调度失败。如何将任务分配给恰当的资源,以取得执行时间和执行成本的最小化,问题定义如下。
定义1 用户提交的包含n个任务的工作流WF,用有向无环图 (direct acyclic graph, DAG) 描述为:${\rm{WF}} = (T, E)$,其中$T = \{ {t_1}, {t_2}, \cdots, {t_n}\} $代表任务集合,集合中有n个任务。$E = \{ {e_{ij}}\} $为边集,代表任务之间的依赖关系,若${e_{ij}} = 0$代表任务${t_i}$和${t_j}$之间并不存在执行顺序的先后关系;若${e_{ij}} \ne 0$代表任务${t_i}$执行完成后,任务${t_j}$才可以执行,${e_{ij}}$的值代表了任务${t_i}$和${t_j}$之间需要传输的数据量。典型工作流具有单一的首节点t1和尾节点tn,任务${t_2}$~tn-1可泛化为多个任务路径$P = \left\{ {{p_1}, {p_2}, \cdots, {p_L}} \right\}$。
定义2 云计算系统中存在的可供调度的资源用$R = \{ {r_1}, {r_2}, \cdots, {r_m}\} $表示,m为资源的总数。
定义3 矩阵W = TR是任务执行时间代价矩阵,其中${w_{ij}}$代表任务${t_i}$在资源${r_j}$上执行花费的时间。
定义4 矩阵$\boldsymbol{C} = {\boldsymbol{R}^2}$是衡量两个资源之间的通信能力即数据传输能力的矩阵,其中${c_{ij}}$代表资源${r_i}$和资源${r_j}$之间的传输带宽,即数据传输能力。
定义5 任务资源分配策略定义为X。对于给定的任务集合T和资源集合R,分配策略为:
$$X(n, m) = \{ {x_{11}}, {x_{12}}, \cdot \cdot \cdot, {x_{1m}}, {x_{21}}, {x_{22}}, \cdot \cdot \cdot, {x_{ik}}, \cdot \cdot \cdot, {x_{nm}}\} $$ (1) 式中,${x_{ij}}$取值为0或1,表示是否将任务${t_i}$分配给资源${r_j}$。所有任务的总执行时间定义为:
$$TET = \sum\limits_{i = 1}^n {\sum\limits_{j = 1}^m {{x_{ij}}{w_{ij}}} } $$ (2) 式中,${x_{ij}}{w_{ij}}$表示任务${t_i}$分配给资源${r_j}$的执行时间。所有任务的总执行成本cost为:
$$\cos t = \sum\limits_{i = 1}^n {\sum\limits_{j = 1}^m {{x_{ij}}{w_{ij}}pric{e_j}} } $$ (3) 式中,${\rm{price}}_{j}$表示分配给特定资源${r_j}$的单位时间
定价。
根据任务分配策略X,将任务${t_i}$分配给资源${r_k}$执行,任务${t_j}$分配给资源${r_l}$执行。对于所有的任务,其总数据传输时间为:
$${\rm{DTT}} = \sum\limits_{i = 1}^n {\sum\limits_{j = 1}^n {\frac{{{e_{ij}}}}{{{c_{kl}}}}} } $$ (4) 根据式 (2) 和式 (4),可以得出所有任务执行完成时间为:
$$makespan = S + {\rm{TET}} + {\rm{DTT}}$$ (5) 式中,S表示资源搜索时间。
根据以上分析,任务资源分配模型以数学的形式表示为:对于给定的任务集合T和资源集合R,如何找到一个最优的分配策略,使得任务的完成时间和执行成本最小。根据式 (3) 和式 (5),目标函数定义为:
$${\rm{func}} = {\rm{cost}} + {\rm{makespan}}$$ (6) 定义式 (3)~式 (6) 的目的是为了准确刻画成本,用于最小化求解,其约束条件为:
$${\rm{cost}} \le B\;{\rm{and}}\;{\rm{makespan}} \le D$$ (7) 约束条件表明,在成本最小化、完成时间最小化的同时,不能超过预算限制和时间限制。根据式 (3)、式 (5) 和式 (6),影响优化目标的主要因素是式 (5) 中的资源搜索时间S、所有任务的执行完成时间TET和所有的任务的总数据传输时间DTT受调度算法本身的影响。因此如何减小S、TET、DTT是调度算法的首要考虑因素。
-
针对已有算法的不足,本算法首先进行资源分组预处理,通过选择最优分组解决全局资源搜索成本的问题。并定义了时间和成本约束量化模型,最小化任务执行时间和成本。
-
分组处理将大量各种类型的云计算资源根据其特征和对任务的支持能力划分为若干小类,以解决资源搜索空间大而带来的效率低下、资源浪费、时间复杂度高等问题。
模糊聚类主要是对资源特征矩阵进行处理。完整的模糊聚类过程首先需要采集云计算资源的特征数据,根据资源特征属性,建立每个资源的多重属性特征初始矩阵。由于每个资源的特征属性的数量级与量纲存在差异,需要对初始数据矩阵进行适当的变换,即数据归一化操作,将标准矩阵中的值限定在0~1之间,方便后续的聚类划分。
本文使用$S = \left\{ {{s_1}, {s_2}, \cdots, {s_M}} \right\}$表示需要被聚类的资源集合,其中M表示资源个数;使用向量$S'({s_i}) = \{ {s_{i1}}, {s_{i2}}, \cdots, {s_{iV}}\} (i = 1, 2, \cdots, M)$表示第i个资源的特征属性,其中${s_{ij}}$表示第i个资源在第j个特征属性上的度量值,V表示特征属性个数。
特征属性是指面向任务处理能力的云计算资源特征或性质,主要包括计算能力、传输能力、内存大小、存储能力、网络位置、连接数等特征。确定特征属性后,再依据特征属性对云计算资源进行聚类,将具有相似特性的资源归到一起。针对不同的任务需求,特征属性的选择会有所不同。结合混合云场景中的典型业务场景,本算法考虑下面4个特征属性:
1) ${c_1}$代表计算能力属性,表示资源的平均计算能力,即资源节点的计算性能。性能的高低直接关系到任务的执行时间,对任务调度过程中的时间成本有着至关重要的影响。
2) ${c_2}$代表计算节点间的数据传输能力属性,表示云资源节点间的联通边权值的平均值,即连接链路的通信能力的平均值,描述了资源与资源间的数据传输性能,数据传输性能的高低直接影响数据传输的时间成本。
3) ${c_3}$表示计算节点与历史数据资源节点间的数据传输能力属性。在跨地域的混合云中,数据资源节点到不同混合云计算资源节点间的数据传输能力差异交大。该能力主要体现为对历史数据的传输加载时间需求。
4) ${c_4}$代表连接数属性,表示连接到该资源节点的其他资源的数目。分派到该资源的任务可以与其他多个资源的任务进行数据传输。
模糊聚类资源分组处理分为3个步骤:
1) 数据标准化处理
此步骤主要是消除数据量纲差异。对于原始数据表$S'$,使用平均值和标准差来处理目标系统中的数据从而获得标准化数据,每个数据的标准化值为:
$${p'_{ik}} = ({p_{ik}} - \overline {{c_k}} )/{S_{ck}}$$ (8) 式中,${c_k}$代表原始数据中第k个特征向量,$\overline {{c_k}} $是${\boldsymbol{c}_k}$的平均值;${S_{ck}}$是${\boldsymbol{c}_k}$的标准化方差。由于标准化值${p'_{ik}}$并非全属于[0, 1],采用极差标准化方法将${p'_{ik}}$转化得到${p''_{ik}}$。极差标准化方法定义如下:
$${p''_{ik}} = ({p'_{ik}} - {p'_{k\min }})/({p'_{k\max }} - {p'_{k\min }})$$ (9) 式中,${p'_{k\min }}$是最小值;${p'_{k\max }}$是${p'_{1k}}, {p'_{2k}}, \cdots, {p'_{Nk}}$的最大值。
2) 模糊矩阵实现
此步骤的主要目的是便于后续根据云计算资源特征属性的相似性对资源进行聚类。利用指数相似系数法可以计算处理单元$S = \{ {s_1}, {s_2}, \cdots, {s_N}\} $的模糊相似关系${R_s}$。经过测试,指数相似系数法具有更好的效果,计算方法如下:
$${r_{ij}} = \frac{1}{n}\sum {{{\rm{e}}^{ - \frac{3}{4}\frac{{{{({p_{ik}} - {p_{ik}})}^2}}}{{S_{ck}^{'2}}}}}} $$ (10) 式中,$S_{ck}^{2}$是第k个特征向量的方差;${r_{ij}}$为处理单元${p_i}$和${p_j}$的相似度。通过相似系数矩阵的合成运算得到具有传递闭包的模糊等价关系${R_e}$。
3) 聚类信息评估
采用基于割集的聚类方法,可以得到一组聚类结果,用${\rm{CLUSTER}} = \{ {\rm{C}}{{\rm{L}}_1}, {\rm{C}}{{\rm{L}}_2}, \cdots, {\rm{C}}{{\rm{L}}_K}\} $表示,${\rm{C}}{{\rm{L}}_j}$表示第j个资源群组。每个群组的整体性能表示为:
$${\rm{PERF}}({\rm{C}}{{\rm{L}}_j}) = \frac{1}{w}\sum\limits_{{p_w} \in C{L_j}} {\sum\limits_{i = 1}^n {{\alpha _i}{P^N}[k][i]} } $$ (11) 式中,w代表群组中处理单元的个数;${\alpha _i}$代表处理单元第i个特征向量的权重,它的值一般可以通过历史数据或经验获得。通过对每个群组的整体性能的计算,根据性能高低重新排序。任务调度时,优选排序靠前的资源群组。
-
在问题模型描述和资源属性建模的基础上,进一步引入工作流的任务时间约束和成本预算约束量化方法,并通过算法模型实现完成时间和执行成本这两个目标的权衡优化。
-
用户提交工作流给云平台执行,并指定期望的总体执行完成时间D。在调度过程中,调度粒度落到工作流中的任务层面,需要将执行时间约束加入到任务调度选择条件中。为此,定义以下3个变量:
1) 工作流剩余执行时间要求SWD:描述工作流中尚未执行任务的执行时间要求。
2) 执行时间适应因子DAF:用于调整当前任务的执行时间限制。
3) 当前任务执行时间CTD:描述当前任务的执行时间限制。
对于任务${t_i}$,其剩余截止时间为:
$${\rm{SW}}{{\rm{D}}_i} = D-\sum\limits_{{t_k} \in {\rm{pred}}({t_i})} {{\rm{ET}}({t_k})} $$ (12) 任务的执行时间${\rm{ET}}({t_k})$根据资源分配策略X计算如下:
$${\rm{ET}}({t_k}) = \sum\limits_{j = 1}^m {{x_{kj}}{w_{kj}}} $$ (13) 根据式 (13),任务${t_i}$的截止时间适应因子为:
$${\text{DF}}{{\text{A}}_i} = \left\{ \begin{gathered} \overline {{\text{ET}}(i)} /\sum\limits_{k = 1}^n {\overline {{\text{ET}}(k)} } \;\;\;{\text{SW}}{{\text{D}}_i} \geqslant 0 \hfill \\ 0\;\;\;\;\;\;\;\;\;\;\;\;\;\;\;\;\;\;\;\;\;\;\;\;\;{\text{SW}}{{\text{D}}_i} < 0 \hfill \\ \end{gathered} \right.$$ (14) 任务${t_k}$的平均执行时间$\overline {{\rm{ET}}(k)} $为任务${t_k}$在所有资源上的执行时间的平均值:
$$\overline {{\rm{ET}}(k)} = \sum\limits_{j = 1}^m {{w_{kj}}/m} $$ (15) 根据式 (12)~式 (15),${t_i}$的当前任务执行时间为:
$${\rm{CT}}{{\rm{D}}_i} = {\rm{SW}}{{\rm{D}}_i} \times {\rm{DA}}{{\rm{F}}_i}$$ (16) -
前面问题模型描述中约定工作流规定的成本预算为B。根据对工作流执行总成本的要求,需要将成本约束加入到任务选择条件中。为此,引入以下3个变量。
1) 剩余成本预算SWB:描述未执行的任务的成本限制。
2) 成本预算适应因子BAF:用于调整当前任务的预算限制。
3) 当前任务成本预算CTB:描述当前任务的执行成本限制。
对于任务${t_i}$,其剩余成本预算为:
$${\rm{SW}}{{\rm{B}}_i} = B-\sum\limits_{{t_k} \in {\rm{pred}}({t_i})} {{\rm{EC}}({t_k})} $$ (17) 执行成本${\rm{EC}}({t_k})$为:
$${\rm{EC}}({t_k}) = \sum\limits_{j = 1}^m {{x_{kj}}{w_{kj}}{\rm{pric}}{{\rm{e}}_j}} $$ (18) 任务${t_i}$的成本预算适应因子为:
$${\text{BA}}{{\text{F}}_i} = \left\{ {\begin{array}{*{20}{l}} {\overline {{\text{EC}}(i)} {\text{ /}}\overline {{\text{EC}}(i)} \sum\limits_{k = 1}^n {\overline {{\text{EC}}(k)} } \;\;\;\;\;\;\;\;\;{\text{SW}}{{\text{B}}_i} \geqslant 0} \\ {0\;\;\;\;\;\;\;\;\;\;\;\;\;\;\;\;\;\;\;\;\;\;\;\;\;\;\;\;\;\;\;\;\;\;\;\;\;\;\;\;{\text{SW}}{{\text{B}}_i} < 0} \end{array}} \right.$$ (19) 任务${t_k}$的平均执行成本$\overline {{\rm{EC}}(k)} $为任务${t_k}$在所有资源上的执行成本的平均值:
$$\overline {{\text{EC}}(k)} = \sum\limits_{j = 1}^m {{w_{kj}}{\text{pric}}{{\text{e}}_j}} /m$$ (20) 根据式 (17)~式 (20),任务${t_i}$的当前任务预算为:
$${\rm{CT}}{{\rm{B}}_i} = {\rm{SW}}{{\rm{B}}_i} \times {\rm{BA}}{{\rm{F}}_i}$$ (21) -
基于任务${t_i}$对执行时间和成本预算的要求,构建可为任务${t_i}$分配的资源集合${\rm{B}}{{\rm{S}}_i}$。通过预测任务${t_i}$在资源${r_p}$所需要的执行成本与执行时间是否满足条件${\rm{EC}}(i, p) \le {\rm{CT}}{{\rm{B}}_i}{\rm{ }}和{\rm{ ET}}(i, p) \le {{\mathop{\rm CTD}\nolimits} _i}$,将满足条件的资源保留下来,构成可为任务${t_i}$分配的资源集合${\rm{C}}{{\rm{L}}_{j, i}}$,表示为:
$$\begin{array}{l} {\rm{C}}{{\rm{L}}_{j, i}} = \{ {r_p}|\exists {r_p} \in {\rm{C}}{{\rm{L}}_j}{\rm{ and C}}{{\rm{L}}_j} \in {\rm{CLUSTER}}\\ {\rm{EC}}(i, p) \le {\rm{CT}}{{\rm{B}}_i}{\rm{ and ET}}(i, p) \le {\rm{CT}}{{\rm{D}}_i}\} \end{array}$$ (22) 集合${\rm{B}}{{\rm{S}}_i}$表示所有${\rm{C}}{{\rm{L}}_{j, i}}$中的资源所构成的可分配资源集合:
$$\begin{array}{l} {\rm{B}}{{\rm{S}}_i} = \{ {r_p}|\exists {r_p} \in \{ {\rm{C}}{{\rm{L}}_{j, i}}|{\rm{C}}{{\rm{L}}_j} \in {\rm{CLUSTER and }}\\ {\rm{ }}j \in {\rm{[0, }}\left| {{\rm{CLUSTER}}} \right|{\rm{]}}\} \} \end{array}$$ (23) 在进行任务调度时,从${{\mathop{\rm BS}\nolimits} _i}$中选择合适的资源分配给任务。
-
调度准备阶段的工作主要是为任务级调度做准备。包含根据优先级构造任务列表、资源聚类、依据工作流总体时间和成本约束量化任务粒度的时间和成本约束、构造可分配资源集合等操作。这些操作节省了搜索资源空间所花费的时间,同时也降低了后续任务调度执行的时间成本和预算成本。
-
基于3.1和3.2节描述的算法模型,优化求解任务-资源分配策略。引入时间成本平衡因子,以平衡用户对时间和成本的要求定义如下分配规则。
1) 如果${\rm{B}}{{\rm{S}}_i} \ne \emptyset $,使得最小的资源优先被选择,即优化函数:
$${F_i} = \min \left\{ {\alpha {\rm{ET}}(i, j) + (1 -\alpha ){\rm{EC}}(i, j)} \right\}{\rm{ }}j \in {\rm{B}}{{\rm{S}}_i}$$ (24) 式中,$\alpha $是时间成本平衡因子,取值范围为[0, 1],代表了用户偏好的执行时间和执行成本敏感度。如果对于任务${t_i}$的多个备选资源节点,度量值${F_i}$相等,则优选任务${t_i}$前序任务所在的资源节点。
2) 如果${\rm{B}}{{\rm{S}}_i} = \emptyset $且${\rm{SWB}} \ge 0$,所有的可用资源只要满足式 (24),均可以被选择。因为即使局部节点的可用资源不满足约束条件,但完整工作流的约束也有可能是满足的。
3) 如果${\rm{B}}{{\rm{S}}_i} = \emptyset $且${\rm{SWB}} < 0$,${\rm{SWD}} < 0$,则选择可用资源中价格最小整体性能最高的资源。
完整工作流中多个任务路径P可以并行化执行,各个路径的执行时间和执行成本分别用ET (pi) 和EC (pi) 表示,用路径上各个任务的执行时间和执行成本求和得到。考虑到路径是可以并行执行的,因此最优化函数为:
$${\rm{PF}} = \min \mathop {{\rm{Max}}}\limits_{i = 1}^L \{ \alpha {\rm{EC}}({p_i})\} + \mathop {{\rm{Max}}\{ }\limits_{i = 1}^L (1-\alpha ){\rm{ET}}({p_i})\} $$ (25) 则工作流WF的优化求解目标为:
$${\mathop{\rm WFF}\nolimits} = {F_1} + PF + {F_m}$$ (26) 通过将问题建立成数学模型,将工作流的任务调度问题转化为有约束条件的极小极大问题的求解。该目标函数的最优化结果是由多个任务构成的调度策略,通过求解该目标函数的最优值,可得到相应的最优化的资源分配策略,也就是满足用户提交的工作流任务的最优化调度策略。
-
基于云计算仿真软件CloudSim开发了实验系统,核心扩展了工作流调度模块。通过实验对比分析了本文提出的算法与HEFT算法[8]、BHEFT算法[12]在运行时间和成本方面的性能。设置任务节点数分别为10、20、50、100、150、200、250、300的情况下,分别运行20次的模拟实验,并取得实验结果的平均值进行对比分析。
-
根据文献[13],选择正常调度长度 (normalized schedule length, NSL) 作为评价算法在调度任务时的时间性能指标,正常调度长度NSL计算如下:
$${\rm{NSL}} = \frac{{{\rm{total execution time}}}}{{{T_{{\rm{fast}}}}}}$$ (27) 式中,${T_{{\rm{fast}}}}$是工作流在最快的资源上执行所有任务的执行时间。NSL的值越大,表示任务执行的时间越长。本算法与BHEFT算法、HEFT算法在运行时间方面的性能对比结果如图 1所示。
可以看出,随着任务数量的增加,3个算法的NSL值均呈上升趋势。但是,相比于BHEFT算法和HEFT算法,本算法仍然具有相对较小的NSL值;并且随着任务数量的增加,在资源够用的情况下本算法的NSL值上升趋势并不明显。这是由于本算法根据工作流任务属性,首先进行了资源分组处理策略,有效减少了资源搜索空间,从而降低了资源搜索时间;其次,将工作流全局资源调度问题转化成了极小极大问题,可以通过数学公式求解得到优化的资源分配策略。
-
根据文献[14],选择正常调度成本 (normalized schedule cost, NSC) 作为评价算法在调度任务时的成本性能指标,计算如下:
$${\rm{NSC}} = \frac{{{\rm{total cost}}}}{{{C_{{\rm{onCheap}}}}}}$$ (28) 式中,${C_{{\rm{onCheap}}}}$是所有任务在最廉价资源上的执行成本。NSC的值越大,表示耗费的成本越大。本算法与BHEFT算法和HEFT算法在运行成本方面的性能对比结果图 2所示。
可以看出,在对工作流任务进行调度时,本算法在成本方面的调度性能明显优于HEFT算法,略优于BHEFT算法。这是由于本算法引入了成本约束的限制条件,有效降低了任务调度的成本。
通过上面两个实验,可以得出在相同的截止时间和预算的约束下,使用相同的定价模型,在降低执行成本和完成时间上,本算法比其他两个算法优越。
-
算法执行加速比Speedup[15]表示所有任务的最小顺序执行时间之和与实际完工时间的比值,Speedup计算如下:
$${\rm{Speedup}} = \frac{{\mathop {\min }\limits_{{r_j} \in R} \{ \sum\limits_{{t_i} \in T} {{\rm{ET}}(i, j)} \} }}{{{\rm{makespan}}}}$$ (29) 它是衡量算法性能的一个指标,值越大,表示算法性能越好。本算法与BHEFT算法和HEFT算法在加速比方面的性能对比结果如图 3所示。
由图可知,在不同的任务数量下,本算法比其他两个算法具有更好的加速性能,运行执行效率更快。因为本算法采用全局策略一次性求解方法,并且本算法构建的策略求解模型计算简单。
Multi-Constrained Scheduling Algorithm of Cloud Workflow Based on Resource Grouping
-
摘要: 已有的云工作流调度算法采用全局搜索方式进行资源选取,存在计算成本高、对大规模云系统适应性差的问题。该文提出了基于资源分组的多约束云工作流调度算法,采用有向无环图的方法,对云工作流中的多任务之间的执行顺序和数据交换等属性进行量化建模;使用模糊聚类方法实现基于资源多维特征的分组处理,降低工作流任务到资源匹配过程中的搜索空间;并引入执行时间和成本预算约束,将工作流的任务调度问题转化为有约束条件的极小极大问题进行快速求解。仿真测试表明,该算法显著降低了任务执行完成时间和成本。Abstract: The existing cloud workflow scheduling algorithms, using the global search for resource selection, exist a high computational cost and poor adaptability for large-scale cloud systems. Aimed at solving these problem, a multi-constrained cloud workflow scheduling algorithm based on resource grouping is proposed in this paper. It uses the direct acyclic graph to model the multi-task in cloud workflow and characterize the execution sequences and data transfer requirement between tasks with the DAG's node and edge's attributes. Then, fuzzy clustering method is employed to classify resources based on multidimensional features and reduce the computational load from workflow tasks to resource selection. By introducing execution time and cost budget constraints, the proposed algorithm transforms the scheduling problem into a minimax problem. Simulation results show that our algorithm significantly reduces the task execution time and cost.
-
Key words:
- cloud computing /
- cloud workflow /
- scheduling algorithms /
- resource allocation /
- fuzzy clustering
-
[1] FANG Y, WANG F, GE J. A task scheduling algorithm based on load balancing in cloud computing[C]//Web Information Systems and Mining. Sanya, China: Springer, 2010: 271-277. [2] VILALTA R, MAYORAL A, MUÑOZ R, et al. The SDN/NFV cloud computing platform and transport network of the ADRENALINE testbed[C]//2015 1st IEEE Conference on Network Softwarization (NetSoft). [S.l.]: IEEE, 2015: 1-5. [3] 陈超.改进CS算法结合决策树的云工作流调度[J].电子科技大学学报, 2016, 45(6): 974-980. http://www.juestc.uestc.edu.cn/CN/abstract/abstract57.shtml CHEN Chao. Workflow task scheduling in cloud computing based on hybrid improved CS algorithm and decision tree[J]. Journal of University of Electronic Science and Technology of China, 2016, 45(6): 974-980. http://www.juestc.uestc.edu.cn/CN/abstract/abstract57.shtml [4] MATHEW T, SEKARAN K C, JOSE J. Study and analysis of various task scheduling algorithms in the cloud computing environment[C]//2014 International Conference on Advances in Computing, Communications and Informatics. [S.l.]: IEEE, 2014: 658-664. [5] GUO L, ZHAO S, SHEN S, et al. Task scheduling optimization in cloud computing based on heuristic algorithm[J]. Journal of Networks, 2012, 7(3): 547-553. https://www.researchgate.net/publication/267824936_Task_Scheduling_Optimization_in_Cloud_Computing_Based_on_Heuristic_Algorithm [6] VARALAKSHMI P, RAMASWAMY A, BALASUBRAMANIAN A, et al. An optimal workflow based scheduling and resource allocation in cloud[C]// Advances in Computing and Communications. [S.l.]: Springer, 2011: 411-420. [7] TOPCUOGLU H, HARIRI S, WU M. Performanceeffective and low-complexity task scheduling for heterogeneous computing[J]. IEEE Transactions on Parallel and Distributed Systems, 2002, 13(3): 260-274. doi: 10.1109/71.993206 [8] ARABNEJAD H, BARBOSA J G. List scheduling algorithm for heterogeneous systems by an optimistic cost table[J]. IEEE Transactions on Parallel and Distributed Systems, 2014, 25(3): 682-694. doi: 10.1109/TPDS.2013.57 [9] MALAWSKI M, JUVE G, DEELMAN E, et al. Cost-and deadline-constrained provisioning for scientific workflow ensembles in iaas clouds[C]//Proceedings of the International Conference on High Performance Computing, Networking, Storage and Analysis. [S.l.]: IEEE Computer Society, 2012. [10] ABRISHAMI S, NAGHIBZADEH M, EPEMA D H J. Deadline-constrained workflow scheduling algorithms for infrastructure as a service clouds[J]. Future Generation Computer Systems, 2013, 29(1): 158-169. doi: 10.1016/j.future.2012.05.004 [11] VAN D B R, VANMECHELEN K, BROECKHOVE J. Online cost-efficient scheduling of deadline-constrained workloads on hybrid clouds[J]. Future Generation Computer Systems, 2013, 29(4): 973-985. doi: 10.1016/j.future.2012.12.012 [12] ZHENG W, SAKELLARIOU R. Budget-deadline constrained workflow planning for admission control[J]. Journal of Grid Computing, 2013, 11(4): 633-651. doi: 10.1007/s10723-013-9257-4 [13] SHIN K S, CHA M J, JANG M S, et al. Task scheduling algorithm using minimized duplications in homogeneous systems[J]. Journal of Parallel and Distributed Computing, 2008, 68(8): 1146-1156. doi: 10.1016/j.jpdc.2008.04.001 [14] VERMA A, KAUSHAL S. Cost minimized pso based workflow scheduling plan for cloud computing[J]. International Journal of Information Technology and Computer Science (IJITCS), 2015, 7(8): 37. doi: 10.5815/ijitcs [15] CAO H, JIN H, WU X, et al. DAGMap: Efficient and dependable scheduling of DAG workflow job in Grid[J]. The Journal of Supercomputing, 2010, 51(2): 201-223. doi: 10.1007/s11227-009-0284-7