JP4286703B2 - Resource planning program - Google Patents
Resource planning program Download PDFInfo
- Publication number
- JP4286703B2 JP4286703B2 JP2004105093A JP2004105093A JP4286703B2 JP 4286703 B2 JP4286703 B2 JP 4286703B2 JP 2004105093 A JP2004105093 A JP 2004105093A JP 2004105093 A JP2004105093 A JP 2004105093A JP 4286703 B2 JP4286703 B2 JP 4286703B2
- Authority
- JP
- Japan
- Prior art keywords
- service
- ndc
- time
- derived
- load
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Lifetime
Links
- 238000011156 evaluation Methods 0.000 claims description 81
- 238000000034 method Methods 0.000 claims description 71
- 238000012937 correction Methods 0.000 claims description 2
- 238000012545 processing Methods 0.000 description 32
- 238000005259 measurement Methods 0.000 description 27
- 238000005457 optimization Methods 0.000 description 27
- 230000008569 process Effects 0.000 description 23
- 238000004891 communication Methods 0.000 description 19
- 238000013439 planning Methods 0.000 description 19
- 238000004364 calculation method Methods 0.000 description 16
- 238000010586 diagram Methods 0.000 description 14
- 230000006872 improvement Effects 0.000 description 14
- 239000000344 soap Substances 0.000 description 9
- 238000004422 calculation algorithm Methods 0.000 description 8
- 238000009826 distribution Methods 0.000 description 8
- 238000009795 derivation Methods 0.000 description 7
- 230000007704 transition Effects 0.000 description 7
- 230000005540 biological transmission Effects 0.000 description 6
- 230000008859 change Effects 0.000 description 5
- 238000002360 preparation method Methods 0.000 description 5
- 230000006866 deterioration Effects 0.000 description 3
- 238000004088 simulation Methods 0.000 description 3
- YHXISWVBGDMDLQ-UHFFFAOYSA-N moclobemide Chemical compound C1=CC(Cl)=CC=C1C(=O)NCCN1CCOCC1 YHXISWVBGDMDLQ-UHFFFAOYSA-N 0.000 description 2
- 238000005192 partition Methods 0.000 description 2
- 238000013468 resource allocation Methods 0.000 description 2
- 238000010845 search algorithm Methods 0.000 description 2
- 230000001174 ascending effect Effects 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000007726 management method Methods 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 108700019579 mouse Ifi16 Proteins 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 238000003860 storage Methods 0.000 description 1
- 230000002123 temporal effect Effects 0.000 description 1
Images
Landscapes
- Multi Processors (AREA)
Description
この発明は、複数の計算機から構成される計算機クラスタが複数接続されて構成される計算機クラスタシステムが運用する複数のサービスの該複数の計算機クラスタへの配置計画を作成する資源計画作成プログラムに関し、特に、各計算機クラスタが過負荷になることを防ぐとともに、計算機クラスタの計算資源を効率的に使用することができる資源計画の作成プログラムに関するものである。 The present invention relates to a resource plan creation program for creating an arrangement plan for a plurality of services operated by a computer cluster system configured by connecting a plurality of computer clusters composed of a plurality of computers to the plurality of computer clusters. The present invention relates to a resource plan creation program capable of preventing each computer cluster from being overloaded and efficiently using the computing resources of the computer cluster.
近年のデータセンタは、一つのデータセンタ内において、複数のサービスプロバイダ事業者から運用を委託された複数のネットワーク・サービスを同時に運用するようになってきており、それと共に、同時運用する複数のサービスの中で負荷の増加しているサービスに対しては、データセンタ内の計算資源の割当量を動的に増やし、負荷の減少しているサービスにはデータセンタ内の計算資源の割当量を動的に減らすユーティリティ方式に基づく資源割当制御を行っている(例えば、特許文献1参照)。 In recent years, data centers have been operating a plurality of network services entrusted by a plurality of service providers within a data center at the same time. For services with a high load, the allocation of computational resources in the data center is dynamically increased, and for services with a low load, the allocation of computational resources in the data center is changed. Resource allocation control is performed based on a utility method that reduces the amount of data (see, for example, Patent Document 1).
しかし、データセンタで運用している一部のサービスが一時的に過負荷となり、このサービスに対する資源割当を大幅に増やす必要が生じたときに、新たに追加割当すべき遊休資源がデータセンタ内で不足し、資源追加が出来ない事態が発生する場合がある。 However, when some services operated in the data center are temporarily overloaded and there is a need to significantly increase the resource allocation for this service, there are additional idle resources to be allocated in the data center. There may be a situation where there is a shortage and resources cannot be added.
このような事態の発生を防ぐためには、データセンタでの全ての運用サービスの負荷の合計がピークになる時の必要資源量を予測し、データセンタに恒常的にピーク時必要資源量を用意することが考えられるが、この場合には、ピーク時以外の期間中は大半の資源量が遊休資源として使われないままになり、データセンタ全体としてコストパフォーマンスや計算資源利用効率が低下してしまう。 In order to prevent such a situation from occurring, the required resource amount when the total load of all operation services in the data center reaches a peak is predicted, and the peak required resource amount is constantly prepared in the data center. However, in this case, during the period other than the peak time, most of the amount of resources remains unused as idle resources, and the cost performance and computational resource utilization efficiency of the entire data center is reduced.
そこで、国際特許出願JP03/03273では、後方支援データセンタを用いる方式が提案されている。この方式では、通常、各サービスはサービスの運用を依頼したサービスプロバイダ事業者が指定した特定のデータセンタ(以下「オリジナル・センタ」という。)で恒常的に運用される(以下、このようなサービスを「原始サービス」という。)。 In view of this, International Patent Application JP 03/03273 proposes a method using a logistic support data center. In this method, each service is normally operated at a specific data center (hereinafter referred to as “original center”) designated by the service provider that requested the service operation (hereinafter referred to as such service). ("Primary service").
そして、原始サービスが負荷の時間変動によって一時的に過負荷になり、それによってオリジナル・センタ自体もセンタ全体として過負荷状態になった場合、オリジナル・センタ上の過負荷になった原始サービスの一部を、後方支援センタと呼ぶ別異のデータセンタで処理するため、後方支援センタ上に当該原始サービスに対応する補助的サービス(以下「派生サービス」という。)を発生させて後方支援センタ上で運用を開始する。 Then, if the original service is temporarily overloaded due to load fluctuations and the original center itself is overloaded as a whole, one of the original services that have been overloaded on the original center. Are processed in a different data center called a logistic support center, an auxiliary service (hereinafter referred to as “derivative service”) corresponding to the original service is generated on the logistic support center and Start operation.
これによって、過負荷になった原始サービスが負担していた負荷の一部を後方支援センタ上の派生サービスが肩代わりすることができ、オリジナル・センタのセンタ全体としての過負荷状態を解消できる。 As a result, a part of the load borne by the overloaded original service can be taken over by the derived service on the logistic support center, and the overload state of the original center as a whole can be eliminated.
ここで、各サービスに到着したユーザ・リクエスト量の原始サービスと派生サービスへの分配比率はネットワーク内の負荷分散装置またはリダイレクタに設定され、当該負荷分散装置等は設定された比率に基づいて、サービスに到着したユーザ・リクエスト量を原始サービスと派生サービスの間で振り分ける。 Here, the distribution ratio of the user request amount arriving at each service to the original service and the derived service is set in the load balancer or redirector in the network, and the load balancer etc. is based on the set ratio. The amount of user requests arriving at is distributed between the primitive service and the derived service.
このような従来のデータセンタ運用形態においては、オリジナル・センタは一般に複数個あり、後方支援センタは一つであることが多い。また、オリジナル・センタと後方支援センタの役割分担は明確であり、後方支援センタは専ら派生サービスの運用のためだけに用いられていた。 In such a conventional data center operation mode, there are generally a plurality of original centers and one logistic support center in many cases. Also, the division of roles between the original center and the logistic support center was clear, and the logistic support center was used exclusively for the operation of derived services.
しかしながら、特定のデータセンタを後方支援センタとして定め、全ての派生サービスを専らそのデータセンタでのみ運用する従来の技術には、複数のオリジナル・センタ上の多数の原始サービスから同時に一つの後方支援センタに対して派生サービスの発生要求が集中した場合、後方支援センタがセンタ全体として過負荷状態になるという問題がある。 However, in the conventional technology in which a specific data center is defined as a logistic support center and all derived services are operated exclusively in the data center, a number of original services on a plurality of original centers can be simultaneously used as one logistic support center. On the other hand, there is a problem that the logistic support center becomes overloaded as a whole when the requests for generation of derived services are concentrated.
また、派生サービスの発生要求の集中がピークになる時に後方支援センタで必要となる資源量を予測し、後方支援センタに恒常的に当該ピーク時必要資源量を用意するとなると、ピーク時以外は後方支援センタの計算資源の大半は使われないこととなり、資源利用効率が低下する。 In addition, if the amount of resources required at the logistical support center is predicted when the concentration of generation requests for derived services reaches a peak, and the required amount of resources at the peak is constantly prepared in the logistic support center, Most of the computing resources of the support center will not be used, and resource utilization efficiency will decrease.
この発明は、上述した従来技術による問題点を解消するためになされたものであり、データセンタを典型例とするような計算機資源の集合体である計算機クラスタの各々が過負荷になることを防ぐとともに、計算機クラスタの計算資源を効率的に使用することができる資源計画作成プログラムを提供することを目的とする。 The present invention has been made to solve the above-described problems caused by the prior art, and prevents each computer cluster, which is a collection of computer resources such as a data center as a typical example, from being overloaded. Another object is to provide a resource plan creation program that can efficiently use the computing resources of a computer cluster.
上述した課題を解決し、目的を達成するため、本発明は、複数の計算機から構成される計算機クラスタが複数接続されて構成される計算機クラスタシステムが運用する複数のサービスを該複数の計算機クラスタへ配置する資源計画を作成する資源計画作成プログラムであって、運用される計算機クラスタが定められたサービスである原始サービスから該原始サービスの負荷予測に基づいて各計算機クラスタから他の計算機クラスタへ運用の一部が移される派生サービスを、負荷予測の予測期間を所定の時間間隔で複数のタイムスロットに分割したタイムスロット毎に生成する派生サービス生成手順と、前記派生サービス生成手順により生成された派生サービス群を前記複数の計算機クラスタへ最適配置する資源計画として、タイムスロット毎の派生サービスの配置計画であるタイムスロット配置計画を該タイムスロットの時刻順に並べた配置計画系列を、計算機クラスタ間の負荷均等度と、時間軸上で隣接するタイムスロット間のタイムスロット配置計画の類似度とを評価指標として用いて作成する計画作成手順と、をコンピュータに実行させることを特徴とする。 In order to solve the above-described problems and achieve the object, the present invention provides a plurality of services operated by a computer cluster system configured by connecting a plurality of computer clusters including a plurality of computers to the plurality of computer clusters. A resource plan creation program for creating a resource plan to be deployed, wherein an operation of a computer cluster to be operated from each computer cluster to another computer cluster based on a load prediction of the source service from a service in which the computer cluster to be operated is determined Derived service generation procedure for generating a part of the derived service for each time slot obtained by dividing the prediction period of load prediction into a plurality of time slots at a predetermined time interval, and the derived service generated by the derived service generating procedure as resource planning for optimal arrangement of the group to the plurality of computer cluster, each time slot An arrangement plan sequence in which time slot arrangement plans, which are derived service arrangement plans, are arranged in the order of the timeslots, is similar to the load equality between computer clusters and the time slot arrangement plan between adjacent time slots on the time axis. And a plan creation procedure for creating a plan using the degree as an evaluation index .
この発明によれば、運用される計算機クラスタが定められたサービスである原始サービスから原始サービスの負荷予測に基づいて各計算機クラスタから他の計算機クラスタへ運用の一部が移される派生サービスを、負荷予測の予測期間を所定の時間間隔で複数のタイムスロットに分割したタイムスロット毎に生成し、生成した派生サービス群を複数の計算機クラスタへ最適配置する資源計画として、タイムスロット毎の派生サービスの配置計画であるタイムスロット配置計画をタイムスロットの時刻順に並べた配置計画系列を、計算機クラスタ間の負荷均等度と、時間軸上で隣接するタイムスロット間のタイムスロット配置計画の類似度とを評価指標として用いて作成するよう構成したので、過負荷の計算機クラスタが運用するサービスの一部を計算機クラスタシステム全体で肩代わりすることができる。 According to this invention, a derived service in which a part of the operation is transferred from each computer cluster to another computer cluster based on the load prediction of the source service from the source service, which is a service for which the computer cluster to be operated is determined , is loaded. Arrangement of derived services for each time slot as a resource plan that generates a forecast period for each time slot divided into a plurality of time slots at a predetermined time interval and optimally allocates the derived service group to a plurality of computer clusters An arrangement index series that arranges time slot allocation plans, which are plans, in the order of time slot time, and evaluates the load equality between computer clusters and the similarity of time slot allocation plans between adjacent time slots on the time axis since it is configured to create used as, for service computer cluster overload operated one It can take over the entire computer cluster system.
本発明によれば、過負荷の計算機クラスタが運用するサービスの一部を計算機クラスタシステム全体で肩代わりするので、各計算機クラスタが過負荷になることを防ぐとともに、計算機クラスタの計算資源を効率的に使用することができるという効果を奏する。 According to the present invention, a part of services operated by an overloaded computer cluster is taken over by the entire computer cluster system, so that each computer cluster is prevented from being overloaded and the computing resources of the computer cluster are efficiently allocated. There is an effect that it can be used.
以下に添付図面を参照して、この発明に係る資源計画作成プログラムの好適な実施例を詳細に説明する。なお、ここでは、本発明を複数のデータセンタの計算資源を複数のサービスに割り当てる資源計画の作成に適用した場合を中心に説明する。 Exemplary embodiments of a resource plan creation program according to the present invention will be described below in detail with reference to the accompanying drawings. Here, the case where the present invention is applied to the creation of a resource plan in which computing resources of a plurality of data centers are assigned to a plurality of services will be mainly described.
まず、本実施例に係る資源計画の概念について説明する。図1は、本実施例に係る資源計画の概念を説明するための説明図である。図1の左側のグラフには、XXチケット販売会社の提供するWEBサービスに関する年間の負荷変動予測がプロットされている。 First, the concept of the resource plan according to the present embodiment will be described. FIG. 1 is an explanatory diagram for explaining the concept of the resource plan according to the present embodiment. The graph on the left side of FIG. 1 plots the annual load fluctuation prediction regarding the WEB service provided by the XX ticket sales company.
このグラフ内の水平の点線で示した高さがXXチケット販売会社の自社センタの保有資源量で処理できる負荷の量を表している。このグラフの負荷変動は2箇所のピークを持ち、いずれのピークにおいても自社センタ資源で処理できる負荷量(点線の高さ)を超えてしまっている。そこで、本実施例に係る資源計画では、ピーク時に自社センタ以外のデータセンタに派生サービスを発生させて点線を超えた分の負荷を肩代わりさせる。 The height indicated by the horizontal dotted line in this graph represents the amount of load that can be processed by the amount of resources owned by the own center of the XX ticket sales company. The load fluctuation in this graph has two peaks, and at any peak, the load amount (the height of the dotted line) that can be processed by the company's center resource has been exceeded. Therefore, in the resource plan according to the present embodiment, a derived service is generated in a data center other than its own center at the peak time, and the load exceeding the dotted line is taken over.
ここで、左側のピークの発生期間においては、データセンタXでは資源が殆ど消費されていないのに対し、データセンタYでは大半の資源が他のサービスなどによって消費されている。従って、左側のピーク時にはデータセンタXに派生サービスを配置する。 Here, in the peak generation period on the left side, almost no resources are consumed in the data center X, whereas most resources are consumed in the data center Y by other services. Accordingly, the derivative service is arranged in the data center X at the left peak.
一方、右側のピークの発生期間においては、データセンタXの大半の資源が他のサービスなどによって消費されており、データセンタYでは資源が殆ど消費されていないので、データセンタYに派生サービスを配置する。 On the other hand, during the peak occurrence period on the right side, most of the resources in the data center X are consumed by other services and the resources in the data center Y are hardly consumed. To do.
すなわち、本実施例に係る資源計画では、複数個あるオリジナル・センタの内、運用中の原始サービスが低負荷となったことにより一時的に遊休資源が大量に余っているオリジナル・センタを選んで臨時の後方支援センタとして扱い、当該臨時の後方支援センタで、派生サービスを運用する。 That is, in the resource plan according to the present embodiment, among the plurality of original centers, an original center that temporarily has a large amount of idle resources due to a low load on the operating primitive service is selected. Treat it as a temporary logistic support center and operate the derivative service at the temporary logistic support center.
このような運用形態に基づくならば、オリジナル・センタと後方支援センタの役割分担は各データセンタに固有のものではなく、データセンタXが原始サービスAを恒常的に運用しており、データセンタYが原始サービスBを恒常的に運用している場合、データセンタXは、原始サービスAにとっては常にオリジナル・センタとしての役割を持ち、原始サービスBにとっては後方支援センタとしての役割を持つ場合がある。以後、ここでは、オリジナル・センタと後方支援センタの役割分担は上記のようにサービスとの相対関係で決まるものとする。 Based on such an operation mode, the division of roles between the original center and the logistic support center is not unique to each data center, the data center X constantly operates the primitive service A, and the data center Y When the source service B is constantly operated, the data center X may always have the role of the original center for the source service A and the role of the logistic support center for the source service B. . Hereinafter, it is assumed here that the roles of the original center and the logistic support center are determined by the relative relationship with the service as described above.
ここで、多数のデータセンタがネットワークで繋がった環境で多数の原始サービスを運用しようとする際には、ある原始サービスが将来において過負荷になった際、どのデータセンタを派生サービス運用のための後方支援センタとして選択すればよいかが問題となる。つまり、将来発生することが予想される各派生サービスを各々どのデータセンタにいつ何時に配置すべきかが問題となる。 Here, when trying to operate a large number of primitive services in an environment where a large number of data centers are connected by a network, when a certain primitive service is overloaded in the future, which data center can be The question is whether to select a logistical support center. That is, there is a problem of when and at what time each derived service expected to occur in the future should be placed in which data center.
ただし、ある将来時点で発生している各派生サービスを各計算機クラスタへどのように配置するかについての最適解の探索については、計算量と計算時間を考慮する必要がある。例えば、データセンタが3個あり、ある将来時点で30個の派生サービスが同時に発生しているとすると、ある1個の派生サービスは、発生元の原始サービスのオリジナル・センタ以外の二つのデータセンタのどちらかに配置可能だから、30個の派生サービスの3個のデータセンタへの配置の仕方は2の30乗(10億以上)通りあることになる。 However, it is necessary to consider the calculation amount and the calculation time when searching for the optimum solution for how to arrange each derived service occurring at a certain future time point in each computer cluster. For example, if there are three data centers and 30 derived services are generated simultaneously at a certain future time point, one derived service has two data centers other than the original center of the originating service. Therefore, 30 derived services can be arranged in 3 data centers in 2 30 powers (1 billion or more).
従って、これら全てを単純探索により評価するのは膨大な時間の無駄となり、派生サービス集合のデータセンタ集合への配置の最適解を発見するに当たっては、探索ステップ数ができるだけ少なく抑えられるような最適解探索手法が必要となる。 Therefore, it is wasted a lot of time to evaluate all of these by a simple search, and in finding the optimal solution for the arrangement of the derived service set in the data center set, an optimal solution that can suppress the number of search steps as little as possible. A search method is required.
具体的には、データセンタ群と原始サービスの集合が与えられ、各原始サービスを運用するオリジナル・センタが指定された場合、派生サービスの将来発生時点を予め予測し、全てのデータセンタの計算資源利用効率が改善されるように、様々な時点で発生する各派生サービスを各々どのデータセンタで運用するか(派生サービスのセンタ配置)を最適化する必要がある(図2)。 Specifically, when a set of data centers and primitive services is given, and the original center that operates each primitive service is specified, the future occurrence time of the derived service is predicted in advance, and the calculation resources of all data centers In order to improve the use efficiency, it is necessary to optimize in which data center each derived service generated at various times is operated (center arrangement of the derived service) (FIG. 2).
また、派生サービス集合の構成や各派生サービスの処理する負荷量、各データセンタの資源消費状況などは時々刻々と変化するので、時間の経過に従って、派生サービス集合のデータセンタ群への配置の最適化を定期的にやり直す必要がある。上記の配置の最適化を定期的にやり直す際は、時間軸をタイムスロットと呼ぶ周期に分割し、各タイムスロット毎に最適な派生サービス配置を求める(図3)。 In addition, the configuration of the derived service set, the load amount processed by each derived service, the resource consumption status of each data center, etc. change from time to time, so the optimal arrangement of the derived service set to the data center group over time It is necessary to redo periodically. When the above optimization of arrangement is periodically performed again, the time axis is divided into periods called time slots, and an optimum derived service arrangement is obtained for each time slot (FIG. 3).
従って、最終的には、派生サービス集合のデータセンタ群への配置パターンの最適候補を一定時間周期毎(各タイムスロット毎)に求めて、それをタイムスロットの時刻順に時系列として並べた情報を出力する必要がある。この出力情報のことを以後、データセンタ群の資源計画と呼ぶ。 Therefore, finally, the optimum candidate of the arrangement pattern of the derived service set in the data center group is obtained for every fixed time period (each time slot), and the information in which the time series of the time slots are arranged in time order is obtained. It is necessary to output. This output information is hereinafter referred to as a data center group resource plan.
また、最適な派生サービス配置の時系列を探索するに当たって、同時発生する派生サービスの個数によっては、探索空間が巨大となり、単純探索では膨大な時間がかかるので、それを防ぐために、本実施例に係る資源計画では、以下の工夫をする。 In addition, when searching for the time series of the optimum derived service arrangement, the search space becomes huge depending on the number of derived services that occur at the same time, and a simple search takes a lot of time. In such resource planning, the following measures are taken.
探索対象の解は一般に複数個の指標によって評価され、それら全ての指標をなるべく最適にする解が最終的に選ばれなくてはならないが、探索空間の中から少なくとも一つの指標が最適であるような解から構成される集合(Pareto解集合)を絞り込み、そのPareto解集合の中から特定の基準によって任意の解を選び、その解を暫定解とする。 The solution to be searched is generally evaluated by a plurality of indices, and a solution that optimizes all the indices as much as possible must be finally selected, but at least one of the indices in the search space seems to be optimal. Narrow down a set composed of various solutions (Pareto solution set), select an arbitrary solution from the Pareto solution set according to a specific criterion, and set the solution as a provisional solution.
そして、後述するNDC入れ替え操作により、暫定解を漸近的に真の最適解に近づけてゆき、暫定解の評価値が一定の収束半径に入ったらその暫定解を最終的な最適解として出力する。 Then, the provisional solution is asymptotically brought close to the true optimum solution by the NDC replacement operation described later, and when the evaluation value of the provisional solution enters a certain convergence radius, the provisional solution is output as the final optimum solution.
なお、データセンタが運用するサービスには、WEBサービスのようにユーザ・リクエストを受け付けてから数秒以内に応答を返さなくてはならないようなリアルタイム性を要求されるトランザクション型のサービスと、毎日、毎月といった一定の周期で決められた時刻に投入された複数のジョブ群を、予め定められたデッドライン時刻までに全て処理完了する必要のあるバッチ型のサービスがある。 The services operated by the data center include a transaction-type service that requires a response within a few seconds after receiving a user request, such as a WEB service, and a daily and monthly service. There is a batch-type service in which it is necessary to complete processing of a plurality of job groups input at a predetermined time in a predetermined cycle by a predetermined deadline time.
バッチ型のサービスは複数個のジョブによって構成され、一般に複数回に分けて、各々決められた時刻に、複数個ずつのジョブがまとめてデータセンタに投入される。このジョブの投入スケジュールは一日周期や1ヶ月周期等の一定周期毎に繰り返される。ジョブの投入スケジュールは、そのバッチ型サービスの運用を委託した委託元業者によって事前に指定される。 A batch-type service is composed of a plurality of jobs, and is generally divided into a plurality of times, and a plurality of jobs are collectively put into a data center at a predetermined time. This job submission schedule is repeated at regular intervals such as a daily cycle or a one-month cycle. The job submission schedule is specified in advance by a consignor who has entrusted the operation of the batch service.
バッチ型サービスに関しては、投入されたジョブ群が指定されたデッドライン時刻までに全て処理完了するのであれば、個々のジョブは、いつ何時処理されてもよく、いわばリアルタイム性を必要としない。 As for the batch type service, as long as all of the input jobs are processed by the designated deadline time, each job may be processed anytime, so that it does not require real time.
従って、データセンタ群で運用する原始サービス集合がトランザクション型のサービスとバッチ型のサービスの2種類のサービスから構成されている場合は、トランザクション型サービスがリアルタイム性を要求されるサービスであることを考慮し、データセンタ群の持つ計算資源は、トランザクション型サービスに優先的に割り当てる。 Therefore, when the primitive service set operated in the data center group is composed of two types of services, a transaction type service and a batch type service, it is considered that the transaction type service is a service that requires real-time property. However, the computing resources of the data center group are preferentially allocated to the transaction type service.
その後、トランザクション型サービスに割り当てられなかった余剰計算資源をバッチ型サービスの処理に割り当てるような資源計画の生成を行う必要がある。従って、データセンタ群の資源計画を生成するには、まず、トランザクション型の原始サービスのみを当該データセンタ群で運用したと仮定して資源計画の生成を行い、その資源計画においてトランザクション型サービスに割り当てられていない余剰計算資源に対し、バッチ型サービスの資源計画の生成を行う。 After that, it is necessary to generate a resource plan that allocates surplus computing resources that have not been allocated to the transaction type service to processing of the batch type service. Therefore, to generate a resource plan for a data center group, first create a resource plan on the assumption that only the transaction-type primitive service is operated in the data center group, and assign it to the transaction-type service in the resource plan. A resource plan for a batch service is generated for surplus computing resources that have not been assigned.
また、バッチ型原始サービスの負荷変動予測に関しては、バッチ型サービスのジョブ投入スケジュールが予め既知であることから、ARIMAモデル手法のような数理的な予測アルゴリズムによってサービスの将来負荷変動を予測するのではなく、将来の負荷変動の推移を特定のジョブ・スケジューリング・アルゴリズムによって計画することが出来る。 Also, regarding the load fluctuation prediction of batch-type primitive services, since the job input schedule of batch-type services is known in advance, it is not possible to predict the future load fluctuation of services using a mathematical prediction algorithm such as the ARIMA model method. In the future, the transition of future load fluctuations can be planned by a specific job scheduling algorithm.
従って、バッチ型原始サービスの集合に関する資源計画の生成では、バッチ型原始サービスの将来の負荷変動は予測するのではなく、ジョブ・スケジューリング・アルゴリズムによって事前に計画されたものを用いるという形をとる。 Therefore, in the generation of a resource plan for a set of batch-type primitive services, the future load fluctuations of the batch-type primitive services are not predicted, but those that are planned in advance by a job scheduling algorithm are used.
具体的なジョブ・スケジューリング・アルゴリズムは、後述するが、当該スケジューリング・アルゴリズムの特徴は、バッチ型原始サービスを構成する各ジョブを、投入時刻の遅い順にスケジューリングしてゆき、スケジューリング対象となったジョブを、当該ジョブの投入時刻からデッドライン時刻までの間の時間帯の中でデータセンタ群の余剰計算資源の最も多い時刻に当該ジョブをスケジューリングするというものである。 The specific job scheduling algorithm will be described later. The characteristic of the scheduling algorithm is that the jobs that make up the batch-type primitive service are scheduled in the order of late submission time, and the jobs to be scheduled are scheduled. The job is scheduled at the time when the surplus computing resources of the data center group are the largest in the time zone between the time when the job is submitted and the deadline time.
このようなジョブ・スケジューリング・アルゴリズムを採用する理由は、バッチ型サービスの負荷の処理は、なるべくトランザクション型サービスによる負荷が空いている時を選んで行わせることにある。 The reason for adopting such a job scheduling algorithm is that the processing of the load of the batch type service is selected as much as possible when the load of the transaction type service is free.
次に、本実施例に係る資源計画作成装置の構成について説明する。図4は、本実施例に係る資源計画作成装置の構成を示す機能ブロック図である。同図に示すように、この資源計画作成装置100は、トランザクション計画部110と、バッチ計画部120と、資源計画送信部130とを有する。
Next, the configuration of the resource plan creation device according to the present embodiment will be described. FIG. 4 is a functional block diagram illustrating the configuration of the resource plan creation device according to the present embodiment. As shown in the figure, the resource
トランザクション計画部110は、トランザクション型サービスに対して資源計画を作成する処理部であり、予測部111と、派生サービス生成部112と、DC生成部113と、NDC生成部114と、最適解探索部115とを有する。
The
なお、以下のトランザクション計画部110の説明において、サービス、原始サービスおよび派生サービスについては、特に断らない限り、トランザクション型のサービスを意味する。また、トランザクション型サービスの資源計画の生成においては、タイムスロットの長さはデータセンタ群の運営業者によって、データセンタ群全体で一意の値が手動で決定されるものとする。
In the following description of the
予測部111は、運用すべき全ての原始サービスの負荷変動の将来予測を行う処理部である。ここで、予測の対象となる期間を以後、予測期間と呼び、その長さは、1日、1ヶ月、1年などである。 The prediction unit 111 is a processing unit that performs future prediction of load fluctuations of all primitive services to be operated. Here, the period to be predicted is hereinafter referred to as a prediction period, and its length is one day, one month, one year, or the like.
派生サービス生成部112は、予測部111による負荷変動予測とオリジナル・センタの保有資源量に基づいて、派生サービスの発生時刻、発生個数、各派生サービスと原始サービスとの間の負荷分配比率を求める処理部である。
The derived
派生サービスの発生条件としては以下のようなものが例として挙げられる。図5−1および図5−2は、派生サービスの発生条件を説明するための説明図(1)および(2)である。図5−1は、データセンタ内に配置された原始サービスのリソース使用率が90%を超えたときに派生サービスを発生させる場合を示している。 Examples of the conditions for generating a derived service include the following. FIGS. 5A and 5B are explanatory diagrams (1) and (2) for explaining the generation conditions of the derived service. FIG. 5A shows a case where a derived service is generated when the resource usage rate of the primitive service arranged in the data center exceeds 90%.
また、図5−2は、三つのデータセンタX、YおよびZのリソース使用率の平均を算出し、各データセンタのリソース使用率が平均の1.2倍以上になったときに派生サービスを発生させる場合を示している。 Also, FIG. 5-2 calculates the average of the resource usage rates of the three data centers X, Y, and Z, and when the resource usage rate of each data center becomes 1.2 times or more of the average, the derived service is displayed. The case where it generates is shown.
実際には、派生サービス生成部112は、各データセンタ毎に原始サービスによるリソース使用率の標準偏差を計算し、その値が一定の閾値を超えた時に派生サービスを発生させるという発生条件を採用している。
Actually, the derived
DC生成部113は、予測期間を一定周期のタイムスロットに分割し、各タイムスロット毎にタイムスロット内で発生する派生サービスをどのデータセンタに配置するかを定める配置組合せパターンの候補全てを生成する処理部である。
The
ここで、生成される配置組合せパターンの各候補のことをDC(Deployment Candidate)と呼び、タイムスロット(t)について生成したDCの集合に属するDCのことを、タイムスロット(t)に属するDCと呼ぶ。 Here, each of the generated arrangement combination patterns is called a DC (Deployment Candidate), and a DC belonging to the set of DCs generated for the time slot (t) is a DC belonging to the time slot (t). Call.
NDC生成部114は、各タイムスロットに属するDCからVDC(Violating DC)を除外したNDC(Normal DC)を作成する処理部である。ここで、VDCとは、複数の評価指標m1, …, mkによる評価結果e1, …, ekが所定の条件に違反するDCであり、NDCとは、それ以外のDCである。
The
評価指標は、評価指標を用いて派生サービス群のデータセンタ群への配置組合せの最適化をすることにより、データセンタ群全体の資源利用効率が改善されるようなものであり、例えば、負荷の均等度(図6−1)、NDCの類似度(図6−2)などがある。なお、ここでは、評価値の値が小さいほど評価が良いものとする。 The evaluation index is such that the resource utilization efficiency of the entire data center group is improved by optimizing the arrangement combination of the derived service group to the data center group using the evaluation index. There are equality (FIG. 6-1), NDC similarity (FIG. 6-2), and the like. Here, the smaller the evaluation value, the better the evaluation.
図6−1は、三つのデータセンタX、YおよびZにおいて負荷の配置が均等でなく悪い配置と負荷の配置が均等で良い配置とを示しており、配置が良いほど負荷の均等度の値は小さいものとする。 FIG. 6A illustrates an arrangement in which the load arrangement is not uniform in the three data centers X, Y, and Z, and an arrangement in which the load arrangement is uniform and good. Shall be small.
図6−2は、四つのデータセンタW、X、YおよびZの間での、タイムスロット(K−1)からタイムスロット(K)に移る際の派生サービスの移動およびタイムスロット(K)からタイムスロット(K+1)に移る際の派生サービスの移動を示しており、ここでは、時間の経過に伴うタイムスロットの遷移時におけるサービス移動個数が多いほどNDCの類似度の値は大きいものとする。 FIG. 6-2 shows the movement of the derived service and the time slot (K) when moving from the time slot (K-1) to the time slot (K) between the four data centers W, X, Y and Z. The movement of the derived service at the time of shifting to the time slot (K + 1) is shown. Here, it is assumed that the value of the NDC similarity is larger as the number of service movements at the time slot transition with time elapses.
最適解探索部115は、Pareto最適性理論に基づいて最適なNDC系列を作成する処理部である。ここで、NDC系列とは、各タイムスロットからNDCを一つずつ選んでタイムスロット順に時系列に並べたものである。すなわち、最適なNDC系列を作成することが最適な資源計画を作成することとなる。
The optimal
具体的には、この最適解探索部115は、NDC系列毎に、それを構成する各NDCのk個の評価値e1, …, ekの各々をNDC系列全体にわたって合計して系列評価値E1, …, Ekとする。
Specifically, the optimal
そして、k個の系列評価値E1, …, Ekの中で、いずれか一つ以上の系列評価値が最小の値となるものを全て選び出し、初期系列集合とする。この初期系列集合は、NDC系列の集合を解空間とし、k個の系列評価値E1, …, Ekの各々を目的関数とした時の多目的最適化問題におけるPareto解集合に相当する。 Then, out of the k series evaluation values E 1 ,..., E k , all the ones having one or more series evaluation values having the minimum value are selected and set as the initial series set. This initial sequence set corresponds to a Pareto solution set in a multi-objective optimization problem when a set of NDC sequences is a solution space and each of k sequence evaluation values E 1 ,..., E k is an objective function.
そして、求めた初期系列集合の中から系列評価関数ξの値が最小となるようなNDC系列を選び出し、準最適NDC系列とする。そして、各タイムスロット毎に、準最適NDC系列を構成する各NDCを、当該NDCと同一のタイムスロットに属する他の全てのNDCと比較し、以下の入れ替え条件が成り立つ場合には、前者のNDCを後者のNDCと入れ替える操作を行う。 Then, an NDC sequence that minimizes the value of the sequence evaluation function ξ is selected from the obtained initial sequence set and set as a sub-optimal NDC sequence. Then, for each time slot, each NDC constituting the sub-optimal NDC sequence is compared with all other NDCs belonging to the same time slot as the NDC, and when the following replacement condition is satisfied, the former NDC Is replaced with the latter NDC.
ここで、ei(Tp,c)は準最適NDC系列内のタイムスロットTpに属するNDCについてのeiの値であり、ei(Tp,o)はタイムスロットTpに属するNDCであって準最適NDC系列に含まれないNDCについてのeiの値と定義する。 Here, e i (T p , c) is the value of e i for the NDC belonging to the time slot T p in the suboptimal NDC sequence, and e i (T p , o) is the NDC belonging to the time slot T p. And defined as the value of e i for NDC not included in the suboptimal NDC sequence.
そして、タイムスロットTpに属する準最適NDC系列内のNDCのk個の全ての評価値について、ei(Tp,c) ≧ ei(Tp,o) (1 ≦ i ≦ k)となる場合はNDCの入れ替えを行う。つまり、NDCの入れ替えの結果、k個の評価値の組を構成する全ての評価値に関して評価値が改善される場合はNDCの入れ替えを行う。 For all k evaluation values of the NDC in the suboptimal NDC sequence belonging to the time slot T p , e i (T p , c) ≧ e i (T p , o) (1 ≦ i ≦ k) If so, replace NDC. That is, as a result of the NDC replacement, if the evaluation values are improved for all evaluation values constituting the set of k evaluation values, the NDC replacement is performed.
また、次の場合にもNDCの入れ替えを行う。k個の評価値の組を構成する評価値の中で、一部の評価値が入れ替えにより改善され、その他の評価値が改悪される場合、改善される評価値の改善量に入れ替え制御関数を適用した値の重み付け平均が、改悪される評価値の改悪量に入れ替え制御関数を適用した値の重み付け平均より上回るならば入れ替えを行うというものである。 Also, NDC replacement is performed in the following cases. When some evaluation values are improved by replacement and other evaluation values are deteriorated among the evaluation values constituting the set of k evaluation values, the replacement control function is replaced with the improvement amount of the evaluation value to be improved. If the weighted average of the applied values is higher than the weighted average of the values obtained by applying the replacement control function to the amount of deterioration of the evaluation value to be deteriorated, the replacement is performed.
つまり、整数の集合I=[i|1≦i≦k]が二つの部分集合I1とI2に分割でき、i ∈ I1の場合にei(Tp,c) ≦ ei(Tp,o)であり、i ∈ I2の場合にei(Tp,c)>ei(Tp,o)であるとき、以下の式(1)
が成り立つならば、NDC入れ替え操作を実行する。ここで、φiは重み係数、Δei(T
p) = ei(Tp,c)−ei(Tp,o)、δei(Tp) = ei(Tp,o)−ei(Tp,c)、Λiおよびλiは評価値eiに関する入れ替え制御関数である。
In other words, the set of integers I = [i | 1 ≦ i ≦ k] can be divided into two subsets I1 and I2, and when i ∈ I1, e i (T p , c) ≦ e i (T p , o ) And when i ∈ I2 and e i (T p , c)> e i (T p , o), the following equation (1)
If the above holds, the NDC replacement operation is executed. Where φ i is a weighting factor, Δe i (T
p ) = e i (T p , c) −e i (T p , o), δe i (T p ) = e i (T p , o) −e i (T p , c), Λ i and λ i is a replacement control function for the evaluation value e i .
そして、NDCの入れ替えによって修正された準最適NDC系列を系列評価関数ξで評価し、NDC入れ替え操作を行う以前の準最適NDC系列のξで評価した値と比較し、改善率が一定の閾値を下回ったら準最適NDC系列をデータセンタ群の資源計画とし、そうでなければ、NDC入れ替えによって修正されたNDC系列を新たな準最適NDC系列としてNDCの入れ替えを繰り返す。 Then, the sub-optimal NDC sequence modified by the NDC replacement is evaluated by the sequence evaluation function ξ, and compared with the value evaluated by the ξ of the sub-optimal NDC sequence before the NDC replacement operation, a threshold with a constant improvement rate is set. If it falls below, the sub-optimal NDC sequence is used as the resource plan for the data center group. If not, NDC replacement is repeated with the NDC sequence modified by NDC replacement as a new sub-optimal NDC sequence.
ここで、図7〜図12を用いてこの最適解探索部115の処理の具体例について説明する。図7は、最適解探索部115による最適化手順の概略を説明するための説明図である。なお、ここでは、評価指標として負荷の均等度とNDCの類似度を用いる。
Here, a specific example of processing of the optimum
同図に示すように、この最適解探索部115は、最適化ステップ(1)として、NDCの類似度に基づいて暫定解の初期候補群を生成し、最適化ステップ(2)として、暫定解の初期候補群を負荷の均等度とNDCの類似度を用いて評価し、評価値が最小のものを暫定解とする。
As shown in the figure, the optimum
そして、最適化ステップ(3)として、暫定解に対するNDCの入れ替えによってより良い暫定解を生成し、最適化ステップ(4)として、収束条件を満たすか否かを判定し、収束条件を満たす場合には、暫定解を最終解として出力し、収束条件を満たさない場合には、最適化ステップ(3)に戻って収束条件を満たすまでNDCの入れ替えを繰り返す。 Then, in the optimization step (3), a better provisional solution is generated by replacing the NDC with the provisional solution. In the optimization step (4), it is determined whether or not the convergence condition is satisfied. Outputs the provisional solution as the final solution, and when the convergence condition is not satisfied, returns to the optimization step (3) and repeats the NDC replacement until the convergence condition is satisfied.
図8は、最適化手順の説明に用いるNDCテーブルの概念を説明するための説明図である。同図に示すように、NDCテーブルとは、各タイムスロットに属するNDCを負荷均等度の良い順に並べたものである。以下、このNDCテーブルを用いて各最適化ステップを説明する。 FIG. 8 is an explanatory diagram for explaining the concept of the NDC table used for explaining the optimization procedure. As shown in the figure, the NDC table is a table in which NDCs belonging to each time slot are arranged in order of good load uniformity. Hereinafter, each optimization step will be described using this NDC table.
図9は、最適化ステップ(1)を説明するための説明図である。同図に示すように、この最適化ステップでは、隣接するタイムスロット間で「NDCの類似度=0」となるNDC同士を接続して類似NDC系列を生成する。例えば、図9では、タイムスロット(0)のNDC(1)を先頭とする類似NDC系列、タイムスロット(0)のNDC(2)を先頭とする類似NDC系列などの複数の類似NDC系列が得られる。 FIG. 9 is an explanatory diagram for explaining the optimization step (1). As shown in the figure, in this optimization step, similar NDC sequences are generated by connecting NDCs having “NDC similarity = 0” between adjacent time slots. For example, in FIG. 9, a plurality of similar NDC sequences such as a similar NDC sequence starting from NDC (1) in time slot (0) and a similar NDC sequence starting from NDC (2) in time slot (0) are obtained. It is done.
なお、NDC同士を接続する場合に、「NDCの類似度=0」となるNDCがない場合には、NDCの類似度が最も小さいNDCを選択する。この結果、生成された類似NDC系列は、NDCの類似度を評価指標とし、この評価指標の値が最も小さいNDC系列であり、これらを暫定解の初期候補群とする。また、各タイムスロットで最小の負荷均等度を持つNDCから構成されるNDC系列は、系列全体としての負荷均等度の合計が最小のNDC系列であり、これも暫定解の初期候補群に含める。 When NDCs are connected to each other, if there is no NDC having “NDC similarity = 0”, the NDC having the lowest NDC similarity is selected. As a result, the generated similar NDC sequence is an NDC sequence having the smallest value of the evaluation index as the evaluation index, and uses these as the initial candidate group of the provisional solution. An NDC sequence composed of NDCs having the minimum load uniformity in each time slot is an NDC sequence having the minimum total load uniformity as a whole sequence, and this is also included in the initial candidate group of the provisional solution.
図10は、最適化ステップ(2)を説明するための説明図である。同図に示すように、この最適化ステップでは、負荷均等度およびNDCの類似度を評価指標として全ての類似NDC系列を評価し、系列評価値Ecが最小の最良類似NDC系列を暫定解とする。 FIG. 10 is an explanatory diagram for explaining the optimization step (2). As shown in the figure, in this optimization step, all similar NDC sequences are evaluated using the load uniformity and NDC similarity as evaluation indexes, and the best similar NDC sequence having the smallest sequence evaluation value Ec is used as a provisional solution. .
図11−1は、最適化ステップ(3)を説明するための説明図である。同図に示すように、この最適化ステップでは、暫定解の各タイムスロットにおいて、暫定解に含まれるNDC以外のNDCが所定の条件を満たす場合に、NDCを入れ替える。 FIG. 11A is an explanatory diagram for explaining the optimization step (3). As shown in the figure, in this optimization step, in each time slot of the provisional solution, NDC other than NDC included in the provisional solution is replaced when NDC satisfies a predetermined condition.
ここで、所定の条件とは、図11−2に示すように、負荷均等度およびNDCの類似度を同時に改善するNDCがある場合には、そのタイムスロットでの評価値Eiの値が最小のものを選んで入れ替えを行う。 Here, as shown in FIG. 11-2, the predetermined condition is that when there is NDC that simultaneously improves the load uniformity and the similarity of NDC, the value of the evaluation value E i in the time slot is minimum. Select one and replace it.
また、どちらか一方だけが改善する場合には、以下のようにする。負荷均等度だけが改善するときは、NDCの類時度の悪化量ΔSを所定の関数で評価した値BL(ΔS)よりも、負荷均等度の改善量ΔLの方が大きいNDCの中でΔL−BL(ΔS)の値が最大のものを選び、類似度だけが改善するときは、類似度の改善量ΔSを所定の関数で評価した値BL(ΔS)よりも、負荷均等度の悪化量ΔLの方が大きいNDCの中でBL(ΔS)−ΔLの値が最大のものを選んで入れ替えを行う。 If only one of them improves, do the following: When only the load uniformity improves, ΔL among the NDCs in which the improvement amount ΔL of the load uniformity is larger than the value BL (ΔS) obtained by evaluating the deterioration amount ΔS of the NDC analogy by a predetermined function. When the value of −BL (ΔS) is the largest and only the similarity is improved, the amount of deterioration of the load uniformity is worse than the value BL (ΔS) obtained by evaluating the improvement ΔS of the similarity with a predetermined function. Among NDCs having a larger ΔL, the one having the largest BL (ΔS) −ΔL is selected and replaced.
図12は、最適化ステップ(4)を説明するための説明図である。同図に示すように、この最適化ステップでは、NDC入れ替え処理を施した最良類似NDC系列の系列評価値Ecの改善率を調べ、改善率が例えば3%以内であれば収束条件を満たしたものとして最終解を出力し、収束条件を満たさない場合には、最適化ステップ(3)に戻って、入れ替え処理を繰り返す。 FIG. 12 is an explanatory diagram for explaining the optimization step (4). As shown in the figure, in this optimization step, the improvement rate of the sequence evaluation value Ec of the best similar NDC sequence subjected to the NDC replacement process is checked. If the improvement rate is within 3%, for example, the convergence condition is satisfied. When the final solution is output and the convergence condition is not satisfied, the process returns to the optimization step (3) and the replacement process is repeated.
このように、NDCの類似度に基づいてNDC系列の初期候補群を生成し、初期候補群から系列評価値Ecが最小の最良類似NDC系列を暫定解とし、NDCの入れ替えによって暫定解を改善することによって、最適なNDC系列を求めることができる。なお、ここでは、負荷均等度およびNDCの類似度の二つの評価指標を用いたが、一般には、任意の個数の評価指標を用いることができる。また、収束条件に用いる改善率も3%以外の他の値を用いることができる。 In this way, an initial candidate group of NDC sequences is generated based on the similarity of NDC, the best similar NDC sequence having the smallest sequence evaluation value Ec is set as a provisional solution from the initial candidate group, and the provisional solution is improved by replacing NDC. Thus, an optimal NDC sequence can be obtained. Here, although two evaluation indexes of load uniformity and NDC similarity are used, in general, an arbitrary number of evaluation indexes can be used. Also, the improvement rate used for the convergence condition can be a value other than 3%.
バッチ計画部120は、バッチ型の原始サービス集合について資源計画の生成を行う処理部であり、負荷量算出部121と、バッチ型派生サービス生成部122と、バッチ型DC生成部123と、バッチ型NDC生成部124と、バッチ型最適解探索部125とを有する。
The
なお、以下のバッチ計画部120の説明では、ジョブの投入スケジュールは1日周期で繰り返され、予測期間の長さが1日のトランザクション型サービスについての資源計画が得られていると仮定して説明する。
In the following description of the
また、あるバッチ型サービスの1個のジョブを標準的な性能のサーバ1台で処理するのに必要な時間を「ターンアラウンド時間」と呼び、この時間の長さはバッチ型サービス毎に一意に定まる。 Also, the time required to process one job of a batch type service with one standard performance server is called “turnaround time”, and the length of this time is unique for each batch type service. Determined.
また、標準的な性能のサーバ1台が捌くことの出来る負荷量を「単位サーバ性能」と呼ぶ。デッドライン時刻とターンアラウンド時間は各バッチ型原始サービス毎に一意の値が定まる。また、バッチ型サービスの個々のジョブの投入時刻と予測期間の開始時刻の時間差は当該バッチ型サービスのターンアラウンド時間の整数倍とする。 Also, the load that one server with standard performance can run is called “unit server performance”. The deadline time and turnaround time are unique for each batch-type primitive service. Further, the time difference between the input time of each job of the batch type service and the start time of the prediction period is an integral multiple of the turnaround time of the batch type service.
負荷量算出部121は、将来の負荷量を算出する処理部である。具体的には、この負荷量算出部121は、以下の手順で将来の負荷量を算出する。まず、全てのバッチ型原始サービスのターンアラウンド時間の最小公倍数を求め、この値を新たなタイムスロットの長さとする。
The load
そして、各データセンタ毎、各計測周期毎に、当該計測周期において当該データセンタに存在する(トランザクション型サービスに割り当てられなかった)余剰資源量で捌くことの出来る負荷量を単位サーバ性能で除算し、余剰資源量を標準性能サーバ台数の表現に換算する(以後これを、余剰サーバ台数と呼ぶ)。 Then, for each data center and each measurement cycle, the load amount that can be distributed by the surplus resource amount (not allocated to the transaction type service) that exists in the data center in the measurement cycle is divided by the unit server performance. The surplus resource amount is converted into a representation of the standard performance server number (hereinafter referred to as the surplus server number).
そして、予測期間内における各バッチ型原始サービスの将来負荷変動を0で初期化する。その後、各バッチ型原始サービス毎に、各バッチ型サービスのジョブ投入スケジュールが、「時刻t1にn1件のジョブを投入、t2にn2件を投入、…、tkにnk件を投入」となっている時、1≦i≦kである各整数iについて以下の(S1)〜(S5)を実行する。ただしt1>t2>…>tkとする。 Then, the future load fluctuation of each batch-type primitive service within the prediction period is initialized with zero. Then, for each batch type primitive service, job submission schedule for each batch type service, "at a time t 1 is turned on the job of 1 n, charged with 2 n to t 2, ..., n k matter to t k The following (S1) to (S5) are executed for each integer i satisfying 1 ≦ i ≦ k. However, t 1 > t 2 >...> t k .
(S1)時刻tiから当該バッチ型原始サービスのデッドライン時刻までの期間(これをスケジュール期間と呼ぶ)を当該バッチ型原始サービスのターンアラウンド時間の長さを持つタイム・クォンタムに分割する。
(S2)各データセンタの各タイム・クォンタム毎に余剰サーバ台数が最小となる計測周期を求め、その時の余剰サーバ台数をそのタイム・クォンタムの余剰サーバ台数とする。
(S1) The period from the time t i to the deadline time of the batch type primitive service (this is called a schedule period) is divided into time quantums having the length of the turnaround time of the batch type primitive service.
(S2) A measurement cycle that minimizes the number of surplus servers for each time quantum of each data center is obtained, and the surplus server number at that time is set as the number of surplus servers in the time quantum.
(S3)各タイム・クォンタムにおいて、余剰サーバ台数が最大であるデータセンタを検索し、当該データセンタをそのタイム・クォンタムにおける最大センタとし、各タイム・クォンタム毎に全データセンタにわたって余剰サーバ台数を合計し、その合計値を、当該タイム・クォンタムのR値とする。 (S3) In each time quantum, the data center having the maximum number of surplus servers is searched, the data center is set as the maximum center in the time quantum, and the number of surplus servers is totaled over all data centers for each time quantum. The total value is set as the R value of the time quantum.
(S4)R値が最大となるタイム・クォンタムを検索し、当該タイム・クォンタムにおける最大センタの余剰サーバ台数の値を1だけ減算し、当該タイム・クォンタムについて最大センタとR値を求めなおすとともに、当該バッチ型原始サービスの将来負荷変動の当該タイム・クォンタムに対応する部分の負荷量に、単位サーバ性能と等しい負荷量を加算する。
(S5)niから1を減算し、ni>0なら(S3)に戻る。
(S4) The time quantum having the maximum R value is searched, the value of the surplus server number of the maximum center in the time quantum is subtracted by 1, and the maximum center and the R value are calculated again for the time quantum. A load amount equal to the unit server performance is added to the load amount corresponding to the time quantum of the future load fluctuation of the batch type primitive service.
(S5) Subtract 1 from n i, and if n i > 0, return to (S3).
バッチ型派生サービス生成部122は、負荷量算出部121により算出された将来負荷変動を表す負荷量に基づいてバッチ型派生サービスを発生させる処理部である。具体的には、このバッチ型派生サービス生成部122は、各バッチ型原始サービスについて、将来負荷変動を表す負荷量に基づいて、当該バッチ型原始サービスからバッチ型派生サービスが発生する時刻を定める。
The batch type derivation
その際、当該バッチ型原始サービスから適切な個数のバッチ型派生サービスを発生させ、バッチ型原始サービスの負荷量をそれらのバッチ型派生サービスの間で適切に分配するものとする。そして、各タイムスロット毎に、そのタイムスロット内で発生するバッチ型派生サービスの集合を生成する。 At this time, an appropriate number of batch-type derived services are generated from the batch-type original service, and the load amount of the batch-type original service is appropriately distributed among the batch-type derived services. Then, for each time slot, a set of batch-type derived services that occur in the time slot is generated.
バッチ型DC生成部123は、各タイムスロット毎に、そのタイムスロットで発生するバッチ型派生サービス集合のデータセンタ群への配置組合せパターンの全ての候補(DC)を生成する処理部である。
The batch type
バッチ型NDC生成部124は、DCからVDCを除いたNDCを作成する処理部である。すなわち、このバッチ型NDC生成部124は、各タイムスロット毎に、評価指標m1,…,mkに基づいて、当該タイムスロットに属する各DCを評価し、各DCについての評価値e1,…,ekを計算する。 The batch type NDC generation unit 124 is a processing unit that creates an NDC obtained by removing VDC from DC. That is, the batch type NDC generation unit 124 evaluates each DC belonging to the time slot based on the evaluation index m 1 ,..., M k for each time slot, and evaluates the evaluation value e 1 , ..., e k is calculated.
そして、各タイムスロット毎に、そのタイムスロットに属する各DCを評価値e1,…,ekに基づいてNDCとVDCに分類し、VDCを当該タイムスロットに属するDCの集合から除く。 Then, for each time slot, each DC belonging to the time slot is classified into NDC and VDC based on the evaluation values e 1 ,..., E k , and the VDC is excluded from the set of DCs belonging to the time slot.
バッチ型最適解探索部125は、バッチ型資源計画を作成する処理部である。すなわち、このバッチ型最適解探索部125は、NDC系列の集合から、トランザクション型サービスの場合と同様の手法でPareto解集合(初期系列集合)を生成し、初期系列集合の中から系列評価関数の値の最小となるNDC系列を選び、準最適NDC系列とする。
The batch type optimal
そして、準最適NDC系列内の各タイムスロットに対応するNDCをNDCの入れ替え操作(トランザクション型サービスの場合と同様)によって入れ替え、NDC入れ替え操作の前後の準最適NDC系列の系列評価関数の値を比較し、改善率が3%以下なら準最適NDC系列をバッチ型資源計画とし、そうでなければNDCの入れ替えを繰り返す。 Then, the NDC corresponding to each time slot in the sub-optimal NDC sequence is replaced by an NDC replacement operation (similar to the transaction type service), and the values of the sequence evaluation functions of the sub-optimal NDC sequences before and after the NDC replacement operation are compared. If the improvement rate is 3% or less, the sub-optimal NDC sequence is set as a batch type resource plan. Otherwise, the NDC replacement is repeated.
資源計画送信部130は、作成した資源計画をインターネット20を介して接続されるn個のデータセンタ101〜10nに送信する処理部である。各データセンタは、この資源計画送信部130により送信された資源計画にしたがってサービスの運用を行う。
The resource
次に、図3に示したトランザクション計画部110の処理手順について説明する。なお、以下では、トランザクション型サービスの例としてXMLベースのWEBサービスを仮定し、原始サービスは全てWEBサービスであるとする。
Next, the processing procedure of the
また、原始サービスの負荷変動予測の対象となった予測期間を表す時間軸は一定周期のタイムスロットに分割され、各タイムスロットは原始サービスの負荷を計測する周期である計測周期に分割される。そして、予測期間に含まれるタイムスロットの全数をNt、予測期間内の(時間軸上の時刻の早いほうから数えて)i番目のタイムスロットをTiと表す。 In addition, the time axis representing the prediction period that is the target of load fluctuation prediction of the original service is divided into time slots having a fixed period, and each time slot is divided into measurement periods that are periods for measuring the load of the original service. The total number of time slots included in the prediction period is represented as N t , and the i-th time slot within the prediction period (counted from the earliest time on the time axis) is represented as T i .
また、時刻tにおけるサービスの負荷量は、時刻tに当該サービスに到着する毎秒当りのユーザ・リクエスト数とする。ここで、データセンタの集合をC=[ci|1≦i≦Nc]、原始サービスの集合をP=[pi|1≦i≦Np]、タイムスロットTiの期間内において発生している全ての派生サービスの集合をD(Ti)=[d(Ti,j)|1≦j≦n(Ti)]、DCを評価するためのk個の評価指標の組を[m1, m2, …, mk]、k個の評価指標でDCを評価したk個の評価値の組を[e1, e2,…, ek]、NDC系列を構成する各NDCのeiをNDC系列全体にわたって合計したものを系列評価値Ei、タイムスロットTiに属するNDCの集合をΓ(Ti)=[γ(Ti,j)|1≦j≦ν(Ti)]、NDC系列全体の集合をSとする。 Also, the service load at time t is the number of user requests per second arriving at the service at time t. Here, a set of data centers is C = [c i | 1 ≦ i ≦ N c ], a set of primitive services is P = [p i | 1 ≦ i ≦ N p ], and occurs within the time slot T i D (T i ) = [d (T i , j) | 1 ≦ j ≦ n (T i )], and a set of k evaluation indexes for evaluating DC. [m 1, m 2, ... , m k], k -number of a set of k evaluation values of the evaluation of the DC with metric [e 1, e 2, ... , e k], each constituting the NDC series A sum of NDC e i over the entire NDC sequence is a sequence evaluation value E i , and a set of NDCs belonging to the time slot T i is Γ (T i ) = [γ (T i , j) | 1 ≦ j ≦ ν ( T i )], and let S be the set of all NDC sequences.
また、あるNDC系列s∈Sを構成するNDCでタイムスロットTiに属するNDCを
γs(Ti,j)と書き、またNDCγ(Ti,j)について計算した評価値eiの値をei(γ(Ti,j))と書く。従って、NDC系列の一つのインスタンスs∈Sは、s = <γs(T1,j1), γs(T2,j2), γs(T3,j3), … , γs(TNt-1,jNt-1), γs(TNt,jNt)>と表わされる。
Further, the NDC belonging to the time slot T i in NDC constituting a certain NDC series s∈S γ s (T i, j ) written as, also NDCγ (T i, j) the value of the evaluation value e i calculated for Write e i (γ (T i , j)). Thus, one instance s∈S of the NDC sequence is given by s = <γ s (T 1 , j 1 ), γ s (T 2 , j 2 ), γ s (T 3 , j 3 ) ,. (T Nt−1 , j Nt−1 ), γ s (T Nt , j Nt )>.
また、データセンタciが原始サービスpjのオリジナル・センタであることをpj ⇒ ci等と表し、ciの全資源量を使って捌くことが出来る負荷量(毎秒リクエスト数)をR(ci)と表す。 In addition, p j ⇒ c i indicates that the data center c i is the original center of the primitive service p j , and the load (number of requests per second) that can be generated using the total resource amount of c i is R (c i ).
また、ここでは、DCを評価する評価指標として以下に定義する三つの指標m1,m2,m3を採用した。ここで、m1は派生サービスを評価対象のDCに従って配置した場合のデータセンタ群全体の負荷の均等度合いを表す。データセンタ群の各データセンタで用意しておくべきピーク時必要資源量を最小化するには、予測期間全体にわたって、全てのデータセンタの間で負荷量を均等に分散すればよいからである。 Here, three indexes m 1 , m 2 , and m 3 defined below are adopted as evaluation indexes for evaluating DC. Here, m 1 represents the degree of load equality of the entire data center group when the derived service is arranged according to the DC to be evaluated. This is because, in order to minimize the peak required resource amount to be prepared in each data center of the data center group, the load amount should be evenly distributed among all the data centers throughout the prediction period.
また、m2は派生サービス間通信量を表す。各原始サービスがXMLベースのWEBサービスである場合、原始サービス同士がSOAPプロトコルによって互いに通信しあうケースが考えられる。このような場合、それらの原始サービスから発生した派生サービス同士もSOAP通信を行うことになる。 M 2 represents the traffic volume between derived services. When each primitive service is an XML-based WEB service, there may be a case where the primitive services communicate with each other using the SOAP protocol. In such a case, derived services generated from these primitive services also perform SOAP communication.
従って、あるDCに従って各派生サービスを配置先データセンタに配置した際、互いに頻繁に大量のデータをSOAP通信でやり取りするような複数の派生サービスの各々が異なるデータセンタに配置されることとなった場合、データセンタ間の通信量が大幅に増大する。 Therefore, when each derived service is arranged in the arrangement data center according to a certain DC, each of a plurality of derived services that frequently exchange large amounts of data with each other by SOAP communication is arranged in different data centers. In this case, the amount of communication between data centers is greatly increased.
そして、通信路の帯域幅が不足することによりSOAP通信の通信遅延が増大すると、結果として各データセンタに対して不必要な負荷をかけることになる。そのため、DCの評価指標として派生サービス間通信量m2を採用した。 If the communication delay of the SOAP communication increases due to a shortage of the bandwidth of the communication path, an unnecessary load is applied to each data center as a result. Therefore, the inter-derivative service traffic m 2 was adopted as the DC evaluation index.
また、m3はNDCの類似度を表す。タイムスロットTiに属するNDC γ(Ti,j1)の類似度の定義は次の通りである。あるNDC系列が定められたとき、NDC系列を構成するNDCで、タイムスロットTi-1に対応するNDC をγ(Ti-1,j0) 、タイムスロットTiに対応するNDC をγ(Ti,j1)、タイムスロットTi+1に対応するNDC をγ(Ti+1,j2)としたとき、時間の経過に従ってタイムスロットがTi-1からTiに遷移する際には、派生サービス集合のデータセンタ群への配置がγ(Ti-1,j0)からγ(Ti,j1)へと変更になるに伴って、派生サービス集合[D(Ti-1)∩D(Ti)]に属する幾つかの派生サービスは、あるデータセンタから別のデータセンタへ移動させられる場合がある。 M 3 represents the degree of similarity of NDC. The definition of the similarity of NDC γ (T i , j 1 ) belonging to the time slot T i is as follows. When a certain NDC sequence is determined, NDC corresponding to the time slot T i-1 is γ (T i−1 , j 0 ) and NDC corresponding to the time slot T i is γ ( T i , j 1 ) and NDC corresponding to time slot T i + 1 is γ (T i + 1 , j 2 ), when the time slot transitions from T i -1 to T i as time elapses Includes a derived service set [D (T i ) as the arrangement of the derived service set in the data center group changes from γ (T i−1 , j 0 ) to γ (T i , j 1 ). -1 ) ∩D (T i )], some derived services may be moved from one data center to another.
また、タイムスロットがTiからTi+1に遷移する際にも同様に派生サービス配置がγ(Ti,j1)からγ(Ti+1,j2)へと変更になるに伴い、[D(Ti)∩D(Ti+1)]に属する幾つかの派生サービスがデータセンタ間を移動させられる場合がある。 Similarly, when the time slot transitions from T i to T i + 1 , the derived service arrangement is changed from γ (T i , j 1 ) to γ (T i + 1 , j 2 ). , Several derived services belonging to [D (T i ) ∩D (T i + 1 )] may be moved between data centers.
そこで、タイムスロットTiに対応するNDC系列内のNDC γ(Ti,j1)の類似度は、タイムスロットがTi-1からTiに遷移する時に上記の理由によりデータセンタ間を移動させられる派生サービスの個数とタイムスロットがTiからTi+1に遷移する時にデータセンタ間を移動させられる派生サービスの個数を合計したものとする。 Therefore, the similarity of NDC γ (T i , j 1 ) in the NDC sequence corresponding to time slot T i moves between data centers for the above reason when the time slot transitions from T i -1 to T i. It is assumed that the number of derived services to be moved and the number of derived services to be moved between data centers when the time slot transitions from T i to T i + 1 are totaled.
すなわち、あるNDCの類似度が大きいということは、そのNDCに従って派生サービスを配置すると、タイムスロットの遷移に伴う派生サービスの移動回数が多くなり、その分だけデータセンタ群に対してサービス移動のための制御負荷をかけることになる。 That is, the similarity degree of a certain NDC is large. When a derived service is arranged according to the NDC, the number of times the derived service moves along with the time slot transition increases, and the data center group is moved accordingly. The control load will be applied.
その結果、各データセンタが本来なら処理する必要のない負荷まで大量に担わされることになってしまうため、NDCの類似度をNDCの評価指標の一つとして採用する必要がある。なお、m3はm1,m2と異なり、NDC単体では評価できず、NDC系列が指定されて初めて評価することができる。 As a result, each data center is burdened with a large amount of load that normally does not need to be processed. Therefore, it is necessary to employ NDC similarity as one of the NDC evaluation indexes. Note that, unlike m 1 and m 2 , m 3 cannot be evaluated by a single NDC, but can be evaluated only when an NDC sequence is designated.
図13は、図3に示したトランザクション計画部110の処理手順を示すフローチャートである。同図に示すように、このトランザクション計画部110は、まず、予測部111が、1≦i≦Npとなる全ての整数iについて、piの予測期間全体にわたる負荷変動予測をARIMAモデル予測などの既存の予測手法を用いて予測する(ステップS101)。なお、piの負荷変動予測はpiの負荷量の時間関数として表され、時刻tにおけるpiの負荷量は
θi(t)と表すことにする。
FIG. 13 is a flowchart showing a processing procedure of the
そして、派生サービス生成部112が、負荷変動予測およびオリジナル・センタの資源量に基づいて派生サービスを発生させる(ステップS102)。なお、負荷変動予測に基づく派生サービスの発生のさせ方の詳細については後述する。そして、1≦i≦Ntとなる各整数iについてTiの期間中に発生すると予測された派生サービスの集合D(Ti)を生成する(ステップS103)。
Then, the derived
そして、DC生成部113が、1≦i≦Ntとなる各整数iについて、D(Ti)に属する各派生サービスのデータセンタ群Cへの可能な配置組合せの全ての候補(DC)を木探索アルゴリズムによって生成し、タイムスロットTiについて生成した配置組合せの候補の集合をΓ(Ti)とする(ステップS104)。
Then, the
そして、NDC生成部114が、1≦i≦Ntとなる各整数i、1≦j≦ν(Ti)となる各整数jの全ての組み合わせについてγ(Ti,j)∈Γ(Ti)を評価指標m1,m2で評価し、評価値e1,e2を求める(ステップS105)。なお、γ(Ti,j)についてe1およびe2を計算する手順の詳細は後述する。
Then, the
そして、1≦i≦Ntとなる各整数i、1≦j≦ν(Ti)となる各整数jの全ての組み合わせについて、e1(γ(Ti,j)) > 0.7またはe2(γ(Ti,j)) > 0.8ならばγ(Ti,j)をVDCとし、集合Γ(Ti)から取り除く。そうでなければ、γ(Ti,j)をNDCとし集合Γ(Ti)に残す(ステップS106)。 Then, for all combinations of each integer i where 1 ≦ i ≦ N t and each integer j where 1 ≦ j ≦ ν (T i ), e 1 (γ (T i , j))> 0.7 or e 2 If (γ (T i , j))> 0.8, γ (T i , j) is taken as VDC and removed from the set Γ (T i ). Otherwise, γ (T i , j) is set as NDC and left in the set Γ (T i ) (step S106).
そして、最適解探索部116が、NDC系列集合Sを定義し(ステップS107)、NDC系列集合Sに含まれるNDC系列でk個の系列評価値E1(s),E2(s),E3(s)のいずれか一つ以上が最小値をとるNDC系列sを全て探し出し、初期系列集合の要素とする(ステップS108)。 Then, the optimum solution search unit 116 defines the NDC sequence set S (step S107), and k sequence evaluation values E 1 (s), E 2 (s), E in the NDC sequences included in the NDC sequence set S All NDC sequences s in which at least one of 3 (s) has the minimum value are searched for and used as elements of the initial sequence set (step S108).
ただし、
そして、初期系列集合に属するNDC系列を系列評価関数ξ(s)で評価し、その評価値が最小となるNDC系列を準最適NDC系列σとする(ステップS109)。ただし、k=3で
そして、1≦i≦Ntとなる各整数iに対応するタイムスロットTiついてNDCの入れ替え処理を行い(ステップS110)、NDCの入れ替えを行う前の準最適NDC系列をσ'、NDC入れ替え後の準最適NDC系列をσとして改善率|ξ(σ')−ξ(σ)|/ξ(σ')を算出する(ステップS111)。なお、NDCの入れ替え処理の詳細については後述する。 Then, NDC replacement processing is performed for the time slot T i corresponding to each integer i satisfying 1 ≦ i ≦ N t (step S110), and the sub-optimal NDC sequence before NDC replacement is replaced by σ ′ and NDC. The improvement rate | ξ (σ ′) − ξ (σ) | / ξ (σ ′) is calculated using σ as the quasi-optimal NDC sequence (step S111). The details of the NDC replacement process will be described later.
そして、改善率が0.03以下であるか否かを判定し(ステップS112)、改善率が0.03以下である場合には、σをデータセンタ群Cの資源計画として出力し、全ての処理を終える(ステップS113)。そうでなければ、σを新たなσ'としてステップS110に戻る。 Then, it is determined whether or not the improvement rate is 0.03 or less (step S112). If the improvement rate is 0.03 or less, σ is output as a resource plan for the data center group C, and all The process ends (step S113). Otherwise, σ is set as a new σ ′, and the process returns to step S110.
このように、派生サービス生成部112が生成した派生サービスに対して最適解探索部115がPareto最適化理論に基づいて最適NDC系列を生成することによって、データセンタ群に対する最適な資源計画を作成することができる。
In this way, the optimal
次に、派生サービス生成部112による派生サービス生成の詳細について説明する。派生サービス生成部112は、全ての計測周期について、各計測周期毎に次の(S1)〜(S3)を行う。
Next, details of derivation service generation by the derivation
(S1)計測周期の中心時刻t、1≦i≦Ncとなる整数iについて、pj ⇒ ciとなる全てのjについて
(S2)1≦i≦Ncとなる各整数iについてpiの時刻tにおける負荷量の一部を派生サービスとして分割する。ここで、派生サービスへの負荷量の分割のしかたは次の通りである。 (S2) For each integer i satisfying 1 ≦ i ≦ N c , a part of the load amount at time t of p i is divided as a derived service. Here, how to divide the load amount into the derived service is as follows.
各原始サービスから派生サービスがNc-1個ずつ発生したと仮定し、各派生サービスの仮のセンタ配置を定める。仮定した派生サービスと原始サービスの負荷量の分配比率は次のようにして求める。 Assuming that N c −1 derived services are generated from each primitive service, a temporary center arrangement of each derived service is determined. The distribution ratio between the assumed service load and the source service load is obtained as follows.
線形計画法を用いて上記の分配比率を最適化し、次の条件が満たされるようにする。各派生サービスを上記の仮のセンタ配置で配置した際、各データセンタci(1≦i≦Nc)について、そこで運用している原始サービスと派生サービスの負荷量の合計をgiとした時の、標本集合[gi / R(ci)|1≦i≦Nc]の標準偏差が0.1以下になるようにする。 The above distribution ratio is optimized using linear programming so that the following conditions are satisfied. When each derived service is arranged in the above temporary center arrangement, for each data center c i (1 ≦ i ≦ N c ), the total load amount of the source service and the derived service operated there is defined as g i The standard deviation of the sample set [g i / R (c i ) | 1 ≦ i ≦ N c ] is set to be 0.1 or less.
もし整数計画法によって上記の条件を充足する分割比率が得られなかった場合は、各派生サービスの仮のセンタ配置をランダムに変更して、再び整数計画法による分割比率の最適化を行うことを繰り返すことにより、各原始サービスについて派生サービスに分割する負荷量の分割比率を求める。 If the division ratio that satisfies the above conditions cannot be obtained by integer programming, the provisional center layout of each derived service should be changed at random and the division ratio optimized by integer programming should be performed again. By repeating, the division ratio of the load amount to be divided into derived services for each primitive service is obtained.
ただし、Nc>5であった場合でも一つの原始サービスから同時に発生可能な派生サービスの個数の上限は4個とする。ある派生サービスについて上記の方法で決定した分配比率が0であった場合、その派生サービスは存在しないものとして扱う。
(S3)次の計測周期に移り、新たな計測周期について(S1)を開始する。
However, even if N c > 5, the upper limit of the number of derived services that can be generated simultaneously from one primitive service is four. When the distribution ratio determined by the above method for a derived service is 0, the derived service is treated as not existing.
(S3) Move to the next measurement cycle and start (S1) for a new measurement cycle.
次に、γ(Ti,j)についてe1を計算する手順の詳細について説明する。タイムスロットTi内に含まれる計測周期の中心時刻の集合を[ti h|1≦h≦Nm]とする。すなわち、タイムスロットTiの開始時点からh番目の計測周期の中心時刻をti hとし、一つのタイムスロット内にはNm個の計測周期が含まれるとする。 Next, details of the procedure for calculating e 1 for γ (T i , j) will be described. A set of center times of the measurement periods included in the time slot T i is defined as [t i h | 1 ≦ h ≦ N m ]. That is, it is assumed that the central time of the h-th measurement cycle from the start time of the time slot T i is t i h, and N m measurement cycles are included in one time slot.
データセンタcr(1≦r≦Nc)に配置されている全サービスの時刻tにおける負荷量合計をgr(t)とすると、γ(Ti,j)に対するeiの値は以下のようにして求まる。 Assuming that the total load amount at time t of all services arranged in the data center cr (1 ≦ r ≦ N c ) is g r (t), the value of e i for γ (T i , j) is It is obtained in this way.
まず、1≦r≦Ncである各整数rについてセンター毎負荷量合計値の時系列[gr(ti h)| 1≦h≦Nm ]を求め、1≦r≦Ncである各整数rについて時系列[gr(ti h)/R(cr)| 1≦h≦Nm ]の時間軸上の平均値
そして、集合[μ(0,i), μ(1,i), μ(2,i), …,μ(Nc,i)]を標本分布と見なした時の標準偏差を計算し、この標準偏差をγ(Ti,j)に対するeiの値とする。 Then, the standard deviation when the set [μ (0, i), μ (1, i), μ (2, i),…, μ (N c , i)] is regarded as the sample distribution is calculated, Let this standard deviation be the value of e i for γ (T i , j).
次に、γ(Ti,j)についてe2を計算する手順の詳細について説明する。まず、評価対象NDCの属するタイムスロットT内の各計測周期について各データセンタ毎に、サービス間のSOAP通信による通信量をbpsの単位で見積もる。 Next, details of the procedure for calculating e 2 for γ (T i , j) will be described. First, for each data center for each measurement cycle in the time slot T to which the evaluation target NDC belongs, the communication amount by SOAP communication between services is estimated in units of bps.
そして、データセンタ毎に、その見積もり通信量を、当該データセンタと外部ネットワークを繋ぐ通信路の帯域幅の値(bps単位)で除算した値(以下、通信路占有率と呼ぶ)を求める。 Then, for each data center, a value (hereinafter referred to as a communication path occupation ratio) obtained by dividing the estimated communication amount by the bandwidth value (in bps) of the communication path connecting the data center and the external network is obtained.
そして、計測周期毎の通信路占有率をタイムスロットT全体にわたって平均した値を各データセンタについて計算する。当該平均値が最大となるデータセンタでの当該平均値をe2の値とする。 And the value which averaged the communication channel occupation rate for every measurement period over the whole time slot T is calculated about each data center. The average value of the data center to which the average value is maximized for a value of e 2.
なお、互いに通信しあう原始サービス同士の関係が、図14に示すようなものであるとき、データセンタciにおける計測周期がtの時の、サービス間のSOAP通信の通信量の見積もり手順の例を以下に示す。 An example of a procedure for estimating the amount of SOAP communication between services when the measurement cycle in the data center c i is t when the relationship between primitive services communicating with each other is as shown in FIG. Is shown below.
ここで、e2による評価対象となっているNDCにおいて配置先データセンタが指定されている派生サービスの集合をD=[dk|1≦k≦Nd]、dkの配置先データセンタがciであることをdk ⇒ ci等と表す。また、サービスXの負荷量を毎秒リクエスト数で表した値をL(X,t)と表す。また、原始サービスpjがdkの派生元の原始サービスであることを、pj↑dk等と表す。 Here, a set of derived services arrangement destination data center is designated in the NDC that is evaluated by e 2 D = [d k | 1 ≦ k ≦ N d], the placement destination data center d k that it is a c i expressed as d k ⇒ c i like. A value representing the load amount of the service X by the number of requests per second is represented as L (X, t). In addition, p j ↑ d k or the like indicates that the primitive service p j is a primitive service from which d k is derived.
まず、図14の1段目と2段目の間の通信量の見積もりで、計測周期tの時のデータセンタciにおける値B1(ci,t)を求める。まず、B1(ci,t)を0で初期化し、以下の四つの場合に分けて考える。 First, the value B 1 (c i , t) at the data center c i at the measurement cycle t is obtained by estimating the communication amount between the first stage and the second stage in FIG. First, B 1 (c i , t) is initialized to 0, and the following four cases are considered.
(1) p1 ⇒ ciかつp2 ⇒ ciの場合
B1(ci,t)= B1(ci,t)+|L(p1,t)×ω1 − L(p2,t)|とする。
(1) When p 1 ⇒ c i and p 2 ⇒ c i
Let B 1 (c i , t) = B 1 (c i , t) + | L (p 1 , t) × ω 1 −L (p 2 , t) |.
(2) p1 ⇒ ciであり、p2 ⇒ ciでない場合
(p2↑dh)∧(dh⇒ci)となる全ての添字hの集合をHとすると
Let H be the set of all subscripts h such that (p 2 ↑ d h ) ∧ (d h ⇒c i )
(3) p2 ⇒ ciであり、p1 ⇒ ciでない場合
(p1↑dh)∧(dh⇒ci)となる全ての添字hの集合をHとすると
Let H be the set of all subscripts h such that (p 1 ↑ d h ) ∧ (d h ⇒c i )
(4) p1 ⇒ ciでなく、p2 ⇒ ciでもない場合
(p1↑dh)∧(dh⇒ci) となる全ての添字hの集合をHとし、(p2↑dk)∧(dk⇒ci)となる全ての添字kの集合をKとすると
Let H be the set of all subscripts h such that (p 1 ↑ d h ) ∧ (d h ⇒c i ), and the set of all subscripts k such that (p 2 ↑ d k ) ∧ (d k ⇒c i ) Let K be K
その次に、図14の2段目と3段目の間の通信量の見積もりで、計測周期tの時のデータセンタciにおける値B2(ci,t)を求める。まず、B1(ci,t)を0で初期化し、以下の四つの場合に分けて考える。 Next, the value B 2 (c i , t) at the data center c i at the measurement cycle t is obtained by estimating the communication volume between the second and third stages in FIG. First, B 1 (c i , t) is initialized to 0, and the following four cases are considered.
(1) p2 ⇒ ciかつp3 ⇒ ciの場合
B2(ci,t)= B2(ci,t)+|L(p2,t)×ω2 − L(p3,t)|とする。
(1) When p 2 ⇒ c i and p 3 ⇒ c i
Let B 2 (c i , t) = B 2 (c i , t) + | L (p 2 , t) × ω 2 −L (p 3 , t) |.
(2) p2 ⇒ ciであり、p3 ⇒ ciでない場合
(p3↑dh)∧(dh⇒ci)となる全ての添字hの集合をHとすると
Let H be the set of all subscripts h such that (p 3 ↑ d h ) ∧ (d h ⇒c i )
(3) p3 ⇒ ciであり、p2 ⇒ ciでない場合
(p2↑dh)∧(dh⇒ci)となる全ての添字hの集合をHとすると
Let H be the set of all subscripts h such that (p 2 ↑ d h ) ∧ (d h ⇒c i )
(4) p2 ⇒ ciでなく、p3 ⇒ ciでもない場合
(p2↑dh)∧(dh⇒ci) となる全ての添字hの集合をHとし、(p3↑dk)∧(dk⇒ci)となる全ての添字kの集合をKとすると
Let H be the set of all subscripts h such that (p 2 ↑ d h ) ∧ (d h ⇒c i ), and the set of all subscripts k such that (p 3 ↑ d k ) ∧ (d k ⇒c i ) Let K be K
ここで、ω(ci,t)=ω1(ci,t)+ω2(ci,t)とすることで、計測周期tの時のデータセンタciにおける見積もり通信量ω(ci,t)が得られる。 Here, by assuming that ω (c i , t) = ω 1 (c i , t) + ω 2 (c i , t), the estimated communication amount ω (c at the data center c i at the measurement period t i , t) is obtained.
次に、NDC系列集合Sから初期系列集合(Pareto集合)を抽出する手順の詳細について説明する。まず、系列評価値E1(s)を最小にするようなs∈Sを求める。このようなsは一般に複数個存在する。 Next, details of a procedure for extracting an initial sequence set (Pareto set) from the NDC sequence set S will be described. First, sεS that minimizes the series evaluation value E 1 (s) is obtained. There are generally a plurality of such s.
具体的には、1≦i≦Ntとなる各整数iについてΓ(Ti)に属する全てのNDCを配列に格納して、e1の値をキーとしてその配列をソーティングし、Γ(Ti)内でe1の値が最小となるNDCの集合Γb(Ti)を生成する。そして、直積集合Γb(T0)×Γb(T1)×…×Γb(TNt)に属する各NDC系列を系列評価値E1(s)を最小にするようなs∈Sとする。 Specifically, for each integer i satisfying 1 ≦ i ≦ N t , all NDCs belonging to Γ (T i ) are stored in the array, and the array is sorted using the value of e 1 as a key, and Γ (T the value of e 1 in i) to produce the smallest set of NDC Γ b (T i). Then, s∈S that minimizes the sequence evaluation value E 1 (s) of each NDC sequence belonging to the Cartesian product set Γ b (T 0 ) × Γ b (T 1 ) ×... × Γ b (T Nt ) To do.
その次に、系列評価値E2(s)を最小にするようなs∈Sを求める。すなわち、1≦i≦Ntとなる各整数iについてΓ(Ti)に属する全てのNDCを配列に格納して、e2の値をキーとしてその配列をソーティングし、Γ(Ti)内でe2の値が最小となるNDCの集合Γb(Ti)を生成する。そして、直積集合Γb(T0)×Γb(T1)×…×Γb(TNt)に属する各NDC系列を系列評価値E2(s)を最小にするようなs∈Sとする。 Next, sεS that minimizes the series evaluation value E 2 (s) is obtained. That is, for each integer i satisfying 1 ≦ i ≦ N t , all the NDCs belonging to Γ (T i ) are stored in the array, the array is sorted using the value of e 2 as a key, and Γ (T i ) To generate an NDC set Γ b (T i ) that minimizes the value of e 2 . Further, each NDC sequence belonging to the Cartesian product set Γ b (T 0 ) × Γ b (T 1 ) ×... × Γ b (T Nt ) is set to s∈S such that the sequence evaluation value E 2 (s) is minimized. To do.
その次に、系列評価値E3(s)を最小にするようなs∈Sを求める。ここで時間軸全体にわたるNDCの集合Γを以下のように定義する。
そして、1≦k≦NAとなる各整数kと1≦i≦Ntとなる各整数iの全ての組合せについて以下の処理を行う。集合Γ(Ti)内のNDCを検索して、γ(Ti,j)∈Γ(Ti),1≦j≦ν(Ti)で、γkとγ(Ti,j)を比較した時の相対類似度が最小となるような添字jk iの値を求める。
Then, the following processes are performed for all combinations of each integer i to be 1 ≦ k ≦ N A to become the each
ここで、相対類似度とは、二つのNDCを比較した時、二つのNDCの指定する派生サービス配置の両方に共通に含まれている派生サービスの中で、一方のNDCで指定されている配置先データセンタと他方のNDCで指定されている配置先データセンタが異なるような派生サービスの個数を表す。 Here, the relative similarity refers to an arrangement specified by one NDC among the derived services that are commonly included in both derived service arrangements designated by the two NDCs when two NDCs are compared. This represents the number of derived services in which the destination data center and the placement destination data center designated by the other NDC are different.
そして、1≦k≦NAとなる各整数kについて以下のように表されるNDC系列s(k) = <γ(T0,jk 0),γ(T1,jk 1),…,γ(TNt,jk Nt)>を求める。
Then, 1 ≦ k ≦ N NDC sequence s expressed as follows composed for each integer k A (k) = <γ (
最後に、集合[s(k)|1≦k≦NA]に含まれるNDC系列s(k)の内E2(s(k))の値が最小となるものを選び出す。 Finally, the NDC sequence s (k) included in the set [s (k) | 1 ≦ k ≦ N A ] is selected so as to minimize the value of E 2 (s (k)).
上記のようにしてE1(s),E2(s),E3(s)の内のいずれかが最小値となるNDC系列を全てSの中から選び出し、Pareto集合(初期系列集合)の要素とする。 As described above, all NDC sequences in which one of E 1 (s), E 2 (s), and E 3 (s) has the minimum value are selected from S, and the Pareto set (initial sequence set) is selected. Element.
次に、NDCの入れ替え処理の詳細について説明する。NDCの入れ替え処理としては以下の(S1)〜(S3)を行う。
(S1)集合Γ(Ti)内を探索して、γσ(Ti,j1)とγ(Ti,j2)(ただしj1≠j2とする)の間に以下の関係が成り立つようなj2を求める。
e1(γσ(Ti,j1)) > e1(γ(Ti,j2))
e2(γσ(Ti,j1)) > e2(γ(Ti,j2))
e3(γσ(Ti,j1)) > e3(γ(Ti,j2))
Next, details of the NDC replacement process will be described. As the NDC replacement processing, the following (S1) to (S3) are performed.
(S1) The following relationship is established between γσ (T i , j 1 ) and γ (T i , j 2 ) (where j 1 ≠ j 2 ) by searching the set Γ (T i ). seek j 2 such as.
e 1 (γσ (T i , j 1 ))> e 1 (γ (T i , j 2 ))
e 2 (γσ (T i , j 1 ))> e 2 (γ (T i , j 2 ))
e 3 (γσ (T i , j 1 ))> e 3 (γ (T i , j 2 ))
上記の条件を満たすj2が見つかった場合は、γσ(Ti,j1)とγ(Ti,j2)を入れ替えることにより、γ(Ti,j2)をNDC系列σ内のタイムスロットTiに対応するNDCとし、(S3)に進む。上記の条件を満たすj2が見つからないときには(S2)に進む。 If j 2 satisfying the above conditions is found, γσ (T i , j 1 ) and γ (T i , j 2 ) are interchanged to change γ (T i , j 2 ) to the time within the NDC sequence σ. The NDC corresponding to the slot T i is set, and the process proceeds to (S3). When j 2 satisfying the above conditions is not found, the process proceeds to (S2).
(S2)集合Γ(Ti)内を探索して、γσ(Ti,j1)とγ(Ti,j2)(ただしj1≠j2とする)の間に以下の関係が成り立つようなj2を求める。
ここで、I1,I2は整数集合[h|1≦h≦3]を共通部分の無い2つに分割した部分集合でh ∈ I1の時にeh(γσ(Ti,j1)) ≦ eh(γ(Ti,j2))であり、h ∈ I2の時にeh(γσ(Ti,j1)) > eh(γ(Ti,j2))であり、また、Δeh = eh(γσ(Ti,j1))−eh(γ(Ti,j2)),δeh= eh(γ(Ti,j2))−eh(γσ(Ti,j1))である。 Here, I1 and I2 are subsets obtained by dividing the integer set [h | 1 ≦ h ≦ 3] into two having no common part, and e h (γσ (T i , j 1 )) ≦ e when h ∈ I1 h (γ (T i , j 2 )), and when h ∈ I2, e h (γσ (T i , j 1 ))> e h (γ (T i , j 2 )) and Δe h = e h (γσ (T i , j 1 )) − e h (γ (T i , j 2 )), δe h = e h (γ (T i , j 2 )) − e h (γσ (T i , j 1 )).
上記の条件を満たすj2が見つかった場合は、γσ(Ti,j1)とγ(Ti,j2)を入れ替えることにより、γ(Ti,j2)をNDC系列σ内のタイムスロットTiに対応するNDCとする。上記条件を満たすj2が見つからない場合は、タイムスロットTiについてはNDCの入れ替えを行わない。ここで、λ1,λ2,λ3,Λ1,Λ2,Λ3の定義及び、φ1,φ2,φ3の値は以下の通りとする。 If j 2 satisfying the above conditions is found, γσ (T i , j 1 ) and γ (T i , j 2 ) are interchanged to change γ (T i , j 2 ) to the time within the NDC sequence σ. It is assumed that the NDC corresponds to the slot T i . If j 2 satisfying the above condition is not found, NDC replacement is not performed for time slot T i . Here, the definitions of λ 1 , λ 2 , λ 3 , Λ 1 , Λ 2 , Λ 3 and the values of φ 1 , φ 2 , φ 3 are as follows.
λ1(x)=x λ2(x)=x λ3(x)=0.1×exp(1.3x)
Λ1(x)=x Λ2(x)=x Λ3(x)=0.1×exp(1.3x)
φ1=1.0 φ2=1.0 φ3=1.0
ただし、exp( )は自然対数の底を基数とする指数関数である。
λ 1 (x) = x λ 2 (x) = x λ 3 (x) = 0.1 × exp (1.3x)
Λ 1 (x) = x Λ 2 (x) = x Λ 3 (x) = 0.1 × exp (1.3x)
φ 1 = 1.0 φ 2 = 1.0 φ 3 = 1.0
Here, exp () is an exponential function with the base of the natural logarithm.
(S3)i = i+1として次のタイムスロットに移り、(S1)に戻る。 (S3) As i = i + 1, the process moves to the next time slot and returns to (S1).
次に、図3に示したバッチ計画部120の処理手順について説明する。バッチ型サービスの例としては、コンビニエンス・ストアの各店舗の売り上げ情報の集計処理のための計算サービスなどが考えられる。
Next, the processing procedure of the
以下、ここでは、バッチ型原始サービスの集合をP=[pi|1≦i≦Np]、piの各ジョブのターンアラウンド時間をτi、データセンタciにおいて、ciに配置されている全サービスの負荷量の合計がピークとなる時の、ciの必要資源量を毎秒リクエスト数で表したものをRmax(ci)、データセンタciの資源の内、時刻tにおいてWEBサービスに割り当てられずに残っている余剰計算資源量をR(ci,t)、単位サーバ性能の値をfとし、他の記号の定義などはトランザクション計画部110の処理手順の説明に用いた時と同様とする。
Hereinafter, in this case, a set of batch type primitive service P = [p i | 1 ≦ i ≦ N p], the turnaround time of each job p i tau i, the data center c i, is located c i R max (c i ) represents the required resource amount of ci in the number of requests per second when the total load amount of all services is at a peak, and the WEB service at the time t among the resources of the data center ci R (c i , t) is the surplus computational resource amount that is not allocated to the server, the value of the unit server performance is f, and the definitions of other symbols are used to explain the processing procedure of the
また、ここでは、piの各ジョブの投入時刻と予測期間の開始時刻との時間差はτiの整数倍であるとし、τiはトランザクション型サービスの負荷の計測周期の整数倍であるとする。 Further, here, the time difference between the start time of the closing time and the predicted period of each job p i is set to an integer multiple of tau i, tau i is assumed to be an integer multiple of the measurement cycle loads transactional services .
また、バッチ型サービスに関する資源計画の生成では、NDCを評価する指標として、WEBサービスの資源計画生成で採用した評価指標の内、m1とm3のみを採用する。何故なら、バッチ型サービス同士がSOAP通信を行うことは通常はありえないので、サービス間のSOAP通信量に関する評価指標であるm2は考慮する意義がないからである。 Also, in generating a resource plan for a batch-type service, only m 1 and m 3 are adopted as evaluation indexes used for generating a resource plan for a WEB service. This is because it is not normally possible for batch services to perform SOAP communication, and m 2, which is an evaluation index related to the amount of SOAP communication between services, is not meaningful.
図15は、図3に示したバッチ計画部120の処理手順を示すフローチャートである。同図に示すように、このバッチ計画部120は、まず、負荷量算出部121が、τ1,τ2,…,τNpの最小公倍数を求め、その値をタイムスロットの長さとする(ステップS201)。
FIG. 15 is a flowchart showing a processing procedure of the
そして、時間軸をタイムスロットに分割し、1≦i≦Ncとなる各整数iについて、η(ci,t)=R(ci,t) / fとし、後述するジョブ・スケジューリング・アルゴリズムにより、各バッチ型原始サービスpi(1≦i≦Np)について、将来負荷変動を計画する(ステップS202)。なお、piに関する将来負荷変動は時系列データとして生成され、将来時刻tにおけるpiの負荷量をθ(i,t)と表す。 Then, the time axis is divided into time slots, and for each integer i satisfying 1 ≦ i ≦ N c , η (c i , t) = R (c i , t) / f is set, and a job scheduling algorithm described later Thus, future load fluctuations are planned for each batch-type primitive service p i (1 ≦ i ≦ N p ) (step S202). The future load fluctuation related to p i is generated as time-series data, and the load amount of p i at the future time t is expressed as θ (i, t).
そして、バッチ型派生サービス生成部122が負荷量算出部121が算出した負荷量に基づいてバッチ型派生サービスを発生させる(ステップS203)。なお、バッチ型派生サービス生成部122によるバッチ型派生サービス発生の詳細については後述する。
Then, the batch type derived
そして、1≦i≦Ntとなる各整数iについて、Tiの期間中に発生すると予測された派生サービスの集合D(Ti)を生成する(ステップS204)。 Then, 1 for ≦ i ≦ N t become each integer i, to generate a set D of predicted derived service to occur during the T i (T i) (step S204).
そして、バッチ型DC生成部123が、1≦i≦Ntとなる各整数iについて、D(Ti)に属する各派生サービスのデータセンタ群Cへの可能な配置組合せの全ての候補(DC)を木探索アルゴリズムによって生成し(ステップS205)、タイムスロットTiについて生成した配置組合せの候補の集合をΓ(Ti)とする。
Then, the batch type
そして、バッチ型NDC生成部124が、1≦i≦Ntとなる各整数i、1≦j≦ν(Ti)となる各整数jの全ての組み合わせについてγ(Ti,j)∈Γ(Ti)を評価指標m1で評価し、評価値e1を求める(ステップS206)。 Then, the batch type NDC generation unit 124 calculates γ (T i , j) ∈Γ for all combinations of each integer i satisfying 1 ≦ i ≦ N t and each integer j satisfying 1 ≦ j ≦ ν (T i ). (T i) was evaluated by the evaluation index m 1 to obtain an evaluation value e 1 (step S206).
そして、1≦i≦Ntとなる各整数i、1≦j≦ν(Ti)となる各整数jの全ての組み合わせについて、e1(γ(Ti,j)) > 0.7ならばγ(Ti,j)をVDCとし、集合Γ(Ti)から取り除く。そうでなければ、γ(Ti,j)をNDCとし集合Γ(Ti)に残す(ステップS207)。 Then, for all combinations of each integer i satisfying 1 ≦ i ≦ N t and each integer j satisfying 1 ≦ j ≦ ν (T i ), if e 1 (γ (T i , j))> 0.7, then γ Let (T i , j) be a VDC and remove it from the set Γ (T i ). Otherwise, γ (T i , j) is set as NDC and left in the set Γ (T i ) (step S207).
そして、バッチ型最適解探索部125が、NDC系列集合Sを作成し(ステップS208)、NDC系列集合Sに含まれるNDC系列でk個の系列評価値E1(s),E3(s)のいずれか一つ以上が最小値をとるNDC系列sを全て探し出し、初期系列集合の要素とする(ステップS209)。
Then, the batch-type optimum
ただし、
とする。
However,
And
そして、初期系列集合に属するNDC系列を系列評価関数ξ(s)で評価し、その評価値が最小となるNDC系列を準最適NDC系列σとする(ステップS210)。ただし、ξ(s)=K1E1(s)+K2E2(s)とする。また、K1=1.0, K3=0.1とした。 Then, the NDC sequence belonging to the initial sequence set is evaluated by the sequence evaluation function ξ (s), and the NDC sequence having the smallest evaluation value is set as a sub-optimal NDC sequence σ (step S210). However, ξ (s) = K 1 E 1 (s) + K 2 E 2 (s). Further, K 1 = 1.0 and K 3 = 0.1.
そして、1≦i≦Ntとなる各整数iに対応するタイムスロットTiついて後述するNDCの入れ替え処理を行う(ステップS211)。そして、NDCの入れ替えを行う前の準最適NDC系列のξ( )での評価値と、NDC入れ替え後の準最適NDC系列のξ( )での評価値を用いて改善率を算出する(ステップS212)。 Then, NDC replacement processing described later is performed for the time slot T i corresponding to each integer i satisfying 1 ≦ i ≦ N t (step S211). Then, the improvement rate is calculated using the evaluation value at ξ () of the sub-optimal NDC sequence before NDC replacement and the evaluation value at ξ () of the sub-optimal NDC sequence after NDC replacement (step S212). ).
そして、改善率が3%以下であるか否かを判定し(ステップS213)、改善率が3%以下なら現在の準最適NDC系列を資源計画として出力し(ステップS214)、全ての処理を終える。そうでなければステップS211に戻る。 Then, it is determined whether or not the improvement rate is 3% or less (step S213). If the improvement rate is 3% or less, the current sub-optimal NDC sequence is output as a resource plan (step S214), and all the processes are finished. . Otherwise, the process returns to step S211.
次に、バッチ型原始サービスの将来負荷変動を計画するためのジョブ・スケジューリング・アルゴリズムについて説明する。各バッチ型原始サービスpi(1≦i≦Np)のジョブ投入スケジュールとターンアラウンド時間、デッドライン時刻が図16の様であるとき、各バッチ型原始サービスpi(1≦i≦Np)について以下の(S1)〜(S9)を実行する。 Next, a job scheduling algorithm for planning future load fluctuations of the batch type primitive service will be described. When the job input schedule, turnaround time, and deadline time of each batch type primitive service p i (1 ≦ i ≦ N p ) are as shown in FIG. 16, each batch type primitive service p i (1 ≦ i ≦ N p) ), The following (S1) to (S9) are executed.
ただし、予測期間の開始時刻をt0とすると、任意のiとjについて、t(i,j)−t0 = TA(i)×N、TD(i)−t0 = TA(i)×N'(ただしNおよびN'は整数)の関係が有り、TA(i)は計測周期の長さの整数倍であるものとする。また、単位サーバ性能をfとする。 However, if the start time of the prediction period is t 0 , t (i, j) −t 0 = TA (i) × N, TD (i) −t0 = TA (i) × N for any i and j '(Where N and N' are integers), and TA (i) is an integral multiple of the length of the measurement cycle. The unit server performance is assumed to be f.
(S1)j=ρ(i)とする。また、予測期間内の各時刻tにおいてθi(t)=0とする。
(S2)予測期間内の各時刻tにおいて、トランザクション型およびバッチ型のいかなるサービスにも割り当てられていないデータセンタck内の余剰資源量をR(ck,t)とした時のη(ck,t)=R(ck,t) / fを求める。
(S1) j = ρ (i). Also, θ i (t) = 0 at each time t within the prediction period.
(S2) η (c when R (c k , t) is the surplus resource amount in the data center ck that is not assigned to any transaction-type or batch-type service at each time t in the forecast period k , t) = R (c k , t) / f is obtained.
(S3)時刻t(i,j)から時刻TD(i)までの時間帯を、TA(i)の長さのタイム・クォンタムに分割し、時刻t(i,j)から開始時刻の早い順に数えてh番目のタイム・クォンタムをQ(i,j,h)とする。またNQ(i,j)=(TD(i)−t(i,j))/TA(i)とする。 (S3) The time period from time t (i, j) to time TD (i) is divided into time quantum lengths of TA (i), and the start time from time t (i, j) in ascending order. The h-th time quantum is counted as Q (i, j, h). N Q (i, j) = (TD (i) −t (i, j)) / TA (i).
(S4)1≦h≦NQ(i,j)となる各整数hと1≦k≦Ncとなる各整数kの組合せについて次の処理を行う。タイム・クォンタムQ(i,j,h)に含まれる複数の計測周期の中で計測周期の中心時刻tにおけるη(ck,t)の値が最小となる計測周期を求め、当該計測周期の中心時刻tの時のη(ck,t)の値をQ(i,j,h)における余剰資源量η(Q(i,j,h),ck)とする。 (S4) The following processing is performed for combinations of each integer h satisfying 1 ≦ h ≦ N Q (i, j) and each integer k satisfying 1 ≦ k ≦ N c . A measurement cycle that minimizes the value of η (c k , t) at the center time t of the measurement cycle among a plurality of measurement cycles included in the time quantum Q (i, j, h) is obtained. The value of η (c k , t) at the central time t is defined as the surplus resource amount η (Q (i, j, h), c k ) in Q (i, j, h).
(S5)1≦h≦NQ(i,j)となる各整数hについて、次の処理を行う。η(Q(i,j,h),ck)が最大となるような添字kの値を求め、これをk(i,j,h)とし、
(S6)η(i,j,h)の値を最大にするような添字hの値を求め、η(ck(i,j,h),t)から1を減算し、R(ck(i,j,h),t)からfを減算する。
(S7) t(i,j)+TA(i)×h ≦ t ≦ t(i,j)+TA(i)×(h+1)となる各時刻tについてθi(t)= θi(t)+fとする。
(S6) The value of the index h that maximizes the value of η (i, j, h) is obtained, 1 is subtracted from η (c k (i, j, h) , t), and R (c k Subtract f from (i, j, h) , t).
(S7) θ i (t) = θ i for each time t where t (i, j) + TA (i) × h ≦ t ≦ t (i, j) + TA (i) × (h + 1) (t) + f.
(S8)n(i,j)から1を減算してn(i,j)>0なら(S5)へ戻る。
(S9)jが1なら処理を終了。そうでなければj = j−1として(S2)に戻る。
以上の手順実行の結果得られたθi(t)の値がバッチ型原始サービスpiの将来時刻tの時の将来負荷である。
(S8) Subtract 1 from n (i, j) and if n (i, j)> 0, return to (S5).
(S9) If j is 1, the process is terminated. Otherwise, j = j−1 and return to (S2).
The value of θ i (t) obtained as a result of the above procedure execution is the future load at the future time t of the batch-type primitive service p i .
次に、バッチ型派生サービス生成部122によるバッチ型派生サービス生成の詳細について説明する。バッチ型派生サービス生成部122は、1≦i≦Ncとなる各整数iについて、以下の(S1)および(S2)を実行する。ここで、時刻tにおけるデータセンタciのWEBサービスによる負荷量の合計をg(ci,t)と表す。
Next, details of batch type derivation service generation by the batch type derivation
(S1)予測期間内の各計測周期において、次の処理を実行する。当該計測周期の中心時刻tにおいて、pj ⇒ ciとなる全ての添字jの集合をJとした時に
ただし、
(S2)予測期間内の各計測周期において次の処理を実行する。当該計測周期の中心時刻をtとした場合、pj ⇒ ciとなる全ての添字jの集合をJとした時に
次に、NDCの入れ替え処理の詳細について説明する。NDCの入れ替え処理としては、以下の(S1)〜(S3)を行う。
(S1)集合Γ(Ti)内を探索して、γσ(Ti,j1)とγ(Ti,j2)(ただしj1≠j2とする)の間に以下の関係が成り立つようなj2を求める。
e1(γσ(Ti,j1)) > e1(γ(Ti,j2))
e3(γσ(Ti,j1)) > e3(γ(Ti,j2))
Next, details of the NDC replacement process will be described. As the NDC replacement process, the following (S1) to (S3) are performed.
(S1) The following relationship is established between γσ (T i , j 1 ) and γ (T i , j 2 ) (where j 1 ≠ j 2 ) by searching the set Γ (T i ). seek j 2 such as.
e 1 (γσ (T i , j 1 ))> e 1 (γ (T i , j 2 ))
e 3 (γσ (T i , j 1 ))> e 3 (γ (T i , j 2 ))
上記の条件を満たすj2が見つかった場合は、γσ(Ti,j1)とγ(Ti,j2)を入れ替えることにより、γ(Ti,j2)をNDC系列σ内のタイムスロットTiに対応するNDCとし、(S3)に進む。上記の条件を満たすj2が見つからないときには(S2)に進む。 If j 2 satisfying the above conditions is found, γσ (T i , j 1 ) and γ (T i , j 2 ) are interchanged to change γ (T i , j 2 ) to the time within the NDC sequence σ. The NDC corresponding to the slot T i is set, and the process proceeds to (S3). When j 2 satisfying the above conditions is not found, the process proceeds to (S2).
(S2)集合Γ(Ti)内を探索して、γσ(Ti,j1)とγ(Ti,j2)(ただしj1≠j2とする)の間に以下の式(S2)または式(S3)のいずれか一方の関係が成り立つようなj2を求める。
ただし、λ(x)=0.1×exp(1.3×x)とした。上記の条件を満たすj2が見つかった場合は、γσ(Ti,j1)とγ(Ti,j2)を入れ替えることにより、γ(Ti,j2)をNDC系列σ内のタイムスロットTiに対応するNDCとする。上記条件を満たすj2が見つからない場合は、タイムスロットTiについてはNDCの入れ替えを行わない。
(S3)i = i+1として次のタイムスロットに移り、(S1)に戻る。
However, λ (x) = 0.1 × exp (1.3 × x). If j 2 satisfying the above conditions is found, γσ (T i , j 1 ) and γ (T i , j 2 ) are interchanged to change γ (T i , j 2 ) to the time within the NDC sequence σ. It is assumed that the NDC corresponds to the slot T i . If j 2 satisfying the above condition is not found, NDC replacement is not performed for time slot T i .
(S3) As i = i + 1, the process moves to the next time slot and returns to (S1).
次に、本実施例に係る資源計画作成装置100による資源計画作成のシミュレーション結果について説明する。図17は、本実施例に係る資源計画作成装置100による資源計画作成のシミュレーション結果を示す図である。
Next, a simulation result of resource plan creation by the resource
同図に示すように、データセンタXのConsumerトラフィックが朝と夜の高負荷時に3分割されて、データセンタYおよびデータセンタZでも処理が行われている。また、データセンタZの商店トラフィックが朝晩のピーク時に3分割されて、データセンタXおよびデータセンタYでも処理が行われている。 As shown in the figure, the Consumer traffic of the data center X is divided into three at high load in the morning and night, and the processing is also performed in the data center Y and the data center Z. Further, the store traffic of the data center Z is divided into three at the peak of morning and evening, and processing is also performed in the data center X and the data center Y.
上述してきたように、本実施例では、複数のデータセンタによって運用される複数のトランザクション型サービスに対して、トランザクション計画部110の予測部111が原始サービスの負荷予測を行い、派生サービス生成部112が予測部111による負荷予測およびデータセンタの計算資源量に基づいて派生サービスを生成し、最適解探索部115が派生サービス生成部112により生成された派生サービスに対する最適な資源計画を作成する。
As described above, in this embodiment, the prediction unit 111 of the
また、複数のデータセンタによって運用される複数のバッチ型サービスに対して、負荷量算出部121が原始サービスの負荷予測を行い、バッチ計画部120のバッチ型派生サービス生成部122が負荷量算出部121による負荷予測およびトランザクション型サービスの処理に使用されない計算資源量に基づいて派生サービスを生成し、バッチ型最適解探索部125が派生サービス生成部122により生成された派生サービスに対する最適な資源計画を作成する。
In addition, for a plurality of batch type services operated by a plurality of data centers, the load
従って、各データセンタに対して計算資源に応じた最適な負荷割り当てを行うことができるので、データセンタの過負荷を防ぐとともに、データセンタの計算資源を効率良く使用することができる。 Therefore, since it is possible to perform the optimum load allocation corresponding to the calculation resource for each data center, it is possible to prevent the data center from being overloaded and to efficiently use the data center calculation resource.
また、このような資源計画の生成処理により、各派生サービスと発生元となった原始サービスとの間の負荷分配比率、および各派生サービスの発生時刻とその時の配置先データセンタが定まるので、データセンタ毎に予測期間内における原始サービス負荷と派生サービス負荷の合計量の時間変動推移が得られる。 In addition, the resource plan generation process determines the load distribution ratio between each derived service and the originating source service, the time at which each derived service occurred, and the location data center at that time. For each center, a temporal variation of the total amount of the original service load and the derived service load within the prediction period is obtained.
これを基に、各データセンタ毎に、負荷の変動に応じて派生サービスの発生を適切に行った場合の、当該データセンタのピーク時負荷量を見積もることができ、この見積もり負荷量は、派生サービスの発生を全く行わない場合や、各派生サービスの配置が不適切である場合の各データセンタのピーク時負荷量より小さい値とすることができる。 Based on this, the peak load amount of the data center can be estimated for each data center when the derived service is appropriately generated according to the load fluctuation. It can be set to a value smaller than the peak load amount of each data center when no service is generated or when each derived service is improperly arranged.
また、本実施例では、資源計画作成装置100だけで負荷予測、最適資源計画の作成および資源計画のデータセンタへの送信まで行う場合について説明したが、本発明はこれに限定されるものではなく、例えば負荷予測部111を他の装置で行う場合にも同様に適用することができる。
Further, in the present embodiment, a case has been described in which only the resource
また、本実施例では、資源計画作成装置について説明したが、この資源計画作成装置が有する構成をソフトウェアによって実現することで、同様の機能を有する資源計画作成プログラムを得ることができる。そこで、この資源計画作成プログラムを実行するコンピュータシステムについて説明する。 In the present embodiment, the resource plan creation device has been described. However, by realizing the configuration of the resource plan creation device with software, a resource plan creation program having the same function can be obtained. Therefore, a computer system that executes this resource plan creation program will be described.
図18は、本実施例に係る資源計画作成プログラムを実行するコンピュータシステムを示す図である。同図に示すように、このコンピュータシステム200は、本体部201と、本体部201からの指示により表示画面202aに情報を表示するディスプレイ202と、このコンピュータシステム200に種々の情報を入力するためのキーボード203と、ディスプレイ202の表示画面202a上の任意の位置を指定するマウス204と、LAN206または広域エリアネットワーク(WAN)に接続するLANインタフェースと、公衆回線207に接続するモデムとを有する。ここで、LAN206は、他のコンピュータシステム(PC)211、サーバ212、プリンタ213などとコンピュータシステム200とを接続している。
FIG. 18 is a diagram illustrating a computer system that executes a resource plan creation program according to the present embodiment. As shown in the figure, the
また、図19は、図18に示した本体部201の構成を示す機能ブロック図である。同図に示すように、この本体部201は、CPU221と、RAM222と、ROM223と、ハードディスクドライブ(HDD)224と、CD−ROMドライブ225と、FDドライブ226と、I/Oインタフェース227と、LANインタフェース228と、モデム229とを有する。
FIG. 19 is a functional block diagram showing the configuration of the
そして、このコンピュータシステム200において実行される資源計画作成プログラムは、フロッピィディスク(FD)208、CD−ROM209、DVDディスク、光磁気ディスク、ICカードなどの可搬型記憶媒体に記憶され、これらの記憶媒体から読み出されてコンピュータシステム200にインストールされる。
The resource plan creation program executed in the
あるいは、この資源計画作成プログラムは、LANインタフェース228を介して接続されたサーバ212のデータベース、他のコンピュータシステム(PC)211のデータベースなどに記憶され、これらのデータベースから読み出されてコンピュータシステム200にインストールされる。
Alternatively, the resource plan creation program is stored in a database of the
そして、インストールされた資源計画作成プログラムは、HDD224に記憶され、RAM222、ROM223などを利用してCPU221により実行される。
The installed resource plan creation program is stored in the
また、本実施例では、データセンタにサービスを配置する場合について説明したが、本発明はこれに限定されるものではなく、他の計算機クラスタにサービスを配置する場合にも同様に適用することができる。 In this embodiment, the case where the service is arranged in the data center has been described. However, the present invention is not limited to this, and the present invention can be similarly applied to the case where the service is arranged in another computer cluster. it can.
例えば、各データセンタの内部を構成する計算資源の集合が複数の区画に分割され、各区画毎に独立した運用管理がなされている場合である。この場合、各区画毎に、どの派生サービスをいつ何時配置するかについて最適化したり、どの区画で恒常的にどの原始サービスを運用するか定め、区画毎に、そこで運用する原始サービスから派生サービスを発生させる将来時点を決定するといったことも可能である。 For example, there is a case where a set of computing resources constituting the inside of each data center is divided into a plurality of sections, and independent operation management is performed for each section. In this case, for each partition, optimize which derived service is placed when, and which primitive service is to be operated in which partition. It is also possible to determine the future time point to be generated.
(付記1)複数の計算機から構成される計算機クラスタが複数接続されて構成される計算機クラスタシステムが運用する複数のサービスを該複数の計算機クラスタへ配置する資源計画を作成する資源計画作成プログラムであって、
運用される計算機クラスタが定められたサービスである原始サービスから該原始サービスの負荷予測に基づいて各計算機クラスタから他の計算機クラスタへ運用の一部が移される派生サービスを生成する派生サービス生成手順と、
前記派生サービス生成手順により生成された派生サービス群を前記複数の計算機クラスタへ配置する資源計画を所定の評価指標に基づいて作成する計画作成手順と、
をコンピュータに実行させることを特徴とする資源計画作成プログラム。
(Supplementary note 1) A resource plan creation program for creating a resource plan for allocating a plurality of services operated by a computer cluster system configured by connecting a plurality of computer clusters composed of a plurality of computers to the plurality of computer clusters. And
Derived service generation procedure for generating a derived service in which a part of the operation is transferred from each computer cluster to another computer cluster based on the load prediction of the original service from the original service which is a service in which the operated computer cluster is determined; ,
A plan creation procedure for creating a resource plan for allocating the derived service group generated by the derived service generation procedure to the plurality of computer clusters based on a predetermined evaluation index;
A resource plan creation program characterized by causing a computer to execute.
(付記2)前記派生サービス生成手順は、前記負荷予測の予測期間を所定の時間間隔で複数のタイムスロットに分割したタイムスロット毎に派生サービスを生成し、
前記計画作成手順は、前記タイムスロット毎の派生サービスの配置計画であるタイムスロット配置計画を該タイムスロットの時刻順に並べた配置計画系列を前記資源計画として作成することを特徴とする付記1に記載の資源計画作成プログラム。
(Supplementary Note 2) The derived service generation procedure generates a derived service for each time slot obtained by dividing the prediction period of the load prediction into a plurality of time slots at a predetermined time interval.
The
(付記3)前記計画作成手順は、派生サービス群を前記複数の計算機クラスタへ最適に配置する資源計画をPareto最適性理論に基づいて作成することを特徴とする付記2に記載の資源計画作成プログラム。
(Supplementary note 3) The resource plan creation program according to
(付記4)前記計画作成手順は、計算機クラスタ間の負荷均等度と、時間軸上で隣接するタイムスロット間の前記タイムスロット配置計画の類似度とを評価指標として用いることを特徴とする付記3に記載の資源計画作成プログラム。 (Additional remark 4) The said plan preparation procedure uses the load equality between computer clusters, and the similarity of the said time slot arrangement | positioning plan between the time slots adjacent on a time axis as an evaluation parameter | index, It is characterized by the above-mentioned. Resource planning program described in 1.
(付記5)前記計画作成手順は、前記類似度と負荷均等度を評価指標とした場合に評価が最も良い配置計画系列を初期系列集合とし、該初期系列集合に含まれる配置計画系列に対して前記負荷均等度の評価がより良くなるような補正を行うことによって前記資源計画を作成することを特徴とする付記4に記載の資源計画作成プログラム。
(Additional remark 5) The said plan preparation procedure makes the arrangement plan series with the best evaluation when the similarity and the load uniformity are used as evaluation indexes as an initial series set, and for the arrangement plan series included in the initial series set The resource plan creation program according to
(付記6)前記計画作成手順により作成された資源計画を各計算機クラスタに送信する資源計画送信手順をさらにコンピュータに実行させることを特徴とする付記1〜5のいずれか一つに記載の資源計画作成プログラム。 (Additional remark 6) The resource plan as described in any one of additional remarks 1-5 which makes a computer further perform the resource plan transmission procedure which transmits the resource plan produced by the said plan creation procedure to each computer cluster Creation program.
(付記7)前記計算機クラスタはデータセンタであり、前記計算機クラスタシステムは複数のデータセンタがネットワークを介して接続されたシステムであることを特徴とする付記1〜6のいずれか一つに記載の資源計画作成プログラム。 (Supplementary note 7) The computer cluster is a data center, and the computer cluster system is a system in which a plurality of data centers are connected via a network. Resource planning program.
(付記8)前記派生サービス生成手順は、
指定されたデッドライン時刻までに、サービスを構成する全てのジョブが処理完了されていれば、個々のジョブはいつ何時処理されても構わないことを特徴とするような非リアルタイム性のバッチ型サービスが計算機クラスタの集合で運用されている場合に、リアルタイム性を要求されるトランザクション型のサービスに対して計算機クラスタの資源を優先的に割り当て、残った余剰資源をバッチ型サービスに割り当てるために、トランザクション型サービスに対して資源計画の生成を行い、その後、割り当て対象とならなかった余剰資源についてバッチ型サービスの資源計画の生成を行う事を特徴とする付記1に記載の資源計画作成プログラム。
(Supplementary Note 8) The derived service generation procedure is as follows.
A non-real-time batch service characterized in that each job can be processed anytime and at any time if all the jobs that make up the service have been processed by the specified deadline time. When a cluster is operated as a set of computer clusters, transactions are performed in order to preferentially allocate computer cluster resources to transaction-type services that require real-time performance and to allocate remaining surplus resources to batch-type services. The resource plan creation program according to
(付記9)前記計画作成手順は、各バッチ型原始サービスを構成する全てのジョブを、その投入時刻がデッドライン時刻に近いものから順に実行計画の対象とし、いかなるサービスによっても使用されていない余剰計算資源の量の計算機クラスタ集合全体にわたる総和が最大となる期間に当該スケジューリング対象となったジョブの実行計画を生成する
ことを特徴とする付記1に記載の資源計画作成プログラム。
(Supplementary note 9) The plan creation procedure includes all jobs that make up each batch-type primitive service as targets of execution plans in order from the one whose input time is close to the deadline time, and the surplus that is not used by any service The resource plan creation program according to
(付記10)複数の計算機から構成される計算機クラスタが複数接続されて構成される計算機クラスタシステムが運用する複数のサービスを該複数の計算機クラスタへ配置する資源計画を作成する資源計画作成プログラムを記録したコンピュータ読み取り可能な記録媒体であって、
運用される計算機クラスタが定められたサービスである原始サービスから該原始サービスの負荷予測に基づいて各計算機クラスタから他の計算機クラスタへ運用が移される派生サービスを生成する派生サービス生成手順と、
前記派生サービス生成手順により生成された派生サービスを前記複数の計算機クラスタへ配置する資源計画を所定の評価指標に基づいて作成する計画作成手順と、
をコンピュータに実行させる資源計画作成プログラムを記録したことを特徴とするコンピュータ読み取り可能な記録媒体。
(Supplementary note 10) Records a resource plan creation program for creating a resource plan for allocating a plurality of services operated by a computer cluster system configured by connecting a plurality of computer clusters composed of a plurality of computers to the plurality of computer clusters A computer-readable recording medium,
Derived service generation procedure for generating a derived service in which the operation is transferred from each computer cluster to another computer cluster based on the load prediction of the original service from the original service which is a service in which the operated computer cluster is determined;
A plan creation procedure for creating a resource plan for allocating the derived service generated by the derived service generation procedure to the plurality of computer clusters based on a predetermined evaluation index;
A computer-readable recording medium in which a resource plan creation program for causing a computer to execute is recorded.
(付記11)複数の計算機から構成される計算機クラスタが複数接続されて構成される計算機クラスタシステムが運用する複数のサービスを該複数の計算機クラスタへ配置する資源計画を作成する資源計画作成方法であって、
運用される計算機クラスタが定められたサービスである原始サービスから該原始サービスの負荷予測に基づいて各計算機クラスタから他の計算機クラスタへ運用の一部が移される派生サービスを生成する派生サービス生成工程と、
前記派生サービス生成工程により生成された派生サービス群を前記複数の計算機クラスタへ最適に配置する資源計画を所定の評価指標に基づいて作成する計画作成工程と、
を含んだことを特徴とする資源計画作成方法。
(Supplementary Note 11) A resource plan creation method for creating a resource plan for allocating a plurality of services operated by a computer cluster system configured by connecting a plurality of computer clusters composed of a plurality of computers to the plurality of computer clusters. And
A derived service generation step of generating a derived service in which a part of the operation is transferred from each computer cluster to another computer cluster based on a load prediction of the original service from the original service which is a service in which the operated computer cluster is determined; ,
A plan creation step of creating a resource plan that optimally arranges the derived service group generated by the derived service generation step in the plurality of computer clusters based on a predetermined evaluation index;
A resource planning method characterized by including
(付記12)複数の計算機から構成される計算機クラスタが複数接続されて構成される計算機クラスタシステムが運用する複数のサービスを該複数の計算機クラスタへ配置する資源計画を作成する資源計画作成装置であって、
運用される計算機クラスタが定められたサービスである原始サービスから該原始サービスの負荷予測に基づいて各計算機クラスタから他の計算機クラスタへ運用の一部が移される派生サービスを生成する派生サービス生成手段と、
前記派生サービス生成手段により生成された派生サービス群を前記複数の計算機クラスタへ最適に配置する資源計画を所定の評価指標に基づいて作成する計画作成手段と、
を備えたことを特徴とする資源計画作成装置。
(Supplementary note 12) A resource plan creation device for creating a resource plan for allocating a plurality of services operated by a computer cluster system configured by connecting a plurality of computer clusters composed of a plurality of computers to the plurality of computer clusters. And
Derived service generation means for generating a derived service in which a part of the operation is transferred from each computer cluster to another computer cluster based on the load prediction of the original service from the original service which is a service in which the operated computer cluster is determined ,
Plan creation means for creating a resource plan for optimally arranging the derived service group generated by the derived service generation means in the plurality of computer clusters, based on a predetermined evaluation index;
A resource plan creation device characterized by comprising:
以上のように、本発明に係る資源計画作成プログラムは、複数のデータセンタへのサービス割り当てに有用であり、特に、過負荷をなくし、計算資源を有効利用する必要があるデータセンタに適している。 As described above, the resource plan creation program according to the present invention is useful for allocating services to a plurality of data centers, and is particularly suitable for data centers that need to eliminate overload and effectively use computing resources. .
101〜10n データセンタ
20 インターネット
100 資源計画作成装置
110 トランザクション計画部
111 予測部
112 派生サービス生成部
113 DC生成部
114 NDC生成部
115 最適解探索部
120 バッチ計画部
121 負荷量算出部
122 バッチ型派生サービス生成部
123 バッチ型DC生成部
124 バッチ型NDC生成部
125 バッチ型最適解探索部
130 資源計画送信部
200,211 コンピュータシステム
201 本体部
202 ディスプレイ
202a 表示画面
203 キーボード
204 マウス
206 LAN
207 公衆回線
208 フロッピィディスク
209 CD−ROM
212 サーバ
213 プリンタ
221 CPU
222 RAM
223 ROM
224 ハードディスクドライブ
225 CD−ROMドライブ
226 フロッピィディスクドライブ
227 I/Oインタフェース
228 LANインタフェース
229 モデム
10 1 to 10 n
207
212
222 RAM
223 ROM
224
Claims (2)
運用される計算機クラスタが定められたサービスである原始サービスから該原始サービスの負荷予測に基づいて各計算機クラスタから他の計算機クラスタへ運用の一部が移される派生サービスを、負荷予測の予測期間を所定の時間間隔で複数のタイムスロットに分割したタイムスロット毎に生成する派生サービス生成手順と、
前記派生サービス生成手順により生成された派生サービス群を前記複数の計算機クラスタへ最適配置する資源計画として、タイムスロット毎の派生サービスの配置計画であるタイムスロット配置計画を該タイムスロットの時刻順に並べた配置計画系列を、計算機クラスタ間の負荷均等度と、時間軸上で隣接するタイムスロット間のタイムスロット配置計画の類似度とを評価指標として用いて作成する計画作成手順と、
をコンピュータに実行させることを特徴とする資源計画作成プログラム。 A resource plan creation program for creating a resource plan for allocating a plurality of services operated by a computer cluster system configured by connecting a plurality of computer clusters composed of a plurality of computers to the plurality of computer clusters,
A derived service in which a part of the operation is transferred from each computer cluster to another computer cluster based on the load prediction of the source service from the source service, which is a service for which the computer cluster to be operated is determined, is used for the prediction period of the load prediction. Derived service generation procedure for generating each time slot divided into a plurality of time slots at a predetermined time interval ;
As a resource plan for optimally allocating the derived service group generated by the derived service generation procedure to the plurality of computer clusters , time slot allocation plans that are derived service allocation plans for each time slot are arranged in the order of the times of the time slots. A plan creation procedure for creating an arrangement plan series using load equality between computer clusters and similarity of time slot arrangement plans between adjacent time slots on a time axis as an evaluation index ;
A resource plan creation program characterized by causing a computer to execute.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2004105093A JP4286703B2 (en) | 2004-03-31 | 2004-03-31 | Resource planning program |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2004105093A JP4286703B2 (en) | 2004-03-31 | 2004-03-31 | Resource planning program |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2005293048A JP2005293048A (en) | 2005-10-20 |
JP4286703B2 true JP4286703B2 (en) | 2009-07-01 |
Family
ID=35325935
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2004105093A Expired - Lifetime JP4286703B2 (en) | 2004-03-31 | 2004-03-31 | Resource planning program |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP4286703B2 (en) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US9983911B2 (en) | 2014-08-19 | 2018-05-29 | Nec Corporation | Analysis controller, analysis control method and computer-readable medium |
Families Citing this family (16)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2007183883A (en) | 2006-01-10 | 2007-07-19 | Fujitsu Ltd | Resource plan preparation program, recording medium with this program recorded thereon, and apparatus and method for preparing resource plan |
JP4629587B2 (en) * | 2006-01-18 | 2011-02-09 | 富士通株式会社 | Reservation management program |
JP4644175B2 (en) * | 2006-10-10 | 2011-03-02 | 日本放送協会 | ACCESS LOAD CONTROL DEVICE, ITS PROGRAM, AND POST RECEPTION SYSTEM |
JP4978693B2 (en) | 2007-06-08 | 2012-07-18 | 富士通株式会社 | Manager, agent and system, and transmission control method |
US7970903B2 (en) | 2007-08-20 | 2011-06-28 | Hitachi, Ltd. | Storage and server provisioning for virtualized and geographically dispersed data centers |
JP5155699B2 (en) * | 2008-03-07 | 2013-03-06 | 新日鉄住金ソリューションズ株式会社 | Information processing apparatus, information processing method, and program |
JP2009252204A (en) * | 2008-04-11 | 2009-10-29 | Hitachi Ltd | Operation management system and operation management method of computer |
JP5349876B2 (en) * | 2008-09-08 | 2013-11-20 | 新日鉄住金ソリューションズ株式会社 | Information processing apparatus, information processing method, and program |
JP2011048419A (en) * | 2009-08-25 | 2011-03-10 | Nec Corp | Resource management device, processing system, resource management method, and program |
JP5576085B2 (en) * | 2009-10-13 | 2014-08-20 | 株式会社日立製作所 | Distributed computer system and operation method thereof |
JP2011134215A (en) * | 2009-12-25 | 2011-07-07 | Taito Corp | Clustering system |
WO2012108007A1 (en) | 2011-02-08 | 2012-08-16 | 富士通株式会社 | Execution control program, execution control device and execution control method |
US20130151688A1 (en) * | 2011-12-07 | 2013-06-13 | Alcatel-Lucent Usa Inc. | Optimization mechanisms for latency reduction and elasticity improvement in geographically distributed data centers |
CN103399799B (en) * | 2013-07-30 | 2017-02-22 | 浪潮(北京)电子信息产业有限公司 | Computational physics resource node load evaluation method and device in cloud operating system |
JP6031051B2 (en) * | 2014-02-12 | 2016-11-24 | 西日本電信電話株式会社 | Job execution planning device |
JP7077676B2 (en) * | 2018-03-07 | 2022-05-31 | 富士フイルムビジネスイノベーション株式会社 | Processing allocation device and processing allocation program |
-
2004
- 2004-03-31 JP JP2004105093A patent/JP4286703B2/en not_active Expired - Lifetime
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US9983911B2 (en) | 2014-08-19 | 2018-05-29 | Nec Corporation | Analysis controller, analysis control method and computer-readable medium |
Also Published As
Publication number | Publication date |
---|---|
JP2005293048A (en) | 2005-10-20 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP4286703B2 (en) | Resource planning program | |
CN109643247B (en) | Multi-standard adaptive scheduling for market-oriented hybrid cloud infrastructure | |
Yadav et al. | Managing overloaded hosts for energy-efficiency in cloud data centers | |
Rekha et al. | Efficient task allocation approach using genetic algorithm for cloud environment | |
Jiang et al. | Optimal cloud resource auto-scaling for web applications | |
Singh et al. | A provisioning model and its comparison with best-effort for performance-cost optimization in grids | |
JP2020504382A (en) | Predictive asset optimization for computer resources | |
Krishnadoss et al. | OLOA: Based Task Scheduling in Heterogeneous Clouds. | |
Ramasamy et al. | An effective HPSO-MGA optimization algorithm for dynamic resource allocation in cloud environment | |
US11531657B1 (en) | Autonomous workload management in an analytic platform | |
Liumei et al. | Towards energy efficient cloud: an optimized ant colony model for virtual machine placement | |
TW200532518A (en) | Methods and apparatus for managing computing resources based on yield management framework | |
Zhang et al. | An Energy and SLA‐Aware Resource Management Strategy in Cloud Data Centers | |
CN115330123A (en) | Cloud platform order allocation optimization method based on improved particle swarm optimization | |
Balouek-Thomert et al. | Parallel differential evolution approach for cloud workflow placements under simultaneous optimization of multiple objectives | |
Mahan et al. | A novel resource productivity based on granular neural network in cloud computing | |
Chouliaras et al. | An adaptive auto-scaling framework for cloud resource provisioning | |
CN118467186B (en) | Multi-tenant server-free platform resource management method and system | |
JP7111779B2 (en) | Predictive asset optimization for computing resources | |
Bostandoost et al. | LACS: Learning-Augmented Algorithms for Carbon-Aware Resource Scaling with Uncertain Demand | |
Milocco et al. | Evaluating the upper bound of energy cost saving by proactive data center management | |
US20230205596A1 (en) | Autonomous workload management in an analytic platform | |
Fadda et al. | Multi period assignment problem for social engagement and opportunistic IoT | |
Zhang et al. | Two-level task scheduling with multi-objectives in geo-distributed and large-scale SaaS cloud | |
Ghosh et al. | A two-phase approach for stochastic optimization of complex business processes |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20070322 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20081205 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20081216 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20090213 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20090317 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20090325 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120403 Year of fee payment: 3 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120403 Year of fee payment: 3 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130403 Year of fee payment: 4 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20140403 Year of fee payment: 5 |