JP3987517B2 - Computer system and cluster system program - Google Patents
Computer system and cluster system program Download PDFInfo
- Publication number
- JP3987517B2 JP3987517B2 JP2004254427A JP2004254427A JP3987517B2 JP 3987517 B2 JP3987517 B2 JP 3987517B2 JP 2004254427 A JP2004254427 A JP 2004254427A JP 2004254427 A JP2004254427 A JP 2004254427A JP 3987517 B2 JP3987517 B2 JP 3987517B2
- Authority
- JP
- Japan
- Prior art keywords
- service
- computer
- load
- optimal
- relocation
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Lifetime
Links
- 238000000034 method Methods 0.000 claims description 40
- 230000008707 rearrangement Effects 0.000 claims description 28
- 230000008569 process Effects 0.000 claims description 26
- 230000008859 change Effects 0.000 claims description 11
- 230000004044 response Effects 0.000 claims description 10
- 230000002093 peripheral effect Effects 0.000 claims description 4
- 238000000926 separation method Methods 0.000 claims description 3
- 230000007717 exclusion Effects 0.000 claims 3
- 230000006870 function Effects 0.000 description 14
- 238000010586 diagram Methods 0.000 description 6
- 230000007423 decrease Effects 0.000 description 2
- 230000001419 dependent effect Effects 0.000 description 2
- 239000000284 extract Substances 0.000 description 2
- 238000012423 maintenance Methods 0.000 description 2
- 239000002131 composite material Substances 0.000 description 1
- 239000000470 constituent Substances 0.000 description 1
- 238000005315 distribution function Methods 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 230000015654 memory Effects 0.000 description 1
Images
Landscapes
- Hardware Redundancy (AREA)
Description
本発明は、一般的には、複数の計算機で構成される計算機システムに関し、特に、計算機の障害や負荷状況に応じてサービスの最適配置機能を実現するクラスタシステムの技術に関する。 The present invention generally relates to a computer system including a plurality of computers, and more particularly to a cluster system technology that realizes an optimal service allocation function according to a computer failure or a load situation.
近年、複数の計算機(例えばサーバ)で構成される計算機システムを管理し、アプリケーションプログラムを実行することによりクライアント端末(ユーザ)に提供するサービスの処理性能及び信頼性を高めるクラスタシステムと呼ばれるソフトウェア技術が開発されている。クラスタシステムは、計算機の起動時や障害発生,負荷状況の変動に対応して、
計算機システム上で稼動するサービスを最適な計算機にスケジュールするなどの機能を有し、可用性の向上や負荷分散を実現する。
In recent years, there has been a software technique called a cluster system that manages a computer system composed of a plurality of computers (for example, servers) and improves the processing performance and reliability of services provided to client terminals (users) by executing application programs. Has been developed. The cluster system responds to computer start-up, failure occurrence, and changes in load conditions.
It has functions such as scheduling services running on a computer system to the optimal computer, improving availability and load balancing.
クラスタシステムは大別して、負荷分散機能を重視した負荷分散型クラスタシステムと、フェイルオーバ機能を重視した高可用型クラスタシステムがある(例えば、非特許文献1及び非特許文献2を参照)。
Cluster systems are roughly classified into a load distribution type cluster system that places importance on the load distribution function and a highly available type cluster system that places importance on the failover function (see, for example, Non-Patent
クラスタシステムは、システム運用上のルールに相当するポリシ(policy)情報の設定に基づいて、サービスを実行するのに最適な計算機を決定している。通常では、ポリシ情報はユーザの設定により変更可能である。 The cluster system determines an optimal computer for executing the service based on the setting of policy information corresponding to the rules for system operation. Normally, policy information can be changed by user settings.
また、クラスタシステムは、全ての計算機が高負荷状態で、サービスを割当てる最適な計算機が無い場合には、予備用の計算機(プロビジョニング計算機)を利用して対応している。
近年では、負荷分散型クラスタシステムと高可用型クラスタシステムとが混在するクラスタシステムが開発されている。このようなシステムでは、単純に前記のポリシ情報の設定のみでサービスの最適配置(最適な計算機へのサービスの割当て)がなされると、計算機の負荷状況の変動に応じたサービスの実行が保証されない事態が発生する。具体的には、サービスの自動スイッチオーバを実行すると、負荷の変動に伴なって頻繁にスイッチオーバが発生したり、低優先度サービスが先に実行していた時の対応が不明であったり、またサービスの実行可能な計算機が無い時には、起動されないことがあった。 In recent years, a cluster system in which a load balancing cluster system and a highly available cluster system are mixed has been developed. In such a system, when the optimal arrangement of services (assignment of services to the optimal computer) is performed simply by setting the policy information, the execution of the service according to the change in the load status of the computer is not guaranteed. Things happen. Specifically, when automatic switchover of services is performed, frequent switchovers occur due to load fluctuations, or the response when the low priority service was executed first is unknown, Also, when there was no computer that could execute the service, it could not be started.
そこで、本発明の目的は、サービスの最適配置後の動的な負荷状況の変化等のサービスの実行状況に応じたサービスの再配置を確実に行なうことが可能なクラスタシステムを実現することができる。 Accordingly, an object of the present invention is to realize a cluster system capable of reliably performing a service relocation according to a service execution status such as a dynamic load status change after the optimal service allocation. .
本発明の一観点に従った2台以上の計算機を持つ計算機システムは、前記各計算機が実行する複数のサービスの割当て処理を決定するためのポリシ情報を保存するポリシ管理部と、前記ポリシ情報に従って、各サービスを最適な計算機に割当てる処理を実行するサービス最適配置部と、前記計算機間におけるサービスの実行状況に応じて、前記サービス最適配置部により割当てられたサービスの再配置処理を前記ポリシ情報を参照して実行するサービス再配置部とを具備することを特徴とする。 A computer system having two or more computers according to an aspect of the present invention includes a policy management unit that stores policy information for determining allocation processing of a plurality of services executed by each computer, and the policy information A service optimal allocation unit that executes a process of allocating each service to an optimal computer, and a service relocation process allocated by the service optimal allocation unit according to the execution status of the service between the computers. And a service relocation unit executed by referring to the data.
本発明の他の観点によれば、特に、負荷分散型クラスタシステムと高可用型クラスタシステムとが混在する複合クラスタシステムにおいて、動的な負荷状況の変化に応じたクラスタシステム間のサービスの最適配置を可能とする構成を有する計算機システムが構成される。 According to another aspect of the present invention, particularly in a composite cluster system in which a load balancing cluster system and a highly available cluster system coexist, an optimal arrangement of services between cluster systems in response to a change in dynamic load status A computer system having a configuration enabling the above is configured.
本発明によれば、サービスの最適配置後の動的な負荷状況の変化等のサービスの実行状況に応じたサービスの再配置を確実に行なうことが可能なクラスタシステムを実現することができる。 According to the present invention, it is possible to realize a cluster system capable of reliably rearranging services in accordance with service execution status such as dynamic load status change after optimal service allocation.
以下図面を参照して、本発明の実施形態を説明する。 Embodiments of the present invention will be described below with reference to the drawings.
(第1の実施形態)
図1は、第1の実施形態に関する計算機システムのシステム構成を示すブロック図である。
(First embodiment)
FIG. 1 is a block diagram illustrating a system configuration of a computer system according to the first embodiment.
計算機システムは、例えば4台の計算機C1〜C4がネットワークN上で相互に接続された構成である。各計算機C1〜C4はそれぞれ、オペレーティングシステム(OS-1〜OS-4)31〜34の制御下で動作する。なお、ここでは、1台の予備用の計算機(プロビジョニング計算機)C5がネットワークNを介して計算機システムに接続されている。更に1台またはそれ以上の予備用の計算機をネットワークNに接続してもよい。 The computer system has a configuration in which, for example, four computers C1 to C4 are connected to each other on the network N. The computers C1 to C4 operate under the control of operating systems (OS-1 to OS-4) 31 to 34, respectively. Here, one spare computer (provisioning computer) C5 is connected to the computer system via the network N. Furthermore, one or more spare computers may be connected to the network N.
計算機C1〜計算機C4によって、クラスタシステムを構成している。このクラスタシステムでは、クラスタ制御部(CS1)10が動作する。クラスタ制御部10は、計算機C1〜計算機C4にそれぞれ設けられたクラスタ制御用のプログラム(クラスタソフトウェア)(図示せず)が相互に通信を行いながら同期して一体となって動作することにより実現されるバーチャルマシンである。このため、クラスタ制御部10は計算機C1〜計算機C4にまたがって存在していると考えることができる。クラスタ制御部10は、サービス最適配置機能を実現するサービス最適配置部11、サービス再配置機能を実現するサービス再配置部12、ポリシ管理機能を実現するポリシ管理部13、負荷管理機能を実現する負荷管理部14、及びサービス制御機能を実現するサービス制御部15を有する。
A cluster system is configured by the computers C1 to C4. In this cluster system, the cluster control unit (CS1) 10 operates. The
サービス最適配置部11は、サービスの起動が必要になった場合に、サービス実行に最適な計算機を、ポリシ管理部13により保管されているポリシ情報に従って決定する。ポリシ情報は、具体的には例えば以下のような項目(1)〜(5)のポリシ(運用上のルール)を指定する。
When the service needs to be activated, the service
(1)サービスの優先順位。 (1) Service priority.
サービス毎に実行を優先する順位が付けられる。サービスの優先順位に従って、必要なリソース、即ち計算機を割当てる順序が決められる。また、優先順位の高いサービスを実行するために優先順位の低いサービスを停止させることもある。 A priority is given to execution for each service. According to the priority of the service, the order in which necessary resources, that is, computers are allocated is determined. In addition, a service with a low priority may be stopped in order to execute a service with a high priority.
(2)サービスに割当てる計算機の優先順位。 (2) Priorities of computers assigned to services.
サービスを実行可能な計算機が複数あるときに優先的に割当てられる計算機の順位をつける。 When there are a plurality of computers that can execute the service, a computer is assigned a priority.
(3)サービス間の関係(排他,依存など)。 (3) Relationship between services (exclusive, dependent, etc.).
同時に実行不可能なサービスを排他関係にあるサービスと言い、他のサービスが実行されている時にしか実行できないサービスを依存関係にあるサービスとする。また、同じ計算機で実行不可能なサービスをサーバ排他関係にあるサービスと言い、他のサービスが実行されている時にしか実行できないサービスをサーバ依存関係にあるサービスとする。このようなサービス相互間の関係を設定する。 A service that cannot be executed at the same time is called a service in an exclusive relationship, and a service that can be executed only when another service is executed is a service in a dependency relationship. Also, a service that cannot be executed on the same computer is called a server exclusive service, and a service that can be executed only when another service is being executed is a server dependent service. Such a relationship between services is set.
(4)サービス実行の必須リソース(周辺機器など)の割当て。 (4) Allocation of essential resources (peripheral devices, etc.) for service execution.
サービスを実行するのに必須なリソースを設定し、そのリソースを持つ計算機以外でサービスが実行されないように設定する。 Set the resources required to execute the service, and set the service so that it will not be executed on computers other than those with that resource.
(5)計算機の負荷状況(最低負荷状況の計算機に割当てる)。 (5) Computer load status (assigned to the computer with the lowest load status).
サービスを実行するときに最低負荷の計算機を選択し、そのサービスを実行しても過負荷にならない計算機を選択するなどの条件を設定する。 A condition such as selecting a computer with the lowest load when executing a service and selecting a computer that does not become overloaded even when the service is executed is set.
サービス再配置部12は、本実施形態の要旨に関する要素であり、サービスの負荷状況の変化や計算機停止に至らない障害発生などで、サービスの計算機配置に不均衡が発生した時に、サービスの再配置をポリシ管理部13により保管されているポリシ情報に従って決定する。
The
この再配置に関するポリシ情報は、例えば以下のような項目(1)〜(4)のポリシを指定する。 The policy information related to the rearrangement specifies the following items (1) to (4), for example.
(1)自サービスのスイッチオーバの可/不可。 (1) Enable / disable switchover of own service.
実行中のサービスを停止し、この停止したサービスを他の計算機で実行を継続させるために他の計算機に移送することをスイッチオーバと言う。このスイッチオーバの可・不可の設定をする。これは、予め静的に設定する場合と、クリティカルな処理を実行中に不可に設定する動的な設定をする場合とがある。 Stopping a service being executed and transferring the stopped service to another computer in order to continue execution on another computer is referred to as a switchover. Set whether to enable or disable this switchover. This may be set statically in advance or may be dynamically set so that critical processing is disabled during execution.
(2)サービスの実行可能なノードが無い場合に他サービス停止の可/不可。 (2) When there is no node that can execute the service, other services can be stopped.
あるサービスの起動時にこれを実行可能な計算機がない場合に当該サービスより優先度の低い実行中のサービスを停止してそのサービスを起動させることの可・不可を設定する。 When there is no computer that can execute this at the time of starting a certain service, it sets whether or not it is possible to stop a running service having a lower priority than the service and start the service.
この場合、停止されたサービスは他の計算機へスイッチオーバするように設定される場合がある。これらの設定は、システム全体、サービス単位、あるいは計算機単位で設定することができる。 In this case, the stopped service may be set to switch over to another computer. These settings can be set for the entire system, for each service, or for each computer.
(3)スイッチオーバ/停止サービスの判定基準(高負荷優先/低負荷優先)。 (3) Switchover / stop service criteria (high load priority / low load priority).
判断基準の例としては、
高負荷のサービスから先にスイッチオーバ・停止させる場合、
低負荷のサービスから先にスイッチオーバ・停止させる場合、
スイッチオーバ・停止させるサービスの優先順位を設定する場合
がある。このような設定をシステム単位、計算機単位で設定することが可能である。
Examples of criteria include
If you want to switch over / stop first after a high-load service,
If you want to switch over / stop first from a low-load service,
The priority of services to be switched over or stopped may be set. Such a setting can be set for each system and each computer.
また、最後に1つだけ残ったサービスのスイッチオーバの可/不可の設定にはそのサービスの大きさと計算機の容量との関係などを考慮して設定する必要がある。例えば、ある計算機に対しては過負荷となるサービスを同じ程度の容量の計算機にスイッチオーバしてもやはり過負荷となり、この場合はスイッチオーバは不可となる。 In addition, in order to enable / disable the switchover of the last one remaining service, it is necessary to consider the relationship between the size of the service and the capacity of the computer. For example, even if an overloaded service is switched over to a computer having the same capacity for a certain computer, it is still overloaded. In this case, the switchover is impossible.
(4)負荷状況の変化時の対応。 (4) Response when load conditions change.
計算機の負荷状況が変化したときにサービスのスイッチオーバ/停止などを実行するかどうか、を設定する。負荷状況は変化の閾値なども設定できる。 Sets whether to perform service switchover / stop, etc. when the load status of the computer changes. The load status can be set as a change threshold.
(4−1)現状維持重視の場合で、サービスのスイッチオーバ/停止が起きない程度でサービスの再配置を実行する。 (4-1) Service relocation is executed to the extent that service switchover / stop does not occur in the case where current status is important.
(4−2)最適配置重視の場合で、たとえサービスのスイッチオーバ/停止が起きても最適になるようにサービスを再配置する。 (4-2) In a case where optimum arrangement is emphasized, the service is rearranged so that it is optimal even if the service is switched over or stopped.
このほかに、例えばある計算機にその停止に至らない程度の不具合が生じて一時的にその容量が低下した時なども後で述べるサービス再配置部はその必要性を検知してサービス再配置の処理が行われる。 In addition to this, the service relocation unit, which will be described later, detects the necessity, for example, when a problem occurs in a computer that does not stop, and the capacity temporarily decreases. Is done.
これらのポリシ情報は、予めユーザにより設定が可能である。なお、再配置が決定したサービスは、サービス最適配置部11によって、実行される計算機が割当てられるまで停止状態になる。
These policy information can be set in advance by the user. The service determined to be rearranged is stopped by the service
ポリシ管理部13は、サービス最適配置部11やサービス再配置部12が使用するポリシ情報を保存・管理している。
The
負荷管理部14は、各計算機C1〜C4でのサービス負荷や計算機負荷状況を判定し、
この判定結果によりサービスの再配置が必要な場合には、その旨を負荷情報と共にサービス再配置部12に通知する。この通知を受けて、サービス再配置部12は、後述するようなサービスの再配置処理を実行する。
The
If it is necessary to relocate the service based on the determination result, the
当該負荷情報には、各計算機C1〜C4のCPU、メモリ、ディスクの使用量やレスポンスタイムなどが含まれる。また、各計算機C1〜C4はそれぞれ、ノード負荷モニタ21〜24を有し、それぞれの負荷状況を監視している。 The load information includes the usage amount and response time of the CPUs, memories, and disks of the computers C1 to C4. The computers C1 to C4 have node load monitors 21 to 24, respectively, and monitor their load conditions.
(クラスタシステムの動作)
クラスタシステム10は、ユーザが作成した並列実行型サービス及び高可用型サービスの実行を管理する。並列実行型サービスは、例えばWebサービスなどであり、一時期に複数の計算機C1〜C4で同時に実行可能なタイプのサービスである。並列実行型サービスが一時期に実行されるサービス数は、負荷管理部14により管理されており、高負荷になればサービス数が増大し、低負荷になればサービス数が減少する。
(Cluster system operation)
The
一方、ユーザが作成した高可用型サービスは、例えばデータベース検索サービスなどであり、一時期にどこか一つの計算機(例えばC2)でのみ実行可能なタイプのサービスである。高可用型サービスは、障害発生時にフェイルオーバや、障害予測時や高負荷時のスイッチオーバで他の計算機に移動して処理を継続するように作成されている。 On the other hand, the highly available service created by the user is a database search service, for example, and is a service that can be executed by only one computer (for example, C2) at one time. The high availability service is created so as to continue processing by moving to another computer when a failure occurs, or when a failure is predicted or a switchover occurs during a high load.
例えば計算機C2で実行中の高可用型サービスの負荷が急激に上昇したときに、クラスタシステム10の負荷管理部14は、当該計算機C2の負荷が限界に近いと判定すると、サービスの再配置の必要をサービス再配置部12に通知する。
For example, if the
サービス再配置部12は、ポリシ管理部13で保管されているポリシ情報(ユーザにより設定可能)に従って、高可用型サービスまたは並列実行型サービスのサービス再配置処理を開始する。
The
具体的には、サービス再配置部12は例えば並列実行型サービスの再配置を決定すると、これを受けて、サービス制御部15が一時的に並列実行型サービスの停止を行なう。この並列実行型サービスの停止後に、サービス最適配置部11は、サービス実行に最適な計算機(例えばC1)を選択する。選択された計算機(例えばC1)上のサービス制御部15は、並列実行型サービスを起動させることで、サービスの自動スイッチオーバを実行する。
Specifically, for example, when the
以上のようなクラスタシステム10によるサービス自動スイッチオーバ機構により、動的な負荷変動に対応したサービスの最適配置が可能になる。
The service automatic switchover mechanism by the
(サービス配置処理)
以下図2のフローチャートを参照して、本実施形態のクラスタシステム10のサービス再配置処理の手順を説明する。
(Service allocation processing)
The procedure of the service rearrangement process of the
サービス再配置部12は、ポリシ管理部13に問い合わせを実行して、例えばユーザにより設定されたポリシ情報の設定に従って再配置処理を実行する。ポリシ情報は、前述したように、例えば以下のような項目(1)〜(4)のポリシを指定する。
The
(1)サービス毎のスイッチオーバの可/不可。 (1) Enable / disable switchover for each service.
(2)サービスの実行可能なノードが無い場合に他サービス停止の可/不可。 (2) When there is no node that can execute the service, other services can be stopped.
(3)スイッチオーバ/停止サービスの判定基準。 (3) Criteria for switchover / stop service.
(3−1)高負荷優先/低負荷優先。 (3-1) High load priority / low load priority.
(3−2)最後のサービスのスイッチオーバの可/不可。 (3-2) Whether or not the last service can be switched over.
(4)負荷状況の変化時の対応。 (4) Response when load conditions change.
(4−1)現状維持重視の場合で、サービス停止が起きない程度で再配置。 (4-1) Relocation to the extent that service is not interrupted in the case where current maintenance is important.
(4−2)最適配置重視の場合で、サービス停止を起こしながら再配置。 (4-2) In the case where optimum placement is emphasized, rearrangement is performed while causing a service stop.
前述したように、負荷管理部14は、負荷状況の判定に応じて、サービスの再配置が必要であるか否かを判定する(ステップS1)。この判定基準としては、例えば「計算機が継続的に高負荷でサービス実行の遅延が予測される場合」や、「計算機に実行待ちになっている高負荷(予測)の高優先度サービスがある場合」等であり、サービスの再配置が必要であると判断される。
As described above, the
以下、サービスの再配置が必要な場合の処理(ステップS1のYES)を説明する。 In the following, processing when service relocation is necessary (YES in step S1) will be described.
サービス再配置部12は、ポリシ情報のポリシ(1及び3)に従って、サービスのスイッチオーバや、停止可能なサービスがあるか否かを判定する(ステップS2)。判定結果が「YES」であれば、クラスタシステム10のサービス制御部15は、スイッチオーバ可能と設定されたサービスより、優先度の低いものからサービスの再配置が必要なくなるまでサービスのスイッチオーバを実行する(ステップS3)。
The
一方、スイッチオーバ可能なサービスが無い場合は、サービス再配置部12は、ポリシ情報のポリシ(2)に従って、強制処置が可能であるか否かを判定する(ステップS2のNO,S4)。強制処置が可能であれば、優先度の低いものからサービスの再配置が必要なくなるまでスイッチオーバを実行する処理に移行する(ステップS4のYES,S3)。
On the other hand, when there is no service that can be switched over, the
強制処置できない場合は、クラスタシステム10は、利用可能なプロビジョニング計算機(予備計算機)を探索し、存在する場合には当該計算機C5を追加する(ステップS4のNO,S5,S6)。ここで、追加されたプロビジョニング計算機C5は、計算機システムの負荷が低下したときに返却の指定がある場合には、当該負荷が低下したときに返却される。なお、利用可能なプロビジョニング計算機が存在しない場合には、一定時間のスリープ状態を経てリターンとなる(ステップS5のNO,S11)。
If the forcible treatment cannot be performed, the
次に、負荷管理部14の判定結果により、サービスの再配置が不必要である場合について説明する(ステップS1のNO)。
Next, a case where the rearrangement of services is unnecessary according to the determination result of the
サービス再配置部12は、ポリシ情報のポリシ(4−2)に従って、最適化配置重視で高負荷になりつつある場合には、サービス再配置処理を実行する(ステップS7のYES,S8のYES)。そうでなければ、サービス再配置処理は終了となる(ステップS7のNO,S8のNO)。
In accordance with the policy information policy (4-2), the
ここで、計算機が高負荷になりつつあるか否かの判定は、一定の間隔で平均した負荷が単調に増加していて、遠くない将来において高負荷になることが予測できるか否かで判定できる。 Here, whether or not the computer is becoming heavily loaded is determined by whether or not the load averaged at regular intervals is increasing monotonously and it can be predicted that the load will be high in the not-too-distant future. it can.
さらに、サービス再配置処理を実行する場合に、サービス再配置部12は、サービスを移動した方がより最適な配置かどうかを判定し、最適な場合にはサービスのスイッチオーバを実行する(ステップS9のYES,S10)。最適な配置であると判断できない場合には、サービス再配置処理は終了となる(ステップS9のNO)。
Further, when executing the service rearrangement process, the
ここで、最適な配置の判断基準は、選択された計算機で再配置するサービスを現在と同じ負荷で稼動させた場合、計算機間の負荷の状態がより平均化される場合である。また、サービスのスイッチオーバのオーバヘッドを加味しても、選択された計算機で処理を行う方が早いと考えられる場合などである。 Here, the criterion for determining the optimal arrangement is when the service to be relocated on the selected computer is operated with the same load as the current load, and the load state between the computers is more averaged. In addition, there is a case where it is considered that it is faster to perform processing with the selected computer even if the overhead of service switchover is taken into account.
ここで、サービス再配置のポリシとして、サービス毎にスイッチオーバの可/不可や現状維持重視のポリシが出来ることや、スイッチオーバで停止しても、スイッチオーバ先の計算機で起動可能にならないかぎり実行されないことで、計算機の負荷変動に過敏に反応して、スイッチオーバを繰り返す事を防止することが可能になる。 Here, as a policy for service relocation, a switchover policy can be enabled / disabled for each service, a policy that emphasizes the maintenance of the current status can be performed, and even if it is stopped by a switchover, it is executed as long as it can not be started by the switchover destination computer By not doing so, it becomes possible to prevent the switchover from being repeated in response to the load fluctuation of the computer.
以上要するに、本実施形態のクラスタシステムであれば、ポリシベースで管理されたサービス再配置機能を持たせることで、動的な負荷状況の変化に応じてサービスの再配置を可能とし、かつ、ユーザの運用環境に合ったクラスタシステムの構築を容易に実現することが可能となる。 In short, with the cluster system of this embodiment, by providing a service relocation function managed on a policy basis, it is possible to relocate services according to dynamic load status changes, and users It is possible to easily construct a cluster system suitable for the operational environment.
(第2の実施形態)
図3から図5は、第2の実施形態に関する計算機システムのシステム構成及びその変化を示すブロック図である。
(Second Embodiment)
FIG. 3 to FIG. 5 are block diagrams showing the system configuration of the computer system related to the second embodiment and its changes.
図3に示すように、初期状態での計算機システムは、例えば5台の計算機C1〜C5がネットワークN上で相互に接続された構成である。さらに、ネットワークN上には6台目の計算機C6が接続されている。当該計算機C6は、停止しており、プロビジョニング計算機(予備計算機)としてプロビジョニング計算機プール60に登録されている。
As shown in FIG. 3, the computer system in the initial state has a configuration in which, for example, five computers C1 to C5 are connected to each other on the network N. Further, on the network N, a sixth computer C6 is connected. The computer C6 is stopped and registered in the
プロビジョニング計算機プール60とは、停止している1台又は複数台の計算機をプロビジョニング計算機として登録したことを概念的に図示し総称したものである。
The
計算機をプロビジョニング計算機としてプロビジョニング計算機プール60に登録することは、図示しないプロビジョニング計算機に関する情報(例えばプロセッサ名やMACアドレスなど)を登録情報として登録することを意味し、この登録情報によりプロビジョニング計算機プール60に登録された複数のプロビジョニング計算機を管理する。
Registering a computer as a provisioning computer in the
計算機C1〜C3はそれぞれオペレーティングシステムOS(OS-1-1〜OS-1-3)の制御下で稼動中である。また、計算機C4,C5はそれぞれオペレーティングシステムOS(OS-2-1,OS-2-2)の制御下で稼動中である。 The computers C1 to C3 are operating under the control of the operating system OS (OS-1-1 to OS-1-3), respectively. The computers C4 and C5 are operating under the control of the operating system OS (OS-2-1, OS-2-2).
稼動中の計算機C1〜C5では、プロビジョニング計算機割当て機能を実現するプロビジョニング計算機割当て部31と、プロビジョニング計算機切離し機能を実現するプロビジョニング計算機切離し部32と、プロビジョニングポリシ管理機能を実現するプロビジョニングポリシ管理部(以下単にポリシ管理部との略す場合がある)33とが稼動している。計算機C1、計算機C2、計算機C3でそれぞれプロビジョニング計算機割当て部31と、プロビジョニング計算機切離し部32と、プロビジョニングポリシ管理部33とが稼働し相互に通信を行いながら同期をとって連携することで、計算機C1、計算機C2、計算機C3がクラスタシステムCS1を構成する。符号30は、クラスタシステムCS1を模式的に図示している。一方、計算機C4、計算機C5でそれぞれプロビジョニング計算機割当て部31と、プロビジョニング計算機切離し部32と、プロビジョニングポリシ管理部33とが稼働し相互に通信を行いながら同期をとって連携することで、計算機C4、計算機C5がクラスタシステムCS2を構成する。符号40は、クラスタシステムCS2を模式的に図示している。これらの各クラスタシステムは、相互に無関係であり、相互にサービスを関係付けたりすることは無い。
In the operating computers C1 to C5, a provisioning
本計算機システムには、ストレージエリアネットワークSAN( Storage Area Network )45を介して複数のストレージ装置(ディスク装置)50〜57、70が接続されている。 A plurality of storage devices (disk devices) 50 to 57 and 70 are connected to the computer system via a storage area network SAN (Storage Area Network) 45.
本計算機システムでは、各計算機を起動するためのブートイメージを、ストレージ装置(ディスク装置)50〜57に予め記憶させ登録している。ここでブートイメージとは、計算機を起動するためのオペレーティングシステム及びこのオペレーティングシステムで実行可能なアプリケーションプログラムを含んでいる。 In this computer system, a boot image for starting each computer is stored and registered in advance in storage devices (disk devices) 50-57. Here, the boot image includes an operating system for starting the computer and an application program executable by the operating system.
各ストレージ装置50〜53及び54〜57には、それぞれブートイメージOS−1−1、OS−1−2、OS−1−3、OS−1−4、OS−2−1、OS−2−2、OS−2−3、OS−2−4が登録されている。例えば計算機C3を起動させるためのブートイメージ(OS-1-3)をストレージ装置52上に登録している。計算機C3をこのブートイメージ(OS-1-3)を用いて起動させると、当該計算機C3は、OS(OS-1-3)によりその動作が制御される稼動計算機となる。図3において、どの計算機がどのブートイメージで起動したかを矢印で図示した。
The
一方、図5に示すように、計算機C3を起動させるためのブートイメージ(OS-2-4)をストレージ装置57上に登録している。計算機C3をこのブートイメージ(OS-2-4)を用いて起動させると、当該計算機C3は、OS(OS-2-4)によりその動作が制御される稼動計算機となる。図5において、どの計算機がどのブートイメージで起動したかを矢印で図示した。
On the other hand, as shown in FIG. 5, a boot image (OS-2-4) for starting up the computer C3 is registered on the
(クラスタシステムの動作)
プロビジョニング計算機割当て部31は、クラスタ制御部30,40で実行する計算機が必要になった場合、ポリシ管理部33を介してアクセス可能なプロビジョニングポリシデータベース(以下ポリシDBと略す)70に蓄積されたプロビジョニングポリシ情報に従って、プロビジョニング計算機をクラスタシステムに割当てる。
(Cluster system operation)
The provisioning
プロビジョニング計算機切離し部32は、クラスタ制御部30,40で実行する計算機に余剰が発生した場合、ポリシ管理部33を介してアクセス可能なポリシDB70に従って、クラスタシステム内の計算機を切離し、プロビジョニング計算機としてプール60に登録する。
The provisioning
ポリシ管理部33は、プロビジョニングポリシ情報(以下単にポリシ情報と略す場合がある)の設定/参照機能を提供する。当該ポリシ情報は、例えば以下のような項目(1)〜(4)のプロビジョニングポリシを指定する。
The
(1)クラスタシステム毎の計算機割当てレベル(優先度)。 (1) Computer allocation level (priority) for each cluster system.
同時に二つ以上のクラスタシステムからプロビジョニング計算機要求が来た場合、優先的に割り当てるクラスタシステムの順位(優先度)の設定をする。クラスタシステムからの要求があったときに必要なプロビジョニングノードが無い場合に、優先度の低いクラスタシステムに割当てられた計算機を強制的に要求のあったクラスタシステムに割当てる場合もある。 When provisioning computer requests are received from two or more cluster systems at the same time, the order (priority) of the cluster systems to be preferentially assigned is set. When there is no provisioning node required when a request is made from the cluster system, a computer assigned to the cluster system having a low priority may be forcibly assigned to the requested cluster system.
(2)提供計算機の返還の可/不可。 (2) Whether the provided computer can be returned or not.
クラスタシステムにおいて割当てられたプロビジョニング計算機をプロビジョニングプールに変換することが可能か否かを設定する。従って、この設定で不可の場合は、そのクラスタシステム内の割当て計算機数は増加する一方となる。 Whether or not the provisioning computer assigned in the cluster system can be converted into a provisioning pool is set. Therefore, if this setting is not possible, the number of assigned computers in the cluster system will only increase.
(3)提供計算機の強制返還の可/不可。 (3) Whether the provided computer can be forcibly returned.
プロビジョニングプールよりクラスタシステムへ提供されている計算機を強制的に返還させることができるか否かを設定する。すなわち、強制的に返還させてもシステムの運用に支障がないかなどを設定の際の条件とする。例えば、優先度の高いクラスタシステムより要求があったときにプロビジョニングプールに予備の計算機がない場合には、優先度の低いクラスタシステムへ強制返還の要求が行くように設定される。 Sets whether the computer provided to the cluster system from the provisioning pool can be forcibly returned. In other words, whether or not the system is forcibly returned does not interfere with system operation. For example, when there is a spare computer in the provisioning pool when there is a request from a cluster system with a high priority, a forced return request is made to the cluster system with a low priority.
(4)提供計算機数の指標(必須計算機数,最大計算機数,初期計算機数)。 (4) Index of the number of provided computers (required number of computers, maximum number of computers, number of initial computers).
クラスタシステムを構成するために必要な計算機数を必須計算機数とする。クラスタシステムに割当て可能な最大の計算機数を最大計算機数とする。また、クラスタシステムの起動時に最適な割当て計算機数を初期計算機数とする。このように、クラスタシステムへ提供する計算機数を決定する際の指標を設定することができる。 The number of computers necessary for configuring the cluster system is set as the required number of computers. The maximum number of computers that can be allocated to the cluster system is defined as the maximum number of computers. Also, the optimal number of computers assigned at the time of starting the cluster system is set as the initial number of computers. In this way, it is possible to set an index for determining the number of computers to be provided to the cluster system.
ポリシ情報は、通常では、ユーザが計算機システムの構築/保守時に、ポリシDB70に設定される。
The policy information is normally set in the
図8には、図3に示したクラスタシステムにおける各計算機に登録するためのプロビジョニングDB70に登録したプロビジョニングポリシ情報の一例を示す。
FIG. 8 shows an example of provisioning policy information registered in the
(プロビジョニング計算機割当て処理)
以下図6のフローチャートを参照して、本実施形態のプロビジョニング計算機割当て処理の手順を説明する。
(Provisioning computer allocation process)
The procedure of the provisioning computer assignment process of this embodiment will be described below with reference to the flowchart of FIG.
まず、図3に示すように、初期状態での計算機システムは、計算機C1〜C3が稼動中であり、クラスタシステム(CS1)30が動作中である。また、計算機C4,C5が稼動中であり、クラスタシステム(CS2)40が動作中である。さらに、計算機C6は、停止しており、プロビジョニング計算機としてプール60に登録されている。
First, as shown in FIG. 3, in the computer system in the initial state, the computers C1 to C3 are operating, and the cluster system (CS1) 30 is operating. The computers C4 and C5 are in operation, and the cluster system (CS2) 40 is in operation. Furthermore, the computer C6 is stopped and registered in the
ここで、クラスタシステム(CS2)40の負荷が増大し、2台の計算機C4,C5では処理できない状況になると、クラスタシステム(CS2)40はプロビジョニング計算機割当て部41に計算機追加を要請する(ステップS21のYES)。
Here, when the load on the cluster system (CS2) 40 increases and the two computers C4 and C5 cannot process, the cluster system (CS2) 40 requests the provisioning
プロビジョニング計算機割当て部41は、プロビジョニング計算機プール60を検索し、
登録されている計算機C6を取り出し、要求されたクラスタシステム(CS2)40に追加する(ステップS23のYES,S24)。ここで、プロビジョニング計算機割当て部41は、図4に示すように、クラスタシステム(CS2)40に所属するブートイメージの中で、使用されていないブートイメージ(OS-2-3)をストレージ装置56から取り出し、計算機C6に接続して起動させる。
The provisioning
The registered computer C6 is taken out and added to the requested cluster system (CS2) 40 (YES in step S23, S24). Here, as shown in FIG. 4, the provisioning
但し、クラスタシステム(CS2)40から、ブートイメージの満たすべき要件が、詳細に指定された場合は、その要件に合うブートイメージを検索することになる。 However, if the requirements to be satisfied by the boot image are specified in detail from the cluster system (CS2) 40, a boot image that meets the requirements is retrieved.
ところで、2つのクラスタシステム30,40から同時に、計算機追加の要求がなされた場合には、プロビジョニング計算機割当て部31,41は、ポリシ管理部33,43を介してポリシDB70をアクセスし、ポリシ情報に従って計算機割当てレベルの大きいクラスタ制御部を選択する(ステップS22)。そして、例えばクラスタシステム(CS2)40の方が割当てレベルが大きい場合には、プロビジョニング計算機割当て部41は、プロビジョニング計算機プール60を検索し、登録されている計算機C6を優先的に割当てる(ステップS23のYES,S24)。
By the way, when a computer addition request is made simultaneously from the two
さらに、クラスタシステム(CS2)40の負荷がさらに増大し、3台の計算機C4〜C6でも処理ができなくなると、クラスタ制御部40は、プロビジョニング計算機割当て部41に計算機追加を要請する。
Further, when the load on the cluster system (CS2) 40 further increases and the processing cannot be performed by the three computers C4 to C6, the
プロビジョニング計算機割当て部41は、プロビジョニング計算機プール60には計算機が登録されていないため、前記のポリシ情報に従って強制返還可能なクラスタ制御部が存在するか否かを判断する(ステップS23のNO,S25)。存在しない場合には、一定時間のスリープ状態を経て、計算機がプール60に登録されるまで待機状態となる(ステップS25のNO,S26)。
Since the computer is not registered in the
一方、例えばクラスタシステム(CS1)30が強制返還可能な場合には、プロビジョニング計算機割当て部41は、当該クラスタシステム(CS1)30上の計算機に強制返還を要求する(ステップS25のYES)。強制返還を要求されたクラスタシステム(CS1)30の計算機上のプロビジョニング計算機切離し部32は、切り離し可能な計算機(例えばC3)を決定し、プロビジョニング計算機としてプロビジョニング計算機プール60に登録する(ステップS27)。
On the other hand, for example, when the cluster system (CS1) 30 can be forcibly returned, the provisioning
クラスタシステム(CS1)30から切離された計算機C3がプロビジョニング計算機プール60へ登録されると、クラスタシステム(CS2)40のプロビジョニング計算機割当て部41は、プロビジョニング計算機プール60を検索し、登録されている計算機C3を取り出して割当てる(ステップS23のYES,S24)。
When the computer C3 disconnected from the cluster system (CS1) 30 is registered in the
プロビジョニング計算機割当て部41は、図5に示すように、クラスタシステム(CS2)40に所属するブートイメージの中で、使用されていないブートイメージ(OS-2-4)をストレージ装置57から取り出し、計算機C3に接続して起動させる。
As shown in FIG. 5, the provisioning
(プロビジョニング計算機切離し処理)
次に、図7のフローチャートを参照して、本実施形態のプロビジョニング計算機切離し処理の手順を説明する。
(Provisioning computer disconnection process)
Next, the procedure of the provisioning computer disconnection process according to this embodiment will be described with reference to the flowchart of FIG.
ここでは、クラスタシステム(CS1)30のプロビジョニング計算機切離し部32は、計算機切り離し要求を受けると、ポリシ情報に従って、クラスタシステム(CS1)30上の切離し可能な計算機(ここではC3)を決定する(ステップS31のYES,S33)。
Here, upon receiving the computer disconnection request, the provisioning
さらに、プロビジョニング計算機切離し部32は、決定した計算機C3で稼動中のサービスにスイッチオーバ要求を出す(ステップS34)。ここで、クラスタ制御部30において、ポリシ情報に従って、切離し条件として全サービスの停止待ちの場合には、プロビジョニング計算機切離し部32は、全サービスの停止を待って、計算機C3を切離して、プロビジョニング計算機としてプロビジョニング計算機プール60に登録する(ステップS35のYES,S37,S38)。
Further, the provisioning
一方、切離し条件として全サービスの停止待ちではない場合には、プロビジョニング計算機切離し部32は、切離し準備として一定時間だけ待って、計算機C3を切離して、プロビジョニング計算機としてプロビジョニング計算機プール60に登録する(ステップS35のNO,S36,S38)。
On the other hand, if the disconnection condition is not waiting for the stop of all services, the provisioning
以上のように本実施形態によれば、複数のクラスタシステムからプロビジョニング計算機の追加要求があった場合に、ポリシ情報に従って、例えば強制返還が設定されているクラスタシステム(CS1)30から、相対的に計算機割当てレベルの高いクラスタシステム(CS2)40へ、計算機を切離して割当てる処理を実行できる。要するに、クラスタシステム毎にプロビジョニングポリシを設定可能なプロビジョニング計算機の割当て/切離し機能を持つことにより、クラスタシステム間で計算機割当てレベルに基づいた最適な計算機の割当て(移動)が可能となる。このようなクラスタシステムと、例えば課金システムとを連動させることで、ネットワークサービスでの高度なSLA(service level agreement)等を実現するシステムを構築することが可能になる。 As described above, according to the present embodiment, when there is a provisioning computer addition request from a plurality of cluster systems, for example, from the cluster system (CS1) 30 in which forced return is set, according to the policy information, It is possible to execute a process of allocating a computer to a cluster system (CS2) 40 having a high computer allocation level. In short, by having a provisioning computer assignment / separation function capable of setting a provisioning policy for each cluster system, it is possible to assign (move) an optimum computer based on the computer assignment level between the cluster systems. By linking such a cluster system with, for example, a billing system, it is possible to construct a system that realizes an advanced service level agreement (SLA) in a network service.
この実施形態の種々の実施の態様をまとめると次のようになる。 Various aspects of this embodiment can be summarized as follows.
(1)2台以上の計算機が接続されて、2つ以上のクラスタシステムを実現する計算機システムにおいて、
前記各クラスタシステムが共通して使用可能な少なくとも1つのプロビジョニング計算機と、
プロビジョニング計算機の割当て処理又は切離し処理のポリシを指定するためのポリシ情報を変更可能に保存するポリシ管理手段と、
前記ポリシ情報に従って、前記少なくとも1つのプロビジョニング計算機から追加要求の計算機を割当る割当て処理または余剰な計算機を切離す切離し処理を実行する割当て/切離し手段と
を具備した計算機システム。
(1) In a computer system in which two or more computers are connected to realize two or more cluster systems,
At least one provisioning computer that can be commonly used by the respective cluster systems;
Policy management means for storing policy information for designating a policy for assigning or detaching a provisioning computer in a changeable manner;
A computer system comprising: an allocation process for allocating an additional request computer from the at least one provisioning computer in accordance with the policy information, or an allocating / detaching unit for detaching a surplus computer.
(2)前記割当て/切離し手段は、前記ポリシ情報に従って少なくとも1つのプロビジョニング計算機として登録されている計算機、または他のクラスタシステムで使用されている計算機を、必要なクラスタシステムに割当てる(1)項に記載の計算機システム。 (2) The allocation / detachment means allocates a computer registered as at least one provisioning computer according to the policy information, or a computer used in another cluster system to a necessary cluster system in the item (1). The computer system described.
(3)前記割当て/切離し手段は、前記ポリシ情報に従ってクラスタシステムで使用されている計算機を切離し、前記少なくとも1つのプロビジョニング計算機として登録する(1)項に記載の計算機システム。 (3) The computer system according to (1), wherein the allocation / detachment unit disconnects a computer used in a cluster system according to the policy information and registers it as the at least one provisioning computer.
(4)前記ポリシ管理手段は、前記ポリシ情報を変更可能に保存するデータベースを管理し、前記各計算機からのアクセスに応じて、当該データベースから前記ポリシ情報の取出し、または設定を行なう(1)項に記載の計算機システム。 (4) The policy management means manages a database that stores the policy information in a changeable manner, and extracts or sets the policy information from the database in accordance with access from the computers. The computer system described in 1.
(5)2台以上の計算機が接続された計算機システムに適用し、2つ以上のクラスタシステムのそれぞれに含まれるプログラムであって、
変更可能なポリシ情報に従って、各クラスタシステムが共通して使用可能な少なくとも1つのプロビジョニング計算機から追加要求の計算機を割当る処理を実行する手順と、
前記ポリシ情報に従って、各クラスタシステムが使用している少なくとも1つのプロビジョニング計算機を切離す処理を実行する手順と
を前記計算機システムに実行させるためのプログラム。
(5) A program that is applied to a computer system to which two or more computers are connected, and is included in each of two or more cluster systems,
A procedure of executing a process of assigning a computer of an additional request from at least one provisioning computer that can be commonly used by each cluster system in accordance with the changeable policy information;
A program for causing the computer system to execute a procedure for executing a process of disconnecting at least one provisioning computer used by each cluster system according to the policy information.
なお、本発明は上記実施形態そのままに限定されるものではなく、実施段階ではその要旨を逸脱しない範囲で構成要素を変形して具体化できる。また、上記実施形態に開示されている複数の構成要素の適宜な組み合わせにより、種々の発明を形成できる。例えば、実施形態に示される全構成要素から幾つかの構成要素を削除してもよい。さらに、異なる実施形態にわたる構成要素を適宜組み合わせてもよい。 Note that the present invention is not limited to the above-described embodiment as it is, and can be embodied by modifying the components without departing from the scope of the invention in the implementation stage. In addition, various inventions can be formed by appropriately combining a plurality of components disclosed in the embodiment. For example, some components may be deleted from all the components shown in the embodiment. Furthermore, constituent elements over different embodiments may be appropriately combined.
10…クラスタ制御部、11…サービス最適配置部、
12…サービス再配置部、13…ポリシ管理部、14…負荷管理部、
15…サービス制御部、30…クラスタシステムCS1、
31…プロビジョニング計算機割当て部、
32…プロビジョニング計算機切離し部、33…プロビジョニングポリシ管理部、
40…クラスタシステムCS2、
50〜57…ストレージ装置(ブートイメージ登録ディスク)、
60…プロビジョニング計算機プール、
70…プロビジョニングポリシデータベース(ポリシDB)、C1〜C6…計算機。
10 ... cluster control unit, 11 ... service optimal arrangement unit,
12 ... Service relocation unit, 13 ... Policy management unit, 14 ... Load management unit,
15 ... Service control unit, 30 ... Cluster system CS1,
31 ... provisioning computer allocation unit,
32 ... provisioning computer disconnection unit, 33 ... provisioning policy management unit,
40 ... Cluster system CS2,
50 to 57: Storage device (boot image registration disk),
60 ... Provisioning computer pool,
70... Provisioning policy database (policy DB), C1 to C6.
Claims (9)
前記計算機が実行する複数のサービスの割当てを決定するためのサービスの優先順位とサービスに割当てる計算機の優先順位とサービス間の排他、依存関係を含む関係とサービス実行に必須の周辺機器を含むリソースの割当てと最低負荷状況の計算機にサービスを割当てるための計算機の負荷状況とのうち少なくとも一つを持つ最適配置用ポリシ情報と、サービスのスイッチオーバの可/不可とサービスの実行可能なノードが無い場合の他サービスの停止の可/不可と前記スイッチオーバ/他サービス停止の判断基準と負荷状況の変化時の対応とのうち少なくとも一つを持つサービスの再配置用ポリシ情報とを保存するポリシ管理部と、
前記最適配置用ポリシ情報に基づいて実行するサービスを最適な計算機に割当てるサービス最適配置部と、
前記最適配置後の各計算機でのサービス負荷や計算機負荷状況によりサービスの再配置が必要か否かを判定する負荷管理部と、
前記負荷管理部によるサービスの再配置が必要との判定結果に従って、前記再配置用ポリシ情報に基づき、前記負荷管理部により再配置が必要と判定されたサービスの実行に最適な計算機を決定するサービス再配置部と、
前記再配置が必要と判定されたサービスの実行を一時的に停止させ、前記サービス配置部により決定された前記再配置が必要と判定されたサービスの実行に最適な計算機で前記再配置が必要と判定されたサービスを起動してサービスをスイッチオーバーするサービス制御部とを具備することを特徴とする計算機システム。 In a computer system with two or more computers,
The priority of the service for determining the allocation of a plurality of services executed by the computer, the priority of the computer allocated to the service, the exclusion between the services, the relationship including the dependency relationship, and the resource including the peripheral device essential for the service execution Policy information for optimal placement having at least one of the allocation and the load status of the computer for allocating the service to the computer with the lowest load status, service switchover enabled / disabled, and no service executable node Policy management unit for storing service relocation policy information having at least one of whether or not other services can be stopped and whether or not the switchover / other services stop determination criteria and the response when the load status changes When,
A service optimal allocation unit that allocates a service to be executed based on the policy information for optimal allocation to an optimal computer;
A load management unit that determines whether or not the relocation of the service is necessary depending on the service load and the computer load state in each computer after the optimal placement;
A service for determining an optimal computer for execution of a service determined to be relocated by the load management unit based on the relocation policy information according to a determination result that the service needs to be relocated by the load management unit A relocation section;
The execution of the service determined to be necessary for the rearrangement is temporarily stopped, and the rearrangement is required by a computer optimal for the execution of the service determined to be necessary for the rearrangement determined by the service allocation unit. And a service control unit that activates the determined service and switches over the service.
当該サービスの再配置の必要性がある場合に、前記再配置用ポリシ情報に従って予備計算機の使用を含む再配置処理を実行することを特徴とする、請求項1に記載の計算機システム。 The service relocation unit determines the necessity of service relocation according to a change in load status of each computer,
2. The computer system according to claim 1, wherein when there is a need for relocation of the service, relocation processing including use of a spare computer is executed in accordance with the relocation policy information.
前記ポリシ管理部は、前記プロビジョニング計算機の割当て処理および切り離し処理のポリシを指定する為の割当て、切り離し処理用ポリシ情報を保管し、 The policy management unit stores policy information for allocation and detachment processing for designating a policy for allocation processing and detachment processing of the provisioning computer,
前記計算機システムは更に前記割当て、切り離し処理用ポリシ情報に従って、前記プロビジョニング計算機群から追加要求の計算機を割当る割当て処理または余剰な計算機を切り離す切り離し処理を実行する割当て/切り離し手段を含む、請求項1に記載の計算機システム。 2. The computer system further includes an allocation / separation unit that executes an allocation process for allocating an additional request computer from the provisioning computer group or a detachment process for detaching a surplus computer in accordance with the policy information for allocation and detachment processing. The computer system described in 1.
前記計算機が実行する複数のサービスの割当てを決定するためのサービスの優先順位とサービスに割当てる計算機の優先順位とサービス間の排他、依存関係を含む関係とサービス実行に必須の周辺機器を含むリソースの割当てと最低負荷状況の計算機にサービスを割当てるための計算機の負荷状況とのうち少なくとも一つを持つ最適配置用ポリシ情報と、サービスのスイッチオーバの可/不可とサービスの実行可能なノードが無い場合の他サービスの停止の可/不可と前記スイッチオーバ/他サービス停止の判断基準と負荷状況の変化時の対応とのうち少なくとも一つを持つサービスの再配置用ポリシ情報とを保存し、
前記最適配置用ポリシ情報に基づいて実行するサービスを最適な計算機に割当てる処理を実行し、
前記最適配置後の各計算機でのサービス負荷や計算機負荷状況によりサービスの再配置が必要か否かを判定し、
前記負荷管理部によるサービスの再配置が必要との判定結果に従って、前記再配置用ポリシ情報に基づき、前記負荷管理部により再配置が必要と判定されたサービスの実行に最適な計算機を決定し、
前記再配置が必要と判定されたサービスの実行を一時的に停止させ、前記サービス配置部により決定された前記再配置が必要と判定されたサービスの実行に最適な計算機で前記再配置が必要と判定されたサービスを起動してサービスをスイッチオーバーすることを特徴とするサービス実行方法。 A service execution method by a computer system in which two or more computers are connected to realize one cluster system,
The priority of the service for determining the allocation of a plurality of services executed by the computer, the priority of the computer allocated to the service, the exclusion between the services, the relationship including the dependency relationship, and the resource including the peripheral device essential for the service execution Policy information for optimal placement having at least one of the allocation and the load status of the computer for allocating the service to the computer with the lowest load status, service switchover enabled / disabled, and no service executable node A service relocation policy information having at least one of whether or not the other service can be stopped, the switchover / other service stop determination criterion, and the response when the load status changes ,
A process of allocating a service to be executed based on the optimal placement policy information to an optimal computer ;
Determine whether or not it is necessary to relocate the service according to the service load and the computer load status on each computer after the optimal placement,
In accordance with the determination result that the load management unit needs to relocate the service, based on the relocation policy information, determine a computer optimal for executing the service determined to be relocated by the load management unit,
The execution of the service determined to be necessary for the rearrangement is temporarily stopped, and the rearrangement is required by a computer optimal for the execution of the service determined to be necessary for the rearrangement determined by the service allocation unit. A service execution method characterized by starting a determined service and switching over the service.
前記計算機が実行する複数のサービスの割当てを決定するためのサービスの優先順位とサービスに割当てる計算機の優先順位とサービス間の排他、依存関係を含む関係とサービス実行に必須の周辺機器を含むリソースの割当てと最低負荷状況の計算機にサービスを割当てるための計算機の負荷状況とのうち少なくとも一つを持つ最適配置用ポリシ情報と、サービスのスイッチオーバの可/不可とサービスの実行可能なノードが無い場合の他サービスの停止の可/不可と前記スイッチオーバ/他サービス停止の判断基準と負荷状況の変化時の対応とのうち少なくとも一つを持つサービスの再配置用ポリシ情報とを保存する手順と、
前記最適配置用ポリシ情報に基づいて実行するサービスを最適な計算機に割当てる処理を実行する手順と、
前記最適配置後の各計算機でのサービス負荷や計算機負荷状況によりサービスの再配置が必要か否かを判定する手順と、
前記負荷管理部によるサービスの再配置が必要との判定結果に従って、前記再配置用ポリシ情報に基づき、前記負荷管理部により再配置が必要と判定されたサービスの実行に最適な計算機を決定する手順と、
前記再配置が必要と判定されたサービスの実行を一時的に停止させ、前記サービス配置部により決定された前記再配置が必要と判定されたサービスの実行に最適な計算機で前記再配置が必要と判定されたサービスを起動してサービスをスイッチオーバーする手順と、
を前記計算機システムに実行させるためのプログラム。 A program for realizing a cluster system by applying it to a computer system in which two or more computers are connected,
The priority of the service for determining the allocation of a plurality of services executed by the computer, the priority of the computer allocated to the service, the exclusion between the services, the relationship including the dependency relationship, and the resource including the peripheral device essential for the service execution Policy information for optimal placement having at least one of the allocation and the load status of the computer for allocating the service to the computer with the lowest load status, service switchover enabled / disabled, and no service executable node A procedure for storing policy information for relocation of a service having at least one of whether or not the other service can be stopped, whether the switchover / other service is stopped, and a response when the load status changes ,
A procedure for executing a process of assigning a service to be executed based on the policy information for optimal placement to an optimal computer ;
A procedure for determining whether or not relocation of services is necessary depending on the service load and the computer load status in each computer after the optimal placement;
A procedure for determining an optimal computer for executing a service determined to be relocated by the load management unit based on the relocation policy information in accordance with a determination result that the load management unit needs to relocate the service. When,
The execution of the service determined to be necessary for the rearrangement is temporarily stopped, and the rearrangement is required by a computer optimal for the execution of the service determined to be necessary for the rearrangement determined by the service allocation unit. Start the determined service and switch over the service;
For causing the computer system to execute .
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2004254427A JP3987517B2 (en) | 2003-09-02 | 2004-09-01 | Computer system and cluster system program |
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2003310161 | 2003-09-02 | ||
JP2004254427A JP3987517B2 (en) | 2003-09-02 | 2004-09-01 | Computer system and cluster system program |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2005100387A JP2005100387A (en) | 2005-04-14 |
JP3987517B2 true JP3987517B2 (en) | 2007-10-10 |
Family
ID=34467514
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2004254427A Expired - Lifetime JP3987517B2 (en) | 2003-09-02 | 2004-09-01 | Computer system and cluster system program |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP3987517B2 (en) |
Families Citing this family (20)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP1730634A4 (en) * | 2004-01-30 | 2009-09-16 | Ibm | Componentized automatic provisioning and management of computing environments for computing utilities |
JP2007148469A (en) | 2005-11-24 | 2007-06-14 | Hitachi Ltd | Preliminary resource allocation method using business process definition |
EP2037362A4 (en) * | 2006-05-24 | 2012-04-18 | Nec Corp | Virtual machine management device, method for managing virtual machine and program |
JP4751265B2 (en) * | 2006-08-01 | 2011-08-17 | 株式会社日立製作所 | Resource management system and method |
US20100030877A1 (en) * | 2007-02-23 | 2010-02-04 | Mitsuru Yanagisawa | Virtual server system and physical server selecting method |
JP4863959B2 (en) * | 2007-10-11 | 2012-01-25 | 株式会社日立製作所 | Business service execution system, business service execution method, and business service execution program |
KR100968202B1 (en) | 2007-12-12 | 2010-07-06 | 한국전자통신연구원 | Cluster System For Reducing Consumption Power And Power Source Management Method Thereof |
JP2010218344A (en) * | 2009-03-18 | 2010-09-30 | Hitachi Ltd | Service linkage device, program, service linkage method, and service provision system |
JP5471080B2 (en) * | 2009-06-30 | 2014-04-16 | 日本電気株式会社 | Information system, control device, data processing method thereof, and program |
JP5412304B2 (en) * | 2010-01-20 | 2014-02-12 | 株式会社エヌ・ティ・ティ・データ | Resource providing system, resource providing method, and virtualization apparatus |
JP5470177B2 (en) * | 2010-07-06 | 2014-04-16 | 株式会社日立製作所 | Trace system |
US20120102200A1 (en) * | 2010-10-26 | 2012-04-26 | Qualcomm Incorporated | Application specific resource management |
JP5738133B2 (en) * | 2011-09-09 | 2015-06-17 | 三菱電機株式会社 | Reduction processing device, reduction processing system, reduction processing method and reduction processing program of reduction processing device |
JP2013205859A (en) * | 2012-03-27 | 2013-10-07 | Hitachi Solutions Ltd | Distributed computing system |
JP2014078160A (en) | 2012-10-11 | 2014-05-01 | International Business Maschines Corporation | Device and method for assisting decision of virtual resource combination |
JP6072072B2 (en) | 2012-12-12 | 2017-02-01 | 株式会社東芝 | Cloud system management apparatus, cloud system, rearrangement method, and program |
US9727355B2 (en) * | 2013-08-23 | 2017-08-08 | Vmware, Inc. | Virtual Hadoop manager |
JP2015069283A (en) * | 2013-09-27 | 2015-04-13 | 日本電気株式会社 | Information processing device, information processing method, and information processing program |
AU2018379088B2 (en) * | 2017-12-08 | 2024-06-27 | Net-Thunder, Llc | Automatically deployed information technology (IT) system and method |
CN113055427B (en) * | 2019-12-28 | 2022-12-23 | 浙江宇视科技有限公司 | Service-based server cluster access method and device |
-
2004
- 2004-09-01 JP JP2004254427A patent/JP3987517B2/en not_active Expired - Lifetime
Also Published As
Publication number | Publication date |
---|---|
JP2005100387A (en) | 2005-04-14 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP3987517B2 (en) | Computer system and cluster system program | |
US20050050200A1 (en) | Computer system and cluster system program | |
US8589920B2 (en) | Resource allocation | |
CN102479099B (en) | Virtual machine management system and use method thereof | |
EP3252608B1 (en) | Node system, server device, scaling control method, and program | |
US6931640B2 (en) | Computer system and a method for controlling a computer system | |
US9874924B1 (en) | Equipment rack power reduction using virtual machine instance migration | |
US9442763B2 (en) | Resource allocation method and resource management platform | |
US8656355B2 (en) | Application-based specialization for computing nodes within a distributed processing system | |
JP4119162B2 (en) | Multiplexed computer system, logical computer allocation method, and logical computer allocation program | |
JP4519098B2 (en) | Computer management method, computer system, and management program | |
JP5039951B2 (en) | Optimizing storage device port selection | |
US7900206B1 (en) | Information technology process workflow for data centers | |
US7167854B2 (en) | Database control method | |
US20040250248A1 (en) | System and method for server load balancing and server affinity | |
JP2010530108A (en) | Shared data center disaster recovery system and method | |
CN110221920B (en) | Deployment method, device, storage medium and system | |
KR20090059851A (en) | System and method for service level management in virtualized server environment | |
CN110086726A (en) | A method of automatically switching Kubernetes host node | |
KR20200080458A (en) | Cloud multi-cluster apparatus | |
US11726684B1 (en) | Cluster rebalance using user defined rules | |
US20070180452A1 (en) | Load distributing system and method | |
Wang et al. | Provision of storage QoS in distributed file systems for clouds | |
US7669202B1 (en) | Resource management | |
US11762681B2 (en) | Dynamic configuration of virtual objects |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20060817 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20060822 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20061023 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20070116 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20070710 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20070712 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20100720 Year of fee payment: 3 |