JP5561622B2 - 多重化システム、データ通信カード、状態異常検出方法、及びプログラム - Google Patents

多重化システム、データ通信カード、状態異常検出方法、及びプログラム Download PDF

Info

Publication number
JP5561622B2
JP5561622B2 JP2011210049A JP2011210049A JP5561622B2 JP 5561622 B2 JP5561622 B2 JP 5561622B2 JP 2011210049 A JP2011210049 A JP 2011210049A JP 2011210049 A JP2011210049 A JP 2011210049A JP 5561622 B2 JP5561622 B2 JP 5561622B2
Authority
JP
Japan
Prior art keywords
physical machine
state
data communication
communication card
power supply
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2011210049A
Other languages
English (en)
Other versions
JP2013073289A (ja
Inventor
紀圭 馬場
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Priority to JP2011210049A priority Critical patent/JP5561622B2/ja
Priority to US13/609,556 priority patent/US8990632B2/en
Publication of JP2013073289A publication Critical patent/JP2013073289A/ja
Application granted granted Critical
Publication of JP5561622B2 publication Critical patent/JP5561622B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/3003Monitoring arrangements specially adapted to the computing system or computing system component being monitored
    • G06F11/3006Monitoring arrangements specially adapted to the computing system or computing system component being monitored where the computing system is distributed, e.g. networked systems, clusters, multiprocessor systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/3055Monitoring arrangements for monitoring the status of the computing system or of the computing system component, e.g. monitoring if the computing system is on, off, available, not available
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/3058Monitoring arrangements for monitoring environmental properties or parameters of the computing system or of the computing system component, e.g. monitoring of power, currents, temperature, humidity, position, vibrations
    • G06F11/3062Monitoring arrangements for monitoring environmental properties or parameters of the computing system or of the computing system component, e.g. monitoring of power, currents, temperature, humidity, position, vibrations where the monitored property is the power consumption
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/16Error detection or correction of the data by redundancy in hardware
    • G06F11/20Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements
    • G06F11/202Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where processing functionality is redundant

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Computing Systems (AREA)
  • Physics & Mathematics (AREA)
  • Quality & Reliability (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Mathematical Physics (AREA)
  • Hardware Redundancy (AREA)
  • Power Sources (AREA)
  • Debugging And Monitoring (AREA)

Description

本発明は、多重化システムに関し、特にフォールトトレラントシステムやクラスターシステムを実現する多重化システム、データ通信カード、状態異常検出方法、及びプログラムに関する。
現在、物理マシン上で複数のOS(Operating System)を動作させることを可能とした仮想化技術が広く用いられている。仮想化技術によって、利用率の低い複数の仮想マシンを、1つの物理マシン上にまとめて、物理マシン1台あたりの利用効率を高めるとともに、物理マシンの台数を減らして消費電力を抑えることが可能となる。
仮想化技術には、物理マシン上で稼働するホストOS上に仮想マシンを動作させる層を設け、その層の上でゲストOSを動作させる方式や、ホストOSを介さず、ハードウェア(HW)上に仮想マシンを動作させるハイパーバイザ(hypervisor)を設け、そのハイパーバイザ上でゲストOSを動作させる方式等がある。
また、現在、耐障害性の高いコンピュータシステムとして、フォールトトレラントシステム(Fault Tolerant System)が広く用いられている。
例えば、専用のハードウェア(HW)を介してロックステップ方式の動作を行い、多重化(多くは二重化)された主要なハードウェア(HW)を障害発生時に遅滞なく切り替えて動作し続けるハードウェア(HW)方式のフォールトトレラントシステムが、従来から知られている。
また、仮想マシンが動作している物理マシンでハードウェア(HW)上の故障等による障害が発生した場合に、その仮想マシンが行っている処理を、他の物理マシン上で待機している仮想マシンが継続して実行するソフトウェア(SW)方式のフォールトトレラントシステムが、近年研究されている。
ハードウェア(HW)方式のフォールトトレラントシステムでは、高価な専用のハードウェア(HW)を1システム毎に多重化する必要があるため、システムコストがかさむことになる。これに対して、ソフトウェア(SW)方式のフォールトトレラントシステムでは、汎用のハードウェア(HW)上で動作する複数の仮想マシンを用いて擬似的に多重化するため、専用のハードウェア(HW)が不要となり、システム毎にハードウェア(HW)を多重化する必要もないため、安価にシステムを構築・維持でき、システムコストを抑えることができる。
ソフトウェア(SW)方式のフォールトトレラントシステムでの処理の主体の切り替え方法の例として、ハードウェア(HW)方式のフォールトトレラントシステムで行われているロックステップ方式の動作や、メモリコピー方式の動作を、ソフトウェア(SW)により行い、障害発生時には瞬時に、処理の主体となる仮想マシンを切り替えるという方法がある。
しかし、一般的なIAサーバでソフトウェア(SW)方式のフォールトトレラントシステムやクラスターシステムを構築した場合、装置の故障検出を、一般的なハードウェア(HW)のエラー検出機構や専用のエラー検出ソフトウェア(SW)に依存することになる。
一般的なハードウェア(HW)では、機能を動作させた場合のみ故障を検出することができる。しかし、待機系となり動作していない場合には、故障を検出することができない。また、検出した故障を、ソフトウェア(SW)を介在せずに他系装置に通知する仕組みを持っていない。
また、専用のエラー検出ソフトウェア(SW)では、ソフトウェア(SW)によって動作させることができる機能については定期的なヘルスチェックを行うことで、早期に故障を検出したり、検出した装置を他系装置に通知したりできる。しかし、ソフトウェア(SW)が稼働するまでは、その機能を使用することができない。また、一般的に、ソフトウェア(SW)はタイムアウトによって故障を検出するため、他系装置に通知するには一定の時間を要する。したがって、フェイルオーバ(failover)時間を短くすることが困難である。
関連する技術として、特許文献1(特許第4468426号公報)に高可用システム及び実行状態制御方法が開示されている。この関連技術では、第1の仮想計算機を管理する第1のハイパーバイザが備える収集部が、第1の仮想計算機について発生した、第1の仮想計算機に対する入力を伴うイベントに関する同期情報を収集する。また、第2の仮想計算機を管理する第2のハイパーバイザが備える制御部が、この同期情報に従って、第2の仮想計算機の入力に係る実行状態を、第1の仮想計算機の入力に係る実行状態と同一になるように制御する。これにより、独立した2台の計算機上でそれぞれ稼働する仮想計算機を組み合わせて二重化を実現する。
また、特許文献2(特開2009−080692号公報)に仮想計算機システム及び同システムにおけるサービス引き継ぎ制御方法が開示されている。この関連技術では、仮想マシンが動作しているサーバ計算機に障害が発生した場合、サーバ計算機の仮想マシンモニタは、障害発生時刻に最も近い時点でディスク装置に採取されたスナップショットに基づき、仮想マシンを仮想マシンとしてサーバ計算機上に再生成する。通信記録ユニットの状態再現部は、仮想マシンに対応付けられた通信履歴に基づき、スナップショットの採取時期から上記障害発生時刻までの期間における仮想マシンの状態を仮想マシンに再現させる。再起動部は、例えば仮想マシンの状態の再現に失敗した場合、仮想マシンをサーバ計算機上で再起動する。これにより、仮想マシンが動作している物理計算機に障害が発生した場合、別の物理計算機上で再生成または再起動される仮想マシンによりサービスを継続させる。
また、特許文献3(特開2008−033483号公報)に計算機システム、計算機および計算機動作環境の移動方法が開示されている。この関連技術では、第1計算機の動作を中断する。次に、第1ディスク上のコピーイメージに含まれるファイルのリストを作成する。次に、第1計算機の実行コンテキストを、第2計算機にコピーする。次に、第2計算機において上記動作を再開させる。次に、上記リストを参照して、コピーイメージを第1ディスクから第2ディスクにコピーする。これにより、第1ディスクを使用する第1計算機の動作環境を、第2ディスクを使用する第2計算機に移動させる際に、業務の中断時間を短縮する。
特許第4468426号公報 特開2009−080692号公報 特開2008−033483号公報
従来の多重化システムでは、汎用装置を用いて故障検出を行っているが、汎用装置の故障検出能力は低い。例えば、故障検出機能を動作させた時にしか故障を検出できないため、待機系等で装置や故障検出機能が停止している場合は検出できない。また、多重化用OSの介在なく、外部に故障を通知することができないため、多重化した各装置のOSが起動していなければならない。更に、多重化用OSの故障検出機能も、多重化用OSが動作を開始するまでは機能しない。一般的に、ソフトウェア(SW)による故障検出では、タイムアウトで故障検出するため、検出まで時間がかかる。
本発明の目的は、一般的なIAサーバでソフトウェア(SW)方式のフォールトトレラントシステムやクラスターシステムを構築するために利用されるデータ通信カードに、自系装置のメモリやチップ等の状態監視機能と、他系装置への状態通知機能及び電源制御機能を追加した多重化システムを提供することである。
本発明に係る多重化システムは、複数の物理マシンと、複数の物理マシンの各々に搭載され、通信回線を介して自系の物理マシンと他系の物理マシンとを接続し、相互にデータの送受信を行うためのデータ通信カードとを含む。データ通信カードは、自律的に、自系の物理マシン及び他系の物理マシンの状態を監視し、状態異常を検出する。
本発明に係るデータ通信カードは、複数の物理マシンの各々に搭載されたデータ通信カードであって、通信回線を介して自系の物理マシンと他系の物理マシンとを接続し、相互にデータの送受信を行う手段と、自律的に、自系の物理マシン及び他系の物理マシンの状態を監視し、状態異常を検出する手段とを具備する。
本発明に係る状態異常検出方法は、複数の物理マシンの各々に搭載されたデータ通信カードにより実施される状態異常検出方法であって、通信回線を介して自系の物理マシンと他系の物理マシンとを接続し、相互にデータの送受信を行うことと、自律的に、自系の物理マシン及び他系の物理マシンの状態を監視し、状態異常を検出することとを含む。
本発明に係るプログラムは、複数の物理マシンの各々に搭載されたデータ通信カードにより実行されるプログラムであって、通信回線を介して自系の物理マシンと他系の物理マシンとを接続し、相互にデータの送受信を行うステップと、自律的に、自系の物理マシン及び他系の物理マシンの状態を監視し、状態異常を検出するステップとをデータ通信カードに実行させるためのプログラムである。なお、本発明に係るプログラムは、記憶装置や記憶媒体に格納することが可能である。
データ通信カードが、物理マシンの状態に関わらず、定期的に物理マシン内部の状態を常に監視するため、早期のエラー検出が可能となる。また、多重化システムにおけるスタンバイ系(待機系、従系)装置等、普段は動作していない装置のエラー検出も可能となる。
本発明に係る多重化システムの基本構成を示す概念図である。 本発明に係る物理マシンの構成例を示す概念図である。 本発明に係るデータ通信カードの構成例を示す概念図である。 本発明に係るデータ通信カード内部の詳細を示すブロック図である。 本発明に係る多重化システムのシステム構成1を示す概念図である。 本発明に係る多重化システムのシステム構成2を示す概念図である。
<実施形態>
以下に、本発明の実施形態について添付図面を参照して説明する。
[基本構成]
図1に示すように、本発明に係る多重化システムは、複数の物理マシン100(100−i,i=1〜n:nは台数)を含む。
ここでは、物理マシン100(100−i,i=1〜n)の各々の例として、PC(パソコン)、アプライアンス(appliance)、シンクライアントサーバ、ワークステーション、メインフレーム、スーパーコンピュータ等の計算機を想定している。なお、物理マシン100(100−i,i=1〜n)は、端末やサーバに限らず、中継機器でも良い。中継装置の例として、ネットワークスイッチ(network switch)、ルータ(router)、プロキシ(proxy)、ゲートウェイ(gateway)、ファイアウォール(firewall)、ロードバランサ(load balancer:負荷分散装置)、帯域制御装置(packet shaper)、セキュリティ監視制御装置(SCADA:Supervisory Control And Data Acquisition)、ゲートキーパー(gatekeeper)、基地局(base station)、アクセスポイント(AP:Access Point)、或いは、複数の通信ポートを有する計算機等が考えられる。
図示しないが、上記のような計算機や中継機器等は、プログラムに基づいて駆動し所定の処理を実行するプロセッサと、当該プログラムや各種データを記憶するメモリと、ネットワークインターフェースによって実現される。
上記のプロセッサの例として、CPU(Central Processing Unit)、ネットワークプロセッサ(NP:Network Processor)、マイクロプロセッサ(microprocessor)、マイクロコントローラ、或いは、専用の機能を有する半導体集積回路(IC:Integrated Circuit)等が考えられる。
上記のメモリの例として、RAM(Random Access Memory)、ROM(Read Only Memory)、EEPROM(Electrically Erasable and Programmable Read Only Memory)やフラッシュメモリ等の半導体記憶装置等を想定している。HDD(Hard Disk Drive)やSSD(Solid State Drive)等の補助記憶装置、又は、DVD(Digital Versatile Disk)等のリムーバブルディスクや、SDメモリカード(Secure Digital memory card)等の記憶媒体(メディア)等が考えられる。また、バッファ(buffer)やレジスタ(register)でも良い。或いは、DAS(Direct Attached Storage)、FC−SAN(Fibre Channel − Storage Area Network)、NAS(Network Attached Storage)、IP−SAN(IP − Storage Area Network)等を用いたストレージ装置でも良い。
なお、上記のプロセッサ及び上記のメモリは、一体化していても良い。例えば、近年では、マイコン等の1チップ化が進んでいる。したがって、電子機器等に搭載される1チップマイコンが、上記のプロセッサ及び上記のメモリを備えている事例が考えられる。
上記のネットワークインターフェースの例として、ネットワーク通信に対応した基板(マザーボード、I/Oボード)やチップ等の半導体集積回路、NIC(Network Interface Card)等のネットワークアダプタや同様の拡張カード、アンテナ等の通信装置、通信ポート等が考えられる。
また、ネットワークの例として、インターネット、LAN(Local Area Network)、無線LAN(Wireless LAN)、WAN(Wide Area Network)、バックボーン(Backbone)、ケーブルテレビ(CATV)回線、固定電話網、携帯電話網、WiMAX(IEEE 802.16a)、3G(3rd Generation)、専用線(lease line)、IrDA(Infrared Data Association)、Bluetooth(登録商標)、シリアル通信回線、データバス等が考えられる。
但し、実際には、これらの例に限定されない。
本発明では、物理マシン100(100−i,i=1〜n)の各々には、データ通信カード10が搭載されている。搭載の方法として、挿入、内蔵、組込、接続等が考えられる。但し、実際には、これらの例に限定されない。
データ通信カード10は、物理マシン100(100−i,i=1〜n)に搭載可能な高機能な拡張カードである。データ通信カード10は、上記のネットワークインターフェースでも良い。データ通信カード10は、LSI(Large Scale Integration)を搭載している。データ通信カード10は、他のデータ通信カードと通信回線を介して接続し、互いにデータの送受信を行う。また、データ通信カード10は、障害検出機能を持ち、自身が搭載された物理マシン内部の障害や、接続相手のデータ通信カードが搭載された他の物理マシン内部の障害を検出する。他の物理マシン内部の障害については、接続相手のデータ通信カードからの通知により認識しても良い。
なお、データ通信カード10の形状は、カード型に限らない。例えば、データ通信カード10は、物理マシン100(100−i,i=1〜n)の基板と一体化していても良い。但し、実際には、これらの例に限定されない。
物理マシン100(100−i,i=1〜n)上に、データ通信カード10を使用できる環境が最低限整っていて、対応したソフトウェアが導入されている/導入可能である場合、物理マシン100(100−i,i=1〜n)にデータ通信カード10を挿すだけで、物理マシン100(100−i,i=1〜n)は、FTサーバ(Fault Tolerant Server)やクラスターサーバになる。ソフトウェア(SW)方式のフォールトトレラントシステムやクラスターシステムを実現する場合、データ通信カード10自体が、仮想マシン用の設定情報やイメージファイル等を保持し、物理マシン100(100−i,i=1〜n)に提供するようにしていても良い。このとき、データ通信カード10は、「FTカード」や「クラスターカード」と呼ぶこともできる。
[物理マシンの内部構成]
図2を参照して、物理マシン100(100−i,i=1〜n)の各々の内部構成の詳細について説明する。
物理マシン100(100−i,i=1〜n)の各々は、データ通信カード10と、ハードウェア(HW:hardware)20と、ソフトウェア(SW:software)30と、ドライバ40と、I/O(Input/Output)チップ50と、BMC(Baseboard Management Controller)60を備える。
ここでは、2台の物理マシン(物理マシン100−1、物理マシン100−2)を例に説明する。例えば、物理マシン100−1は、データ通信カード10−1と、ハードウェア(HW)20−1と、ソフトウェア(SW)30−1と、ドライバ40−1と、BMC60−1と、I/Oチップ50−1を備える。また、物理マシン100−2は、データ通信カード10−2と、ハードウェア(HW)20−2と、ソフトウェア(SW)30−2と、ドライバ40−2と、BMC60−2と、I/Oチップ50−2を備える。
データ通信カード10については、上記の通りである。
ハードウェア(HW)20は、物理マシン100(100−i,i=1〜n)内部のハードウェア(HW)である。通常、ハードウェア(HW)20は、DC電源の給電(電力供給)を受けて駆動する。ハードウェア(HW)20の例として、プロセッサ、メモリ、補助記憶装置、ネットワークインターフェース、PCI(Peripheral Components Interconnect bus)スロット、及び電源装置、又はこれらの組み合わせ等が考えられる。なお、ハードウェア(HW)20は、同一の物理マシン内部で多重化されていても良い。
ソフトウェア(SW)30は、ハードウェア(HW)20を利用し、物理マシン100(100−i,i=1〜n)上で動作するソフトウェア(SW)である。ソフトウェア(SW)30の例として、OSやアプリケーションソフトウェア、ミドルウェア(middleware)等が考えられる。なお、ソフトウェア(SW)30は、物理マシン上に構築された仮想マシン(VM:Virtual Machine)でも良い。
ドライバ40は、物理マシン100(100−i,i=1〜n)の内部に装着された装置や、外部に接続した機器を制御・操作するためのソフトウェア(SW)/デバイスドライバである。ドライバ40は、OSが上記のような機器を制御するための橋渡しを行う。なお、ドライバ40は、OSに組み込まれ、OSの機能の一部として振舞うようにしても良い。すなわち、ドライバ40は、ソフトウェア(SW)30の一部でも良い。ドライバ40は、ソフトウェア(SW)30がI/Oチップ50に接続された外部のデバイスを利用する際、OSが提供する共通化されたAPI(アプリケーション・プログラミング・インターフェース)によってデバイスの機能を利用できるようにして、抽象化されたAPIとデバイスとの間の対応を受け持つ。
I/Oチップ50は、物理マシン100(100−i,i=1〜n)に搭載された接続口(物理ポート)であり、物理マシン本体と各種周辺機器に接続して、それらの機器とデータをやり取りするための入出力インターフェースである。入出力インターフェースの主な規格として、キーボードやマウスを接続するPS/2、モデムやプリンタなどと双方向で通信を行うシリアルインターフェースのRS232C、ハードディスクドライブ(HDD)等と双方向接続するパラレルインターフェースのSCSI、主に内蔵型HDD等と双方向接続するパラレルインターフェースのIDE、本体と周辺機器全般とを双方向接続するシリアルインターフェースであるUSB、次世代の高速なSCSI規格であるIEEE1394といった規格が知られている。なお、I/Oチップ50は、スーパーI/O(Super Input/Output)チップや、I/Oコントローラ・ハブ(ICH:I/O Controller Hub)でも良い。
BMC60は、物理マシン100(100−i,i=1〜n)内部に設けられたコントローラである。BMC60は、ハードウェア(HW)20の状態を常時監視し、ハードウェア(HW)エラーの発生をOS等に通知する。具体的には、BMC60は、電源ユニットからの供給電圧や冷却ファンの回転数、プロセッサを含む各種パーツの温度、SCSIターミネータの電源電圧等を常時監視している。例え本体の電源がOFFでも、コンセントからの電源コードが電源ユニットに接続されている限り、BMC60には電力が供給されるため、BMC60は、本体の電源がOFF状態でも、ハードウェア(HW)20の状態監視を継続する。
[データ通信カードの詳細]
図3を参照して、データ通信カード10の詳細について説明する。
ここでは、データ通信カード10に搭載されたLSIの例として、FPGA(Field Programmable Gate Array)と、CPLD(Complex Programmable Logic Device)を使用して説明する。なお、FPGAやCPLDは一例に過ぎない。実際には、他のLSIでも良い。
データ通信カード10は、FPGA11と、CPLD12を備える。
例えば、データ通信カード10−1は、FPGA11−1と、CPLD12−1を備える。また、データ通信カード10−2は、FPGA11−2と、CPLD12−2を備える。
FPGA11は、第1のLSIである。FPGA11は、ハードウェア(HW)20、ソフトウェア(SW)30、及びI/Oチップ50の状態監視を行う。FPGA11には、メイン電源(データ通信カード10が受電したDC電源)が給電されている。
CPLD12は、第2のLSIである。CPLD12は、BMC60及び電源装置の状態監視を行う。CPLD12には、スタンバイ電源(データ通信カード10が受電したAC電源から作成されるDC電源)が給電されている。なお、スタンバイ電源とは、電源管理を行うため、常時一定出力を供給するための出力である。スタンバイ電源を出力する回路は、メイン電源をOFFにしても動作している。
なお、FPGA11とCPLD12は、相互に通信可能である。
[FPGA及びCPLDの詳細]
図4を参照して、FPGA11及びCPLD12の詳細について説明する。
FPGA11は、プロセッサ111と、SW状態取得部112と、PCI制御部113と、通信制御部114を備える。
プロセッサ111は、データ通信カード10内部の各部の制御やデータの計算・加工(演算処理)を行う。例えば、プロセッサ111は、データ通信カード10内部のRAM等に記憶されたプログラムに基づいて駆動し、所定の処理を実行する。プロセッサ111は、物理マシン100(100−i,i=1〜n)内部のハードウェア(HW)20に含まれるCPU等のプロセッサではなく、データ通信カード10内部のFPGA11上に設けられている。また、プロセッサ111は、SW状態取得部112、PCI制御部113、及び通信制御部114の動作を変更することが可能である。
SW状態取得部112は、ソフトウェア(SW)30の状態を取得する。SW状態取得部112は、ドライバ40から直接通知を受け取ることで、ソフトウェア(SW)30の状態を取得しても良いし、PCI制御部113を介して、ドライバ40がメモリ上に設定したソフトウェア(SW)30の状態を取得しても良い。
PCI制御部113は、PCI Expressバスを介して、物理マシン100(100−i,i=1〜n)内部のハードウェア(HW)20及びI/Oチップ50と接続し、ハードウェア(HW)20及びI/Oチップ50の状態を監視する。
通信制御部114は、FPGA11とCPLD12とを接続している。したがって、通信制御部114は、FPGA11によるエラー検出結果を、CPLD12側に通知することが可能である。また、通信制御部114は、他のデータ通信カードに搭載されたFPGAと、少なくとも1本のケーブルを介してリモート(remote:遠隔)接続する。ここでは、2本のケーブルを介して接続することとする。ケーブルの本数が複数の場合、物理的/論理的に1本に束ねることも可能である。複数のケーブルを1本に束ねることで、束ねた本数に応じて通信速度を倍増することができる。また、複数のケーブルを1本に束ねることで、いずれかのケーブルが故障した場合でも、残りのケーブルを使用して通信を継続することが可能である。通信制御部114は、この2本のケーブルを介して、FPGA11によるエラー検出結果を、他のデータ通信カードに通知する。
CPLD12は、電源監視部121と、電源制御部122と、SMBus(System Management Bus)制御部123と、通信制御部124を備える。
電源監視部121は、自機(Local:自系)の物理マシン及びリモート接続先(Remote:他系)の物理マシンの電源状態を監視する。このとき、電源監視部121は、自機の物理マシンの電源状態を直接監視しても良いし、SMBus制御部123を介して、BMC60による監視結果を取得しても良い。なお、電源監視部121は、メイン電源の有無/変化により、自機の物理マシンの電源状態を監視しても良い。また、電源監視部121は、通信制御部124を介して、リモート接続先の物理マシンの電源状態を直接監視しても良いし、リモート接続先の物理マシンのSMBus制御部を介して、リモート接続先の物理マシンのBMCによる監視結果を取得しても良い。
電源制御部122は、自機の物理マシン及びリモート接続先の物理マシンの電源状態を制御する。このとき、電源制御部122は、自機の物理マシンの電源状態を直接制御しても良いし、SMBus制御部123及びBMC60を介して制御しても良い。また、電源制御部122は、通信制御部124を介して、リモート接続先の物理マシンの電源状態を直接制御しても良いし、リモート接続先の物理マシンのSMBus制御部及びBMCを介して制御しても良い。
SMBus制御部123は、SMBusを介して、物理マシン100(100−i,i=1〜n)内部のBMC60と接続し、BMC60から監視結果を取得する。また、SMBus制御部123は、BMC60に対して制御指示を行うことも可能である。
通信制御部124は、FPGA11とCPLD12とを接続している。したがって、通信制御部124は、CPLD12によるエラー検出結果を、FPGA11側に通知することが可能である。なお、FPGA11の通信制御部114とCPLD12の通信制御部124とは、同一の装置/回路でも良い。また、通信制御部124は、他のデータ通信カードに搭載されたCPLDと、少なくとも1本のケーブルを介してリモート接続する。ここでは、1本のケーブルを介して接続することとする。ケーブルの本数が複数の場合、物理的/論理的に1本に束ねることが可能である。通信制御部124は、この1本のケーブルを介して、CPLD12によるエラー検出結果を、他のデータ通信カードに通知する。また、通信制御部124は、この1本のケーブルを介して、リモート接続先の物理マシンから電源の給電を受ける(受電する)ようにしても良い。例えば、通信制御部124は、この1本のケーブルを構成する回線の一部を、リモート接続先の物理マシンからの電源の給電用に利用する。この場合、CPLD12は、自機の物理マシンから電源の給電を受けることができなくなっても、リモート接続先の物理マシンから電源の給電を受けることで、動作を継続することができる。
[ハードウェア(HW)状態監視]
以下に、ハードウェア(HW)状態監視の動作の詳細について説明する。
ここでは、ハードウェア(HW)状態監視の一例として、メモリ状態監視の動作について説明する。なお、メモリ状態監視が行われるのは、メイン電源がON状態(メイン電源とスタンバイ電源の両方がONの状態)の時のみである。
PCI制御部113は、PCI Expressバスを介して、メモリの読み出し要求(リードリクエスト)を発行し、CPU等を介してメモリのデータの読み出しを行い、CPU等からコンプリーション(completion:完了)の応答が正常に返ってくるかをチェックすることで、メモリが正常に動作しているか監視する。
例えば、PCI制御部113は、一定間隔で定期的に、全メモリアドレスに対して順番に読み出し要求(リードリクエスト)を発行する。
なお、PCI制御部113の動作は、プロセッサ111により変更することが可能である。
これにより、PCI制御部113は、メモリ故障を検出することが可能となる。
従来は、実際にメモリの読み出しが必要となり、CPU等からメモリの読み出し要求(リードリクエスト)が発行されるまで、エラー検出が不可能であった。
本発明では、データ通信カード10が、メモリの読み出しの有無に関わらず、定期的にメモリの読み出し要求(リードリクエスト)を発行し、メモリの状態を常に監視するため、早期のエラー検出が可能となる。
また、多重化システムにおけるスタンバイ系(待機系、従系)装置等、普段は動作していない装置のエラー検出も可能となる。
[ソフトウェア(SW)状態監視]
以下に、ソフトウェア(SW)状態監視の動作の詳細について説明する。
SW状態取得部112は、ソフトウェア(SW)30の状態を取得することで、ソフトウェア(SW)30が正常に動作しているか監視する。
SW状態取得部112は、ドライバ40から直接通知を受け取ることで、ソフトウェア(SW)30の状態を取得しても良いし、PCI制御部113を介して、ドライバ40がメモリ上に設定したソフトウェア(SW)30の状態を取得しても良い。
これにより、SW状態取得部112は、ソフトウェア(SW)30の異常を検出することが可能となる。
通常、故障監視をしているソフトウェア(SW)自体を用いて、当該ソフトウェア(SW)の異常を検出することは困難である。
本発明では、データ通信カード10が、ソフトウェア(SW)30の状態を監視するため、故障監視をしているソフトウェア(SW)自体のエラー検出が可能となる。
[I/Oチップ状態監視機能]
以下に、I/Oチップ状態監視機能の動作の詳細について説明する。
I/Oチップ状態監視が行われるのは、メイン電源がON状態(メイン電源とスタンバイ電源の両方がONの状態)の時のみである。
PCI制御部113は、PCI Expressバスを介して、I/Oチップ50の設定情報(コンフィグ)の読み出し要求(リードリクエスト)を発行し、直接に/CPU等を介してI/Oチップ50の設定情報の読み出しを行い、I/Oチップ50/CPU等からコンプリーション(completion:完了)の応答が正常に返ってくるかをチェックすることで、I/Oチップ50が正常に動作しているか監視する。
例えば、PCI制御部113は、一定間隔で定期的に、全I/Oチップ50に対して順番に読み出し要求(リードリクエスト)を発行する。
なお、PCI制御部113の動作は、プロセッサ111により変更することが可能である。
これにより、PCI制御部113は、I/Oチップ50の故障を検出することが可能となる。
従来は、実際にI/Oチップ50の読み出しが必要となり、CPU等からI/Oチップ50の読み出し要求(リードリクエスト)が発行されるまで、エラー検出が不可能であった。
本発明では、データ通信カード10が、I/Oチップ50の読み出しの有無に関わらず、定期的にI/Oチップ50の読み出し要求(リードリクエスト)を発行し、I/Oチップ50の状態を常に監視するため、早期のエラー検出が可能となる。
また、多重化システムにおけるスタンバイ系(待機系、従系)装置等、普段は動作していない装置のエラー検出も可能となる。
[BMC状態監視]
以下に、BMC状態監視の動作の詳細について説明する。
なお、BMC状態監視は、メイン電源がON状態(メイン電源とスタンバイ電源の両方がONの状態)/メイン電源がOFF状態(メイン電源がOFFの状態で、スタンバイ電源のみONの状態)のいずれの状態であっても行われる。
SMBus制御部123は、SMBusを介して、BMC60にSMBus読み出し要求(リードリクエスト)を発行し、BMC60が持っているレジスタの値の読み出しを行い、BMC60からコンプリーション(completion:完了)の応答が正常に返ってくるかをチェックすることで、BMC60が正常に動作しているか監視する。
例えば、SMBus制御部123は、一定間隔で定期的に、BMC60にSMBus読み出し要求(リードリクエスト)を発行する。
BMC60は、SMBus制御部123に対して、SMBus書き込み要求(ライトリクエスト)を発行し、データ通信カード10内にあるレジスタに対してデータの書き込みを行うことも可能である。SMBus制御部123は、BMC60から一定間隔でSMBus書き込み要求(ライトリクエスト)が発行されるかどうかをチェックすることで、BMC60が正常に動作しているか監視しても良い。
なお、メイン電源がON状態であれば、プロセッサ111は、SMBus制御部123の動作を変更することが可能である。
これにより、SMBus制御部123は、BMC60の故障を検出することが可能となる。
本発明では、データ通信カード10が、定期的にBMC60のSMBus読み出し要求(リードリクエスト)を発行し、BMC60の状態を常に監視するため、早期のエラー検出が可能となる。
[自機の電源状態監視]
以下に、自機の電源状態監視の動作の詳細について説明する。
なお、自機の電源状態監視は、メイン電源がON状態(メイン電源とスタンバイ電源の両方がONの状態)/メイン電源がOFF状態(メイン電源がOFFの状態で、スタンバイ電源のみONの状態)のいずれの状態であっても行われる。
電源監視部121は、自機の物理マシンの電源状態を監視する。なお、電源監視部121は、スタンバイ電源の給電により駆動している。
(1)メイン電源がON状態時の動作
電源監視部121は、自機の物理マシンのメイン電源がON状態であることを検出する。また、電源監視部121は、通信制御部124を介して、リモート接続先の物理マシンのメイン電源がON状態であることを検出する。
電源制御部122は、リモート接続先の物理マシンのメイン電源がOFF状態であることを検出した場合、通信制御部124を介して、リモート接続先の物理マシンのメイン電源をON状態にする。
なお、自機の物理マシンのメイン電源がON状態であることを検出した場合、電源制御部122は、通信制御部124を介して、リモート接続先の物理マシンのメイン電源をON状態にすることが可能である。リモート接続先の物理マシンのメイン電源をON状態にするか否かについては、設定により変更可能である。自機の物理マシンとリモート接続先の物理マシンとを同時に起動する場合に有用である。
例えば、ソフトウェア(SW)方式のフォールトトレラントシステムを運用する場合、必ず2台の物理マシン(アクティブ系、スタンバイ系)のDC電源がON状態になっている必要がある。そのため、1台の装置の電源スイッチを押した際、連動してもう片方の装置もDC電源をON状態にすることに利点(メリット)がある。逆に、1台の装置を停止(Shutdown)してDC電源をOFF状態にする際、連動してもう片方の装置もDC電源をOFF状態にすることに利点がある。2台の物理マシンを連動させるかどうかは固定的ではなく、選択可能である。
また、電源制御部122は、自機の物理マシンのメイン電源がON状態であることを検出した場合、リモート接続先の物理マシンのメイン電源をOFF状態にすることも可能である。リモート接続先の物理マシンのメイン電源をOFF状態にするか否かについては、設定により変更可能である。自機の物理マシンとリモート接続先の物理マシンとの間で、アクティブ系(実行系、主系)とスタンバイ系(待機系、従系)を切り替える場合に有用である。
(2)メイン電源がOFF状態時の動作
電源監視部121は、自機の物理マシンのメイン電源がOFF状態であることを検出する。また、電源監視部121は、通信制御部124を介して、リモート接続先の物理マシンのメイン電源がOFF状態であることを検出する。
電源制御部122は、リモート接続先の物理マシンのメイン電源がON状態であることを検出した場合、通信制御部124を介して、リモート接続先の物理マシンのメイン電源をOFF状態にする。
なお、自機の物理マシンのメイン電源がOFF状態であることを検出した場合、電源制御部122は、通信制御部124を介して、リモート接続先の物理マシンのメイン電源をOFF状態にすることが可能である。リモート接続先の物理マシンのメイン電源をOFF状態にするか否かについては、設定により変更可能である。自機の物理マシンとリモート接続先の物理マシンとを同時に停止する場合に有用である。
また、電源制御部122は、自機の物理マシンのメイン電源がOFF状態であることを検出した場合、リモート接続先の物理マシンのメイン電源をON状態にすることも可能である。リモート接続先の物理マシンのメイン電源をON状態にするか否かについては、設定により変更可能である。自機の物理マシンとリモート接続先の物理マシンとの間で、アクティブ系(実行系、主系)とスタンバイ系(待機系、従系)を切り替える場合に有用である。
これにより、電源監視部121は、電源故障を検出することが可能となる。
通常、ソフトウェア(SW)制御により物理マシンの電源故障を検出することは困難である。
自機の物理マシンのソフトウェア(SW)により自機の物理マシンの電源故障を検出することが困難な理由は、自機の物理マシンの電源が故障すると、自機の物理マシンのソフトウェア(SW)が停止する可能性が高いためである。
本発明では、データ通信カード10が、自機の物理マシン及びリモート接続先の物理マシンの電源状態を監視するため、各物理マシンの電源故障の検出、及びいずれの物理マシンの電源故障であるかの判別・特定が可能となる。
[リモート接続先の電源状態監視]
以下に、リモート接続先の電源状態監視の動作の詳細について説明する。
なお、リモート接続先の電源状態監視は、メイン電源がON状態(メイン電源とスタンバイ電源の両方がONの状態)/メイン電源がOFF状態(メイン電源がOFFの状態で、スタンバイ電源のみONの状態)のいずれの状態であっても行われる。
電源監視部121は、リモート接続先の物理マシンの電源状態を監視する。なお、電源監視部121は、スタンバイ電源の給電により駆動している。
(1)メイン電源がON状態時の動作
電源監視部121は、通信制御部124を介して、リモート接続先の物理マシンのメイン電源がON状態であることを検出する。また、電源監視部121は、自機の物理マシンのメイン電源がON状態であることを検出する。
電源制御部122は、自機の物理マシンのメイン電源がOFF状態であることを検出した場合、自機の物理マシンのメイン電源をON状態にする。
なお、リモート接続先の物理マシンのメイン電源がON状態であることを検出した場合、電源制御部122は、通信制御部124を介して、自機の物理マシンのメイン電源をON状態にすることが可能である。自機の物理マシンのメイン電源をON状態にするか否かについては、設定により変更可能である。自機の物理マシンとリモート接続先の物理マシンとを同時に起動する場合に有用である。
また、電源制御部122は、リモート接続先の物理マシンのメイン電源がON状態であることを検出した場合、自機の物理マシンのメイン電源をOFF状態にすることも可能である。自機の物理マシンのメイン電源をOFF状態にするか否かについては、設定により変更可能である。自機の物理マシンとリモート接続先の物理マシンとの間で、アクティブ系(実行系、主系)とスタンバイ系(待機系、従系)を切り替える場合に有用である。
(2)メイン電源がOFF状態時の動作
電源監視部121は、通信制御部124を介して、リモート接続先の物理マシンのメイン電源がOFF状態であることを検出する。また、電源監視部121は、自機の物理マシンのメイン電源がOFF状態であることを検出する。
電源制御部122は、自機の物理マシンのメイン電源がON状態であることを検出した場合、自機の物理マシンのメイン電源をOFF状態にする。
なお、リモート接続先の物理マシンのメイン電源がOFF状態であることを検出した場合、電源制御部122は、通信制御部124を介して、自機の物理マシンのメイン電源をOFF状態にすることが可能である。自機の物理マシンのメイン電源をOFF状態にするか否かについては、設定により変更可能である。自機の物理マシンとリモート接続先の物理マシンとを同時に停止する場合に有用である。
また、電源制御部122は、リモート接続先の物理マシンのメイン電源がOFF状態であることを検出した場合、自機の物理マシンのメイン電源をON状態にすることも可能である。自機の物理マシンのメイン電源をON状態にするか否かについては、設定により変更可能である。自機の物理マシンとリモート接続先の物理マシンとの間で、アクティブ系(実行系、主系)とスタンバイ系(待機系、従系)を切り替える場合に有用である。
これにより、電源監視部121は、電源故障を検出することが可能となる。
通常、ソフトウェア(SW)制御により物理マシンの電源故障を検出することは困難である。
自機の物理マシンのソフトウェア(SW)により自機の物理マシンの電源故障を検出することが困難な理由は、自機の物理マシンの電源が故障すると、自機の物理マシンのソフトウェア(SW)が停止する可能性が高いためである。
自機の物理マシンのソフトウェア(SW)によりリモート接続先の物理マシンの電源故障を検出することが困難な理由は、リモート接続先の物理マシンの電源が壊れたのか、リモート接続先の物理マシンのソフトウェア(SW)の通信が止まっただけかを判断するのが困難なためである。
本発明では、データ通信カード10が、自機の物理マシン及びリモート接続先の物理マシンの電源状態を監視するため、早期のエラー検出が可能となる。
[自律制御によるメイン電源のOFF]
以下に、自律制御によりメイン電源をOFF状態にする動作の詳細について説明する。
データ通信カード10は、上記の各状態監視の結果、いずれかの故障を検出した場合、ソフトウェア(SW)30の介在なく、自律的に、故障箇所に係る装置のメイン電源をOFF状態にする。このとき、データ通信カード10は、自機の物理マシン又はリモート接続先の物理マシン自体のメイン電源をOFF状態にしても良い。
例えば、電源制御部122は、自機の物理マシン自体のメイン電源をOFF状態にすべきであれば、自機の物理マシン自体のメイン電源をOFF状態にする。
また、電源制御部122は、リモート接続先の物理マシン自体のメイン電源をOFF状態にすべきであれば、通信制御部124を介して、リモート接続先の物理マシン自体のメイン電源をOFF状態にする。
本発明では、データ通信カード10が、自律的にメイン電源をOFF状態にする制御を行うため、エラー検出後、ソフトウェア(SW)の介在なく、物理マシン自体のメイン電源をOFF状態にすることが可能となる。
[自律制御によるメイン電源のON]
以下に、自律制御によりメイン電源をON状態にする動作の詳細について説明する。
データ通信カード10は、リモート接続先の物理マシンにおける故障を検出した場合、自機の物理マシンのメイン電源がOFF状態であれば、自機の物理マシンのメイン電源をON状態にする。
データ通信カード10は、通信制御部124を介して、リモート接続先の物理マシンにおける故障を検出する。
電源制御部122は、リモート接続先の物理マシンにおける故障が発生した場合、自機の物理マシンのメイン電源をON状態にする。
本発明では、データ通信カード10が、自律的にリモート接続先の物理マシンにおける故障を検出するため、リモート接続先の物理マシンのエラー検出後、ソフトウェア(SW)の介在なく、自機の物理マシンのメイン電源をON状態にすることが可能となる。
これにより、アクティブ・スタンバイ方式の二重化システムにおいて、スタンバイ系(待機系、従系)装置のメイン電源をON状態にする必要がある時まで、メイン電源をOFF状態のまま待機させておくことが可能となる。したがって、スタンバイ系(待機系、従系)装置のメイン電源をON状態で待機させておく必要がなくなり、システム全体の消費電力を大幅に削減することが可能となる。
[システム構成1(データ通信カード独立型)]
図5を参照して、データ通信カード10が、物理マシン100(100−i,i=1〜n)の基板から独立して存在している「システム構成1」について説明する。
ここでは、データ通信カード10は、物理マシン100(100−i,i=1〜n)のカードスロットに挿された拡張カードである。なお、データ通信カード10の形状は、カード型に限らない。
データ通信カード10は、ハードウェア(HW)20の1つであるプロセッサ(CPU等)を介して、I/Oチップ50と接続する。
例えば、データ通信カード10は、PCI Expressバスを介して、物理マシン100(100−i,i=1〜n)内部のハードウェア(HW)20の1つであるプロセッサ(CPU等)と接続する。このプロセッサ(CPU等)は、PCI Expressバスを介して、I/Oチップ50と接続する。
また、データ通信カード10は、SMBusを介して、BMC60と接続する。
[システム構成2(データ通信カード一体型)]
図6を参照して、データ通信カード10が、物理マシン100(100−i,i=1〜n)の基板と一体化している「システム構成2」について説明する。
ここでは、データ通信カード10は、物理マシン100(100−i,i=1〜n)の基板に搭載されたチップである。この場合、物理マシン100(100−i,i=1〜n)の基板自体が、データ通信カード10としての機能も持つことになる。すなわち、物理マシン100(100−i,i=1〜n)の基板自体が、データ通信カード10に相当する。
データ通信カード10は、ハードウェア(HW)20の1つであるプロセッサ(CPU等)とI/Oチップ50との間に存在し、このプロセッサ(CPU等)とI/Oチップ50との間の通信を監視する。
例えば、物理マシン100(100−i,i=1〜n)内部のハードウェア(HW)20の1つであるプロセッサ(CPU等)は、PCI Expressバスを介して、データ通信カード10と接続する。データ通信カード10は、PCI Expressバスを介して、I/Oチップ50と接続する。
また、データ通信カード10は、SMBusを介して、BMC60と接続する。
<本発明の特徴>
以上のように、本発明は、一般的なIAサーバでソフトウェア方式のフォールトトレラントシステムやクラスターシステムを構築するために利用されるデータ通信カードに、スタンバイ電源から動作可能な装置の状態監視機能、他系装置への状態通知機能及び電源制御機能を追加することで、早期の故障検出とフェイルオーバ(failover)及びコールドスタンバイ(cold standby)を実現する。
上記の機能を追加したデータ通信カードを一般的なIAサーバに挿入するだけで、このデータ通信カードが自律的、定期的に、IAサーバの主要コンポーネントが正常に動作しているか否かチェックを行うため、早期の故障検出が可能となる。また、このデータ通信カードは、検出した故障を他系装置に通知し、他系装置を即座にフェイルオーバ処理に遷移させることができる。
また、このデータ通信カードを使用してアクティブ・スタンバイ構成の多重化システムを構築した場合、スタンバイ側の装置は、メイン電源がOFF状態であっても他系装置の状態を監視可能であり、他系装置の故障を検出した場合、自律的にメイン電源がON状態にすることも可能である。
このように、このデータ通信カードは、早期の故障検出とフェイルオーバを実現し、第三者を介さない自律的なコールドスタンバイも実現する。
<備考>
以上、本発明の実施形態を詳述してきたが、実際には、上記の実施形態に限られるものではなく、本発明の要旨を逸脱しない範囲の変更があっても本発明に含まれる。
10… データ通信カード
11… FPGA(Field Programmable Gate Array)
111… プロセッサ
112… SW(software)状態取得部
113… PCI(Peripheral Components Interconnect bus)制御部
114… 通信制御部
12… CPLD(Complex Programmable Logic Device)
121… 電源監視部
122… 電源制御部
123… SMBus(System Management Bus)制御部
124… 通信制御部
20… ハードウェア(HW:hardware)
30… ソフトウェア(SW:software)
40… ドライバ
50… I/O(Input/Output)チップ
60… BMC(Baseboard Management Controller)
100(−i,i=1〜n)… 物理マシン

Claims (11)

  1. 複数の物理マシンと、
    前記複数の物理マシンの各々に搭載され、通信回線を介して自系の物理マシンと他系の物理マシンとを接続し、相互にデータの送受信を行うためのデータ通信カードと
    を含み、
    前記データ通信カードは、
    メイン電源の給電により駆動し、前記自系の物理マシン及び前記他系の物理マシンの内部状態を監視し、状態異常を検出する第1のLSI
    を具備し、
    前記第1のLSIは、
    前記メイン電源がONの状態で、監視及び検出対象の物理マシンのメモリに対してデータの読み出し要求を定期的に発行し、前記読み出し要求に対する応答を確認することで、前記監視及び検出対象の物理マシンの状態異常を検出する
    多重化システム。
  2. 請求項1に記載の多重化システムであって、
    前記データ通信カードは、
    搭載された物理マシンの基板上にチップとして搭載され、前記基板上にそれぞれ配置されているCPUとI/Oチップとの間に設けられており、
    前記第1のLSIは、
    前記メイン電源がONの状態で、監視及び検出対象の物理マシンの前記I/Oチップに対して設定情報の読み出し要求を定期的に発行し、前記読み出し要求に対する応答を確認することで、前記監視及び検出対象の物理マシンの状態異常を検出する
    多重化システム。
  3. 請求項1または2に記載の多重化システムであって、
    前記データ通信カードは、
    スタンバイ電源の給電により駆動し、前記メイン電源がOFFの状態の時でも、前記自系の物理マシン及び前記他系の物理マシンの電源状態を監視し、電源の異常を検出する第2のLSI
    を更に具備する
    多重化システム。
  4. 請求項3に記載の多重化システムであって、
    前記第1のLSIは、
    前記データ通信カード内部を制御するプロセッサと、
    前記自系の物理マシン上で動作するソフトウェア(SW)の状態を取得するSW状態取得部と、
    PCI Expressバスを介して、前記自系の物理マシン内部のハードウェア及びI/Oチップと接続し、前記ハードウェア及び前記I/Oチップの状態を監視するPCI制御部と、
    前記第2のLSI側とデータの送受信を行い、通信回線を介して前記他系の物理マシン側とデータの送受信を行う通信制御部と
    を更に具備し、
    前記第2のLSIは、
    前記自系の物理マシン及び前記他系の物理マシンの電源状態を監視する電源監視部と、
    前記自系の物理マシン及び前記他系の物理マシンの電源状態を制御する電源制御部と、
    SMBusを介して、前記自系の物理マシン内部のBMC(Baseboard Management Controller)と接続し、前記BMCから監視結果を取得するSMBus制御部と、
    前記第1のLSI側とデータの送受信を行い、通信回線を介して前記他系の物理マシン側とデータの送受信を行い、前記自系の物理マシンから電源の給電を受けられない場合、前記他系の物理マシンから電源の給電を受ける通信制御部と
    を更に具備する
    多重化システム。
  5. 請求項1に記載の多重化システムであって、
    前記データ通信カードは、
    前記自系の物理マシンの基板上にチップとして搭載され、前記自系の物理マシン内部の前記基板上にそれぞれ配置されているCPUとI/Oチップとの間に設けられている
    多重化システム。
  6. 複数の物理マシンの各々に搭載されたデータ通信カードであって、
    通信回線を介して自系の物理マシンと他系の物理マシンとを接続し、相互にデータの送受信を行う手段と、
    メイン電源の給電により駆動し、前記自系の物理マシン及び前記他系の物理マシンの内部状態を監視し、状態異常を検出する第1のLSIと
    を具備し、
    前記第1のLSIは、
    前記メイン電源がONの状態で、監視及び検出対象の物理マシンのメモリに対してデータの読み出し要求を定期的に発行し、前記読み出し要求に対する応答を確認することで、前記監視及び検出対象の物理マシンの状態異常を検出する
    データ通信カード。
  7. 請求項6に記載のデータ通信カードであって、
    前記データ通信カードは、
    搭載された物理マシンの基板上にチップとして搭載され、前記基板上にそれぞれ配置されているCPUとI/Oチップとの間に設けられており、
    前記第1のLSIは、
    前記メイン電源がONの状態で、前記監視及び検出対象の物理マシンの前記I/Oチップに対して設定情報の読み出し要求を定期的に発行し、前記読み出し要求に対する応答を確認することで、前記監視及び検出対象の物理マシンの状態異常を検出する
    データ通信カード。
  8. 請求項6または7に記載のデータ通信カードであって、
    スタンバイ電源の給電により駆動し、前記メイン電源がOFFの状態の時でも、前記自系の物理マシン及び前記他系の物理マシンの電源状態を監視し、電源の異常を検出する第2のLSIと
    を更に具備する
    データ通信カード。
  9. 請求項8に記載のデータ通信カードであって、
    前記第1のLSIは、
    前記データ通信カード内部を制御するプロセッサと、
    前記自系の物理マシン上で動作するソフトウェア(SW)の状態を取得するSW状態取得部と、
    PCI Expressバスを介して、前記自系の物理マシン内部のハードウェア及びI/Oチップと接続し、前記ハードウェア及び前記I/Oチップの状態を監視するPCI制御部と、
    前記第2のLSI側とデータの送受信を行い、通信回線を介して前記他系の物理マシン側とデータの送受信を行う通信制御部と
    を更に具備し、
    前記第2のLSIは、
    前記自系の物理マシン及び前記他系の物理マシンの電源状態を監視する電源監視部と、
    前記自系の物理マシン及び前記他系の物理マシンの電源状態を制御する電源制御部と、
    SMBusを介して、前記自系の物理マシン内部のBMC(Baseboard Management Controller)と接続し、前記BMCから監視結果を取得するSMBus制御部と、
    前記第1のLSI側とデータの送受信を行い、通信回線を介して前記他系の物理マシン側とデータの送受信を行い、前記自系の物理マシンから電源の給電を受けられない場合、前記他系の物理マシンから電源の給電を受ける通信制御部と
    を更に具備する
    データ通信カード。
  10. 複数の物理マシンの各々に搭載されたデータ通信カードにより実施される状態異常検出方法であって、
    前記データ通信カードは、
    通信手段と、
    メイン電源の給電により駆動する第1のLSIと
    を具備しており、
    前記状態異常検出方法は、
    前記通信手段が、通信回線を介して自系の物理マシンと他系の物理マシンとを接続し、相互にデータの送受信を行うステップと、
    前記第1のLSIが、前記自系の物理マシン及び前記他系の物理マシンの内部状態を監視し、状態異常を検出するステップと
    を含み、
    前記状態異常を検出するステップでは、
    前記第1のLSIが、前記メイン電源がONの状態で、監視及び検出対象の物理マシンのメモリに対してデータの読み出し要求を定期的に発行し、前記読み出し要求に対する応答を確認することで、前記監視及び検出対象の物理マシンの状態異常を検出する
    状態異常検出方法。
  11. 複数の物理マシンの各々に搭載されたデータ通信カードにより実行されるプログラムであって、
    前記データ通信カードは、
    通信手段と、
    メイン電源の給電により駆動する第1のLSIと
    を具備しており、
    前記プログラムは、
    前記通信手段が、通信回線を介して自系の物理マシンと他系の物理マシンとを接続し、相互にデータの送受信を行うステップと、
    前記第1のLSIが、前記自系の物理マシン及び前記他系の物理マシンの内部状態を監視し、状態異常を検出するステップと
    を含み
    前記状態異常を検出するステップでは、
    前記第1のLSIが、前記メイン電源がONの状態で、監視及び検出対象の物理マシンのメモリに対してデータの読み出し要求を定期的に発行し、前記読み出し要求に対する応答を確認することで、前記監視及び検出対象の物理マシンの状態異常を検出すること
    をデータ通信カードに実行させるためのプログラム。
JP2011210049A 2011-09-27 2011-09-27 多重化システム、データ通信カード、状態異常検出方法、及びプログラム Active JP5561622B2 (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2011210049A JP5561622B2 (ja) 2011-09-27 2011-09-27 多重化システム、データ通信カード、状態異常検出方法、及びプログラム
US13/609,556 US8990632B2 (en) 2011-09-27 2012-09-11 System for monitoring state information in a multiplex system

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2011210049A JP5561622B2 (ja) 2011-09-27 2011-09-27 多重化システム、データ通信カード、状態異常検出方法、及びプログラム

Publications (2)

Publication Number Publication Date
JP2013073289A JP2013073289A (ja) 2013-04-22
JP5561622B2 true JP5561622B2 (ja) 2014-07-30

Family

ID=47912617

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2011210049A Active JP5561622B2 (ja) 2011-09-27 2011-09-27 多重化システム、データ通信カード、状態異常検出方法、及びプログラム

Country Status (2)

Country Link
US (1) US8990632B2 (ja)
JP (1) JP5561622B2 (ja)

Families Citing this family (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9087005B2 (en) * 2013-05-31 2015-07-21 International Business Machines Corporation Increasing resiliency of a distributed computing system through lifeboat monitoring
CN104008037A (zh) * 2014-03-13 2014-08-27 英业达科技有限公司 监控模块的监控方法
WO2015163084A1 (ja) * 2014-04-22 2015-10-29 オリンパス株式会社 データ処理システム及びデータ処理方法
US9804937B2 (en) * 2014-09-08 2017-10-31 Quanta Computer Inc. Backup backplane management control in a server rack system
US9130559B1 (en) * 2014-09-24 2015-09-08 Xilinx, Inc. Programmable IC with safety sub-system
CN105808407B (zh) * 2014-12-31 2019-09-13 华为技术有限公司 管理设备的方法、设备和设备管理控制器
WO2016157328A1 (ja) * 2015-03-27 2016-10-06 三菱電機株式会社 制御システム、及び通信ゲートウェイ装置
US10846160B2 (en) * 2018-01-12 2020-11-24 Quanta Computer Inc. System and method for remote system recovery
CN109067707A (zh) * 2018-06-29 2018-12-21 国家电网公司信息通信分公司 一种电力企业ims通信方法、装置以及ims通信系统
CN109634397A (zh) * 2018-12-07 2019-04-16 郑州云海信息技术有限公司 一种实现智能网卡上下电功能的系统及方法
TWI776427B (zh) * 2021-03-17 2022-09-01 英業達股份有限公司 切換式供電系統及其方法
WO2024121952A1 (ja) * 2022-12-06 2024-06-13 日本電信電話株式会社 故障復旧高速化システム、故障復旧高速化方法及び故障復旧高速化プログラム

Family Cites Families (20)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH08251814A (ja) * 1995-03-15 1996-09-27 Hitachi Ltd 電源二重化運転方式
JPH10150479A (ja) * 1996-11-19 1998-06-02 Fujitsu Ltd 二重化装置の障害時における誤動作防止装置
JP2001060160A (ja) * 1999-08-23 2001-03-06 Mitsubishi Heavy Ind Ltd 制御装置のcpu二重化システム
US6738930B1 (en) * 2000-12-22 2004-05-18 Crystal Group Inc. Method and system for extending the functionality of an environmental monitor for an industrial personal computer
US6895285B2 (en) * 2002-05-23 2005-05-17 American Megatrends, Inc. Computer system status monitoring
US6721907B2 (en) * 2002-06-12 2004-04-13 Zambeel, Inc. System and method for monitoring the state and operability of components in distributed computing systems
US7219254B2 (en) * 2003-03-19 2007-05-15 Lucent Technologies Inc. Method and apparatus for high availability distributed processing across independent networked computer fault groups
US7428655B2 (en) * 2004-09-08 2008-09-23 Hewlett-Packard Development Company, L.P. Smart card for high-availability clustering
JP2006172050A (ja) * 2004-12-15 2006-06-29 Yaskawa Information Systems Co Ltd ホットスタンバイ式2重化システム
US7809992B2 (en) * 2005-07-27 2010-10-05 Ati Technologies Ulc Device and method for malfunction monitoring and control
JP2008033483A (ja) * 2006-07-27 2008-02-14 Nec Corp 計算機システム、計算機および計算機動作環境の移動方法
JP5068056B2 (ja) * 2006-10-11 2012-11-07 株式会社日立製作所 障害回復方法、計算機システム及び管理サーバ
JP2008225567A (ja) * 2007-03-08 2008-09-25 Nec Computertechno Ltd 情報処理システム
JP4468426B2 (ja) * 2007-09-26 2010-05-26 株式会社東芝 高可用システム及び実行状態制御方法
JP2009080692A (ja) * 2007-09-26 2009-04-16 Toshiba Corp 仮想計算機システム及び同システムにおけるサービス引き継ぎ制御方法
JP2009205334A (ja) * 2008-02-27 2009-09-10 Hitachi Ltd 性能モニタ回路及び性能モニタ方法
JP5377898B2 (ja) * 2008-07-10 2013-12-25 株式会社日立製作所 クラスタリングを構成する計算機システムの系切替方法、及びシステム
JP5204603B2 (ja) * 2008-09-29 2013-06-05 株式会社日立製作所 4重化コンピュータシステムおよび2重化リングネットワーク
JP5605672B2 (ja) * 2009-07-21 2014-10-15 日本電気株式会社 電圧監視システムおよび電圧監視方法
US8117494B2 (en) * 2009-12-22 2012-02-14 Intel Corporation DMI redundancy in multiple processor computer systems

Also Published As

Publication number Publication date
JP2013073289A (ja) 2013-04-22
US20130080840A1 (en) 2013-03-28
US8990632B2 (en) 2015-03-24

Similar Documents

Publication Publication Date Title
JP5561622B2 (ja) 多重化システム、データ通信カード、状態異常検出方法、及びプログラム
US8948000B2 (en) Switch fabric management
US7802127B2 (en) Method and computer system for failover
KR100952553B1 (ko) 가상 계산기 시스템 및 그 제어 방법
US8745438B2 (en) Reducing impact of a switch failure in a switch fabric via switch cards
US8677175B2 (en) Reducing impact of repair actions following a switch failure in a switch fabric
US11573737B2 (en) Method and apparatus for performing disk management of all flash array server
JP2014170394A (ja) クラスタシステム
WO2012176278A1 (ja) 情報処理装置、仮想マシン制御方法およびプログラム
JP2006107080A (ja) ストレージ装置システム
US11836100B1 (en) Redundant baseboard management controller (BMC) system and method
JP5549733B2 (ja) 計算機管理装置、計算機管理システム及び計算機システム
JP2019121338A (ja) 機器ラック及び機器ラックからの状態報告を保証する方法
JP5422705B2 (ja) 仮想計算機システム
CN113535472A (zh) 集群服务器
CN113535471A (zh) 集群服务器
CN112912848A (zh) 一种丛集作业过程中的电源请求管理方法
JP4779948B2 (ja) サーバシステム
JP5422706B2 (ja) 管理システム
JP5147955B2 (ja) 仮想計算機システム
KR20150049349A (ko) 펌웨어 관리 장치 및 방법
JPWO2012176278A1 (ja) 情報処理装置、仮想マシン制御方法およびプログラム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20130206

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20130802

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20130807

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20131007

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20140304

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20140423

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20140516

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20140529

R150 Certificate of patent or registration of utility model

Ref document number: 5561622

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313113

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313113

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313113

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350