JP5412902B2 - Storage system - Google Patents
Storage system Download PDFInfo
- Publication number
- JP5412902B2 JP5412902B2 JP2009063903A JP2009063903A JP5412902B2 JP 5412902 B2 JP5412902 B2 JP 5412902B2 JP 2009063903 A JP2009063903 A JP 2009063903A JP 2009063903 A JP2009063903 A JP 2009063903A JP 5412902 B2 JP5412902 B2 JP 5412902B2
- Authority
- JP
- Japan
- Prior art keywords
- disk device
- disk
- partition
- load
- determined
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/06—Digital input from, or digital output to, record carriers, e.g. RAID, emulated record carriers or networked record carriers
- G06F3/0601—Interfaces specially adapted for storage systems
- G06F3/0628—Interfaces specially adapted for storage systems making use of a particular technique
- G06F3/0653—Monitoring storage devices or systems
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F1/00—Details not covered by groups G06F3/00 - G06F13/00 and G06F21/00
- G06F1/26—Power supply means, e.g. regulation thereof
- G06F1/32—Means for saving power
- G06F1/3203—Power management, i.e. event-based initiation of a power-saving mode
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F1/00—Details not covered by groups G06F3/00 - G06F13/00 and G06F21/00
- G06F1/26—Power supply means, e.g. regulation thereof
- G06F1/32—Means for saving power
- G06F1/3203—Power management, i.e. event-based initiation of a power-saving mode
- G06F1/3206—Monitoring of events, devices or parameters that trigger a change in power modality
- G06F1/3215—Monitoring of peripheral devices
- G06F1/3221—Monitoring of peripheral devices of disk drive devices
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F1/00—Details not covered by groups G06F3/00 - G06F13/00 and G06F21/00
- G06F1/26—Power supply means, e.g. regulation thereof
- G06F1/32—Means for saving power
- G06F1/3203—Power management, i.e. event-based initiation of a power-saving mode
- G06F1/3234—Power saving characterised by the action undertaken
- G06F1/325—Power saving in peripheral device
- G06F1/3268—Power saving in hard disk drive
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/06—Digital input from, or digital output to, record carriers, e.g. RAID, emulated record carriers or networked record carriers
- G06F3/0601—Interfaces specially adapted for storage systems
- G06F3/0602—Interfaces specially adapted for storage systems specifically adapted to achieve a particular effect
- G06F3/0625—Power saving in storage systems
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/06—Digital input from, or digital output to, record carriers, e.g. RAID, emulated record carriers or networked record carriers
- G06F3/0601—Interfaces specially adapted for storage systems
- G06F3/0628—Interfaces specially adapted for storage systems making use of a particular technique
- G06F3/0638—Organizing or formatting or addressing of data
- G06F3/064—Management of blocks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/06—Digital input from, or digital output to, record carriers, e.g. RAID, emulated record carriers or networked record carriers
- G06F3/0601—Interfaces specially adapted for storage systems
- G06F3/0668—Interfaces specially adapted for storage systems adopting a particular infrastructure
- G06F3/0671—In-line storage system
- G06F3/0683—Plurality of storage devices
- G06F3/0689—Disk arrays, e.g. RAID, JBOD
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02D—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
- Y02D10/00—Energy efficient computing, e.g. low power processors, power management or thermal management
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Human Computer Interaction (AREA)
- Debugging And Monitoring (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Description
本発明は、ストレージシステムにかかり、特に、複数の記憶装置を装備したストレージシステムに関する。 The present invention relates to a storage system, and particularly relates to a storage system equipped with a plurality of storage devices.
近年、データ記憶容量、信頼性の向上を図るべく、多数のディスク装置を備えたストレージシステムが開発されている。例えば、NAS(Network Attached Storage)装置や、グリッドストレージシステムといったものがある。 In recent years, a storage system having a large number of disk devices has been developed in order to improve data storage capacity and reliability. For example, there are NAS (Network Attached Storage) devices and grid storage systems.
ここで、仮に、数百台のクライアントが起動時の特定処理で読み込むファイルが、ストレージシステム上に格納されているとする。すると、このファイルには、数百台のクライアントが同時に起動する際にアクセスするため、当該ファイルに負荷が集中し、ホットスポットとなる。ところが、このようなホットスポットが出現する時間は短く、1日平均のディスクビジー率でみると、システム全体のわずかなリソースしか占有しない。また、ストレージシステムでは、一般的に、容量がフルに近づくと性能低下が起きやすくなるという問題がある。これに対応すべく、また、突発的な容量増加に耐えられるよう、70%以下など余裕をもって運用されるのが普通である。なお、ILM(情報ライフサイクル管理:Information Lifecycle
Management)の考え方では、大部分のデータはアクセス頻度が低いデータ(例えば1日〜数ヶ月に1回以下)だと言われている。
Here, it is assumed that files read by hundreds of clients in a specific process at startup are stored on the storage system. Then, since this file is accessed when hundreds of clients are activated at the same time, the load is concentrated on the file and it becomes a hot spot. However, the time at which such hot spots appear is short, and the daily average disk busy rate occupies few resources of the entire system. In addition, in a storage system, there is a general problem that performance degradation tends to occur when the capacity approaches to full. In order to cope with this, and to withstand sudden increase in capacity, it is usually operated with a margin of 70% or less. In addition, ILM (Information Lifecycle Management: Information Lifecycle
According to the concept of “Management”, it is said that most data is data with low access frequency (for example, once a day to less than once every several months).
しかしながら、上述したように、ストレージシステム全体の稼働率(負荷・容量)が低い場合であっても、多数のディスク装置を備えているストレージシステムでは、これら多数のディスク装置を絶えず駆動する必要がある。その結果、ストレージシステムの消費電力が下がりにくい、という問題がある。 However, as described above, even in a case where the operation rate (load / capacity) of the entire storage system is low, in a storage system having a large number of disk devices, it is necessary to continuously drive the large number of disk devices. . As a result, there is a problem that the power consumption of the storage system is difficult to decrease.
一方で、特許文献1では、NAS装置などのストレージシステムにおいて、省エネルギー化を図ることを目的とした技術を開示している。具体的には、ストレージシステムを構成する仮想ストレージ毎の負荷を計測し、負荷が高い仮想ストレージの処理を、他のストレージ処理部にて分割し、負荷が低い仮想ストレージの処理を他のストレージ処理部にて統合する。これにより、仮想ストレージシステムを制御しているストレージ処理部への電力供給を制御している。
On the other hand,
ところが、上述した特許文献1に開示の技術では、仮想ストレージ単位で負荷を計測しており、当該仮想ストレージを制御するストレージ処理部に対する電力供給を制御しているだけであるため、物理的なディスク装置に対する電力供給を適切に制御していない。従って、ディスク装置の消費電力の低下を図ることができず、依然としてシステム全体の消費電力が下がりにくい、という問題が生じる。
However, in the technique disclosed in
このため、本発明の目的は、上述した課題である、消費電力の低下が困難であることを解決することができるストレージシステムを提供することにある。 Therefore, an object of the present invention is to provide a storage system that can solve the above-described problem that it is difficult to reduce power consumption.
かかる目的を達成するため本発明の一形態であるストレージシステムは、
ディスク装置毎に当該ディスク装置に対する単位時間あたりの稼働状況を計測して、稼働した上記ディスク装置を稼働ディスクと判定し、稼働していない上記ディスク装置を非稼働ディスクと判定すると共に、単位時間当たりの上記ディスク装置における負荷を計測して、計測結果を記憶する性能監視部と、
上記性能監視部による計測結果に基づいて、稼働ディスクと判定された上記ディスク装置に格納されているデータを、当該ディスク装置における負荷よりも高い負荷の他の上記ディスク装置に格納するデータ再配置部と、
を備える。
In order to achieve such an object, a storage system according to one aspect of the present invention provides:
For each disk device, measure the operating status per unit time for the disk device, determine that the disk device that was operating is an active disk, determine that the disk device that is not operating is a non-operating disk, and A performance monitoring unit for measuring the load on the disk device and storing the measurement result;
A data rearrangement unit that stores data stored in the disk device determined to be an active disk based on a measurement result by the performance monitoring unit in another disk device having a higher load than the load in the disk device. When,
Is provided.
また、本発明の他の形態であるプログラムは、
コンピュータに、
ディスク装置毎に当該ディスク装置に対する単位時間あたりの稼働状況を計測して、稼働した上記ディスク装置を稼働ディスクと判定し、稼働していない上記ディスク装置を非稼働ディスクと判定すると共に、単位時間当たりの上記ディスク装置における負荷を計測して、計測結果を記憶する性能監視部と、
上記性能監視部による計測結果に基づいて、稼働ディスクと判定された上記ディスク装置に格納されているデータを、当該ディスク装置における負荷よりも高い負荷の他の上記ディスク装置に格納するデータ再配置部と、
を実現させるためのプログラムである。
Moreover, the program which is the other form of this invention is:
On the computer,
For each disk device, measure the operating status per unit time for the disk device, determine that the disk device that was operating is an active disk, determine that the disk device that is not operating is a non-operating disk, and A performance monitoring unit for measuring the load on the disk device and storing the measurement result;
A data rearrangement unit that stores data stored in the disk device determined to be an active disk based on a measurement result by the performance monitoring unit in another disk device having a higher load than the load in the disk device. When,
It is a program for realizing.
また、本発明の他の形態であるデータ格納方法は、
ディスク装置毎に当該ディスク装置に対する単位時間あたりの稼働状況を計測して、稼働した上記ディスク装置を稼働ディスクと判定し、稼働していない上記ディスク装置を非稼働ディスクと判定すると共に、単位時間当たりの上記ディスク装置における負荷を計測して、計測結果を記憶して、性能監視を行い、
上記計測結果に基づいて、稼働ディスクと判定された上記ディスク装置に格納されているデータを、当該ディスク装置における負荷よりも高い負荷の他の上記ディスク装置に格納して、データの再配置を行う、
という構成を採る。
In addition, a data storage method according to another aspect of the present invention includes:
For each disk device, measure the operating status per unit time for the disk device, determine that the disk device that was operating is an active disk, determine that the disk device that is not operating is a non-operating disk, and Measure the load on the above disk device, store the measurement results, perform performance monitoring,
Based on the measurement result, data stored in the disk device determined to be an active disk is stored in another disk device having a higher load than the load in the disk device, and data is rearranged. ,
The structure is taken.
本発明は、以上のように構成されることにより、ストレージシステム全体のさらなる省電力化を図ることができる。 By configuring as described above, the present invention can achieve further power saving of the entire storage system.
<実施形態1>
本発明の第1の実施形態を、図1乃至図11を参照して説明する。図1は、本実施形態におけるストレージシステムの構成を示す機能ブロック図である。図2は、ディスク装置の負荷の計測の一例を示す図である。図3乃至図4は、ストレージシステムに記憶されているデータの一例を示す図である。図5乃至図11は、ストレージシステムの動作を示す図である。
<
A first embodiment of the present invention will be described with reference to FIGS. FIG. 1 is a functional block diagram showing the configuration of the storage system in this embodiment. FIG. 2 is a diagram illustrating an example of the load measurement of the disk device. 3 to 4 are diagrams illustrating an example of data stored in the storage system. 5 to 11 are diagrams showing the operation of the storage system.
[構成]
本実施形態におけるストレージシステム10は、図1に示すように、複数のディスク装置6,7,・・・,nを備えており、例えば、NAS装置やグリッドストレージシステムによって実現されている。なお、図1では、ストレージシステムが、ディスク装置6等と一体的に構成されているよう図示しているが、本発明におけるストレージシステムは、ディスク装置6等と分離されており、ディスク装置6等に対するデータの記録再生制御を行うコンピュータにて構成されていてもよい。
[Constitution]
As shown in FIG. 1, the
そして、ストレージシステム10は、装備された演算装置にプログラムが組み込まれることによって構築された、ファイル管理部1と、性能監視部2と、再配置候補リスト記憶部3と、ファイル再配置制御部4と、ファイル群選別制御部5と、を備えている。なお、上記各部1〜5による処理に付随して記憶することが必要なデータを記憶するフラッシュメモリなどの記憶装置も備えている。以下、各構成について詳述する。
The
上記ファイル管理部1は、ディスク装置6等内に格納されたファイルデータの格納位置、つまり、どのディスクのどの区画に格納されているかということを管理している。なお、ディスク装置6等は、図1の符号61,71,n1等に示すように、その記憶容量が複数の区画に分割されている。そして、各区画あるいは区画間をまたがって、ファイルデータ62,72,n2等が格納されている。例えば、一つのディスク装置の記憶容量は、1000程度の区画に分割されている。
The
また、上記性能監視部2は、上述した各区画をユニークな区画番号により識別する。そして、性能監視部2は、一定期間(例えば、10分)における区画毎のI/O(Input/Output)度数分布と、ディスク全体のビジー率を観測する。具体的に、性能監視部2は、該当するディスク装置の単位時間当たりの稼働率、つまり、一定期間あたりの稼働している時間の割合を、上記ディスクビジー率として算出する。そして、ディスクビジー率が「0」ではない、つまり、一定期間(単に時間)内に稼働したディスク装置を、稼働ディスクとして判定し、ディスクビジー率が「0」、つまり、一定期間(単位時間)内に稼働しなかったディスク装置を、非稼働ディスクとして判定する。さらに、性能監視部2あるいはストレージシステム10に装備された他の機能により、非稼働ディスクとして判定したディスク装置は停止される。つまり、非稼働ディスクであるディスク装置への電源供給は停止される。なお、非稼働ディスクは未使用という意味ではない。上述した単位時間あたりに稼働していないだけであって、データが格納されている可能性はある。
Further, the
なお、上述したように計測対象となるディスク装置は、ディスク装置単体であることに限定されず、複数のディスク装置であってもよい。つまり、グループ化された複数のディスク装置を1つのディスク装置として、そのディスクビジー率を計測してもよい。 As described above, the disk device to be measured is not limited to a single disk device, and may be a plurality of disk devices. In other words, the disk busy rate may be measured with a plurality of grouped disk devices as one disk device.
また、性能監視部2は、上述したように計測したディスクビジー率と、各区画毎のI/O度数分布とから、各区画毎のビジー率を算出して、この値を各区画の負荷とする。このとき、各区画に対するRead回数とWrite回数とに基づいて、各区画に対するRead処理時におけるReadビジー率、Write処理時におけるWriteビジー率、をそれぞれ算出する。
Further, the
ここで、図2を参照して、所定のディスク装置6の各区画におけるビジー率算出の一例を説明する。まず、図2(A)に示すように、ディスク装置6が区画#1〜#7に分割されているとする。そして、このときのディスク装置6全体のビジー率が80%であると計測され、また、各区画#1〜#7に対するRead回数とWrite回数とがそれぞれ図2(B)に示す回数であったとする。つまり、ディスク装置6を7つの区画#1〜#7に分けた時の各区画におけるI/O度数が、図2(B)の上側の図に示すように、区画#1からReadが、4回、1回、8回、0回、0回、0回、4回であり、図2(B)の下側の図に示すように、区画#1からWriteが、0回、2回、0回、0回、2回、0回、0回であるとする。この場合に、ディスクビジー率(80%)を、各区画のI/O度数分布で比例分配することにより、各区画のビジー率を算出する。すると、上記の場合には、全I/O数を合計すると20回であるため、I/O一回で全体のビジー率80%うちの4%に貢献することとなる。従って、図2(C)に示すように、各区画のReadビジー率は、それぞれ12%、4%、32%、0%、0%、0%、16%となり、各区画のWriteビジー率は、それぞれ0%、8%、0%、0%、8%、0%、0%となる。このようにして、各区画のReadビジー率、Writeビジー率を算出し、当該各区画の負荷とする。
Here, an example of the busy rate calculation in each section of the
なお、上述した各区画のビジー率の算出は、ディスクビジー率が「0」ではなく稼働ディスクと判定されたディスク装置に対して行う。そして、算出した区画ビジー率が「0」でなければ、性能監視部2は、当該算出した区画ビジー率(Readビジー率、Writeビジー率)を再配置候補リスト記憶部3に入力して記憶する。
Note that the calculation of the busy rate of each partition described above is performed for a disk device in which the disk busy rate is determined to be an active disk instead of “0”. If the calculated partition busy rate is not “0”, the
そして、上記再配置候補リスト記憶部3は、上述したように性能監視部2から受け取った各区画のビジー率、つまり、Readビジー率、Writeビジー率を、それぞれビジー率が高い順と低い順にソートして、それらの優先度を管理する。具体的には、図3に示すように、Read・Writeの二種類の処理において、それぞれ高ビジー率・低ビジー率の二種類の、計4種類の優先度リストを管理する。そして、各優先度リストにおいては、ストレージシステムにある全区画の中から、その値が高い順、及び、低い順に、予め設定された個数(例えば、5つ)ずつ保持している。このリストに登録される区画は、後述のファイル再配置制御部4にてファイルが再配置されるか、さらにより高い、もしくは、低い区画がリストに登録され、各リストの上位に位置する設定個数内から追い出されるまで、当該リスト中に存在し続ける。ただし、一つのリストに同じ区画番号は2度出現しない。例えば、リストをヒープ構造でもち、定期的に各エリアのビジー率をリストの最下位の値と比較して、リストの圏内であれば最下位の値と交換後にソートすることで、このような優先度リストを実現できる。
Then, the relocation candidate
ここで、再配置候補リスト記憶部3における入力された各区画におけるRead・Writeビジー率のリストのソート方法について説明する。まず、すでにリストの最大個数を越えて区画が記憶されている場合には、新たに入力された区画のビジー率と、記憶しているリストの最下位の区画のビジー率と比較し、これよりも高い値(区画が高い順に並んでいる場合)あるいは低い値(区画が低い順に並んでいる場合)であれば、区画番号とビジー率の値を交換する。つまり、区画番号をリストに追加する。その後、交換が発生したリストをソートし、重複する区画が既に登録されていれば、その区画の登録が古い方を削除する。
Here, a method of sorting the list of the read / write busy rates in each input partition in the rearrangement candidate
例えば、最大リスト個数が「3」の高Readビジー率リストがあり、現在空である場合、前述のディスクの区画Readビジー率12%(#1)、4%(#2)、32%(#3)、16%(#7)を挿入するケースを考える。まず、リストが空なので、#1、#2、#3がリストに登録されソートされる。リストの状況は、#3→#1→#2の順番となる。次に#7(16%)を挿入すると、リストは既に最大個数(3)なので、最下位の区画#2(4%)と追加区画#7(16%)のビジー率を比較する。ここでは、#7のビジー率が高いため、#2と#7とを交換する。そして、再度ソートを行い、新たなリスト#3→#7→#1を得る。なお、#7の前後に他に#7はないため、挿入した区画#7は重複しておらず、重複削除の必要は無い。
For example, if there is a high read busy rate list whose maximum number of lists is “3” and it is currently empty, the above-mentioned disk partition read busy rates are 12% (# 1), 4% (# 2), and 32% (# 3) Consider the case of inserting 16% (# 7). First, since the list is empty, # 1, # 2, and # 3 are registered in the list and sorted. The status of the list is in the order of # 3 → # 1 → # 2. Next, when # 7 (16%) is inserted, since the list is already the maximum number (3), the busy rates of the lowest partition # 2 (4%) and the additional partition # 7 (16%) are compared. Here, since the busy rate of # 7 is high, # 2 and # 7 are exchanged. Then, sorting is performed again to obtain a
なお、区画ビジー率のリストは、図3に示すように、ReadとWriteを別々に形成されていることに限定されない。例えば、Readだけ、あるいは、Writeだけに対応するリストを記憶していてもよく、あるいは、Read/Writeの区別無しで、上述した性能監視部2で区画毎のビジー率を計測して、再配置候補リスト記憶部3で管理してもよい。
Note that the partition busy rate list is not limited to the separate formation of Read and Write as shown in FIG. For example, a list corresponding to only Read or Write may be stored, or the
さらに、上記では、各区画の負荷を表す値として、区画毎のビジー率を利用したが、他の計測した値や算出した値を、各区画の負荷とし、これに基づいて、図3に示すような各区画のリストを管理してもよい。例えば、上記性能監視部2は、各区画における単位時間あたりの入力開始から当該入力に対する出力完了までに要する時間であるターンアラウンドタイム(TAT:Turn Around Time)を計測し、これらの累積時間を、各区画における負荷としてもよい。そして、この負荷の値が高い順や低い順に、ファイルの再配置を行う区画を選択するリストの並び替えを行ってもよい。このように、区画の負荷を表す値として、TATを用いた場合には、当該TATの値は故障気味のディスク装置で高くなることがある。従って、後述するように、TATの値に基づいてファイルの再配置を行う区画を選択することで、故障気味のディスクを選択でき、当該ディスクからデータを退避するなどの用途に利用することができる。
Furthermore, in the above, the busy rate for each section is used as a value representing the load of each section. However, other measured values and calculated values are used as the loads of each section, and based on this, FIG. 3 shows. A list of each section may be managed. For example, the
また、上記ファイル郡選別制御部4は、ある区画に含まれるファイルを特定する機能を有する。具体的には、ファイルシステムのレイアウト情報を利用し、区画番号から、その区画を利用しているファイル群やメタデータ群を選別できる。このような逆マップ情報は、昨今のファイルシステムでは内部情報として普通に存在している。
The file group
また、上記ファイル再配置制御部5は、定期的に(例えば1日1回)、上述した再配置候補リスト記憶部3に記憶されたリストに基づいて、各区画に格納されているファイルの再配置を計画して、実行する機能を有する。具体的には、大きく分けて、以下の3つの処理A,B,Cを実行する。
In addition, the file
(処理A)
まず、再配置候補リスト記憶部3に基づいて、ビジー率の高い区画(一番高い区画、あるいは、高い順から所定の順番までの区画)を選択し、現在稼働中のディスクに負荷を分散した場合の効果を予測して計算する。具体的な負荷の分散方法としては、例えば、ファイル群の一部を別ディスクに移動する、高いWrite要求のある単一ファイルをRAID5(Redundant Arrays of Inexpensive Disks 5)などの分散方式で複数ディスクに分散する、高いRead要求のあるファイルの複製を複数ディスクに作成する、などの再配置処理が考えられる。また、予測計算では、高いRead要求の区画のみのファイルを分散、高いWrite要求の区画のみのファイルを分散、高いRead/Write両方の区画のファイルを分散した場合のそれぞれのケースで、予め設定された評価関数により効果を数値化し、この数値に基づいて適したファイル再配置処理を決定する。
(Process A)
First, based on the rearrangement candidate
そして、データ再配置後の予測した評価等の値(例えば、評価関数による評価値や各区画のビジー率)が、予め設定された範囲内となる場合には、ファイルの再配置処理を実行する。その後、再配置に伴い、ファイル管理部1の情報を適切に変更し、再配置候補リスト記憶部3から当該区画を削除して、処理を終了する。
Then, when a value such as a predicted evaluation after data rearrangement (for example, an evaluation value by an evaluation function or a busy rate of each section) is within a preset range, a file rearrangement process is executed. . Thereafter, the information in the
(処理B)
上記処理Aで、ファイル再配置後の負荷が軽減されない場合には、この処理Bを行う。この処理Bでは、まず、再配置候補リスト記憶部3から、ビジー率の高い区画を選択し、現在、非稼働であるディスクを含めて負荷を分散した場合の効果を、ビジー率と消費電力に関する評価関数EV(N)を用いて、予測計算する。なお、この評価関数EV(N)におけるNは非稼働ディスクを含めた使用するディスク台数であるため、すでに現在の稼働ディスク数が下限値となる。
(Process B)
If the load after the file rearrangement is not reduced in the process A, the process B is performed. In this process B, first, a partition with a high busy rate is selected from the rearrangement candidate
そして、上記評価関数(N)は、ディスク台数が増えることでビジー率が下がる効果と、消費電力が増える効果がバランスした最適のディスク稼働台数が得られるものを使う。例えば、ビジー率とディスク数の定数倍を足す、図4に示すような評価関数EV(N)が用いられ、この評価関数に基づく評価値は、値が低い方が評価がよいこととなる。従って、図4の例では、Nmaxが最も効率のよいディスク台数を示している。なお、性能や消費電力が予め決めた閾値を外れる場合は、EV(N)を0とすることで、システムの動作をコントロールできる。 The evaluation function (N) uses a function that can obtain an optimal number of operating disks that balances the effect of decreasing the busy rate with the increase in the number of disks and the effect of increasing power consumption. For example, an evaluation function EV (N) as shown in FIG. 4 is used, which adds a busy rate and a constant multiple of the number of disks, and the evaluation value based on this evaluation function is better when the value is lower. Therefore, in the example of FIG. 4, Nmax indicates the most efficient number of disks. When the performance and power consumption are outside the predetermined threshold values, the operation of the system can be controlled by setting EV (N) to 0.
そして、上述した評価関数(N)を利用した評価の結果、一台以上の非稼働ディスクを利用してファイルの再配置を行うべきと判断された場合、ファイルの再配置を行う。その後、再配置に伴い、ファイル管理部1の情報を適切に変更し、再配置候補リスト記憶部3から当該区画を削除して、処理を終了する。
Then, as a result of the evaluation using the evaluation function (N) described above, if it is determined that the file should be relocated using one or more non-working disks, the file is relocated. Thereafter, the information in the
なお、上述した処理A、Bによる高ビジー率の区画に対して、負荷を軽減するファイルの再配置処理は、上述した処理に限定されない。 Note that the file rearrangement process for reducing the load on the high busy rate sections by the processes A and B described above is not limited to the process described above.
(処理C)
上記処理A,Bを実行した後に、この処理Cを実行する。この処理Cでは、再配置候補リスト記憶部3から、ビジー率の低い区画(一番低い区画、あるいは、低い順から所定の順番までの区画)を選択し、その区画上のファイル群を別の稼働ディスクに移動した場合の効果を表す評価の値を、予測計算する。そして、計算後のビジー率などの値が予め決められた範囲に入る場合には、ファイルの再配置を行い、再配置候補リスト記憶部3から当該区画を削除する。このとき、選択された区画のファイルの再配置は、稼働ディスクであって、選択された区画のビジー率よりも高いビジー率の区画に移動することで実行し、特に、ファイルが移動された後の区画が形成されたディスク装置を停止できる可能性が高いディスク装置であるとよい。
(Process C)
After executing the processes A and B, the process C is executed. In this process C, a partition with a low busy rate (the lowest partition or a partition from the lowest order to a predetermined order) is selected from the rearrangement candidate
なお、上述したストレージシステムは、図1に示すように、各処理を行う機能が1台のコンピュータに装備されている場合を説明したが、各機能が複数台のコンピュータに装備されていてもよい。例えば、上記ファイル管理部1が独立したサーバコンピュータに存在し、クライアントからファイルの物理位置を隠蔽するメタデータサーバの役割を果たす、分散ファイルシステムとして構成されていてもよい。
In the above-described storage system, as shown in FIG. 1, the case where the function for performing each process is provided in one computer has been described, but each function may be provided in a plurality of computers. . For example, the
また、上述したストレージシステムでは、各ディスク装置を、独立したファイルシステムとし、ファイル管理部1が全体を統括構成する構成も考えられる。例えば、画像検索システムを考えた場合に、ファイル管理部1を検索処理部と考え、アクセスパターンに最適な画像データのディスク配置を行う事ができる。
Further, in the above-described storage system, a configuration in which each disk device is an independent file system and the
[動作]
次に、上述したストレージシステムの動作を説明する。はじめに、性能監視部2にて一定時間ごと(例えば、10分毎)に実行される動作について、図5のフローチャートを参照して説明する。
[Operation]
Next, the operation of the above-described storage system will be described. First, the operation executed at regular time intervals (for example, every 10 minutes) in the
まず、各ディスク装置のビジー率と、各区画のRead・WriteのI/O度数分布を取得して記録する(ステップS1)。続いて、ディスク装置のビジー率が「0」ではなく、稼働ディスクと判定された場合には(ステップS2でYes)、そのディスク装置に形成された区画毎のビジー率を、ディスクのビジー率を各区画のI/O度数分布で比例分配することにより算出する(ステップS3)。そして、算出した区画ビジー率が、「0」でなければ、再配置候補リスト記憶部3に入力する(ステップS4)。このとき、再配置候補リスト記憶部3では、上述したように、各リストを高い順、あるいは、低い順に、ソートする。以上の処理が、一定時間ごとに実行される。
First, the busy rate of each disk device and the read / write I / O frequency distribution of each partition are acquired and recorded (step S1). Subsequently, when the busy rate of the disk device is not “0” but is determined to be an active disk (Yes in step S2), the busy rate of each partition formed in the disk device is determined as the busy rate of the disk. Calculation is performed by proportional distribution in the I / O frequency distribution of each section (step S3). If the calculated partition busy rate is not “0”, it is input to the rearrangement candidate list storage unit 3 (step S4). At this time, in the rearrangement candidate
続いて、ファイル再配置制御部4にて定期的に(例えば1日1回)実行される動作について、図6乃至図11に示すフローチャート及びファイル再配置の様子を示す図を参照して、説明する。
Next, operations that are executed periodically (for example, once a day) by the file
はじめに、上述した処理Aを実行するが、このときの動作を、図6及び図7を参照して説明する。まず、再配置候補リスト記憶部3から、ビジー率の高い区画を選択する(ステップS11)。このとき、例えば、図7(A)の符号6に示すディスク装置内の区画#11が選択されたとする。そして、この区画における負荷を、現在稼働中の他のディスク装置(区画)に分散した場合の効果を、ビジー率にて予測計算する(ステップS12)。
First, the process A described above is executed. The operation at this time will be described with reference to FIGS. First, a partition with a high busy rate is selected from the rearrangement candidate list storage unit 3 (step S11). At this time, for example, it is assumed that the
ここでは、図7(A)の矢印に示すように、選択された区画#11内のファイルを、稼働中の他のディスク装置7内の区画#12に移動して、負荷を分散する場合を考える。このような負荷分散処理を行った場合の効果を、予め記憶された評価関数などの評価情報に基づいて評価値として算出する。そして、この評価値が、再配置により効果が上がると判定できる予め設定された基準を満たすか否かを判断する(ステップS13)。基準を満たす場合には(ステップS13でYes)、予測した負荷分散処理を実際に実行する(ステップS14)。すると、図7(B)に示すように、区画#11内に格納された1つのファイルが、稼働中の他のディスク装置7内の区画#12に移動して格納された状態となる。
Here, as shown by the arrow in FIG. 7A, the file in the selected
その後は、ファイルの再配置に伴い、ファイル管理部1の情報を適切に変更する。また、再配置候補リスト記憶部3内の高ビジー率リストから当該区画を削除して(ステップS15)、処理を終了する。
Thereafter, the information in the
ここで、上述したステップS12で予測した分散処理の効果が基準を満たさなかった場合には(ステップS13でNo)、上記処理Bを実行する。このときの動作を、図8及び図9を参照して説明する。 Here, when the effect of the dispersion process predicted in step S12 described above does not satisfy the standard (No in step S13), the process B is executed. The operation at this time will be described with reference to FIGS.
まず、再配置候補リスト記憶部3から、ビジー率の高い区画を選択する(ステップS21)。このとき、例えば、図9(A)の符号6に示すディスク装置内の区画#11が選択されたとする。そして、この区画における負荷を、上記処理Aとは異なり、今度は、現在、非稼働であるディスク装置も含めて、負荷を分散した場合の効果を予測計算する(ステップS22)。
First, a partition with a high busy rate is selected from the rearrangement candidate list storage unit 3 (step S21). At this time, for example, it is assumed that the
ここでは、図9(A)の矢印に示すように、選択された区画#11内のファイルを、非稼働である他のディスク装置9内の区画#14に移動して、負荷を分散する場合を考える。このような負荷分散処理を行った場合の効果を、予め記憶された評価関数などの評価情報に基づいて評価値として算出する。そして、この評価値が、再配置により効果が上がると判定できる予め設定された基準を満たすか否かを判断する(ステップS23)。基準を満たす場合には(ステップS23でYes)、予測した負荷分散処理を実際に実行する(ステップS24)。すると、図9(B)に示すように、区画#11内に格納された1つのファイルが、非稼働の他のディスク装置9内の区画#14に移動して格納された状態となり、また、非稼働であったディスク装置9は稼働状態となる。
Here, as shown by the arrow in FIG. 9A, the file in the selected
その後は、ファイルの再配置に伴い、ファイル管理部1の情報を適切に変更する。また、再配置候補リスト記憶部3内の高ビジー率リストから当該区画を削除して(ステップS25)、処理を終了する。
Thereafter, the information in the
以上のように、本実施形態におけるストレージシステムでは、負荷の高い区画に格納されたファイルを分散したり、あるいは複製して、他のディスク装置に格納するなどして、データの再配置を行っている。これにより、該当する区画が形成されたディスク装置の負荷が軽減されることとなる。その結果、ストレージシステム全体において電力が効率的に利用され、省電力化を図ることができる。特に、非稼働ディスクを増やして負荷分散するさいには、実際の分散処理の前に評価関数などを用いて性能予測を行うことで、性能及び省電力化のバランスを維持することができる。 As described above, in the storage system according to the present embodiment, data is rearranged by distributing files stored in high-load partitions or by copying and storing them in other disk devices. Yes. As a result, the load on the disk device in which the corresponding section is formed is reduced. As a result, power is efficiently used in the entire storage system, and power saving can be achieved. In particular, when distributing the load by increasing the number of non-working disks, the performance and power saving can be balanced by performing performance prediction using an evaluation function or the like before the actual distribution processing.
続いて、上記処理Aあるいは処理Bが実行された後に、上記処理Cを実行する。このときの動作を、図10及び図11を参照して説明する。 Subsequently, after the process A or the process B is executed, the process C is executed. The operation at this time will be described with reference to FIGS.
まず、再配置候補リスト記憶部3から、ビジー率の低い区画を選択する(ステップS31)。このとき、例えば、図11(A)の符号8に示すディスク装置内の区画#13が選択されたとする。そして、この区画に配置されているファイルを、稼働中の他のディスク装置(区画)に移動する場合の効果を予測計算する(ステップS32)。
First, a partition with a low busy rate is selected from the rearrangement candidate list storage unit 3 (step S31). At this time, for example, it is assumed that the
ここでは、図11(A)の矢印に示すように、選択された区画#13内のファイルを、稼働中の他のディスク装置7内の区画#12に移動する場合を考える。このような負荷分散処理を行った場合の効果を、予め記憶された評価関数などの評価情報に基づいて評価値として算出して、この評価値が、再配置により効果が上がると判定できる予め設定された基準を満たすか否かを判断する(ステップS33)。基準を満たす場合には(ステップS33でYes)、予測したファイルの移動を実際に実行する(ステップS34)。すると、図11(B)に示すように、区画#13内に格納されたファイルが、稼働中の他のディスク装置7内の区画#12に移動して格納された状態となる。
Here, consider a case where the file in the selected
その後は、ファイルの再配置に伴い、ファイル管理部1の情報を適切に変更する。また、再配置候補リスト記憶部3内の低ビジー率リストから当該区画を削除して(ステップS35)、処理を終了する。
Thereafter, the information in the
そして、その後は、上述したようにもともと負荷の低かった区画#13内のファイルが他の区画に移動されることから、当該区画#13にはその後の負荷がさらに低減される。従って、後に性能監視部2にてディスク装置のビジー率が計測されたときに、区画#13が位置するディスク装置8のビジー率が「0」であった場合には、当該ディスク装置8を非稼働ディスクと判定でき、その後は、電源供給が停止される。
After that, as described above, since the file in the
以上により、本発明によると、負荷の低い区画内のファイルを他のディスク装置に移動することで、非稼働ディスクを効率的に増加させることができる。従って、非稼働となったディスク装置に対する電源供給を停止することができ、ストレージシステム全体の省電力化を図ることができる。 As described above, according to the present invention, it is possible to efficiently increase the number of non-operating disks by moving the files in a partition with a low load to another disk device. Therefore, it is possible to stop the power supply to the disk device that has become inactive, and to achieve power saving of the entire storage system.
ここで、上述したように、区画ビジー率を計算し、ソート済みリストを管理するための処理量を見積もる。
単位時間あたりの処理:1000台の1TBディスク装置を1000個のエリアに分け、全ディスクが稼働ディスクで、10分に一回ビジー率を集計した場合
ディスクビジー率取得回数:1K個/10分=1.67個/秒
各エリアのサイズ:1GB
エリア数:1M個
ビジー率の計算:1M個/10分=1.67K個/秒
上記のうち、10%がリストの圏内に入ったとすると、リストへのエリア挿入と再ソートが167回/秒である。そして、リストの長さが短ければ、昨今のCPUにとって大きな負荷ではない。また、稼働ディスク数が1/10になれば、管理対象の区画も1/10になり管理処理は大幅に削減される。このようにディスクが1000台つながっていても、少ない計算と統計情報で、再配置処理を実行することができる。
Here, as described above, the partition busy rate is calculated, and the processing amount for managing the sorted list is estimated.
Processing per unit time: When 1000 1TB disk units are divided into 1000 areas, all the disks are active disks, and the busy rate is aggregated once every 10 minutes, the number of disk busy rate acquisition times: 1K / 10 minutes = 1.67 pieces / sec. Size of each area: 1GB
Number of areas: 1M busy rate calculation: 1M / 10 minutes = 1.67K pieces / second Of the above, if 10% entered the list, area insertion and re-sorting to the list was 167 times / second is there. And if the length of the list is short, it will not be a heavy load on modern CPUs. If the number of active disks becomes 1/10, the number of managed partitions will also become 1/10, and management processing will be greatly reduced. Thus, even if 1000 disks are connected, the rearrangement process can be executed with a small amount of calculation and statistical information.
<実施形態2>
本発明の第1の実施形態を、図12を参照して説明する。図12は、ストレージシステムの構成を示す機能ブロック図である。なお、本実施形態では、ストレージシステムの概略を説明する。
<
A first embodiment of the present invention will be described with reference to FIG. FIG. 12 is a functional block diagram showing the configuration of the storage system. In this embodiment, an outline of a storage system will be described.
図1に示すように、本実施形態におけるストレージシステム100は、
ディスク装置111,112毎に当該ディスク装置に対する単位時間あたりの稼働状況を計測して、稼働した上記ディスク装置を稼働ディスクと判定し、稼働していない上記ディスク装置を非稼働ディスクと判定すると共に、単位時間当たりの上記ディスク装置における負荷を計測して、計測結果を記憶する性能監視部101と、
上記性能監視部による計測結果に基づいて、稼働ディスクと判定された上記ディスク装置に格納されているデータを、当該ディスク装置における負荷よりも高い負荷の他の上記ディスク装置に格納するデータ再配置部102と、
を備える。
As shown in FIG. 1, the
For each of the
A data rearrangement unit that stores data stored in the disk device determined to be an active disk based on a measurement result by the performance monitoring unit in another disk device having a higher load than the load in the disk device. 102,
Is provided.
そして、上記ストレージシステムでは、
上記性能監視部は、上記ディスク装置内の記憶領域が複数に分割された各区画における負荷を計測して、計測結果を記憶し、
上記データ再配置部は、上記性能監視部による計測結果に基づいて、稼働ディスクと判定された上記ディスク装置に形成された上記区画のうち、負荷が他の上記区画と比較して低い上記区画に格納されているデータを、稼働ディスクと判定された他の上記ディスク装置に格納する、
という構成を採る。
And in the above storage system,
The performance monitoring unit measures a load in each section in which the storage area in the disk device is divided into a plurality of parts, stores the measurement result,
The data rearrangement unit, in the partition formed in the disk device determined to be an active disk based on the measurement result by the performance monitoring unit, in the partition having a lower load than the other partition. Store the stored data in the other disk device determined to be an active disk.
The structure is taken.
また、上記ストレージシステムでは、
上記データ再配置部は、上記性能監視部による計測結果に基づいて、負荷が低い順から予め設定された順番までの上記区画に格納されているデータを、稼働ディスクと判定された他の上記ディスク装置に格納する、
という構成を採る。
In the above storage system,
The data rearrangement unit, based on the measurement result by the performance monitoring unit, data stored in the sections from the order of low load to the preset order, the other disks determined as active disks Store in the device,
The structure is taken.
上記発明によると、まず、ストレージシステムでは、ディスク装置毎に単位時間当たりの稼働状況を計測する。そして、単位時間あたりに稼働したディスク装置を稼働ディスクと判定し、単位時間あたりに稼働していないディスク装置を非稼働ディスクと判定する。これにより、例えば、非稼働ディスクと判定されたディスク装置を停止することで、ストレージシステム全体の省電力化を図ることができる。 According to the above invention, first, in the storage system, the operating status per unit time is measured for each disk device. Then, the disk device operating per unit time is determined as an active disk, and the disk device not operating per unit time is determined as a non-operating disk. As a result, for example, by stopping the disk device determined to be a non-working disk, it is possible to save power in the entire storage system.
また、ストレージシステムでは、上述したようにディスク装置毎の稼働状況を計測すると共に、ディスク装置における負荷、例えば、ディスク装置内に形成された各区画毎における負荷を計測して記憶している。そして、稼働ディスクであるディスク装置内に形成された区画のうち、負荷が他の区画と比較して低い区画に格納されているデータを、稼働ディスクである他のディスク装置に格納する。なお、上述したデータの移動は、負荷が低い区画順に実行してもよい。 Further, in the storage system, as described above, the operation status for each disk device is measured, and the load on the disk device, for example, the load for each partition formed in the disk device is measured and stored. Then, the data stored in the partition having a lower load than the other partitions among the partitions formed in the disk device that is the working disk is stored in the other disk device that is the working disk. Note that the above-described data movement may be executed in the order of sections with a low load.
これにより、データを稼働中の他のディスク装置に移動させたディスク装置は、もともと負荷が低かったため、その後、アクセスが減少して、非稼働ディスクとなる可能性が高くなる。そして、非稼働ディスクとなった場合には、上述したように、そのディスク装置を停止する。これにより、ストレージシステム全体のさらなる省電力化を図ることができる。 As a result, the disk device that has moved the data to another disk device that is in operation has a low load from the beginning, so that there is a high possibility that the access will be reduced and become a non-working disk. If the disk becomes a non-working disk, the disk device is stopped as described above. Thereby, further power saving of the entire storage system can be achieved.
また、上記ストレージシステムでは、
上記データ再配置部は、上記性能監視部による計測結果に基づいて、稼働ディスクと判定された上記ディスク装置に形成された上記区画のうち、負荷が他の上記区画と比較して高い上記区画における負荷を軽減するよう、上記各区画に格納されたデータの再配置を行う、
という構成を採る。
In the above storage system,
The data rearrangement unit, in the partition formed in the disk device determined to be an active disk based on the measurement result by the performance monitoring unit, in the partition having a higher load than the other partition. To relocate the data stored in each of the above partitions so as to reduce the load,
The structure is taken.
また、上記ストレージシステムの他の態様において、
上記データ再配置部は、稼働ディスクと判定された上記ディスク装置に形成された上記区画のうち、負荷が他の上記区画と比較して高い上記区画に格納されたデータの一部又は全部を、他の上記ディスク装置に格納して、データの再配置を行う、
という構成を採る。
In another aspect of the storage system,
The data rearrangement unit is a part or all of the data stored in the partition having a higher load than the other partition among the partitions formed in the disk device determined to be an active disk. Store it in the other disk devices above, and rearrange the data.
The structure is taken.
また、上記ストレージシステムでは、
上記データ再配置部は、非稼働ディスクと判定された上記ディスク装置を含めて、上記データの再配置を行う、
という構成を採る。
In the above storage system,
The data rearrangement unit rearranges the data including the disk device determined to be a non-working disk.
The structure is taken.
また、上記ストレージシステムでは、
上記データ再配置部は、上記性能監視部による計測結果に基づいて、負荷が高い順から予め設定された順番までの上記区画における負荷を軽減するよう、上記各区画に格納されたデータの再配置を行う、
という構成を採る。
In the above storage system,
The data rearrangement unit rearranges the data stored in each of the partitions so as to reduce the load on the partition from the highest load to a preset order based on the measurement result by the performance monitoring unit. I do,
The structure is taken.
また、上記ストレージシステムでは、
上記性能監視部は、上記各区画における単位時間あたりの入力開始から当該入力に対する出力完了までに要する時間であるターンアラウンドタイムの累積時間を、上記各区画における上記負荷として計測する、
という構成を採る。
In the above storage system,
The performance monitoring unit measures the accumulated time of turnaround time, which is the time required from the start of input per unit time in each section to the completion of output for the input, as the load in each section.
The structure is taken.
上記発明によると、ストレージシステムでは、負荷の高い区画に格納されたデータを分散あるいは複製して他のディスク装置に格納するなどして、データの再配置を行う。これにより、該当する区画が形成されたディスク装置の負荷が軽減されるため、ストレージシステム全体において電力が効率的に利用され、省電力化を図ることができる。 According to the above invention, in the storage system, data is rearranged by distributing or replicating data stored in a high-load partition and storing it in another disk device. As a result, the load on the disk device in which the corresponding partition is formed is reduced, so that power is efficiently used in the entire storage system, and power saving can be achieved.
そして、上述したストレージシステムは、コンピュータにプログラムが組み込まれることで実現できる。具体的に、本発明の他の形態であるプログラムは、コンピュータに、
ディスク装置毎に当該ディスク装置に対する単位時間あたりの稼働状況を計測して、稼働した上記ディスク装置を稼働ディスクと判定し、稼働していない上記ディスク装置を非稼働ディスクと判定すると共に、単位時間当たりの上記ディスク装置における負荷を計測して、計測結果を記憶する性能監視部と、
上記性能監視部による計測結果に基づいて、稼働ディスクと判定された上記ディスク装置に格納されているデータを、当該ディスク装置における負荷よりも高い負荷の他の上記ディスク装置に格納するデータ再配置部と、
を実現させるためのプログラムである。
The storage system described above can be realized by incorporating a program into a computer. Specifically, a program according to another embodiment of the present invention is stored in a computer.
For each disk device, measure the operating status per unit time for the disk device, determine that the disk device that was operating is an active disk, determine that the disk device that is not operating is a non-operating disk, and A performance monitoring unit for measuring the load on the disk device and storing the measurement result;
A data rearrangement unit that stores data stored in the disk device determined to be an active disk based on a measurement result by the performance monitoring unit in another disk device having a higher load than the load in the disk device. When,
It is a program for realizing.
そして、上記プログラムでは、
上記性能監視部は、上記ディスク装置内の記憶領域が複数に分割された各区画における負荷を計測して、計測結果を記憶し、
上記データ再配置部は、上記性能監視部による計測結果に基づいて、稼働ディスクと判定された上記ディスク装置に形成された上記区画のうち、負荷が他の上記区画と比較して低い上記区画に格納されているデータを、稼働ディスクと判定された他の上記ディスク装置に格納する、
という構成を採る。
And in the above program,
The performance monitoring unit measures a load in each section in which the storage area in the disk device is divided into a plurality of parts, stores the measurement result,
The data rearrangement unit, in the partition formed in the disk device determined to be an active disk based on the measurement result by the performance monitoring unit, in the partition having a lower load than the other partition. Store the stored data in the other disk device determined to be an active disk.
The structure is taken.
また、上記プログラムでは、
上記データ再配置部は、上記性能監視部による計測結果に基づいて、稼働ディスクと判定された上記ディスク装置に形成された上記区画のうち、負荷が他の上記区画と比較して高い上記区画における負荷を軽減するよう、上記各区画に格納されたデータの再配置を行う、
という構成を採る。
また、上述したストレージシステムが作動することにより実行される、本発明の他の形態であるデータ格納方法は、
ディスク装置毎に当該ディスク装置に対する単位時間あたりの稼働状況を計測して、稼働した上記ディスク装置を稼働ディスクと判定し、稼働していない上記ディスク装置を非稼働ディスクと判定すると共に、単位時間当たりの上記ディスク装置における負荷を計測して、計測結果を記憶して、性能監視を行い、
上記計測結果に基づいて、稼働ディスクと判定された上記ディスク装置に格納されているデータを、当該ディスク装置における負荷よりも高い負荷の他の上記ディスク装置に格納して、データの再配置を行う。
In the above program,
The data rearrangement unit, in the partition formed in the disk device determined to be an active disk based on the measurement result by the performance monitoring unit, in the partition having a higher load than the other partition. To relocate the data stored in each of the above partitions so as to reduce the load,
The structure is taken.
A data storage method according to another embodiment of the present invention, which is executed when the above-described storage system operates,
For each disk device, measure the operating status per unit time for the disk device, determine that the disk device that was operating is an active disk, determine that the disk device that is not operating is a non-operating disk, and Measure the load on the above disk device, store the measurement results, perform performance monitoring,
Based on the measurement result, data stored in the disk device determined to be an active disk is stored in another disk device having a higher load than the load in the disk device, and data is rearranged. .
また、上述したストレージシステムが作動することにより実行される、本発明の他の形態であるデータ格納方法は、
上記性能監視時に、上記ディスク装置内の記憶領域が複数に分割された各区画における負荷を計測して、計測結果を記憶し、
上記データの再配置時に、上記性能監視による計測結果に基づいて、稼働ディスクと判定された上記ディスク装置に形成された上記区画のうち、負荷が他の上記区画と比較して低い上記区画に格納されているデータを、稼働ディスクと判定された他の上記ディスク装置に格納する、
という構成を採る。
A data storage method according to another embodiment of the present invention, which is executed when the above-described storage system operates,
During the performance monitoring, measure the load in each partition into which the storage area in the disk device is divided into a plurality, and store the measurement results;
At the time of rearrangement of the data, among the partitions formed in the disk device determined to be an active disk based on the measurement result by the performance monitoring, the load is stored in the partition having a lower load than the other partitions. Store the stored data in the other disk device determined to be an active disk,
The structure is taken.
そして、上記データ格納方法の他の態様において、
上記データ再配置時は、上記性能監視による計測結果に基づいて、稼働ディスクと判定された上記ディスク装置に形成された上記区画のうち、負荷が他の上記区画と比較して高い上記区画における負荷を軽減するよう、上記各区画に格納されたデータの再配置を行う、
という構成を採る。
In another aspect of the data storage method,
At the time of the data rearrangement, among the partitions formed in the disk device determined to be an active disk based on the measurement result of the performance monitoring, the load in the partition is higher than that of the other partitions To relocate the data stored in each of the above partitions so as to reduce
The structure is taken.
上述した構成を有する、プログラム、又は、データ格納方法、の発明であっても、上記ストレージシステムと同様の作用を有するために、上述した本発明の目的を達成することができる。 Even the invention of the program or the data storage method having the above-described configuration can achieve the above-described object of the present invention because it has the same operation as the above storage system.
本発明は、ディスクアレイ装置、NAS装置、アグリゲートNAS装置、グリッドストレージなど、複数のディスク装置を搭載したストレージシステムに適用することができ、産業上の利用可能性を有する。 The present invention can be applied to a storage system including a plurality of disk devices such as a disk array device, a NAS device, an aggregate NAS device, and a grid storage, and has industrial applicability.
1 ファイル管理部
2 性能監視部
3 再配置候補リスト記憶部
4 ファイル再配置制御部
5 ファイル郡選別制御部
6,7,n ディスク装置
10,100 ストレージシステム
101 性能監視部
102 データ再配置制御部
111,112 ディスク装置
DESCRIPTION OF
Claims (7)
前記性能監視部による計測結果に基づいて、稼働ディスクと判定された前記ディスク装置に形成された前記区画のうち、負荷が他の前記区画と比較して高い前記区画における負荷を軽減するよう、負荷が他の前記区画と比較して高い前記区画に格納されたデータの一部又は全部を、他の前記ディスク装置に格納して、データの再配置を行い、その後、前記性能監視部による計測結果に基づいて、稼働ディスクと判定された前記ディスク装置に形成された前記区画のうち、負荷が他の前記区画と比較して低い前記区画に格納されているデータを、稼働ディスクと判定された他の前記ディスク装置に格納するデータ再配置部と、
を備えたストレージシステム。 The operation status per unit time for each disk device is measured for each disk device, the operating disk device is determined as an operating disk, the non-operating disk device is determined as a non-operating disk, and the disk device the load per unit time in each compartment storage area of the inner is divided into a plurality measures, and performance monitoring unit for storing the measurement result,
Based on the measurement result by the performance monitoring unit , among the partitions formed in the disk device determined to be an active disk , the load is reduced so as to reduce the load in the partition that is higher than the other partitions. A part or all of the data stored in the partition that is higher than the other partition is stored in the other disk device, the data is rearranged, and then the measurement result by the performance monitoring unit Based on the above, among the partitions formed in the disk device determined to be an active disk, data stored in the partition having a lower load compared to the other partitions is determined to be an active disk. A data relocation unit for storing in the disk device ,
Storage system with
前記データ再配置部は、前記性能監視部による計測結果に基づいて、負荷が低い順から予め設定された順番までの前記区画に格納されているデータを、稼働ディスクと判定された他の前記ディスク装置に格納する、
ストレージシステム。 The storage system according to claim 1 ,
The data rearrangement unit, based on the measurement result of the performance monitoring unit, data stored in the partition from the order of low load to the preset order, the other disks determined as active disks Store in the device,
Storage system.
前記データ再配置部は、非稼働ディスクと判定された前記ディスク装置を含めて、前記データの再配置を行う、
ストレージシステム。 The storage system according to claim 1 or 2 ,
The data rearrangement unit rearranges the data including the disk device determined to be a non-working disk.
Storage system.
前記データ再配置部は、前記性能監視部による計測結果に基づいて、負荷が高い順から予め設定された順番までの前記区画における負荷を軽減するよう、前記各区画に格納されたデータの再配置を行う、
ストレージシステム。 The storage system according to any one of claims 1 to 3 ,
The data rearrangement unit rearranges the data stored in each partition so as to reduce the load in the partition from the order of higher load to the preset order based on the measurement result by the performance monitoring unit. I do,
Storage system.
前記性能監視部は、前記各区画における単位時間あたりの入力開始から当該入力に対する出力完了までに要する時間であるターンアラウンドタイムの累積時間を、前記各区画における前記負荷として計測する、
ストレージシステム。 The storage system according to any one of claims 1 to 4 , wherein
The performance monitoring unit measures, as the load in each partition, the accumulated time of turnaround time, which is the time required from the start of input per unit time in each partition to the completion of output for the input,
Storage system.
ディスク装置毎に当該ディスク装置に対する単位時間あたりの稼働状況を計測して、稼働した前記ディスク装置を稼働ディスクと判定し、稼働していない前記ディスク装置を非稼働ディスクと判定すると共に、前記ディスク装置内の記憶領域が複数に分割された各区画における単位時間当たりの負荷を計測して、計測結果を記憶する性能監視部と、
前記性能監視部による計測結果に基づいて、稼働ディスクと判定された前記ディスク装置に形成された前記区画のうち、負荷が他の前記区画と比較して高い前記区画における負荷を軽減するよう、負荷が他の前記区画と比較して高い前記区画に格納されたデータの一部又は全部を、他の前記ディスク装置に格納して、データの再配置を行い、その後、前記性能監視部による計測結果に基づいて、稼働ディスクと判定された前記ディスク装置に形成された前記区画のうち、負荷が他の前記区画と比較して低い前記区画に格納されているデータを、稼働ディスクと判定された他の前記ディスク装置に格納するデータ再配置部と、
を実現させるためのプログラム。 On the computer,
The operation status per unit time for each disk device is measured for each disk device, the operating disk device is determined as an operating disk, the non-operating disk device is determined as a non-operating disk, and the disk device the load per unit time in each compartment storage area of the inner is divided into a plurality measures, and performance monitoring unit for storing the measurement result,
Based on the measurement result by the performance monitoring unit , among the partitions formed in the disk device determined to be an active disk , the load is reduced so as to reduce the load in the partition that is higher than the other partitions. A part or all of the data stored in the partition that is higher than the other partition is stored in the other disk device, the data is rearranged, and then the measurement result by the performance monitoring unit Based on the above, among the partitions formed in the disk device determined to be an active disk, data stored in the partition having a lower load compared to the other partitions is determined to be an active disk. A data relocation unit for storing in the disk device ,
A program to realize
前記計測結果に基づいて、稼働ディスクと判定された前記ディスク装置に形成された前記区画のうち、負荷が他の前記区画と比較して高い前記区画における負荷を軽減するよう、負荷が他の前記区画と比較して高い前記区画に格納されたデータの一部又は全部を、他の前記ディスク装置に格納し、その後、前記計測結果に基づいて、稼働ディスクと判定された前記ディスク装置に形成された前記区画のうち、負荷が他の前記区画と比較して低い前記区画に格納されているデータを、稼働ディスクと判定された他の前記ディスク装置に格納して、データの再配置を行う、
データ格納方法。
The operation status per unit time for each disk device is measured for each disk device, the operating disk device is determined as an operating disk, the non-operating disk device is determined as a non-operating disk, and the disk device storage area of the inner is to measure the load per unit time in each compartment is divided into a plurality, and stores the measurement result, performs performance monitoring,
Based on the measurement result, among the partitions formed in the disk device determined to be an active disk , the load is other than the other so that the load in the partition is high compared to the other partitions. A part or all of the data stored in the partition higher than the partition is stored in the other disk device, and then formed on the disk device determined to be an active disk based on the measurement result. Among the partitions, data stored in the partition having a lower load than the other partitions is stored in another disk device determined to be an active disk, and data is rearranged.
Data storage method.
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2009063903A JP5412902B2 (en) | 2009-03-17 | 2009-03-17 | Storage system |
PCT/JP2009/006901 WO2010106603A1 (en) | 2009-03-17 | 2009-12-16 | Storage system |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2009063903A JP5412902B2 (en) | 2009-03-17 | 2009-03-17 | Storage system |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2010218193A JP2010218193A (en) | 2010-09-30 |
JP5412902B2 true JP5412902B2 (en) | 2014-02-12 |
Family
ID=42739277
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2009063903A Expired - Fee Related JP5412902B2 (en) | 2009-03-17 | 2009-03-17 | Storage system |
Country Status (2)
Country | Link |
---|---|
JP (1) | JP5412902B2 (en) |
WO (1) | WO2010106603A1 (en) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP3079060B1 (en) * | 2015-04-08 | 2018-03-28 | Huawei Technologies Co., Ltd. | Load balancing for large in-memory databases |
Family Cites Families (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP3613052B2 (en) * | 1999-02-09 | 2005-01-26 | 日本電気株式会社 | Computer-readable recording medium on which an operating system is recorded |
JP2001093220A (en) * | 1999-09-20 | 2001-04-06 | Nec Eng Ltd | Power saving control system and power saving control method in environment of plurality of hard disk drives |
JP4414409B2 (en) * | 2006-04-24 | 2010-02-10 | 富士通株式会社 | Disk device, disk control method and program |
JP4794370B2 (en) * | 2006-06-20 | 2011-10-19 | 株式会社日立製作所 | Storage system and storage control method that achieve both power saving and performance |
JP4935331B2 (en) * | 2006-12-06 | 2012-05-23 | 日本電気株式会社 | Storage system, storage area selection method and program |
JP2008217575A (en) * | 2007-03-06 | 2008-09-18 | Nec Corp | Storage device and configuration optimization method thereof |
-
2009
- 2009-03-17 JP JP2009063903A patent/JP5412902B2/en not_active Expired - Fee Related
- 2009-12-16 WO PCT/JP2009/006901 patent/WO2010106603A1/en active Application Filing
Also Published As
Publication number | Publication date |
---|---|
JP2010218193A (en) | 2010-09-30 |
WO2010106603A1 (en) | 2010-09-23 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5629919B2 (en) | How to place virtual volume hotspots in a storage pool using ongoing load measurement and ranking | |
JP4620722B2 (en) | Data placement control program, data placement control device, data placement control method, and multi-node storage system | |
JP5490093B2 (en) | Storage system and control method thereof | |
US8490106B2 (en) | Apparatus for distributing resources to partitions in multi-processor system | |
JP3541744B2 (en) | Storage subsystem and control method thereof | |
US8429346B1 (en) | Automated data relocation among storage tiers based on storage load | |
US9823875B2 (en) | Transparent hybrid data storage | |
CN103095805A (en) | Cloud storage system of data intelligent and decentralized management | |
CN110096350B (en) | Cold and hot area division energy-saving storage method based on cluster node load state prediction | |
JP2015528174A (en) | Method and apparatus for managing storage arrays | |
KR101356033B1 (en) | Hybrid Main Memory System and Task Scheduling Method therefor | |
Herodotou et al. | Automating distributed tiered storage management in cluster computing | |
CN107273200B (en) | Task scheduling method for heterogeneous storage | |
Liu et al. | Analysis of and optimization for write-dominated hybrid storage nodes in cloud | |
JP5447523B2 (en) | Data processing apparatus, data recording method, and data recording program | |
JP6115575B2 (en) | Data set multiplicity changing device, server, data set multiplicity changing method, and computer program | |
CN102576294B (en) | Storage system and method comprising a plurality of storage devices | |
JP6582721B2 (en) | Control device, storage system, and control program | |
JP5412902B2 (en) | Storage system | |
CN105808150A (en) | Solid state disk caching system for hybrid storage device | |
JP7500991B2 (en) | Storage control device and storage control program | |
JP2007272721A (en) | Storage device and its control method | |
JP2010231465A (en) | Storage system, storage power consumption reduction method, and program | |
CN103577340A (en) | Memory management device and method and electronic device | |
CN102779017A (en) | Control method of data caching area in solid state disc |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20111208 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20130716 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20130830 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20131015 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20131028 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5412902 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
LAPS | Cancellation because of no payment of annual fees |