JP5412902B2 - Storage system - Google Patents

Storage system Download PDF

Info

Publication number
JP5412902B2
JP5412902B2 JP2009063903A JP2009063903A JP5412902B2 JP 5412902 B2 JP5412902 B2 JP 5412902B2 JP 2009063903 A JP2009063903 A JP 2009063903A JP 2009063903 A JP2009063903 A JP 2009063903A JP 5412902 B2 JP5412902 B2 JP 5412902B2
Authority
JP
Japan
Prior art keywords
disk device
disk
partition
load
determined
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2009063903A
Other languages
Japanese (ja)
Other versions
JP2010218193A (en
Inventor
秀明 鈴木
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Priority to JP2009063903A priority Critical patent/JP5412902B2/en
Priority to PCT/JP2009/006901 priority patent/WO2010106603A1/en
Publication of JP2010218193A publication Critical patent/JP2010218193A/en
Application granted granted Critical
Publication of JP5412902B2 publication Critical patent/JP5412902B2/en
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/06Digital input from, or digital output to, record carriers, e.g. RAID, emulated record carriers or networked record carriers
    • G06F3/0601Interfaces specially adapted for storage systems
    • G06F3/0628Interfaces specially adapted for storage systems making use of a particular technique
    • G06F3/0653Monitoring storage devices or systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F1/00Details not covered by groups G06F3/00 - G06F13/00 and G06F21/00
    • G06F1/26Power supply means, e.g. regulation thereof
    • G06F1/32Means for saving power
    • G06F1/3203Power management, i.e. event-based initiation of a power-saving mode
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F1/00Details not covered by groups G06F3/00 - G06F13/00 and G06F21/00
    • G06F1/26Power supply means, e.g. regulation thereof
    • G06F1/32Means for saving power
    • G06F1/3203Power management, i.e. event-based initiation of a power-saving mode
    • G06F1/3206Monitoring of events, devices or parameters that trigger a change in power modality
    • G06F1/3215Monitoring of peripheral devices
    • G06F1/3221Monitoring of peripheral devices of disk drive devices
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F1/00Details not covered by groups G06F3/00 - G06F13/00 and G06F21/00
    • G06F1/26Power supply means, e.g. regulation thereof
    • G06F1/32Means for saving power
    • G06F1/3203Power management, i.e. event-based initiation of a power-saving mode
    • G06F1/3234Power saving characterised by the action undertaken
    • G06F1/325Power saving in peripheral device
    • G06F1/3268Power saving in hard disk drive
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/06Digital input from, or digital output to, record carriers, e.g. RAID, emulated record carriers or networked record carriers
    • G06F3/0601Interfaces specially adapted for storage systems
    • G06F3/0602Interfaces specially adapted for storage systems specifically adapted to achieve a particular effect
    • G06F3/0625Power saving in storage systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/06Digital input from, or digital output to, record carriers, e.g. RAID, emulated record carriers or networked record carriers
    • G06F3/0601Interfaces specially adapted for storage systems
    • G06F3/0628Interfaces specially adapted for storage systems making use of a particular technique
    • G06F3/0638Organizing or formatting or addressing of data
    • G06F3/064Management of blocks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/06Digital input from, or digital output to, record carriers, e.g. RAID, emulated record carriers or networked record carriers
    • G06F3/0601Interfaces specially adapted for storage systems
    • G06F3/0668Interfaces specially adapted for storage systems adopting a particular infrastructure
    • G06F3/0671In-line storage system
    • G06F3/0683Plurality of storage devices
    • G06F3/0689Disk arrays, e.g. RAID, JBOD
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D10/00Energy efficient computing, e.g. low power processors, power management or thermal management

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Human Computer Interaction (AREA)
  • Debugging And Monitoring (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Description

本発明は、ストレージシステムにかかり、特に、複数の記憶装置を装備したストレージシステムに関する。   The present invention relates to a storage system, and particularly relates to a storage system equipped with a plurality of storage devices.

近年、データ記憶容量、信頼性の向上を図るべく、多数のディスク装置を備えたストレージシステムが開発されている。例えば、NAS(Network Attached Storage)装置や、グリッドストレージシステムといったものがある。   In recent years, a storage system having a large number of disk devices has been developed in order to improve data storage capacity and reliability. For example, there are NAS (Network Attached Storage) devices and grid storage systems.

ここで、仮に、数百台のクライアントが起動時の特定処理で読み込むファイルが、ストレージシステム上に格納されているとする。すると、このファイルには、数百台のクライアントが同時に起動する際にアクセスするため、当該ファイルに負荷が集中し、ホットスポットとなる。ところが、このようなホットスポットが出現する時間は短く、1日平均のディスクビジー率でみると、システム全体のわずかなリソースしか占有しない。また、ストレージシステムでは、一般的に、容量がフルに近づくと性能低下が起きやすくなるという問題がある。これに対応すべく、また、突発的な容量増加に耐えられるよう、70%以下など余裕をもって運用されるのが普通である。なお、ILM(情報ライフサイクル管理:Information Lifecycle
Management)の考え方では、大部分のデータはアクセス頻度が低いデータ(例えば1日〜数ヶ月に1回以下)だと言われている。
Here, it is assumed that files read by hundreds of clients in a specific process at startup are stored on the storage system. Then, since this file is accessed when hundreds of clients are activated at the same time, the load is concentrated on the file and it becomes a hot spot. However, the time at which such hot spots appear is short, and the daily average disk busy rate occupies few resources of the entire system. In addition, in a storage system, there is a general problem that performance degradation tends to occur when the capacity approaches to full. In order to cope with this, and to withstand sudden increase in capacity, it is usually operated with a margin of 70% or less. In addition, ILM (Information Lifecycle Management: Information Lifecycle
According to the concept of “Management”, it is said that most data is data with low access frequency (for example, once a day to less than once every several months).

しかしながら、上述したように、ストレージシステム全体の稼働率(負荷・容量)が低い場合であっても、多数のディスク装置を備えているストレージシステムでは、これら多数のディスク装置を絶えず駆動する必要がある。その結果、ストレージシステムの消費電力が下がりにくい、という問題がある。   However, as described above, even in a case where the operation rate (load / capacity) of the entire storage system is low, in a storage system having a large number of disk devices, it is necessary to continuously drive the large number of disk devices. . As a result, there is a problem that the power consumption of the storage system is difficult to decrease.

一方で、特許文献1では、NAS装置などのストレージシステムにおいて、省エネルギー化を図ることを目的とした技術を開示している。具体的には、ストレージシステムを構成する仮想ストレージ毎の負荷を計測し、負荷が高い仮想ストレージの処理を、他のストレージ処理部にて分割し、負荷が低い仮想ストレージの処理を他のストレージ処理部にて統合する。これにより、仮想ストレージシステムを制御しているストレージ処理部への電力供給を制御している。   On the other hand, Patent Document 1 discloses a technique aimed at saving energy in a storage system such as a NAS device. Specifically, the load of each virtual storage that makes up the storage system is measured, the processing of the virtual storage with a high load is divided by other storage processing units, and the processing of the virtual storage with a low load is processed with other storage processing Integrate in department Thereby, the power supply to the storage processing unit that controls the virtual storage system is controlled.

特開2003−296153号公報JP 2003-296153 A

ところが、上述した特許文献1に開示の技術では、仮想ストレージ単位で負荷を計測しており、当該仮想ストレージを制御するストレージ処理部に対する電力供給を制御しているだけであるため、物理的なディスク装置に対する電力供給を適切に制御していない。従って、ディスク装置の消費電力の低下を図ることができず、依然としてシステム全体の消費電力が下がりにくい、という問題が生じる。   However, in the technique disclosed in Patent Document 1 described above, the load is measured in units of virtual storage, and only the power supply to the storage processing unit that controls the virtual storage is controlled. The power supply to the device is not properly controlled. Therefore, there is a problem that the power consumption of the disk device cannot be reduced and the power consumption of the entire system is still difficult to decrease.

このため、本発明の目的は、上述した課題である、消費電力の低下が困難であることを解決することができるストレージシステムを提供することにある。   Therefore, an object of the present invention is to provide a storage system that can solve the above-described problem that it is difficult to reduce power consumption.

かかる目的を達成するため本発明の一形態であるストレージシステムは、
ディスク装置毎に当該ディスク装置に対する単位時間あたりの稼働状況を計測して、稼働した上記ディスク装置を稼働ディスクと判定し、稼働していない上記ディスク装置を非稼働ディスクと判定すると共に、単位時間当たりの上記ディスク装置における負荷を計測して、計測結果を記憶する性能監視部と、
上記性能監視部による計測結果に基づいて、稼働ディスクと判定された上記ディスク装置に格納されているデータを、当該ディスク装置における負荷よりも高い負荷の他の上記ディスク装置に格納するデータ再配置部と、
を備える。
In order to achieve such an object, a storage system according to one aspect of the present invention provides:
For each disk device, measure the operating status per unit time for the disk device, determine that the disk device that was operating is an active disk, determine that the disk device that is not operating is a non-operating disk, and A performance monitoring unit for measuring the load on the disk device and storing the measurement result;
A data rearrangement unit that stores data stored in the disk device determined to be an active disk based on a measurement result by the performance monitoring unit in another disk device having a higher load than the load in the disk device. When,
Is provided.

また、本発明の他の形態であるプログラムは、
コンピュータに、
ディスク装置毎に当該ディスク装置に対する単位時間あたりの稼働状況を計測して、稼働した上記ディスク装置を稼働ディスクと判定し、稼働していない上記ディスク装置を非稼働ディスクと判定すると共に、単位時間当たりの上記ディスク装置における負荷を計測して、計測結果を記憶する性能監視部と、
上記性能監視部による計測結果に基づいて、稼働ディスクと判定された上記ディスク装置に格納されているデータを、当該ディスク装置における負荷よりも高い負荷の他の上記ディスク装置に格納するデータ再配置部と、
を実現させるためのプログラムである。
Moreover, the program which is the other form of this invention is:
On the computer,
For each disk device, measure the operating status per unit time for the disk device, determine that the disk device that was operating is an active disk, determine that the disk device that is not operating is a non-operating disk, and A performance monitoring unit for measuring the load on the disk device and storing the measurement result;
A data rearrangement unit that stores data stored in the disk device determined to be an active disk based on a measurement result by the performance monitoring unit in another disk device having a higher load than the load in the disk device. When,
It is a program for realizing.

また、本発明の他の形態であるデータ格納方法は、
ディスク装置毎に当該ディスク装置に対する単位時間あたりの稼働状況を計測して、稼働した上記ディスク装置を稼働ディスクと判定し、稼働していない上記ディスク装置を非稼働ディスクと判定すると共に、単位時間当たりの上記ディスク装置における負荷を計測して、計測結果を記憶して、性能監視を行い、
上記計測結果に基づいて、稼働ディスクと判定された上記ディスク装置に格納されているデータを、当該ディスク装置における負荷よりも高い負荷の他の上記ディスク装置に格納して、データの再配置を行う、
という構成を採る。
In addition, a data storage method according to another aspect of the present invention includes:
For each disk device, measure the operating status per unit time for the disk device, determine that the disk device that was operating is an active disk, determine that the disk device that is not operating is a non-operating disk, and Measure the load on the above disk device, store the measurement results, perform performance monitoring,
Based on the measurement result, data stored in the disk device determined to be an active disk is stored in another disk device having a higher load than the load in the disk device, and data is rearranged. ,
The structure is taken.

本発明は、以上のように構成されることにより、ストレージシステム全体のさらなる省電力化を図ることができる。   By configuring as described above, the present invention can achieve further power saving of the entire storage system.

実施形態1におけるストレージシステムの構成を示す機能ブロック図である。1 is a functional block diagram illustrating a configuration of a storage system in Embodiment 1. FIG. 図1に開示したストレージシステムにおけるディスク装置の負荷の計測の一例を示す図である。FIG. 2 is a diagram illustrating an example of measurement of a load on a disk device in the storage system disclosed in FIG. 1. 図1に開示した再配置候補リスト記憶部に記憶されているデータの一例を示す図である。It is a figure which shows an example of the data memorize | stored in the rearrangement candidate list memory | storage part disclosed in FIG. 図1に開示したストレージシステムに設定されているデータの一例を示す図である。It is a figure which shows an example of the data set to the storage system disclosed in FIG. 図1に開示したストレージシステムの動作を示すフローチャートである。3 is a flowchart showing the operation of the storage system disclosed in FIG. 1. 図1に開示したストレージシステムの動作を示すフローチャートである。3 is a flowchart showing the operation of the storage system disclosed in FIG. 1. 図1に開示したストレージシステムにおけるデータ再配置時の様子を示す図である。It is a figure which shows the mode at the time of the data rearrangement in the storage system disclosed in FIG. 図1に開示したストレージシステムの動作を示すフローチャートである。3 is a flowchart showing the operation of the storage system disclosed in FIG. 1. 図1に開示したストレージシステムにおけるデータ再配置時の様子を示す図である。It is a figure which shows the mode at the time of the data rearrangement in the storage system disclosed in FIG. 図1に開示したストレージシステムの動作を示すフローチャートである。3 is a flowchart showing the operation of the storage system disclosed in FIG. 1. 図1に開示したストレージシステムにおけるデータ再配置時の様子を示す図である。It is a figure which shows the mode at the time of the data rearrangement in the storage system disclosed in FIG. 実施形態1におけるストレージシステムの構成を示す機能ブロック図である。1 is a functional block diagram illustrating a configuration of a storage system in Embodiment 1. FIG.

<実施形態1>
本発明の第1の実施形態を、図1乃至図11を参照して説明する。図1は、本実施形態におけるストレージシステムの構成を示す機能ブロック図である。図2は、ディスク装置の負荷の計測の一例を示す図である。図3乃至図4は、ストレージシステムに記憶されているデータの一例を示す図である。図5乃至図11は、ストレージシステムの動作を示す図である。
<Embodiment 1>
A first embodiment of the present invention will be described with reference to FIGS. FIG. 1 is a functional block diagram showing the configuration of the storage system in this embodiment. FIG. 2 is a diagram illustrating an example of the load measurement of the disk device. 3 to 4 are diagrams illustrating an example of data stored in the storage system. 5 to 11 are diagrams showing the operation of the storage system.

[構成]
本実施形態におけるストレージシステム10は、図1に示すように、複数のディスク装置6,7,・・・,nを備えており、例えば、NAS装置やグリッドストレージシステムによって実現されている。なお、図1では、ストレージシステムが、ディスク装置6等と一体的に構成されているよう図示しているが、本発明におけるストレージシステムは、ディスク装置6等と分離されており、ディスク装置6等に対するデータの記録再生制御を行うコンピュータにて構成されていてもよい。
[Constitution]
As shown in FIG. 1, the storage system 10 in the present embodiment includes a plurality of disk devices 6, 7,..., N, and is realized by, for example, a NAS device or a grid storage system. In FIG. 1, the storage system is illustrated as being integrated with the disk device 6 or the like, but the storage system in the present invention is separated from the disk device 6 or the like, and the disk device 6 or the like. It may be configured by a computer that performs data recording / reproduction control for the above.

そして、ストレージシステム10は、装備された演算装置にプログラムが組み込まれることによって構築された、ファイル管理部1と、性能監視部2と、再配置候補リスト記憶部3と、ファイル再配置制御部4と、ファイル群選別制御部5と、を備えている。なお、上記各部1〜5による処理に付随して記憶することが必要なデータを記憶するフラッシュメモリなどの記憶装置も備えている。以下、各構成について詳述する。   The storage system 10 includes a file management unit 1, a performance monitoring unit 2, a rearrangement candidate list storage unit 3, and a file rearrangement control unit 4 which are constructed by incorporating a program into the equipped arithmetic device. And a file group selection control unit 5. Note that a storage device such as a flash memory is also provided for storing data that needs to be stored along with the processing by each of the units 1 to 5. Hereinafter, each configuration will be described in detail.

上記ファイル管理部1は、ディスク装置6等内に格納されたファイルデータの格納位置、つまり、どのディスクのどの区画に格納されているかということを管理している。なお、ディスク装置6等は、図1の符号61,71,n1等に示すように、その記憶容量が複数の区画に分割されている。そして、各区画あるいは区画間をまたがって、ファイルデータ62,72,n2等が格納されている。例えば、一つのディスク装置の記憶容量は、1000程度の区画に分割されている。   The file management unit 1 manages the storage location of the file data stored in the disk device 6 or the like, that is, in which partition of which disk. Note that the storage capacity of the disk device 6 or the like is divided into a plurality of sections as indicated by reference numerals 61, 71, n1, etc. in FIG. The file data 62, 72, n2, etc. are stored across the sections or between the sections. For example, the storage capacity of one disk device is divided into about 1000 partitions.

また、上記性能監視部2は、上述した各区画をユニークな区画番号により識別する。そして、性能監視部2は、一定期間(例えば、10分)における区画毎のI/O(Input/Output)度数分布と、ディスク全体のビジー率を観測する。具体的に、性能監視部2は、該当するディスク装置の単位時間当たりの稼働率、つまり、一定期間あたりの稼働している時間の割合を、上記ディスクビジー率として算出する。そして、ディスクビジー率が「0」ではない、つまり、一定期間(単に時間)内に稼働したディスク装置を、稼働ディスクとして判定し、ディスクビジー率が「0」、つまり、一定期間(単位時間)内に稼働しなかったディスク装置を、非稼働ディスクとして判定する。さらに、性能監視部2あるいはストレージシステム10に装備された他の機能により、非稼働ディスクとして判定したディスク装置は停止される。つまり、非稼働ディスクであるディスク装置への電源供給は停止される。なお、非稼働ディスクは未使用という意味ではない。上述した単位時間あたりに稼働していないだけであって、データが格納されている可能性はある。   Further, the performance monitoring unit 2 identifies each section described above by a unique section number. Then, the performance monitoring unit 2 observes an I / O (Input / Output) frequency distribution for each partition and a busy rate of the entire disk in a certain period (for example, 10 minutes). Specifically, the performance monitoring unit 2 calculates, as the disk busy rate, the operating rate per unit time of the corresponding disk device, that is, the ratio of the operating time per fixed period. Then, the disk busy rate is not “0”, that is, a disk device operating within a certain period (simply time) is determined as an active disk, and the disk busy rate is “0”, that is, a certain period (unit time). The disk device that has not been operated is determined as a non-working disk. Further, the disk device determined as a non-working disk is stopped by the performance monitoring unit 2 or other functions provided in the storage system 10. That is, power supply to the disk device that is a non-working disk is stopped. A non-working disk does not mean that it is unused. There is a possibility that data is not stored but only operating per unit time described above.

なお、上述したように計測対象となるディスク装置は、ディスク装置単体であることに限定されず、複数のディスク装置であってもよい。つまり、グループ化された複数のディスク装置を1つのディスク装置として、そのディスクビジー率を計測してもよい。   As described above, the disk device to be measured is not limited to a single disk device, and may be a plurality of disk devices. In other words, the disk busy rate may be measured with a plurality of grouped disk devices as one disk device.

また、性能監視部2は、上述したように計測したディスクビジー率と、各区画毎のI/O度数分布とから、各区画毎のビジー率を算出して、この値を各区画の負荷とする。このとき、各区画に対するRead回数とWrite回数とに基づいて、各区画に対するRead処理時におけるReadビジー率、Write処理時におけるWriteビジー率、をそれぞれ算出する。   Further, the performance monitoring unit 2 calculates the busy rate for each partition from the disk busy rate measured as described above and the I / O frequency distribution for each partition, and uses this value as the load of each partition. To do. At this time, based on the read count and the write count for each partition, the read busy rate at the time of read processing and the write busy rate at the time of write processing are calculated for each partition.

ここで、図2を参照して、所定のディスク装置6の各区画におけるビジー率算出の一例を説明する。まず、図2(A)に示すように、ディスク装置6が区画#1〜#7に分割されているとする。そして、このときのディスク装置6全体のビジー率が80%であると計測され、また、各区画#1〜#7に対するRead回数とWrite回数とがそれぞれ図2(B)に示す回数であったとする。つまり、ディスク装置6を7つの区画#1〜#7に分けた時の各区画におけるI/O度数が、図2(B)の上側の図に示すように、区画#1からReadが、4回、1回、8回、0回、0回、0回、4回であり、図2(B)の下側の図に示すように、区画#1からWriteが、0回、2回、0回、0回、2回、0回、0回であるとする。この場合に、ディスクビジー率(80%)を、各区画のI/O度数分布で比例分配することにより、各区画のビジー率を算出する。すると、上記の場合には、全I/O数を合計すると20回であるため、I/O一回で全体のビジー率80%うちの4%に貢献することとなる。従って、図2(C)に示すように、各区画のReadビジー率は、それぞれ12%、4%、32%、0%、0%、0%、16%となり、各区画のWriteビジー率は、それぞれ0%、8%、0%、0%、8%、0%、0%となる。このようにして、各区画のReadビジー率、Writeビジー率を算出し、当該各区画の負荷とする。   Here, an example of the busy rate calculation in each section of the predetermined disk device 6 will be described with reference to FIG. First, as shown in FIG. 2A, it is assumed that the disk device 6 is divided into sections # 1 to # 7. The busy rate of the entire disk device 6 at this time is measured to be 80%, and the number of reads and the number of writes for each of the partitions # 1 to # 7 are the numbers shown in FIG. To do. That is, when the disk device 6 is divided into seven partitions # 1 to # 7, the I / O frequency in each partition is 4 from the partition # 1 to Read as shown in the upper diagram of FIG. 1 time, 8 times, 0 times, 0 times, 0 times, 4 times, and as shown in the lower diagram of FIG. 2B, Write from the partition # 1 is 0 times, 2 times, Assume 0 times, 0 times, 2 times, 0 times, and 0 times. In this case, the busy ratio of each section is calculated by proportionally distributing the disk busy ratio (80%) with the I / O frequency distribution of each section. In this case, since the total number of I / Os is 20 in total, one I / O contributes to 4% of the overall busy rate of 80%. Therefore, as shown in FIG. 2C, the read busy rate of each partition is 12%, 4%, 32%, 0%, 0%, 0%, 16%, respectively, and the write busy rate of each partition is , 0%, 8%, 0%, 0%, 8%, 0%, and 0%, respectively. In this way, the Read busy rate and Write busy rate of each partition are calculated and set as the load of each partition.

なお、上述した各区画のビジー率の算出は、ディスクビジー率が「0」ではなく稼働ディスクと判定されたディスク装置に対して行う。そして、算出した区画ビジー率が「0」でなければ、性能監視部2は、当該算出した区画ビジー率(Readビジー率、Writeビジー率)を再配置候補リスト記憶部3に入力して記憶する。   Note that the calculation of the busy rate of each partition described above is performed for a disk device in which the disk busy rate is determined to be an active disk instead of “0”. If the calculated partition busy rate is not “0”, the performance monitoring unit 2 inputs and stores the calculated partition busy rate (Read busy rate, Write busy rate) in the rearrangement candidate list storage unit 3. .

そして、上記再配置候補リスト記憶部3は、上述したように性能監視部2から受け取った各区画のビジー率、つまり、Readビジー率、Writeビジー率を、それぞれビジー率が高い順と低い順にソートして、それらの優先度を管理する。具体的には、図3に示すように、Read・Writeの二種類の処理において、それぞれ高ビジー率・低ビジー率の二種類の、計4種類の優先度リストを管理する。そして、各優先度リストにおいては、ストレージシステムにある全区画の中から、その値が高い順、及び、低い順に、予め設定された個数(例えば、5つ)ずつ保持している。このリストに登録される区画は、後述のファイル再配置制御部4にてファイルが再配置されるか、さらにより高い、もしくは、低い区画がリストに登録され、各リストの上位に位置する設定個数内から追い出されるまで、当該リスト中に存在し続ける。ただし、一つのリストに同じ区画番号は2度出現しない。例えば、リストをヒープ構造でもち、定期的に各エリアのビジー率をリストの最下位の値と比較して、リストの圏内であれば最下位の値と交換後にソートすることで、このような優先度リストを実現できる。   Then, the relocation candidate list storage unit 3 sorts the busy rate of each partition received from the performance monitoring unit 2 as described above, that is, the read busy rate and the write busy rate, in order from the highest busy rate to the lowest busy rate, respectively. And manage their priorities. Specifically, as shown in FIG. 3, in the two types of processing of Read and Write, a total of four types of priority lists, each of two types of high busy rate and low busy rate, are managed. Each priority list holds a preset number (for example, five) of all the partitions in the storage system in descending order of the value. The partition registered in this list is the number of files that are rearranged by the file rearrangement control unit 4 to be described later, or a higher or lower partition is registered in the list, and is set at the top of each list. It remains in the list until it is evicted from within. However, the same partition number does not appear twice in one list. For example, if the list has a heap structure, the busy rate of each area is periodically compared with the lowest value of the list, and if it is within the list, it is sorted after the replacement with the lowest value. A priority list can be realized.

ここで、再配置候補リスト記憶部3における入力された各区画におけるRead・Writeビジー率のリストのソート方法について説明する。まず、すでにリストの最大個数を越えて区画が記憶されている場合には、新たに入力された区画のビジー率と、記憶しているリストの最下位の区画のビジー率と比較し、これよりも高い値(区画が高い順に並んでいる場合)あるいは低い値(区画が低い順に並んでいる場合)であれば、区画番号とビジー率の値を交換する。つまり、区画番号をリストに追加する。その後、交換が発生したリストをソートし、重複する区画が既に登録されていれば、その区画の登録が古い方を削除する。   Here, a method of sorting the list of the read / write busy rates in each input partition in the rearrangement candidate list storage unit 3 will be described. First, if the number of partitions has already been stored exceeding the maximum number of lists, the busy rate of the newly input partition is compared with the busy rate of the lowest partition of the stored list. If the value is higher (when the sections are arranged in descending order) or lower (when the sections are arranged in lower order), the section number and the busy rate value are exchanged. That is, the partition number is added to the list. Thereafter, the list in which the exchange has occurred is sorted, and if a duplicated partition is already registered, the oldest registered partition is deleted.

例えば、最大リスト個数が「3」の高Readビジー率リストがあり、現在空である場合、前述のディスクの区画Readビジー率12%(#1)、4%(#2)、32%(#3)、16%(#7)を挿入するケースを考える。まず、リストが空なので、#1、#2、#3がリストに登録されソートされる。リストの状況は、#3→#1→#2の順番となる。次に#7(16%)を挿入すると、リストは既に最大個数(3)なので、最下位の区画#2(4%)と追加区画#7(16%)のビジー率を比較する。ここでは、#7のビジー率が高いため、#2と#7とを交換する。そして、再度ソートを行い、新たなリスト#3→#7→#1を得る。なお、#7の前後に他に#7はないため、挿入した区画#7は重複しておらず、重複削除の必要は無い。   For example, if there is a high read busy rate list whose maximum number of lists is “3” and it is currently empty, the above-mentioned disk partition read busy rates are 12% (# 1), 4% (# 2), and 32% (# 3) Consider the case of inserting 16% (# 7). First, since the list is empty, # 1, # 2, and # 3 are registered in the list and sorted. The status of the list is in the order of # 3 → # 1 → # 2. Next, when # 7 (16%) is inserted, since the list is already the maximum number (3), the busy rates of the lowest partition # 2 (4%) and the additional partition # 7 (16%) are compared. Here, since the busy rate of # 7 is high, # 2 and # 7 are exchanged. Then, sorting is performed again to obtain a new list # 3 → # 7 → # 1. Since there is no other # 7 before and after # 7, the inserted section # 7 is not duplicated and there is no need to delete duplicates.

なお、区画ビジー率のリストは、図3に示すように、ReadとWriteを別々に形成されていることに限定されない。例えば、Readだけ、あるいは、Writeだけに対応するリストを記憶していてもよく、あるいは、Read/Writeの区別無しで、上述した性能監視部2で区画毎のビジー率を計測して、再配置候補リスト記憶部3で管理してもよい。   Note that the partition busy rate list is not limited to the separate formation of Read and Write as shown in FIG. For example, a list corresponding to only Read or Write may be stored, or the performance monitoring unit 2 described above measures the busy rate for each partition and rearranges without distinguishing between Read / Write. You may manage with the candidate list memory | storage part 3. FIG.

さらに、上記では、各区画の負荷を表す値として、区画毎のビジー率を利用したが、他の計測した値や算出した値を、各区画の負荷とし、これに基づいて、図3に示すような各区画のリストを管理してもよい。例えば、上記性能監視部2は、各区画における単位時間あたりの入力開始から当該入力に対する出力完了までに要する時間であるターンアラウンドタイム(TAT:Turn Around Time)を計測し、これらの累積時間を、各区画における負荷としてもよい。そして、この負荷の値が高い順や低い順に、ファイルの再配置を行う区画を選択するリストの並び替えを行ってもよい。このように、区画の負荷を表す値として、TATを用いた場合には、当該TATの値は故障気味のディスク装置で高くなることがある。従って、後述するように、TATの値に基づいてファイルの再配置を行う区画を選択することで、故障気味のディスクを選択でき、当該ディスクからデータを退避するなどの用途に利用することができる。   Furthermore, in the above, the busy rate for each section is used as a value representing the load of each section. However, other measured values and calculated values are used as the loads of each section, and based on this, FIG. 3 shows. A list of each section may be managed. For example, the performance monitoring unit 2 measures a turn around time (TAT) that is a time required from the start of input per unit time to the completion of output for the input in each section, and the accumulated time is It may be a load in each section. Then, the list for selecting the section where the file is rearranged may be rearranged in order of increasing or decreasing load value. As described above, when TAT is used as a value representing the load on a partition, the value of the TAT may be high in a disk device that seems to be out of order. Therefore, as will be described later, by selecting a partition in which a file is to be rearranged based on the value of TAT, it is possible to select a disk that seems to be out of order and use it for applications such as saving data from the disk. .

また、上記ファイル郡選別制御部4は、ある区画に含まれるファイルを特定する機能を有する。具体的には、ファイルシステムのレイアウト情報を利用し、区画番号から、その区画を利用しているファイル群やメタデータ群を選別できる。このような逆マップ情報は、昨今のファイルシステムでは内部情報として普通に存在している。   The file group selection control unit 4 has a function of specifying a file included in a certain section. Specifically, by using the layout information of the file system, it is possible to select the file group and metadata group using the partition from the partition number. Such reverse map information normally exists as internal information in recent file systems.

また、上記ファイル再配置制御部5は、定期的に(例えば1日1回)、上述した再配置候補リスト記憶部3に記憶されたリストに基づいて、各区画に格納されているファイルの再配置を計画して、実行する機能を有する。具体的には、大きく分けて、以下の3つの処理A,B,Cを実行する。   In addition, the file relocation control unit 5 periodically (for example, once a day) reallocates the files stored in each section based on the list stored in the relocation candidate list storage unit 3 described above. It has the function to plan and execute the arrangement. Specifically, the following three processes A, B, and C are executed roughly.

(処理A)
まず、再配置候補リスト記憶部3に基づいて、ビジー率の高い区画(一番高い区画、あるいは、高い順から所定の順番までの区画)を選択し、現在稼働中のディスクに負荷を分散した場合の効果を予測して計算する。具体的な負荷の分散方法としては、例えば、ファイル群の一部を別ディスクに移動する、高いWrite要求のある単一ファイルをRAID5(Redundant Arrays of Inexpensive Disks 5)などの分散方式で複数ディスクに分散する、高いRead要求のあるファイルの複製を複数ディスクに作成する、などの再配置処理が考えられる。また、予測計算では、高いRead要求の区画のみのファイルを分散、高いWrite要求の区画のみのファイルを分散、高いRead/Write両方の区画のファイルを分散した場合のそれぞれのケースで、予め設定された評価関数により効果を数値化し、この数値に基づいて適したファイル再配置処理を決定する。
(Process A)
First, based on the rearrangement candidate list storage unit 3, the partition having the highest busy rate (the highest partition or the partition from the highest order to the predetermined order) is selected, and the load is distributed to the currently operating disks. Predict and calculate the effect of the case. As a specific load distribution method, for example, a part of a file group is moved to another disk, and a single file with a high write request is distributed to multiple disks by a distribution method such as RAID5 (Redundant Arrays of Inexpensive Disks 5). A relocation process such as creating a copy of a file with a high read request distributed on multiple disks can be considered. In addition, the prediction calculation is set in advance for each case where only files with high read request partitions are distributed, only files with high write request partitions are distributed, and files with both high read / write partitions are distributed. The effect is digitized by the evaluation function, and a suitable file relocation process is determined based on the numeric value.

そして、データ再配置後の予測した評価等の値(例えば、評価関数による評価値や各区画のビジー率)が、予め設定された範囲内となる場合には、ファイルの再配置処理を実行する。その後、再配置に伴い、ファイル管理部1の情報を適切に変更し、再配置候補リスト記憶部3から当該区画を削除して、処理を終了する。   Then, when a value such as a predicted evaluation after data rearrangement (for example, an evaluation value by an evaluation function or a busy rate of each section) is within a preset range, a file rearrangement process is executed. . Thereafter, the information in the file management unit 1 is appropriately changed along with the rearrangement, the partition is deleted from the rearrangement candidate list storage unit 3, and the process is terminated.

(処理B)
上記処理Aで、ファイル再配置後の負荷が軽減されない場合には、この処理Bを行う。この処理Bでは、まず、再配置候補リスト記憶部3から、ビジー率の高い区画を選択し、現在、非稼働であるディスクを含めて負荷を分散した場合の効果を、ビジー率と消費電力に関する評価関数EV(N)を用いて、予測計算する。なお、この評価関数EV(N)におけるNは非稼働ディスクを含めた使用するディスク台数であるため、すでに現在の稼働ディスク数が下限値となる。
(Process B)
If the load after the file rearrangement is not reduced in the process A, the process B is performed. In this process B, first, a partition with a high busy rate is selected from the rearrangement candidate list storage unit 3, and the effect when the load is distributed including the currently inactive disks is related to the busy rate and power consumption. Predictive calculation is performed using the evaluation function EV (N). Since N in this evaluation function EV (N) is the number of disks to be used including non-working disks, the current number of working disks is already the lower limit.

そして、上記評価関数(N)は、ディスク台数が増えることでビジー率が下がる効果と、消費電力が増える効果がバランスした最適のディスク稼働台数が得られるものを使う。例えば、ビジー率とディスク数の定数倍を足す、図4に示すような評価関数EV(N)が用いられ、この評価関数に基づく評価値は、値が低い方が評価がよいこととなる。従って、図4の例では、Nmaxが最も効率のよいディスク台数を示している。なお、性能や消費電力が予め決めた閾値を外れる場合は、EV(N)を0とすることで、システムの動作をコントロールできる。   The evaluation function (N) uses a function that can obtain an optimal number of operating disks that balances the effect of decreasing the busy rate with the increase in the number of disks and the effect of increasing power consumption. For example, an evaluation function EV (N) as shown in FIG. 4 is used, which adds a busy rate and a constant multiple of the number of disks, and the evaluation value based on this evaluation function is better when the value is lower. Therefore, in the example of FIG. 4, Nmax indicates the most efficient number of disks. When the performance and power consumption are outside the predetermined threshold values, the operation of the system can be controlled by setting EV (N) to 0.

そして、上述した評価関数(N)を利用した評価の結果、一台以上の非稼働ディスクを利用してファイルの再配置を行うべきと判断された場合、ファイルの再配置を行う。その後、再配置に伴い、ファイル管理部1の情報を適切に変更し、再配置候補リスト記憶部3から当該区画を削除して、処理を終了する。   Then, as a result of the evaluation using the evaluation function (N) described above, if it is determined that the file should be relocated using one or more non-working disks, the file is relocated. Thereafter, the information in the file management unit 1 is appropriately changed along with the rearrangement, the partition is deleted from the rearrangement candidate list storage unit 3, and the process is terminated.

なお、上述した処理A、Bによる高ビジー率の区画に対して、負荷を軽減するファイルの再配置処理は、上述した処理に限定されない。   Note that the file rearrangement process for reducing the load on the high busy rate sections by the processes A and B described above is not limited to the process described above.

(処理C)
上記処理A,Bを実行した後に、この処理Cを実行する。この処理Cでは、再配置候補リスト記憶部3から、ビジー率の低い区画(一番低い区画、あるいは、低い順から所定の順番までの区画)を選択し、その区画上のファイル群を別の稼働ディスクに移動した場合の効果を表す評価の値を、予測計算する。そして、計算後のビジー率などの値が予め決められた範囲に入る場合には、ファイルの再配置を行い、再配置候補リスト記憶部3から当該区画を削除する。このとき、選択された区画のファイルの再配置は、稼働ディスクであって、選択された区画のビジー率よりも高いビジー率の区画に移動することで実行し、特に、ファイルが移動された後の区画が形成されたディスク装置を停止できる可能性が高いディスク装置であるとよい。
(Process C)
After executing the processes A and B, the process C is executed. In this process C, a partition with a low busy rate (the lowest partition or a partition from the lowest order to a predetermined order) is selected from the rearrangement candidate list storage unit 3, and a file group on that partition is selected as another file group. Estimate and calculate an evaluation value that represents the effect of moving to a working disk. When the calculated busy rate or the like falls within a predetermined range, the file is rearranged and the section is deleted from the rearrangement candidate list storage unit 3. At this time, the relocation of the file in the selected partition is executed by moving to a partition with a busy rate higher than the busy rate of the selected partition, especially after the file is moved. It is preferable that the disk device has a high possibility of being able to stop the disk device in which the partition is formed.

なお、上述したストレージシステムは、図1に示すように、各処理を行う機能が1台のコンピュータに装備されている場合を説明したが、各機能が複数台のコンピュータに装備されていてもよい。例えば、上記ファイル管理部1が独立したサーバコンピュータに存在し、クライアントからファイルの物理位置を隠蔽するメタデータサーバの役割を果たす、分散ファイルシステムとして構成されていてもよい。   In the above-described storage system, as shown in FIG. 1, the case where the function for performing each process is provided in one computer has been described, but each function may be provided in a plurality of computers. . For example, the file management unit 1 may exist in an independent server computer and may be configured as a distributed file system that serves as a metadata server that hides the physical location of a file from a client.

また、上述したストレージシステムでは、各ディスク装置を、独立したファイルシステムとし、ファイル管理部1が全体を統括構成する構成も考えられる。例えば、画像検索システムを考えた場合に、ファイル管理部1を検索処理部と考え、アクセスパターンに最適な画像データのディスク配置を行う事ができる。   Further, in the above-described storage system, a configuration in which each disk device is an independent file system and the file management unit 1 performs overall configuration is also conceivable. For example, when an image search system is considered, the file management unit 1 can be considered as a search processing unit, and disk arrangement of image data optimal for an access pattern can be performed.

[動作]
次に、上述したストレージシステムの動作を説明する。はじめに、性能監視部2にて一定時間ごと(例えば、10分毎)に実行される動作について、図5のフローチャートを参照して説明する。
[Operation]
Next, the operation of the above-described storage system will be described. First, the operation executed at regular time intervals (for example, every 10 minutes) in the performance monitoring unit 2 will be described with reference to the flowchart of FIG.

まず、各ディスク装置のビジー率と、各区画のRead・WriteのI/O度数分布を取得して記録する(ステップS1)。続いて、ディスク装置のビジー率が「0」ではなく、稼働ディスクと判定された場合には(ステップS2でYes)、そのディスク装置に形成された区画毎のビジー率を、ディスクのビジー率を各区画のI/O度数分布で比例分配することにより算出する(ステップS3)。そして、算出した区画ビジー率が、「0」でなければ、再配置候補リスト記憶部3に入力する(ステップS4)。このとき、再配置候補リスト記憶部3では、上述したように、各リストを高い順、あるいは、低い順に、ソートする。以上の処理が、一定時間ごとに実行される。   First, the busy rate of each disk device and the read / write I / O frequency distribution of each partition are acquired and recorded (step S1). Subsequently, when the busy rate of the disk device is not “0” but is determined to be an active disk (Yes in step S2), the busy rate of each partition formed in the disk device is determined as the busy rate of the disk. Calculation is performed by proportional distribution in the I / O frequency distribution of each section (step S3). If the calculated partition busy rate is not “0”, it is input to the rearrangement candidate list storage unit 3 (step S4). At this time, in the rearrangement candidate list storage unit 3, as described above, the lists are sorted in order from the highest to the lowest. The above processing is executed at regular time intervals.

続いて、ファイル再配置制御部4にて定期的に(例えば1日1回)実行される動作について、図6乃至図11に示すフローチャート及びファイル再配置の様子を示す図を参照して、説明する。   Next, operations that are executed periodically (for example, once a day) by the file relocation control unit 4 will be described with reference to the flowcharts shown in FIGS. To do.

はじめに、上述した処理Aを実行するが、このときの動作を、図6及び図7を参照して説明する。まず、再配置候補リスト記憶部3から、ビジー率の高い区画を選択する(ステップS11)。このとき、例えば、図7(A)の符号6に示すディスク装置内の区画#11が選択されたとする。そして、この区画における負荷を、現在稼働中の他のディスク装置(区画)に分散した場合の効果を、ビジー率にて予測計算する(ステップS12)。   First, the process A described above is executed. The operation at this time will be described with reference to FIGS. First, a partition with a high busy rate is selected from the rearrangement candidate list storage unit 3 (step S11). At this time, for example, it is assumed that the section # 11 in the disk device indicated by reference numeral 6 in FIG. Then, the effect when the load in this partition is distributed to other currently operating disk devices (partitions) is predicted and calculated based on the busy rate (step S12).

ここでは、図7(A)の矢印に示すように、選択された区画#11内のファイルを、稼働中の他のディスク装置7内の区画#12に移動して、負荷を分散する場合を考える。このような負荷分散処理を行った場合の効果を、予め記憶された評価関数などの評価情報に基づいて評価値として算出する。そして、この評価値が、再配置により効果が上がると判定できる予め設定された基準を満たすか否かを判断する(ステップS13)。基準を満たす場合には(ステップS13でYes)、予測した負荷分散処理を実際に実行する(ステップS14)。すると、図7(B)に示すように、区画#11内に格納された1つのファイルが、稼働中の他のディスク装置7内の区画#12に移動して格納された状態となる。   Here, as shown by the arrow in FIG. 7A, the file in the selected partition # 11 is moved to the partition # 12 in the other operating disk device 7 to distribute the load. Think. The effect when such load distribution processing is performed is calculated as an evaluation value based on evaluation information such as an evaluation function stored in advance. Then, it is determined whether or not the evaluation value satisfies a preset criterion that can be determined that the effect is improved by the rearrangement (step S13). If the criterion is satisfied (Yes in step S13), the predicted load distribution process is actually executed (step S14). Then, as shown in FIG. 7B, one file stored in the partition # 11 is moved to and stored in the partition # 12 in the other disk device 7 in operation.

その後は、ファイルの再配置に伴い、ファイル管理部1の情報を適切に変更する。また、再配置候補リスト記憶部3内の高ビジー率リストから当該区画を削除して(ステップS15)、処理を終了する。   Thereafter, the information in the file management unit 1 is appropriately changed as the files are rearranged. Further, the section is deleted from the high busy rate list in the rearrangement candidate list storage unit 3 (step S15), and the process ends.

ここで、上述したステップS12で予測した分散処理の効果が基準を満たさなかった場合には(ステップS13でNo)、上記処理Bを実行する。このときの動作を、図8及び図9を参照して説明する。   Here, when the effect of the dispersion process predicted in step S12 described above does not satisfy the standard (No in step S13), the process B is executed. The operation at this time will be described with reference to FIGS.

まず、再配置候補リスト記憶部3から、ビジー率の高い区画を選択する(ステップS21)。このとき、例えば、図9(A)の符号6に示すディスク装置内の区画#11が選択されたとする。そして、この区画における負荷を、上記処理Aとは異なり、今度は、現在、非稼働であるディスク装置も含めて、負荷を分散した場合の効果を予測計算する(ステップS22)。   First, a partition with a high busy rate is selected from the rearrangement candidate list storage unit 3 (step S21). At this time, for example, it is assumed that the section # 11 in the disk device indicated by reference numeral 6 in FIG. 9A is selected. Then, unlike the process A described above, the load in this partition is calculated by predicting the effect when the load is distributed, including the disk devices that are currently inactive (step S22).

ここでは、図9(A)の矢印に示すように、選択された区画#11内のファイルを、非稼働である他のディスク装置9内の区画#14に移動して、負荷を分散する場合を考える。このような負荷分散処理を行った場合の効果を、予め記憶された評価関数などの評価情報に基づいて評価値として算出する。そして、この評価値が、再配置により効果が上がると判定できる予め設定された基準を満たすか否かを判断する(ステップS23)。基準を満たす場合には(ステップS23でYes)、予測した負荷分散処理を実際に実行する(ステップS24)。すると、図9(B)に示すように、区画#11内に格納された1つのファイルが、非稼働の他のディスク装置9内の区画#14に移動して格納された状態となり、また、非稼働であったディスク装置9は稼働状態となる。   Here, as shown by the arrow in FIG. 9A, the file in the selected partition # 11 is moved to the partition # 14 in another non-operating disk device 9 to distribute the load. think of. The effect when such load distribution processing is performed is calculated as an evaluation value based on evaluation information such as an evaluation function stored in advance. Then, it is determined whether or not the evaluation value satisfies a preset criterion that can be determined that the effect is improved by the rearrangement (step S23). If the criterion is satisfied (Yes in step S23), the predicted load distribution process is actually executed (step S24). Then, as shown in FIG. 9B, one file stored in the partition # 11 is moved to and stored in the partition # 14 in the other non-operating disk device 9, and The non-operating disk device 9 is in an operating state.

その後は、ファイルの再配置に伴い、ファイル管理部1の情報を適切に変更する。また、再配置候補リスト記憶部3内の高ビジー率リストから当該区画を削除して(ステップS25)、処理を終了する。   Thereafter, the information in the file management unit 1 is appropriately changed as the files are rearranged. Further, the section is deleted from the high busy rate list in the rearrangement candidate list storage unit 3 (step S25), and the process is terminated.

以上のように、本実施形態におけるストレージシステムでは、負荷の高い区画に格納されたファイルを分散したり、あるいは複製して、他のディスク装置に格納するなどして、データの再配置を行っている。これにより、該当する区画が形成されたディスク装置の負荷が軽減されることとなる。その結果、ストレージシステム全体において電力が効率的に利用され、省電力化を図ることができる。特に、非稼働ディスクを増やして負荷分散するさいには、実際の分散処理の前に評価関数などを用いて性能予測を行うことで、性能及び省電力化のバランスを維持することができる。   As described above, in the storage system according to the present embodiment, data is rearranged by distributing files stored in high-load partitions or by copying and storing them in other disk devices. Yes. As a result, the load on the disk device in which the corresponding section is formed is reduced. As a result, power is efficiently used in the entire storage system, and power saving can be achieved. In particular, when distributing the load by increasing the number of non-working disks, the performance and power saving can be balanced by performing performance prediction using an evaluation function or the like before the actual distribution processing.

続いて、上記処理Aあるいは処理Bが実行された後に、上記処理Cを実行する。このときの動作を、図10及び図11を参照して説明する。   Subsequently, after the process A or the process B is executed, the process C is executed. The operation at this time will be described with reference to FIGS.

まず、再配置候補リスト記憶部3から、ビジー率の低い区画を選択する(ステップS31)。このとき、例えば、図11(A)の符号8に示すディスク装置内の区画#13が選択されたとする。そして、この区画に配置されているファイルを、稼働中の他のディスク装置(区画)に移動する場合の効果を予測計算する(ステップS32)。   First, a partition with a low busy rate is selected from the rearrangement candidate list storage unit 3 (step S31). At this time, for example, it is assumed that the section # 13 in the disk device indicated by reference numeral 8 in FIG. Then, the effect of moving the file arranged in this partition to another operating disk device (partition) is predicted and calculated (step S32).

ここでは、図11(A)の矢印に示すように、選択された区画#13内のファイルを、稼働中の他のディスク装置7内の区画#12に移動する場合を考える。このような負荷分散処理を行った場合の効果を、予め記憶された評価関数などの評価情報に基づいて評価値として算出して、この評価値が、再配置により効果が上がると判定できる予め設定された基準を満たすか否かを判断する(ステップS33)。基準を満たす場合には(ステップS33でYes)、予測したファイルの移動を実際に実行する(ステップS34)。すると、図11(B)に示すように、区画#13内に格納されたファイルが、稼働中の他のディスク装置7内の区画#12に移動して格納された状態となる。   Here, consider a case where the file in the selected partition # 13 is moved to the partition # 12 in the other operating disk device 7 as indicated by the arrow in FIG. An effect obtained when such load distribution processing is performed is calculated as an evaluation value based on evaluation information such as an evaluation function stored in advance, and this evaluation value is set in advance so that it can be determined that the effect is improved by rearrangement It is determined whether or not the set criteria are satisfied (step S33). If the criterion is satisfied (Yes in step S33), the predicted file movement is actually executed (step S34). Then, as shown in FIG. 11B, the file stored in the partition # 13 is moved to and stored in the partition # 12 in the other disk device 7 in operation.

その後は、ファイルの再配置に伴い、ファイル管理部1の情報を適切に変更する。また、再配置候補リスト記憶部3内の低ビジー率リストから当該区画を削除して(ステップS35)、処理を終了する。   Thereafter, the information in the file management unit 1 is appropriately changed as the files are rearranged. Further, the section is deleted from the low busy rate list in the rearrangement candidate list storage unit 3 (step S35), and the process is terminated.

そして、その後は、上述したようにもともと負荷の低かった区画#13内のファイルが他の区画に移動されることから、当該区画#13にはその後の負荷がさらに低減される。従って、後に性能監視部2にてディスク装置のビジー率が計測されたときに、区画#13が位置するディスク装置8のビジー率が「0」であった場合には、当該ディスク装置8を非稼働ディスクと判定でき、その後は、電源供給が停止される。   After that, as described above, since the file in the partition # 13 that originally had a low load is moved to another partition, the subsequent load on the partition # 13 is further reduced. Therefore, when the busy rate of the disk device is later measured by the performance monitoring unit 2 and the busy rate of the disk device 8 in which the partition # 13 is located is “0”, the disk device 8 is not used. It can be determined that the disk is a working disk, and thereafter the power supply is stopped.

以上により、本発明によると、負荷の低い区画内のファイルを他のディスク装置に移動することで、非稼働ディスクを効率的に増加させることができる。従って、非稼働となったディスク装置に対する電源供給を停止することができ、ストレージシステム全体の省電力化を図ることができる。   As described above, according to the present invention, it is possible to efficiently increase the number of non-operating disks by moving the files in a partition with a low load to another disk device. Therefore, it is possible to stop the power supply to the disk device that has become inactive, and to achieve power saving of the entire storage system.

ここで、上述したように、区画ビジー率を計算し、ソート済みリストを管理するための処理量を見積もる。
単位時間あたりの処理:1000台の1TBディスク装置を1000個のエリアに分け、全ディスクが稼働ディスクで、10分に一回ビジー率を集計した場合
ディスクビジー率取得回数:1K個/10分=1.67個/秒
各エリアのサイズ:1GB
エリア数:1M個
ビジー率の計算:1M個/10分=1.67K個/秒
上記のうち、10%がリストの圏内に入ったとすると、リストへのエリア挿入と再ソートが167回/秒である。そして、リストの長さが短ければ、昨今のCPUにとって大きな負荷ではない。また、稼働ディスク数が1/10になれば、管理対象の区画も1/10になり管理処理は大幅に削減される。このようにディスクが1000台つながっていても、少ない計算と統計情報で、再配置処理を実行することができる。
Here, as described above, the partition busy rate is calculated, and the processing amount for managing the sorted list is estimated.
Processing per unit time: When 1000 1TB disk units are divided into 1000 areas, all the disks are active disks, and the busy rate is aggregated once every 10 minutes, the number of disk busy rate acquisition times: 1K / 10 minutes = 1.67 pieces / sec. Size of each area: 1GB
Number of areas: 1M busy rate calculation: 1M / 10 minutes = 1.67K pieces / second Of the above, if 10% entered the list, area insertion and re-sorting to the list was 167 times / second is there. And if the length of the list is short, it will not be a heavy load on modern CPUs. If the number of active disks becomes 1/10, the number of managed partitions will also become 1/10, and management processing will be greatly reduced. Thus, even if 1000 disks are connected, the rearrangement process can be executed with a small amount of calculation and statistical information.

<実施形態2>
本発明の第1の実施形態を、図12を参照して説明する。図12は、ストレージシステムの構成を示す機能ブロック図である。なお、本実施形態では、ストレージシステムの概略を説明する。
<Embodiment 2>
A first embodiment of the present invention will be described with reference to FIG. FIG. 12 is a functional block diagram showing the configuration of the storage system. In this embodiment, an outline of a storage system will be described.

図1に示すように、本実施形態におけるストレージシステム100は、
ディスク装置111,112毎に当該ディスク装置に対する単位時間あたりの稼働状況を計測して、稼働した上記ディスク装置を稼働ディスクと判定し、稼働していない上記ディスク装置を非稼働ディスクと判定すると共に、単位時間当たりの上記ディスク装置における負荷を計測して、計測結果を記憶する性能監視部101と、
上記性能監視部による計測結果に基づいて、稼働ディスクと判定された上記ディスク装置に格納されているデータを、当該ディスク装置における負荷よりも高い負荷の他の上記ディスク装置に格納するデータ再配置部102と、
を備える。
As shown in FIG. 1, the storage system 100 in this embodiment is
For each of the disk devices 111 and 112, the operation status per unit time for the disk device is measured, the operating disk device is determined as an operating disk, the non-operating disk device is determined as a non-operating disk, A performance monitoring unit 101 that measures the load in the disk device per unit time and stores the measurement result;
A data rearrangement unit that stores data stored in the disk device determined to be an active disk based on a measurement result by the performance monitoring unit in another disk device having a higher load than the load in the disk device. 102,
Is provided.

そして、上記ストレージシステムでは、
上記性能監視部は、上記ディスク装置内の記憶領域が複数に分割された各区画における負荷を計測して、計測結果を記憶し、
上記データ再配置部は、上記性能監視部による計測結果に基づいて、稼働ディスクと判定された上記ディスク装置に形成された上記区画のうち、負荷が他の上記区画と比較して低い上記区画に格納されているデータを、稼働ディスクと判定された他の上記ディスク装置に格納する、
という構成を採る。
And in the above storage system,
The performance monitoring unit measures a load in each section in which the storage area in the disk device is divided into a plurality of parts, stores the measurement result,
The data rearrangement unit, in the partition formed in the disk device determined to be an active disk based on the measurement result by the performance monitoring unit, in the partition having a lower load than the other partition. Store the stored data in the other disk device determined to be an active disk.
The structure is taken.

また、上記ストレージシステムでは、
上記データ再配置部は、上記性能監視部による計測結果に基づいて、負荷が低い順から予め設定された順番までの上記区画に格納されているデータを、稼働ディスクと判定された他の上記ディスク装置に格納する、
という構成を採る。
In the above storage system,
The data rearrangement unit, based on the measurement result by the performance monitoring unit, data stored in the sections from the order of low load to the preset order, the other disks determined as active disks Store in the device,
The structure is taken.

上記発明によると、まず、ストレージシステムでは、ディスク装置毎に単位時間当たりの稼働状況を計測する。そして、単位時間あたりに稼働したディスク装置を稼働ディスクと判定し、単位時間あたりに稼働していないディスク装置を非稼働ディスクと判定する。これにより、例えば、非稼働ディスクと判定されたディスク装置を停止することで、ストレージシステム全体の省電力化を図ることができる。   According to the above invention, first, in the storage system, the operating status per unit time is measured for each disk device. Then, the disk device operating per unit time is determined as an active disk, and the disk device not operating per unit time is determined as a non-operating disk. As a result, for example, by stopping the disk device determined to be a non-working disk, it is possible to save power in the entire storage system.

また、ストレージシステムでは、上述したようにディスク装置毎の稼働状況を計測すると共に、ディスク装置における負荷、例えば、ディスク装置内に形成された各区画毎における負荷を計測して記憶している。そして、稼働ディスクであるディスク装置内に形成された区画のうち、負荷が他の区画と比較して低い区画に格納されているデータを、稼働ディスクである他のディスク装置に格納する。なお、上述したデータの移動は、負荷が低い区画順に実行してもよい。   Further, in the storage system, as described above, the operation status for each disk device is measured, and the load on the disk device, for example, the load for each partition formed in the disk device is measured and stored. Then, the data stored in the partition having a lower load than the other partitions among the partitions formed in the disk device that is the working disk is stored in the other disk device that is the working disk. Note that the above-described data movement may be executed in the order of sections with a low load.

これにより、データを稼働中の他のディスク装置に移動させたディスク装置は、もともと負荷が低かったため、その後、アクセスが減少して、非稼働ディスクとなる可能性が高くなる。そして、非稼働ディスクとなった場合には、上述したように、そのディスク装置を停止する。これにより、ストレージシステム全体のさらなる省電力化を図ることができる。   As a result, the disk device that has moved the data to another disk device that is in operation has a low load from the beginning, so that there is a high possibility that the access will be reduced and become a non-working disk. If the disk becomes a non-working disk, the disk device is stopped as described above. Thereby, further power saving of the entire storage system can be achieved.

また、上記ストレージシステムでは、
上記データ再配置部は、上記性能監視部による計測結果に基づいて、稼働ディスクと判定された上記ディスク装置に形成された上記区画のうち、負荷が他の上記区画と比較して高い上記区画における負荷を軽減するよう、上記各区画に格納されたデータの再配置を行う、
という構成を採る。
In the above storage system,
The data rearrangement unit, in the partition formed in the disk device determined to be an active disk based on the measurement result by the performance monitoring unit, in the partition having a higher load than the other partition. To relocate the data stored in each of the above partitions so as to reduce the load,
The structure is taken.

また、上記ストレージシステムの他の態様において、
上記データ再配置部は、稼働ディスクと判定された上記ディスク装置に形成された上記区画のうち、負荷が他の上記区画と比較して高い上記区画に格納されたデータの一部又は全部を、他の上記ディスク装置に格納して、データの再配置を行う、
という構成を採る。
In another aspect of the storage system,
The data rearrangement unit is a part or all of the data stored in the partition having a higher load than the other partition among the partitions formed in the disk device determined to be an active disk. Store it in the other disk devices above, and rearrange the data.
The structure is taken.

また、上記ストレージシステムでは、
上記データ再配置部は、非稼働ディスクと判定された上記ディスク装置を含めて、上記データの再配置を行う、
という構成を採る。
In the above storage system,
The data rearrangement unit rearranges the data including the disk device determined to be a non-working disk.
The structure is taken.

また、上記ストレージシステムでは、
上記データ再配置部は、上記性能監視部による計測結果に基づいて、負荷が高い順から予め設定された順番までの上記区画における負荷を軽減するよう、上記各区画に格納されたデータの再配置を行う、
という構成を採る。
In the above storage system,
The data rearrangement unit rearranges the data stored in each of the partitions so as to reduce the load on the partition from the highest load to a preset order based on the measurement result by the performance monitoring unit. I do,
The structure is taken.

また、上記ストレージシステムでは、
上記性能監視部は、上記各区画における単位時間あたりの入力開始から当該入力に対する出力完了までに要する時間であるターンアラウンドタイムの累積時間を、上記各区画における上記負荷として計測する、
という構成を採る。
In the above storage system,
The performance monitoring unit measures the accumulated time of turnaround time, which is the time required from the start of input per unit time in each section to the completion of output for the input, as the load in each section.
The structure is taken.

上記発明によると、ストレージシステムでは、負荷の高い区画に格納されたデータを分散あるいは複製して他のディスク装置に格納するなどして、データの再配置を行う。これにより、該当する区画が形成されたディスク装置の負荷が軽減されるため、ストレージシステム全体において電力が効率的に利用され、省電力化を図ることができる。   According to the above invention, in the storage system, data is rearranged by distributing or replicating data stored in a high-load partition and storing it in another disk device. As a result, the load on the disk device in which the corresponding partition is formed is reduced, so that power is efficiently used in the entire storage system, and power saving can be achieved.

そして、上述したストレージシステムは、コンピュータにプログラムが組み込まれることで実現できる。具体的に、本発明の他の形態であるプログラムは、コンピュータに、
ディスク装置毎に当該ディスク装置に対する単位時間あたりの稼働状況を計測して、稼働した上記ディスク装置を稼働ディスクと判定し、稼働していない上記ディスク装置を非稼働ディスクと判定すると共に、単位時間当たりの上記ディスク装置における負荷を計測して、計測結果を記憶する性能監視部と、
上記性能監視部による計測結果に基づいて、稼働ディスクと判定された上記ディスク装置に格納されているデータを、当該ディスク装置における負荷よりも高い負荷の他の上記ディスク装置に格納するデータ再配置部と、
を実現させるためのプログラムである。
The storage system described above can be realized by incorporating a program into a computer. Specifically, a program according to another embodiment of the present invention is stored in a computer.
For each disk device, measure the operating status per unit time for the disk device, determine that the disk device that was operating is an active disk, determine that the disk device that is not operating is a non-operating disk, and A performance monitoring unit for measuring the load on the disk device and storing the measurement result;
A data rearrangement unit that stores data stored in the disk device determined to be an active disk based on a measurement result by the performance monitoring unit in another disk device having a higher load than the load in the disk device. When,
It is a program for realizing.

そして、上記プログラムでは、
上記性能監視部は、上記ディスク装置内の記憶領域が複数に分割された各区画における負荷を計測して、計測結果を記憶し、
上記データ再配置部は、上記性能監視部による計測結果に基づいて、稼働ディスクと判定された上記ディスク装置に形成された上記区画のうち、負荷が他の上記区画と比較して低い上記区画に格納されているデータを、稼働ディスクと判定された他の上記ディスク装置に格納する、
という構成を採る。
And in the above program,
The performance monitoring unit measures a load in each section in which the storage area in the disk device is divided into a plurality of parts, stores the measurement result,
The data rearrangement unit, in the partition formed in the disk device determined to be an active disk based on the measurement result by the performance monitoring unit, in the partition having a lower load than the other partition. Store the stored data in the other disk device determined to be an active disk.
The structure is taken.

また、上記プログラムでは、
上記データ再配置部は、上記性能監視部による計測結果に基づいて、稼働ディスクと判定された上記ディスク装置に形成された上記区画のうち、負荷が他の上記区画と比較して高い上記区画における負荷を軽減するよう、上記各区画に格納されたデータの再配置を行う、
という構成を採る。
また、上述したストレージシステムが作動することにより実行される、本発明の他の形態であるデータ格納方法は、
ディスク装置毎に当該ディスク装置に対する単位時間あたりの稼働状況を計測して、稼働した上記ディスク装置を稼働ディスクと判定し、稼働していない上記ディスク装置を非稼働ディスクと判定すると共に、単位時間当たりの上記ディスク装置における負荷を計測して、計測結果を記憶して、性能監視を行い、
上記計測結果に基づいて、稼働ディスクと判定された上記ディスク装置に格納されているデータを、当該ディスク装置における負荷よりも高い負荷の他の上記ディスク装置に格納して、データの再配置を行う。
In the above program,
The data rearrangement unit, in the partition formed in the disk device determined to be an active disk based on the measurement result by the performance monitoring unit, in the partition having a higher load than the other partition. To relocate the data stored in each of the above partitions so as to reduce the load,
The structure is taken.
A data storage method according to another embodiment of the present invention, which is executed when the above-described storage system operates,
For each disk device, measure the operating status per unit time for the disk device, determine that the disk device that was operating is an active disk, determine that the disk device that is not operating is a non-operating disk, and Measure the load on the above disk device, store the measurement results, perform performance monitoring,
Based on the measurement result, data stored in the disk device determined to be an active disk is stored in another disk device having a higher load than the load in the disk device, and data is rearranged. .

また、上述したストレージシステムが作動することにより実行される、本発明の他の形態であるデータ格納方法は、
上記性能監視時に、上記ディスク装置内の記憶領域が複数に分割された各区画における負荷を計測して、計測結果を記憶し、
上記データの再配置時に、上記性能監視による計測結果に基づいて、稼働ディスクと判定された上記ディスク装置に形成された上記区画のうち、負荷が他の上記区画と比較して低い上記区画に格納されているデータを、稼働ディスクと判定された他の上記ディスク装置に格納する、
という構成を採る。
A data storage method according to another embodiment of the present invention, which is executed when the above-described storage system operates,
During the performance monitoring, measure the load in each partition into which the storage area in the disk device is divided into a plurality, and store the measurement results;
At the time of rearrangement of the data, among the partitions formed in the disk device determined to be an active disk based on the measurement result by the performance monitoring, the load is stored in the partition having a lower load than the other partitions. Store the stored data in the other disk device determined to be an active disk,
The structure is taken.

そして、上記データ格納方法の他の態様において、
上記データ再配置時は、上記性能監視による計測結果に基づいて、稼働ディスクと判定された上記ディスク装置に形成された上記区画のうち、負荷が他の上記区画と比較して高い上記区画における負荷を軽減するよう、上記各区画に格納されたデータの再配置を行う、
という構成を採る。
In another aspect of the data storage method,
At the time of the data rearrangement, among the partitions formed in the disk device determined to be an active disk based on the measurement result of the performance monitoring, the load in the partition is higher than that of the other partitions To relocate the data stored in each of the above partitions so as to reduce
The structure is taken.

上述した構成を有する、プログラム、又は、データ格納方法、の発明であっても、上記ストレージシステムと同様の作用を有するために、上述した本発明の目的を達成することができる。   Even the invention of the program or the data storage method having the above-described configuration can achieve the above-described object of the present invention because it has the same operation as the above storage system.

本発明は、ディスクアレイ装置、NAS装置、アグリゲートNAS装置、グリッドストレージなど、複数のディスク装置を搭載したストレージシステムに適用することができ、産業上の利用可能性を有する。   The present invention can be applied to a storage system including a plurality of disk devices such as a disk array device, a NAS device, an aggregate NAS device, and a grid storage, and has industrial applicability.

1 ファイル管理部
2 性能監視部
3 再配置候補リスト記憶部
4 ファイル再配置制御部
5 ファイル郡選別制御部
6,7,n ディスク装置
10,100 ストレージシステム
101 性能監視部
102 データ再配置制御部
111,112 ディスク装置
DESCRIPTION OF SYMBOLS 1 File management part 2 Performance monitoring part 3 Reallocation candidate list memory | storage part 4 File reallocation control part 5 File group selection control part 6, 7, n Disk apparatus 10,100 Storage system 101 Performance monitoring part 102 Data reallocation control part 111 112 disk unit

Claims (7)

ディスク装置毎に当該ディスク装置に対する単位時間あたりの稼働状況を計測して、稼働した前記ディスク装置を稼働ディスクと判定し、稼働していない前記ディスク装置を非稼働ディスクと判定すると共に、前記ディスク装置内の記憶領域が複数に分割された各区画における単位時間当たりの負荷を計測して、計測結果を記憶する性能監視部と、
前記性能監視部による計測結果に基づいて、稼働ディスクと判定された前記ディスク装置に形成された前記区画のうち、負荷が他の前記区画と比較して高い前記区画における負荷を軽減するよう、負荷が他の前記区画と比較して高い前記区画に格納されたデータの一部又は全部を、他の前記ディスク装置に格納して、データの再配置を行い、その後、前記性能監視部による計測結果に基づいて、稼働ディスクと判定された前記ディスク装置に形成された前記区画のうち、負荷が他の前記区画と比較して低い前記区画に格納されているデータを、稼働ディスクと判定された他の前記ディスク装置に格納するデータ再配置部と、
を備えたストレージシステム。
The operation status per unit time for each disk device is measured for each disk device, the operating disk device is determined as an operating disk, the non-operating disk device is determined as a non-operating disk, and the disk device the load per unit time in each compartment storage area of the inner is divided into a plurality measures, and performance monitoring unit for storing the measurement result,
Based on the measurement result by the performance monitoring unit , among the partitions formed in the disk device determined to be an active disk , the load is reduced so as to reduce the load in the partition that is higher than the other partitions. A part or all of the data stored in the partition that is higher than the other partition is stored in the other disk device, the data is rearranged, and then the measurement result by the performance monitoring unit Based on the above, among the partitions formed in the disk device determined to be an active disk, data stored in the partition having a lower load compared to the other partitions is determined to be an active disk. A data relocation unit for storing in the disk device ,
Storage system with
請求項1に記載のストレージシステムであって、
前記データ再配置部は、前記性能監視部による計測結果に基づいて、負荷が低い順から予め設定された順番までの前記区画に格納されているデータを、稼働ディスクと判定された他の前記ディスク装置に格納する、
ストレージシステム。
The storage system according to claim 1 ,
The data rearrangement unit, based on the measurement result of the performance monitoring unit, data stored in the partition from the order of low load to the preset order, the other disks determined as active disks Store in the device,
Storage system.
請求項又は2に記載のストレージシステムであって、
前記データ再配置部は、非稼働ディスクと判定された前記ディスク装置を含めて、前記データの再配置を行う、
ストレージシステム。
The storage system according to claim 1 or 2 ,
The data rearrangement unit rearranges the data including the disk device determined to be a non-working disk.
Storage system.
請求項乃至のいずれか一項に記載のストレージシステムであって、
前記データ再配置部は、前記性能監視部による計測結果に基づいて、負荷が高い順から予め設定された順番までの前記区画における負荷を軽減するよう、前記各区画に格納されたデータの再配置を行う、
ストレージシステム。
The storage system according to any one of claims 1 to 3 ,
The data rearrangement unit rearranges the data stored in each partition so as to reduce the load in the partition from the order of higher load to the preset order based on the measurement result by the performance monitoring unit. I do,
Storage system.
請求項乃至のいずれか一項に記載のストレージシステムであって、
前記性能監視部は、前記各区画における単位時間あたりの入力開始から当該入力に対する出力完了までに要する時間であるターンアラウンドタイムの累積時間を、前記各区画における前記負荷として計測する、
ストレージシステム。
The storage system according to any one of claims 1 to 4 , wherein
The performance monitoring unit measures, as the load in each partition, the accumulated time of turnaround time, which is the time required from the start of input per unit time in each partition to the completion of output for the input,
Storage system.
コンピュータに、
ディスク装置毎に当該ディスク装置に対する単位時間あたりの稼働状況を計測して、稼働した前記ディスク装置を稼働ディスクと判定し、稼働していない前記ディスク装置を非稼働ディスクと判定すると共に、前記ディスク装置内の記憶領域が複数に分割された各区画における単位時間当たりの負荷を計測して、計測結果を記憶する性能監視部と、
前記性能監視部による計測結果に基づいて、稼働ディスクと判定された前記ディスク装置に形成された前記区画のうち、負荷が他の前記区画と比較して高い前記区画における負荷を軽減するよう、負荷が他の前記区画と比較して高い前記区画に格納されたデータの一部又は全部を、他の前記ディスク装置に格納して、データの再配置を行い、その後、前記性能監視部による計測結果に基づいて、稼働ディスクと判定された前記ディスク装置に形成された前記区画のうち、負荷が他の前記区画と比較して低い前記区画に格納されているデータを、稼働ディスクと判定された他の前記ディスク装置に格納するデータ再配置部と、
を実現させるためのプログラム。
On the computer,
The operation status per unit time for each disk device is measured for each disk device, the operating disk device is determined as an operating disk, the non-operating disk device is determined as a non-operating disk, and the disk device the load per unit time in each compartment storage area of the inner is divided into a plurality measures, and performance monitoring unit for storing the measurement result,
Based on the measurement result by the performance monitoring unit , among the partitions formed in the disk device determined to be an active disk , the load is reduced so as to reduce the load in the partition that is higher than the other partitions. A part or all of the data stored in the partition that is higher than the other partition is stored in the other disk device, the data is rearranged, and then the measurement result by the performance monitoring unit Based on the above, among the partitions formed in the disk device determined to be an active disk, data stored in the partition having a lower load compared to the other partitions is determined to be an active disk. A data relocation unit for storing in the disk device ,
A program to realize
ディスク装置毎に当該ディスク装置に対する単位時間あたりの稼働状況を計測して、稼働した前記ディスク装置を稼働ディスクと判定し、稼働していない前記ディスク装置を非稼働ディスクと判定すると共に、前記ディスク装置内の記憶領域が複数に分割された各区画に単位時間当たりの負荷を計測して、計測結果を記憶して、性能監視を行い、
前記計測結果に基づいて、稼働ディスクと判定された前記ディスク装置に形成された前記区画のうち、負荷が他の前記区画と比較して高い前記区画における負荷を軽減するよう、負荷が他の前記区画と比較して高い前記区画に格納されたデータの一部又は全部を、他の前記ディスク装置に格納し、その後、前記計測結果に基づいて、稼働ディスクと判定された前記ディスク装置に形成された前記区画のうち、負荷が他の前記区画と比較して低い前記区画に格納されているデータを、稼働ディスクと判定された他の前記ディスク装置に格納して、データの再配置を行う、
データ格納方法。
The operation status per unit time for each disk device is measured for each disk device, the operating disk device is determined as an operating disk, the non-operating disk device is determined as a non-operating disk, and the disk device storage area of the inner is to measure the load per unit time in each compartment is divided into a plurality, and stores the measurement result, performs performance monitoring,
Based on the measurement result, among the partitions formed in the disk device determined to be an active disk , the load is other than the other so that the load in the partition is high compared to the other partitions. A part or all of the data stored in the partition higher than the partition is stored in the other disk device, and then formed on the disk device determined to be an active disk based on the measurement result. Among the partitions, data stored in the partition having a lower load than the other partitions is stored in another disk device determined to be an active disk, and data is rearranged.
Data storage method.
JP2009063903A 2009-03-17 2009-03-17 Storage system Expired - Fee Related JP5412902B2 (en)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2009063903A JP5412902B2 (en) 2009-03-17 2009-03-17 Storage system
PCT/JP2009/006901 WO2010106603A1 (en) 2009-03-17 2009-12-16 Storage system

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2009063903A JP5412902B2 (en) 2009-03-17 2009-03-17 Storage system

Publications (2)

Publication Number Publication Date
JP2010218193A JP2010218193A (en) 2010-09-30
JP5412902B2 true JP5412902B2 (en) 2014-02-12

Family

ID=42739277

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2009063903A Expired - Fee Related JP5412902B2 (en) 2009-03-17 2009-03-17 Storage system

Country Status (2)

Country Link
JP (1) JP5412902B2 (en)
WO (1) WO2010106603A1 (en)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP3079060B1 (en) * 2015-04-08 2018-03-28 Huawei Technologies Co., Ltd. Load balancing for large in-memory databases

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3613052B2 (en) * 1999-02-09 2005-01-26 日本電気株式会社 Computer-readable recording medium on which an operating system is recorded
JP2001093220A (en) * 1999-09-20 2001-04-06 Nec Eng Ltd Power saving control system and power saving control method in environment of plurality of hard disk drives
JP4414409B2 (en) * 2006-04-24 2010-02-10 富士通株式会社 Disk device, disk control method and program
JP4794370B2 (en) * 2006-06-20 2011-10-19 株式会社日立製作所 Storage system and storage control method that achieve both power saving and performance
JP4935331B2 (en) * 2006-12-06 2012-05-23 日本電気株式会社 Storage system, storage area selection method and program
JP2008217575A (en) * 2007-03-06 2008-09-18 Nec Corp Storage device and configuration optimization method thereof

Also Published As

Publication number Publication date
JP2010218193A (en) 2010-09-30
WO2010106603A1 (en) 2010-09-23

Similar Documents

Publication Publication Date Title
JP5629919B2 (en) How to place virtual volume hotspots in a storage pool using ongoing load measurement and ranking
JP4620722B2 (en) Data placement control program, data placement control device, data placement control method, and multi-node storage system
JP5490093B2 (en) Storage system and control method thereof
US8490106B2 (en) Apparatus for distributing resources to partitions in multi-processor system
JP3541744B2 (en) Storage subsystem and control method thereof
US8429346B1 (en) Automated data relocation among storage tiers based on storage load
US9823875B2 (en) Transparent hybrid data storage
CN103095805A (en) Cloud storage system of data intelligent and decentralized management
CN110096350B (en) Cold and hot area division energy-saving storage method based on cluster node load state prediction
JP2015528174A (en) Method and apparatus for managing storage arrays
KR101356033B1 (en) Hybrid Main Memory System and Task Scheduling Method therefor
Herodotou et al. Automating distributed tiered storage management in cluster computing
CN107273200B (en) Task scheduling method for heterogeneous storage
Liu et al. Analysis of and optimization for write-dominated hybrid storage nodes in cloud
JP5447523B2 (en) Data processing apparatus, data recording method, and data recording program
JP6115575B2 (en) Data set multiplicity changing device, server, data set multiplicity changing method, and computer program
CN102576294B (en) Storage system and method comprising a plurality of storage devices
JP6582721B2 (en) Control device, storage system, and control program
JP5412902B2 (en) Storage system
CN105808150A (en) Solid state disk caching system for hybrid storage device
JP7500991B2 (en) Storage control device and storage control program
JP2007272721A (en) Storage device and its control method
JP2010231465A (en) Storage system, storage power consumption reduction method, and program
CN103577340A (en) Memory management device and method and electronic device
CN102779017A (en) Control method of data caching area in solid state disc

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20111208

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20130716

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20130830

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20131015

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20131028

R150 Certificate of patent or registration of utility model

Ref document number: 5412902

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

LAPS Cancellation because of no payment of annual fees