JP6503072B2 - Semiconductor system and calculation method - Google Patents
Semiconductor system and calculation method Download PDFInfo
- Publication number
- JP6503072B2 JP6503072B2 JP2017537148A JP2017537148A JP6503072B2 JP 6503072 B2 JP6503072 B2 JP 6503072B2 JP 2017537148 A JP2017537148 A JP 2017537148A JP 2017537148 A JP2017537148 A JP 2017537148A JP 6503072 B2 JP6503072 B2 JP 6503072B2
- Authority
- JP
- Japan
- Prior art keywords
- spin
- data
- value
- chip
- unit
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 239000004065 semiconductor Substances 0.000 title claims description 190
- 238000004364 calculation method Methods 0.000 title claims description 65
- 230000003993 interaction Effects 0.000 claims description 118
- 230000005540 biological transmission Effects 0.000 claims description 95
- 230000015654 memory Effects 0.000 claims description 90
- 230000005366 Ising model Effects 0.000 claims description 83
- 238000000034 method Methods 0.000 claims description 30
- 238000012545 processing Methods 0.000 claims description 30
- 230000008569 process Effects 0.000 claims description 22
- 238000004220 aggregation Methods 0.000 claims description 14
- 230000002776 aggregation Effects 0.000 claims description 14
- 230000005283 ground state Effects 0.000 description 51
- 210000004027 cell Anatomy 0.000 description 48
- 238000010586 diagram Methods 0.000 description 37
- 238000013500 data storage Methods 0.000 description 36
- 238000003860 storage Methods 0.000 description 15
- 239000000243 solution Substances 0.000 description 13
- 230000010365 information processing Effects 0.000 description 9
- 230000000694 effects Effects 0.000 description 6
- 238000002347 injection Methods 0.000 description 4
- 239000007924 injection Substances 0.000 description 4
- 210000002569 neuron Anatomy 0.000 description 4
- 238000013528 artificial neural network Methods 0.000 description 3
- 230000006399 behavior Effects 0.000 description 3
- 230000008859 change Effects 0.000 description 3
- 238000004891 communication Methods 0.000 description 3
- 230000006870 function Effects 0.000 description 3
- 230000007274 generation of a signal involved in cell-cell signaling Effects 0.000 description 3
- 239000007787 solid Substances 0.000 description 3
- 230000007704 transition Effects 0.000 description 3
- 238000006243 chemical reaction Methods 0.000 description 2
- 238000007906 compression Methods 0.000 description 2
- 230000006835 compression Effects 0.000 description 2
- 238000013144 data compression Methods 0.000 description 2
- 238000009826 distribution Methods 0.000 description 2
- 238000004519 manufacturing process Methods 0.000 description 2
- 230000003068 static effect Effects 0.000 description 2
- 239000000126 substance Substances 0.000 description 2
- 208000033748 Device issues Diseases 0.000 description 1
- 230000002457 bidirectional effect Effects 0.000 description 1
- 210000004556 brain Anatomy 0.000 description 1
- 230000003139 buffering effect Effects 0.000 description 1
- 230000015556 catabolic process Effects 0.000 description 1
- 230000000295 complement effect Effects 0.000 description 1
- 239000000470 constituent Substances 0.000 description 1
- 230000010485 coping Effects 0.000 description 1
- 238000013480 data collection Methods 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000018109 developmental process Effects 0.000 description 1
- 238000009434 installation Methods 0.000 description 1
- 230000010354 integration Effects 0.000 description 1
- 229910044991 metal oxide Inorganic materials 0.000 description 1
- 150000004706 metal oxides Chemical class 0.000 description 1
- 239000000203 mixture Substances 0.000 description 1
- 210000003061 neural cell Anatomy 0.000 description 1
- 238000005457 optimization Methods 0.000 description 1
- 238000003672 processing method Methods 0.000 description 1
- 238000011084 recovery Methods 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 230000010076 replication Effects 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 230000011218 segmentation Effects 0.000 description 1
- 238000004904 shortening Methods 0.000 description 1
- 230000000946 synaptic effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F15/00—Digital computers in general; Data processing equipment in general
- G06F15/76—Architectures of general purpose stored program computers
- G06F15/80—Architectures of general purpose stored program computers comprising an array of processing units with common control, e.g. single instruction multiple data processors
Landscapes
- Engineering & Computer Science (AREA)
- Computer Hardware Design (AREA)
- Theoretical Computer Science (AREA)
- Computing Systems (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Multi Processors (AREA)
- Mram Or Spin Memory Techniques (AREA)
Description
本発明は、半導体システムおよび計算方法に関し、特に、大規模かつ複雑な相互作用モデルの計算を行う半導体システムおよび計算方法に適用して好適なものである。 The present invention relates to a semiconductor system and a calculation method, and is particularly suitable to be applied to a semiconductor system and a calculation method for calculating a large-scale and complex interaction model.
種々の物理現象や社会現象は相互作用モデルで表現することができる。相互作用モデルとは、モデルを構成する複数個のノードと、ノード間の相互作用、さらに必要であればノード毎のバイアスで定義されるモデルである。物理学や社会科学では種々のモデルが提案されているが、いずれも相互作用モデルの一形態であると解釈できる。 Various physical phenomena and social phenomena can be expressed by interaction models. The interaction model is a model defined by a plurality of nodes constituting the model, interactions among the nodes, and, if necessary, a bias for each node. Various models have been proposed in physics and social sciences, but they can all be interpreted as a form of interaction model.
物理学の世界で代表的な相互作用モデルの例として、イジングモデルをあげることができる。イジングモデルは磁性体の振舞いを説明するための統計力学のモデルである。イジングモデルは+1/−1(ないしは、0/1、上/下)の2値をとるスピンと、スピン間の相互作用を示す相互作用係数と、スピン毎にある外部磁場係数とで定義される。 The Ising model can be mentioned as an example of a typical interaction model in the world of physics. The Ising model is a model of statistical mechanics for explaining the behavior of a magnetic substance. The Ising model is defined by binary spins of + 1 / -1 (or 0/1, up / down), an interaction coefficient indicating an interaction between spins, and an external magnetic field coefficient for each spin .
イジングモデルは与えられたスピン配列、相互作用係数、及び、外部磁場係数から、その時のエネルギーを計算することができる。イジングモデルのエネルギー関数は一般的に次式で表わされる。 The Ising model can calculate the energy at that time from the given spin arrangement, interaction coefficient, and external magnetic field coefficient. The energy function of the Ising model is generally expressed by the following equation.
なお、σi,σjはそれぞれi番目とj番目のスピンの値、Jijはi番目とj番目のスピンの間の相互作用係数、hiはi番目のスピンに対する外部磁場係数、σはスピンの配列を表わすものとする。Note that σ i and σ j are the values of the i-th and j-th spins, J ij is the interaction coefficient between the i-th and j-th spins, h i is the external magnetic field coefficient for the i-th spin, and σ is Let us denote the arrangement of spins.
(1)式において、第一項は、スピン間の相互作用に起因するエネルギーを計算するものである。一般的にイジングモデルは無向グラフとして表現され、i番目スピンからj番目スピンへの相互作用と、j番目スピンからi番目スピンへの相互作用を区別することはない。そのため、第一項ではi<jを満たすσi,σjの組み合わせについて、相互作用係数の影響を計算している。また第二項は、各スピンに対する外部磁場に起因するエネルギーを計算するものである。In the equation (1), the first term is to calculate the energy resulting from the interaction between spins. In general, the Ising model is expressed as an undirected graph, and does not distinguish the interaction from the i-th spin to the j-th spin and the interaction from the j-th spin to the i-th spin. Therefore, in the first term, the influence of the interaction coefficient is calculated for the combination of σ i and σ j satisfying i <j. The second term is to calculate the energy attributable to the external magnetic field for each spin.
イジングモデルの基底状態探索とは、イジングモデルのエネルギー関数を最小化するスピンの配列を求める最適化問題である。相互作用係数及び外部磁場係数の値域に制限を付けないときには、トポロジが非平面グラフになるイジングモデルの基底状態を求めることはNP困難問題であることが知られている。 The ground state search of the Ising model is an optimization problem for finding an arrangement of spins that minimizes the energy function of the Ising model. It is known that finding the ground state of the Ising model in which the topology becomes a nonplanar graph is an NP-hard problem when the value range of the interaction coefficient and the external magnetic field coefficient is not limited.
イジングモデルの基底状態探索は、元々イジングモデルが対象としていた磁性体の振る舞いを説明することのみならず、様々な用途に用いられている。これは、イジングモデルが相互作用に基づく最も単純なモデルであり、同様に相互作用に起因する様々な事象を表現する能力を持っているためである。 The ground state search of the Ising model is used not only for explaining the behavior of the magnetic substance originally intended for the Ising model but also for various applications. This is because Ising's model is the simplest model based on interaction, and also has the ability to represent various events resulting from interaction.
また、イジングモデルの基底状態探索は、NP困難なグラフ問題として知られている最大カット問題にも対応する。このようなグラフ問題は、ソーシャルネットワークにおけるコミュニティの検出や、画像処理におけるセグメンテーションなど、幅広い応用を持っている。そのため、イジングモデルの基底状態探索を行うソルバがあれば、このような様々な問題に適用することができる。 Also, the ground state search of the Ising model corresponds to the maximum cut problem known as the NP-hard graph problem. Such graph problems have wide applications, such as community detection in social networks and segmentation in image processing. Therefore, if there is a solver that searches the ground state of Ising model, it can be applied to such various problems.
ところで、イジングモデルの基底状態を求めることは、前述したようにNP困難問題である。したがって、ノイマン型コンピュータで解くことは計算時間の面で困難を伴う。ヒューリステックを導入して高速化を図るアルゴリズムも提案されているが、ノイマン型コンピュータではなく物理現象を利用した計算、すなわちアナログコンピュータでイジングモデルの基底状態を高速に求める方法が提案されている。例えば、このような装置として、特許文献1に記載の装置がある。
Finding the ground state of the Ising model is an NP-hard problem as described above. Therefore, solving with a von Neumann computer involves difficulties in terms of calculation time. An algorithm for speeding up with the introduction of heuristics has also been proposed, but a calculation using physical phenomena instead of a von Neumann computer, that is, a method for rapidly obtaining the ground state of Ising model by an analog computer has been proposed. For example, as such an apparatus, there is an apparatus described in
前記特許文献1に記載のような装置では、解くべき問題に対応した並列度が必要になってくる。イジングモデルの場合では、基底状態を探索すべきイジングモデルのスピン数に対応して、それぞれのスピンや、当該スピンにおける他のスピンとの相互作用を表現する素子(以下、これを単位素子と呼ぶ)が必要となる。例えば、前記特許文献1に開示された装置では、スピンとレーザを対応させているため、スピン数に比例した数のレーザが必要となる。すなわち、多数の単位素子を搭載可能なスケーラビリティの高さが必要となる。
In the apparatus described in
以上のことを考慮した場合、単位素子を規則的に多数並べて実現できる半導体のような固体素子でイジングモデルの基底状態探索を行えることが望ましい。特に、DRAM(Dynamic Random Access Memory)やSRAM(Static Random Access Memory)などの記憶装置に代表されるようなアレイ構造であり、かつ集積性を高められるように単位要素が単純な構造であることが望ましい。 In consideration of the above, it is desirable that the ground state search of the Ising model can be performed by a solid element such as a semiconductor which can be realized by arranging a large number of unit elements regularly. In particular, it has an array structure represented by a storage device such as a dynamic random access memory (DRAM) or a static random access memory (SRAM), and has a simple unit element so as to improve integration. desirable.
例えば、多数のスピンを含む大規模なイジングモデルの基底状態を探索可能な半導体システムを構築するためには、単位素子をスピン数に応じた数だけ半導体チップに搭載する必要がある。そして、イジングモデルのサイズより半導体チップが対応可能なスピン数が大きく、イジングモデルが漏れなく半導体チップに写像可能であることが望ましい。しかし、解くべき問題の問題サイズが拡大することを考慮すると、1個の半導体チップだけで対応した場合、チップサイズが大きくなり、また製造コストも高くなる。従って、このような半導体システムを実現するに際しては、ある程度の数の単位素子が搭載された半導体チップを複数使用するようにして構築することが望ましい。 For example, in order to construct a semiconductor system capable of searching for the ground state of a large scale Ising model including a large number of spins, it is necessary to mount unit elements on the semiconductor chip in a number corresponding to the number of spins. Then, it is desirable that the number of spins that the semiconductor chip can handle is larger than the size of the Ising model, and that the Ising model can be mapped onto the semiconductor chip without leakage. However, considering that the problem size of the problem to be solved increases, if only one semiconductor chip is used, the chip size increases and the manufacturing cost also increases. Therefore, in order to realize such a semiconductor system, it is desirable to construct a plurality of semiconductor chips on which a certain number of unit elements are mounted.
さらに、同一の半導体チップを複数使用する場合は、例えば、最も単純な2次元格子で説明すると、半導体チップがX方向とY方向でタイル状に並べられ、隣接する半導体チップ間は配線にて接続される。この場合、半導体チップの接続は、チップの4方向で実施可能で、隣接チップ間でのデータ伝送は可能であり、上下左右のチップ拡張で大規模な問題を解くことを可能にする。しかし、より複雑な大規模問題を解く場合は、それに合わせて拡張方法の複雑化にも対応する必要がある。 Furthermore, in the case of using a plurality of identical semiconductor chips, for example, in the case of the simplest two-dimensional lattice, semiconductor chips are arranged in a tile in the X direction and Y direction, and adjacent semiconductor chips are connected by wiring Be done. In this case, the connection of the semiconductor chip can be performed in four directions of the chip, data transmission between adjacent chips is possible, and it is possible to solve a large-scale problem by up, down, left, and right chip expansion. However, when solving a more complicated large-scale problem, it is necessary to cope with the complexity of the extension method accordingly.
本発明の目的は、例えばイジングモデルなどのような大規模かつ複雑な相互作用モデルの計算を行うことができ、安価かつ容易に製造可能な半導体システムおよび計算方法を提供することにある。 An object of the present invention is to provide an inexpensive and easily manufacturable semiconductor system and calculation method capable of calculating a large scale and complex interaction model such as Ising model.
本発明の前記ならびにその他の目的と新規な特徴は、本明細書の記述および添付図面から明らかになるであろう。 The above and other objects and novel features of the present invention will be apparent from the description of the present specification and the accompanying drawings.
本願において開示される発明のうち、代表的なものの概要を簡単に説明すれば、下記の通りである。 The outline of typical ones of the inventions disclosed in the present application will be briefly described as follows.
一実施の形態における半導体システムは、複数の半導体チップと、前記複数の半導体チップに接続されたコントローラとを備える半導体システムである。前記複数の半導体チップの各々は、複数のノード間の相互作用によって処理が実行される相互作用モデルで表現された問題データの各ノードの値が格納される第1のメモリと、前記問題データの各ノードに関する係数が格納される第2のメモリと、前記第1のメモリに格納された前記各ノードの値を更新する演算回路とを含むユニットを複数備える。 The semiconductor system in one embodiment is a semiconductor system provided with a plurality of semiconductor chips and a controller connected to the plurality of semiconductor chips. Each of the plurality of semiconductor chips includes: a first memory in which the value of each node of the problem data represented by the interaction model in which processing is executed by interaction among the plurality of nodes; A plurality of units are provided including a second memory in which coefficients related to each node are stored, and an arithmetic circuit that updates the value of each node stored in the first memory.
前記コントローラは、処理対象とする問題データの各ノードの値が格納される第3のメモリと、前記処理対象とする問題データの各ノードに関する係数が格納される第4のメモリと、前記処理対象とする問題データのサイズと、制御対象とする前記半導体チップのチップ数と、1チップで処理可能な問題データのサイズとを設定するレジスタと、前記レジスタの設定値に基づき、前記第3及び前記第4のメモリのアドレスと前記複数の半導体チップの各々のアドレスとの対応関係を設定するアドレス生成部と、前記対応関係に基づき、前記第3及び前記第4のメモリに格納された前記各ノードの値及び前記係数を前記複数の半導体チップへ伝送するデータ展開部と、前記複数の半導体チップの前記第1のメモリに格納された前記各ノードの値を受信し、前記対応関係に基づき前記第3のメモリへ格納するデータ集計部とを備える。 The controller is a third memory in which the value of each node of the problem data to be processed is stored, a fourth memory in which a coefficient related to each node of the problem data to be processed is stored, and the processing object The third and the third are based on a register for setting the size of problem data to be taken, the number of chips of the semiconductor chip to be controlled, and the size of problem data that can be processed in one chip, and the set value of the register. An address generation unit for setting a correspondence between an address of a fourth memory and an address of each of the plurality of semiconductor chips; and each of the nodes stored in the third and the fourth memories based on the correspondence. And a data expansion unit for transmitting the coefficient and the coefficient to the plurality of semiconductor chips, and the values of the respective nodes stored in the first memory of the plurality of semiconductor chips Receiving, and a data aggregation unit for storing said to correspond based on the relationship the third memory.
一実施の形態における計算方法は、複数の半導体チップと、前記複数の半導体チップに接続されたコントローラとを備える半導体システムの計算方法である。前記半導体システムは、上述した一実施の形態における半導体システムと同様の構成を備える。そして、前記アドレス生成部は、前記レジスタの設定値に基づき、前記第3及び前記第4のメモリのアドレスと前記複数の半導体チップの各々のアドレスとの対応関係を設定する。前記データ展開部は、前記対応関係に基づき、前記第3及び前記第4のメモリに格納された前記各ノードの値及び前記係数を前記複数の半導体チップへ伝送する。前記データ集計部は、前記複数の半導体チップの前記第1のメモリに格納された前記各ノードの値を受信し、前記対応関係に基づき前記第3のメモリへ格納する。 The calculation method in one embodiment is a calculation method of a semiconductor system including a plurality of semiconductor chips and a controller connected to the plurality of semiconductor chips. The semiconductor system has the same configuration as the semiconductor system in the above-described embodiment. Then, the address generation unit sets the correspondence between the addresses of the third and fourth memories and the addresses of the plurality of semiconductor chips based on the set value of the register. The data expansion unit transmits the values of the nodes and the coefficients stored in the third and fourth memories to the plurality of semiconductor chips based on the correspondence relationship. The data aggregation unit receives the value of each of the nodes stored in the first memory of the plurality of semiconductor chips, and stores the value in the third memory based on the correspondence.
本願において開示される発明のうち、代表的なものによって得られる効果を簡単に説明すれば、以下の通りである。 The effects obtained by typical ones of the inventions disclosed in the present application will be briefly described as follows.
一実施の形態によれば、例えばイジングモデルなどのような大規模かつ複雑な相互作用モデルの計算を行うことができ、安価かつ容易に製造可能な半導体システムおよび計算方法を実現することができる。 According to one embodiment, a large-scale and complex interaction model such as Ising model can be calculated, and an inexpensive and easily manufacturable semiconductor system and calculation method can be realized.
以下の実施の形態においては、便宜上その必要があるときは、複数のセクションまたは実施の形態に分割して説明するが、特に明示した場合を除き、それらは互いに無関係なものではなく、一方は他方の一部または全部の変形例、詳細、補足説明等の関係にある。また、以下の実施の形態において、要素の数等(個数、数値、量、範囲等を含む)に言及する場合、特に明示した場合および原理的に明らかに特定の数に限定される場合等を除き、その特定の数に限定されるものではなく、特定の数以上でも以下でもよい。 In the following embodiments, when it is necessary for the sake of convenience, it will be described by dividing into a plurality of sections or embodiments, but unless specifically stated otherwise, they are not mutually unrelated, one is the other And some or all of the variations, details, and supplementary explanations. Further, in the following embodiments, when referring to the number of elements (including the number, numerical value, quantity, range, etc.), it is particularly pronounced and clearly limited to a specific number in principle. It is not limited to the specific number except for the number, and may be more or less than the specific number.
さらに、以下の実施の形態において、その構成要素(要素ステップ等も含む)は、特に明示した場合および原理的に明らかに必須であると考えられる場合等を除き、必ずしも必須のものではないことは言うまでもない。同様に、以下の実施の形態において、構成要素等の形状、位置関係等に言及するときは、特に明示した場合および原理的に明らかにそうでないと考えられる場合等を除き、実質的にその形状等に近似または類似するもの等を含むものとする。このことは、上記数値および範囲についても同様である。 Furthermore, in the following embodiments, the constituent elements (including element steps and the like) are not necessarily essential unless explicitly stated or considered to be obviously essential in principle. Needless to say. Similarly, in the following embodiments, when referring to the shapes, positional relationships and the like of components etc., the shapes thereof are substantially the same unless particularly clearly stated and where it is apparently clearly not so in principle. It is assumed that it includes things that are similar or similar to etc. The same applies to the above numerical values and ranges.
以下、実施の形態を図面に基づいて詳細に説明する。なお、実施の形態を説明するための全図において、同一の部材には原則として同一の符号または関連する符号を付し、その繰り返しの説明は省略する。また、以下の実施の形態では、特に必要なとき以外は同一または同様な部分の説明を原則として繰り返さない。
[第1の実施の形態]Hereinafter, embodiments will be described in detail based on the drawings. Note that, in all the drawings for describing the embodiments, the same symbol is attached to the same member in principle, and the same symbol or a related symbol is attached, and the repeated explanation thereof is omitted. Further, in the following embodiments, the description of the same or similar parts will not be repeated in principle unless particularly required.
First Embodiment
第1の実施の形態は、例えばイジングモデルなどのような大規模かつ複雑な相互作用モデルの計算を行うことができ、安価かつ容易に製造可能な半導体システムに関する。
<相互作用モデル>The first embodiment relates to an inexpensive and easily manufacturable semiconductor system capable of calculating a large-scale and complex interaction model such as Ising model, for example.
<Interaction model>
種々の物理現象や社会現象は相互作用モデルで表現することができる。相互作用モデルとは、モデルを構成する複数個のノードと、ノード間の相互作用、さらに必要であればノード毎のバイアスで定義されるモデルである。物理学や社会科学では種々のモデルが提案されているが、いずれも相互作用モデルの一形態であると解釈できる。 Various physical phenomena and social phenomena can be expressed by interaction models. The interaction model is a model defined by a plurality of nodes constituting the model, interactions among the nodes, and, if necessary, a bias for each node. Various models have been proposed in physics and social sciences, but they can all be interpreted as a form of interaction model.
また、相互作用モデルの特徴として、ノード間の影響を2個のノード間の相互作用に限定している(2体間の相互作用)ことがあげられる。例えば、宇宙空間にある惑星の力学を考えてみると、惑星というノードの間に万有引力による相互作用がある点で相互作用モデルの一種とも解釈できるが、惑星間の影響は2個の惑星間にとどまらず、3個以上の惑星が互いに影響し合って複雑な挙動を示す(いわゆる3体問題や多体問題と言われる問題になる)。 Also, as a feature of the interaction model, the influence between nodes is limited to the interaction between two nodes (the interaction between two bodies). For example, considering the dynamics of planets in space, it can be interpreted as a kind of interaction model in that there is universal interaction between nodes called planets, but the inter-planet effect is between two planets Besides, three or more planets interact with each other to show complicated behavior (a problem called so-called three-body problem or many-body problem).
物理学の世界で代表的な相互作用モデルの例として、イジングモデルをあげることができる。イジングモデルとは+1/−1(ないしは上、下など)の2状態を取るスピンをノードとして、2個のスピン間の相互作用を決める相互作用係数と、個々のスピンに対するバイアスである外部磁場係数でモデルが定義される。 The Ising model can be mentioned as an example of a typical interaction model in the world of physics. The Ising model is an interaction coefficient that determines the interaction between two spins with a spin taking two states of + 1 / -1 (or up, down, etc.) as a node, and an external magnetic field coefficient that is a bias for each spin The model is defined by
また、生物学の世界では脳をモデル化したニューラルネットワークが相互作用モデルの一例である。ニューラルネットワークは神経細胞のニューロンを模した人工ニューロンをノードとして、人工ニューロン間はシナプス結合という相互作用を持つ。また、各ニューロン毎にバイアスを与える場合もある。 Also, in the world of biology, neural networks that model the brain are an example of interaction models. A neural network is an artificial neuron that simulates a neuron of a neural cell as a node, and the artificial neuron has an interaction of synaptic connection. In addition, each neuron may be biased.
社会科学の世界では、例えば人間のコミュニケーションを考えると、人間というノードと言語や通信で成される相互作用があることは容易に理解できよう。また、各人間には個別にバイアスがあることも想像できる。そのため、人間のコミュニケーションを、相互作用モデルという点で共通なイジングモデル等に模してその特性を明らかにしようという研究もなされている。 In the social sciences world, for example, considering human communication, it can be easily understood that there is an interaction between human nodes and language and communication. You can also imagine that each person has its own bias. For this reason, research has also been made to imitate human communication as an Ising model common in terms of interaction models and clarify its characteristics.
以下においては、イジングモデルの基底状態探索を行う半導体システム、およびこの半導体システムを含む情報処理システムの例を説明する。
<イジングモデル>In the following, an example of a semiconductor system for performing a ground state search of Ising model and an information processing system including the semiconductor system will be described.
<Ising model>
本実施の形態では、イジングモデルを拡張した、以下の(2)式で示されるモデルを、これ以降イジングモデルと呼ぶものとする。 In the present embodiment, a model expressed by the following equation (2), which is an extension of the Ising model, is hereinafter referred to as the Ising model.
(1)式で示したイジングモデルとの違いは、(2)式では有向グラフで示されるような相互作用が許されることにある。一般的にイジングモデルはグラフ理論では無向グラフとして描画することができる。それは、イジングモデルの相互作用は、i番目スピンからj番目スピンへの相互作用係数Ji,jとj番目スピンからi番目スピンへの相互作用係数Jj,iとを区別していないことによる。The difference from the Ising model shown by the equation (1) is that the interaction as shown by the digraph in the equation (2) is allowed. In general, the Ising model can be drawn as an undirected graph in graph theory. That is because the interaction of Ising model does not distinguish the interaction coefficient J i, j from the i-th spin to the j- th spin and the interaction coefficient J j, i from the j-th spin to the i-th spin .
本実施の形態では、イジングモデルを拡張し、Ji,jとJj,iとを区別しても適用できるため、有向グラフ化したイジングモデルを取り扱う。なお、無向グラフのイジングモデルを有向グラフのイジングモデルで取り扱う場合には、単にJi,jとJj,iとの双方向に同じ相互作用係数を定義することで可能である。この場合、同じモデルでも(1)式のエネルギー関数に対して(2)式のエネルギー関数ではエネルギーの値が2倍になる。In this embodiment, since the Ising model can be extended and applied even if J i, j and J j, i are distinguished, a directed graphing Ising model is handled. When the Ising model of an undirected graph is handled in a directed graph Ising model, it is possible by simply defining the same interaction coefficient in both directions of J i, j and J j, i . In this case, even with the same model, the energy value of the equation (2) is doubled with respect to the energy function of the equation (1).
以上を前提に、以降、本実施の形態における半導体システム、およびそれを含む情報処理システムについて説明する。
<半導体システムを含む情報処理システム>Based on the above, hereinafter, the semiconductor system according to the present embodiment and an information processing system including the same will be described.
<Information processing system including semiconductor system>
図1は、本実施の形態における半導体システムを含む情報処理システムの全体構成の一例を示したブロック図である。図1に示す情報処理システムにおいて、101はCPU(Central Processing Unit)、102はメモリ、103は記憶装置、104は半導体システム、105はシステムバスである。この情報処理システムは、パーソナルコンピュータやワークステーション又はサーバなどから構成され、システムバス105を介してCPU101、メモリ102、記憶装置103及び複数の半導体システム104が接続される。
FIG. 1 is a block diagram showing an example of the entire configuration of an information processing system including a semiconductor system according to the present embodiment. In the information processing system shown in FIG. 1, 101 is a CPU (Central Processing Unit), 102 is a memory, 103 is a storage device, 104 is a semiconductor system, and 105 is a system bus. The information processing system includes a personal computer, a work station or a server, and the
CPU101は、情報処理システム全体の動作制御を司るプロセッサである。このCPU101は、演算装置に相当する。またメモリ102は、例えば揮発性の半導体メモリから構成され、各種プログラムを記憶するために利用される。記憶装置103は、例えばハードディスク装置やSSD(Solid State Drive)などから構成され、プログラムやデータを長期間保持するために利用される。
The
記憶装置103には、本情報処理システムが解くべきイジング形式の問題データ(計算用データ)が格納される。
The
半導体システム104は、イジングモデルの基底状態探索を行う専用ハードウェアである。図1では、2つの半導体システム104を図示しているが、1つや3つ以上の場合もあり得る。
<半導体システム>The
<Semiconductor system>
図2は、半導体システム104の構成の一例を示したブロック図である。図2に示すように、半導体システム104は、コントローラ106、システムI/F107、レジスタ108、データ処理部109、クロック生成部110、問題データ格納部111、スピンデータ格納部112、相互作用制御信号生成部127、乱数発生部128、データI/F113、スイッチ114及び半導体チップ群115を備えて構成され、システムI/F107及びシステムバス105を介してCPU101との間でコマンドやデータの送受を行う。
FIG. 2 is a block diagram showing an example of the configuration of the
半導体チップ群115は、それぞれが単体でイジングモデルの基底状態探索を行う専用のハードウェアである複数の半導体チップ116から構成される。また、半導体チップ116間はチップ間配線117により接続されており、このチップ間配線117を介して半導体チップ116同士が必要な情報を送受する。
The
システムI/F107は、システムバス105を介して、コマンドやパラメータ値、各種データが入力され、入力されたコマンドやパラメータ値、各種データをレジスタ108やデータ処理部109に転送する。
The system I /
問題データ格納部111は、イジングモデルの相互作用係数と外部磁場係数を格納するブロックであり、システムI/F107を介して記憶装置103に格納された問題データが転送される。すなわち、問題データ格納部111は、記憶装置103に格納された、イジングモデルの基底状態探索を実施するための計算用データを格納する第1記憶領域である。
The problem
スピンデータ格納部112は、イジングモデルのスピンの値を格納するブロックであり、システムI/F107を介して記憶装置103に格納されたスピンデータが転送される。また、スピンデータ格納部112は、データ集計部126で集計した結果を格納する第2記憶領域である。
The spin
レジスタ108は、例えば図2を例にすると、相互作用係数と外部磁場係数とスピンで表現される問題のサイズを規定する問題設定レジスタ118と、コントローラ106が制御対象とする半導体チップ116のチップ数を規定するチップ数設定レジスタ120と、1チップで対応可能な問題のサイズを規定するチップ仕様設定レジスタ121で構成する。本レジスタ値は、システムI/F107を介して設定され、コントローラ106内、例えばデータ処理部109で参照される。
For example, in the case of FIG. 2, the
データ処理部109は、チップ間接続部122と、アドレス生成部123と、データ生成部124と、展開部125と、データ集計部126で構成され、システムバス105とシステムI/F107を介して、記憶装置103から伝送される問題データを複数の半導体チップ116に展開するための処理を実施する。
The
詳細は後述するが、アドレス生成部123は、問題設定レジスタ118と、チップ数設定レジスタ120と、チップ仕様設定レジスタ121を参照して、問題データ格納部111とスピンデータ格納部112に格納された各データのアドレスと、伝送先であるチップ番号とローカルアドレスの関係を規定する。
Although the details will be described later, the
データ生成部124は、指定されたアドレスに対応する問題データを問題データ格納部111から読み出し、スピンデータ格納部112からスピンデータを読み出す。そして展開部125は、半導体チップ116毎のデータ伝送を実現するため、伝送データに対して、伝送先のチップ番号と問題データ/スピンデータの判定信号を付与し、データI/F113に転送する。
The data generation unit 124 reads out the problem data corresponding to the designated address from the problem
データ集計部126は、複数の半導体チップ116が処理した結果をスイッチ114とデータI/F113を介して回収して集計し、処理結果であるスピン値をスピンデータ格納部112に書き込む。なお、データ集計部126では、前述したアドレス生成部123で実現する各データのアドレスと、伝送先であるチップ番号とローカルアドレスの関係を規定に対して逆変換を実施する。つまり、スイッチ114を介して入力されるチップ番号、問題データ/スピンデータの判定信号とローカルアドレスを、スピンデータ格納部112のアドレスに変換して、データでスピンデータ格納部112上のスピン値を更新する。
The
チップ間接続部122は、実装上チップが隣接していなくともあたかも接続しているような処理を実施するブロックである。詳細動作は後述するが、チップ間接続部122は、スピンデータ格納部112に格納されたスピン値を処理するブロックであり、任意のアドレスAのスピン値を別のアドレスBのスピンに上書きすることで、アドレスAに対応する計算結果をアドレスBに対応するスピン値に反映させる動作を実施する。
The chip-to-
データI/F113は、コントローラ106と半導体チップ群115間でデータを送受信するインタフェースである。例えば、図2で図示はしていないが、バッファを有しており、展開部125から転送された全てのデータがスイッチ114を介して半導体チップ群115へ転送されるように制御される。
The data I /
クロック生成部110は、コントローラ106の外部から入力されるベースクロックCLKを基準に、コントローラ106内部の論理回路を動作させるクロック1と、複数の半導体チップ116を動作させるクロック2と、半導体チップ116間のデータ伝送に使用するクロック3を生成する。
The
相互作用制御信号生成部127は、半導体チップ116における相互作用動作を実現するためのアドレス信号とクロック信号を生成するブロックである。
The interaction control signal generation unit 127 is a block that generates an address signal and a clock signal for realizing an interaction operation in the
乱数発生部128は、半導体チップ116に対して供給されるRND信号を発生させるブロックである。詳細は後述するが、RND信号を使用することで、グラフ問題における局所最適解から脱出し、大域最適解への収束性を向上させる。
The random
スイッチ114は、コントローラ106と半導体チップ群115を構成する複数の半導体チップ116が接続され、データ処理部109が生成するルールに従って、複数の半導体チップ116への問題データとスピンデータの展開と、複数の半導体チップ116からのスピンデータの回収を実施する。これにより、半導体チップ116間のデータ伝送も実現する。
<コントローラの制御>The
<Control of controller>
図3は、コントローラ106の制御の一例を示した図である。本実施の形態において、コントローラ106は、データ処理部109において、問題設定レジスタ118、チップ数設定レジスタ120及びチップ仕様設定レジスタ121で構成するレジスタ108を参照することにより、設定される解くべき問題サイズに対して、制御対象である半導体チップ116の数が多いか少ないかを判断することができる。
FIG. 3 is a diagram showing an example of control of the
図3では、レジスタ108を参照した場合のコントローラ106の制御例として、ケース1、ケース2、ケース3を示している。いずれの場合も、チップ仕様設定レジスタ121に設定された半導体チップの1つが対応可能な問題サイズが128(サイズ幅)×80(ライン数)×2(Z方向)で、3次元格子であるものとする。
In FIG. 3,
ケース1は、チップ数設定レジスタ120に設定されたチップ数は1と設定され、問題設定レジスタ118に設定された問題サイズも128×80×2の場合である。この場合は、問題サイズと半導体チップ群115で対応可能なサイズとが等しいため、破綻が無く求解可能「o.k.」と判断できる。ケース1の場合、電源制御においてすべてのチップをオンにする。
In
また、ケース2は、問題サイズ(260×160×2)に対してチップ数(4)が少ない場合で、求解不可能「NG」と判断できる。この場合は、例えば、問題変換プログラムに対して警告を発することができても良い。
また、ケース3は、問題サイズ(256×160×2)に対して、チップ数(6)が多くて、余剰なチップ電源をオフ(2チップOFF)して、低電力化を図ることができる場合を示したものである。ケース3の場合、判定は「o.k.」となる。
Also,
なお、図3では説明を容易にするために、問題と半導体チップ116のスピンアレイの構造をいずれも3次元の単純格子として説明したが、構造が複雑化した場合でも、コントローラ106は任意のルールに従い、設定された問題が、規模の観点で解くことができるかできないかの良否判定をできるものとする。
Although FIG. 3 illustrates the problem and the structure of the spin array of the
以上、図3に示す各構成ブロックが動作することで、複数チップを使用したイジングモデルの基底状態探索を実施するものとする。
<半導体チップの構成>As described above, it is assumed that the ground state search of the Ising model using a plurality of chips is performed by the operation of each configuration block shown in FIG.
<Configuration of semiconductor chip>
図4は、半導体チップ116の構成の一例を示したブロック図である。図4に示す半導体チップ116において、401はI/F、402はチップ間伝送I/F、403はレジスタ、404はメモリコントローラ、405はスピンアレイ、406は相互作用I/F、407は相互作用アドレスデコーダ、408はチップ間伝送部コントローラ、409は境界スピン制御部、410は送信用バッファ、411は受信用バッファである。なお、本実施の形態では、半導体チップ116は現在広く用いられているCMOS(Complementary Metal-Oxide Semiconductor)集積回路として実装されていることを想定して説明するが、他の固体素子であっても構わない。
FIG. 4 is a block diagram showing an example of the configuration of the
I/F401は、半導体チップ116がスイッチ114と接続されるブロックであり、コントローラ106と問題データやスピンデータを送受信する際のインタフェースである。
The I /
半導体チップ116においては、スピンアレイ405はSRAMで構成される。したがって、メモリコントローラ404はSRAMコントローラとして動作する。より具体的に言うと、イジングモデルのスピンσi、相互作用係数Ji,j及び外部磁場係数hiをすべてスピンアレイ405内のメモリセルに記憶する情報で表現する。スピンσiの初期状態の設定や基底状態探索完了後の解の読み出しはメモリコントローラ404を介して行う。In the
また、半導体チップ116では、基底状態を探索すべきイジングモデルをスピンアレイ405に設定するための相互作用係数Ji,j及び外部磁場係数hiのリード/ライトもメモリコントローラ404を介して実施する。そのため、スピンアレイ405内のスピンσi、相互作用係数Ji,j及び外部磁場係数hiにはアドレスを付与する。そして、スピンσi、相互作用係数Ji,j又は外部磁場係数hiをリード/ライトする場合、メモリコントローラ404はアドレス指定とR/W(リード/ライト)制御信号を出力し、データバスを介して読み書きする。Further, in the
また、半導体チップ116は、イジングモデルの基底状態探索を実施するための相互作用I/F406と相互作用アドレスデコーダ407を有し、基底状態探索は、スピンアレイ405の内部のスピン間で相互作用を実施することで実現する。相互作用I/F406はコントローラ106から入力されるアドレスとクロックを相互作用アドレスデコーダ407に転送する。そして、相互作用アドレスデコーダ407は、転送されたアドレスに基づいて相互作用を行うスピン群を指定し、クロックはスピンアレイ405に搭載した相互作用回路を動作させる。
The
相互作用回路の詳細は後述するが、ここでは基底状態探索の流れを簡単に説明する。まず、相互作用アドレスデコーダ407は、相互作用I/F406を介して入力されるアドレスに基づいて、スピンアレイ405内のメモリセルに格納された相互作用係数Ji,jと外部磁場係数hi、及びスピン値をリードする。そして、搭載した相互作用回路で相互作用を実施した後で、リード/ライトを行う。Although the details of the interaction circuit will be described later, the flow of ground state search will be briefly described here. First, the
加えて、半導体チップ116は、後述のようにイジングモデルのスピンを表現するメモリセルの値を確率的に反転させる乱数を注入するための乱数注入線を有している。図2で説明した乱数発生部128により発生されたRND信号は、この乱数注入線を介してスピンアレイ405に与えられる。
In addition, the
次に、隣接チップ間のデータ伝送について説明する。隣接チップ間のデータ伝送は、レジスタ403とチップ間伝送部コントローラ408と境界スピン制御部409と送信用バッファ410と受信用バッファ411とチップ間伝送I/F402で実現する。まず、境界スピン制御部409はmビット毎にスピンアレイ405の境界部のスピン値を読み出す。そして、チップ内においては最終的にチップ間伝送I/F402に転送して、nビット幅のチップ間伝送I/F402が境界部のスピン値を別チップに対して伝送する。ここで、送信用バッファ410は境界スピン制御部409のビット幅mとチップ間伝送I/F402のビット幅nの間を調停する役割を果たす。
Next, data transmission between adjacent chips will be described. Data transmission between adjacent chips is realized by the
例えば、m>nの場合は、チップ間伝送I/F402のビット幅nが小さいため、一旦mビットのスピン値を送信用バッファ410に格納し、チップ間伝送I/F402がnビットずつ複数に分けて読み出し、他チップに対して伝送する。また、m<nの場合は、境界スピン制御部409のビット幅mが小さいため、mビットずつスピン値を読み出し、送信用バッファ410にnビットのデータが格納された時点でチップ間伝送I/F402が他チップに対して伝送する。なお、他チップから半導体チップ116へのスピン値伝送は、受信用バッファ411を介して、前述した送信側と同様な動作により実現する。
<イジングモデルの構成>For example, if m> n, the bit width n of the inter-chip transmission I /
<Configuration of Ising model>
図5は、イジングモデルの構成の一例を示した図である。図5では、スピンユニットを複数個並べることで、3次元格子状のトポロジを持つイジングモデルを構成する例を示している。図5において、501と502はスピンであり、503と504は相互作用係数、505は外部磁場係数、506はスピンユニットである。図5の例は、3(X軸方向)×3(Y軸方向)×2(Z軸方向)の大きさの3次元格子である。座標軸の定義は図示した通り、図面右方向をX軸、図面下方向をY軸、図面奥行き方向をZ軸としているが、3次元格子以外のトポロジ、例えばツリー状のトポロジなどを利用する場合には、座標軸とは別にツリーの段数等で表現することになる。図5の3次元格子状のトポロジにおいて、スピン間の相互作用をグラフとしてとらえると、最大で次数5のスピン(頂点)が必要となる。なお、外部磁場係数の接続も含めて考えると、最大で次数6が必要となる。
FIG. 5 is a diagram showing an example of the configuration of the Ising model. FIG. 5 shows an example in which an Ising model having a three-dimensional lattice topology is configured by arranging a plurality of spin units. In FIG. 5, 501 and 502 are spins, 503 and 504 are interaction coefficients, 505 is an external magnetic field coefficient, and 506 is a spin unit. The example of FIG. 5 is a three-dimensional lattice having a size of 3 (X-axis direction) × 3 (Y-axis direction) × 2 (Z-axis direction). As shown in the figure, the coordinate axes are defined as X axis in the right direction of the drawing, Y axis in the down direction of the drawing, and Z axis in the depth direction of the drawing, but when using a topology other than a three dimensional grid, such as a tree topology. Is expressed by the number of steps of the tree separately from the coordinate axes. In the three-dimensional lattice topology of FIG. 5, when the interaction between spins is viewed as a graph, spins (vertices) of
図5に示す1個のスピンユニット506には、隣接するスピン(例えば隣接するスピンが5個の場合σj、σk、σl、σm、σn)の値が入力される。そして、スピンユニット506は、当該のスピン値と、外部磁場係数と、隣接するスピン間に存在する相互作用係数(Jj,i、Jk,i、Jl,i、Jm,i、Jn,i)で構成され、半導体チップ116においては対応するメモリセルを有している。In one
ところで、前述したように、イジングモデルは一般的に無向グラフで表現される相互作用を有している。上述した(1)式では、相互作用を表わす項として、Ji,j×σi×σjがあるが、これはi番目スピンからj番目スピンへの相互作用を示している。この場合、一般的なイジングモデルではi番目スピンからj番目スピンへの相互作用と、j番目スピンからi番目スピンへの相互作用を区別することはない。つまり、Ji,jとJj,iは同一である。しかし、本実施の形態の半導体チップ116では、先に述べたようにこのイジングモデルを有向グラフに拡張し((2)式)、i番目スピンからj番目スピンへの相互作用と、j番目スピンからi番目スピンへの相互作用を非対称にすることを実現している。これにより、モデルの表現能力が高まり、多くの問題をより小規模のモデルで表現することが可能になる。By the way, as described above, the Ising model generally has an interaction represented by an undirected graph. In the above-mentioned equation (1), there is J i, j × σ i × σ j as a term representing the interaction, which indicates the interaction from the i-th spin to the j-th spin. In this case, the general Ising model does not distinguish between the interaction from the i-th spin to the j-th spin and the interaction from the j-th spin to the i-th spin. That is, J i, j and J j, i are the same. However, in the
そのため、1個のスピンユニット506をi番目スピンσiと考えた時に、このスピンユニット506が保持する相互作用係数であるJj,i、Jk,i、Jl,i、Jm,i、Jn,iは、隣接するj番目、k番目、l番目、m番目、n番目のスピンσj、σk、σl、σm、σnから、i番目スピンσiへの相互作用を決めるものである。このことは、図5において、スピンユニット506に含まれている相互作用係数が対応する矢印(相互作用)が、図示されているスピンユニット506の外部のスピンから、スピンユニット506の内部のスピンに向かっていることに対応している。
<スピンユニットの構成>Therefore, when one
<Configuration of spin unit>
図6は、スピンユニット506の構成の一例を示した図である。図6に示すスピンユニット506において、601はメモリセル群であり、602は論理ブロック、603〜615はメモリセル、616はXNOR(排他的論理和の否定)回路、617はスイッチ、618は多数決論理回路、619は反転論理回路、620はセレクタである。
FIG. 6 is a diagram showing an example of the configuration of the
スピンユニット506は、イジングモデルのスピンσi、相互作用係数Jj,i〜Jn,i及び外部磁場係数hiを保持するためのメモリセル群601を有しており、その内訳は、複数の1ビットのメモリセル603〜615(N,IS0,IS1,IU0,IU1,IL0,IL1,IR0,IR1,ID0,ID1,IF0,IF1)で構成される。なお、メモリセル604及び605、メモリセル606及び607、メモリセル608及び609、メモリセル610及び611、メモリセル612及び613、並びに、メモリセル614及び615は、それぞれ2個1組で役割を果たす。The
ここで、スピンユニット506はi番目のスピンを表現するものとして、メモリセルに格納するデータの定義について説明する。メモリセル603(N用)はスピンσiを表現するためのメモリセルであり、スピンの値を保持する。スピンの値はイジングモデルでは+1/−1(+1を上、−1を下とも表現する)であるが、これをメモリセルが保持可能な2値である0/1に対応させる。例えば、+1を1、−1を0に対応させる。Here, as the
メモリセル604〜615(ISx,IUx,ILx,IRx,IDx及びIFx)は、末尾の数字が0と1の2つのメモリセル(例えばメモリセル604〜605(ISx)の場合にはメモリセルIS0及びIS1)の組合せで、+1/0/−1の3値を表現する。例えば、メモリセル604〜605(ISx)の場合には、メモリセル605(IS1)で+1/−1を表現し、メモリセル605(IS1)が保持する値が1の時は+1、メモリセル605(IS1)が保持する値が0の時には−1を表す。
これに加えて、メモリセル604(IS0)が保持する値が0の時には外部磁場係数を0と見なし、メモリセル604(IS0)が保持する値が1の時にはメモリセル605(IS1)が保持する値で決まる+1/−1のいずれかを外部磁場係数とする。外部磁場係数が0の時は外部磁場係数をディセーブルしていると考えれば、メモリセル604(IS0)に保持された値は外部磁場係数のイネーブルビットであると言うことができる(IS0=1の時に、外部磁場係数がイネーブルされる)。相互作用係数を記憶するメモリセル606〜615(IUx,ILx,IRx,IDx及びIFx)も同様に係数とビットの値とを対応させている。
In addition to this, when the value held by the memory cell 604 (IS0) is 0, the external magnetic field coefficient is regarded as 0, and when the value held by the memory cell 604 (IS0) is 1, the memory cell 605 (IS1) is held. One of + 1 / -1 determined by the value is used as the external magnetic field coefficient. If it is considered that the external magnetic field coefficient is disabled when the external magnetic field coefficient is 0, it can be said that the value held in the memory cell 604 (IS0) is the enable bit of the external magnetic field coefficient (IS0 = 1 External field coefficient is enabled). The
なお、スピンユニット506内のメモリセル603〜615(N,IS0,IS1,IU0,IU1,IL0,IL1,IR0,IR1,ID0,ID1,IF0及びIF1)は、それぞれ半導体チップ116の外部からリード/ライト可能とする。そして、メモリコントローラ404でこれらのスピンユニット506を駆動、制御又は読み出しすることにより、一般的なSRAM(Static Random Access Memory)と同様にスピンユニット506内のメモリセル603〜615をリード/ライトすることができるようにする。
The
次に、メモリセル603〜615を参照して、実際に相互作用を実施する論理ブロック602について説明する。
Next, referring to memory cells 603-615,
論理ブロック602は、XNOR(排他的論理和の否定)回路616とスイッチ617と、多数決論理回路618と反転論理回路619とセレクタ620から成る相互作用回路で構成される。そして、相互作用結果に応じてスピンの状態を決定する相互作用回路は、スピンユニット506毎に独立して設置する。独立して設置していることにより、スピン値の同時更新を可能にする。
The
スピンユニット506は、外部とのインタフェースとして、信号線EN,NU1,NL1,NR1,ND1,NF1、NOUT及びRNDを有する。信号線ENは当該スピンユニット506のスピンの更新を許可する切替え信号を入力するインタフェースである。この切替え信号でセレクタ620を制御することで、メモリセル603(N)に保持されたスピンの値を、後述の多数決論理回路618と反転論理回路619を介して与えられる値に更新することができる。
The
信号線NOUTは、当該スピンユニット506のスピンの値を他のスピンユニット506(図5のトポロジで隣接するユニット)に出力するインタフェースである。信号線NU,NL,NR,ND及びNFは、それぞれ他のスピンユニット506(図5のトポロジで隣接するユニット)が保持するスピンの値を入力するためのインタフェースである。信号線NUは上側のスピン(Y軸方向で−1)、信号線NLは左側のスピン(X軸方向で−1)、信号線NRは右側のスピン(X軸方向で+1)、信号線NDは下側のスピン(Y軸方向で+1)、信号線NFは奥行き方向に接続するスピン(Z軸方向で+1ないしは−1)からの入力である。
The signal line NOUT is an interface that outputs the spin value of the
スピンユニット506では隣接スピンとの間でエネルギーを最小化するようにスピンの次状態を決定するが、それは隣接スピンと相互作用係数の積、及び、外部磁場係数を見たときに、正の値と負の値のどちらが支配的か判断することと等価である。例えば、i番目スピンσiに、スピンσj、σk、σl、σm及びσnが隣接しているとして、スピンσiの次状態は以下のように決まる。The
まず、隣接スピンの値はσj=+1、σk=−1、σl=+1、σm=−1、σn=+1とし、相互作用係数はJj,i=+1、Jk,i=+1、Jl,i=+1、Jm,i=−1、Jn,i=−1、外部磁場係数hi=+1とする。このとき、相互作用係数と隣接スピンの積、及び、外部磁場係数をそれぞれ並べると、σj×Jj,i=+1、σk×Jk,i=−1、σl×Jl,i=+1、σm×Jm,i=+1、σn×Jn,i=−1、hi=+1となる。外部磁場係数は、常に値が+1のスピンとの相互作用係数と読み替えて良い。First, the values of adjacent spins are σ j = + 1, σ k = −1, σ l = + 1, σ m = −1, σ n = + 1, and the interaction coefficients are J j, i = + 1, J k, i It is assumed that = + 1, J l, i = + 1, J m, i = -1, J n, i = -1 and the external magnetic field coefficient h i = + 1. At this time, if the product of the interaction coefficient and the adjacent spin and the external magnetic field coefficient are arranged respectively, then σ j × J j, i = + 1, σ k × J k, i = −1, σ l × J l, i = +1, σ m × J m, i = +1, σ n × J n, i = -1, h i = +1. The external magnetic field coefficient may always be read as an interaction coefficient with a spin having a value of +1.
ここで、i番目のスピンと隣接スピンとの間での局所的なエネルギーは、前述した係数にそれぞれi番目スピンの値を乗じて、さらに符号を反転させたものになる。例えば、j番目スピンとの間での局所的なエネルギーは、i番目スピンを+1とした時には−1、i番目スピンを−1としたときには+1となるので、i番目スピンを+1にするほうが、ここでの局所的なエネルギーを小さくする方向に働く。 Here, the local energy between the i-th spin and the adjacent spin is obtained by multiplying the above-mentioned coefficient by the value of the i-th spin and further inverting the sign. For example, the local energy with the j-th spin is -1 when the i-th spin is +1, and +1 when the i-th spin is -1, so it is better to make the i-th spin +1, It works to reduce the local energy here.
このような局所的なエネルギーを全ての隣接スピン間と外部磁場係数について考えたときに、i番目スピンを+1/−1のどちらにしたほうがエネルギーを小さくできるかを計算する。これは、先程示した相互作用係数及び隣接スピンの積と、外部磁場係数とをそれぞれ並べたものにおいて、+1と−1のどちらが多いか数えれば良い。先程の例では、+1が4個、−1が2個である。仮に、i番目スピンを+1とすると、エネルギーの総和は−2、i番目スピンを−1とするとエネルギーの総和は+2になる。よって、+1の個数が多い時にはi番目スピンの次状態を+1とし、−1の個数が多い時にはi番目スピンの次状態を−1にするという多数決で、エネルギーを最小化するi番目スピンの次状態を決定することができる。 When such local energy is considered between all adjacent spins and the external magnetic field coefficient, it is calculated which of + 1 / -1 the i-th spin can reduce the energy. This can be done by counting which of +1 and -1 is more in the arrangement of the product of the interaction coefficient and the adjacent spin shown earlier and the external magnetic field coefficient. In the previous example, there are four + 1's and two -1's. Assuming that the ith spin is +1, the sum of energy is -2 and the ith spin is -1, the sum of energy is +2. Therefore, when the number of +1 is large, the next state of the i-th spin is set to +1, and when the number of -1 is large, the next state of the i-th spin is set to -1. The state can be determined.
ここで、前述した相互作用動作と図6に示す回路ブロックとの関係を説明する。まず、隣接スピンの状態と、相互作用係数の+1/−1を示すメモリセル607(IU1),メモリセル609(IL1),メモリセル611(IR1),メモリセル613(ID1),メモリセル615(IF1)が保持する値との排他的論理和の否定をXNOR回路616で求める。これにより、その相互作用だけを見た時にエネルギーを最小化するスピンの次状態を計算することができる(+1は1、−1は0にエンコードされているものとする)。
Here, the relationship between the interaction operation described above and the circuit block shown in FIG. 6 will be described. First, the memory cell 607 (IU1), the memory cell 609 (IL1), the memory cell 611 (IR1), the memory cell 613 (ID1), the memory cell 615 (the memory cell 607 (IU1) showing the state of adjacent spins and + 1 / -1 of the interaction coefficient. The negation of the exclusive OR with the value held by IF1) is obtained by the
もし、相互作用係数が+1/−1だけであれば、XNOR回路616の出力のうち+1/−1のどちらが多いかを多数決論理回路618において多数決論理で判定すればスピンの次状態を決定することができる。外部磁場係数に関しては、常に状態+1のスピンとの相互作用係数に相当するものと考えれば、単に外部磁場係数の値がスピンの次の状態を決定する多数決論理回路618に入力すべき値となる。
If the interaction coefficient is only + 1 / -1, then the majority logic determines in the majority logic whether the + 1 / -1 of the outputs of the
次に、係数0の実現方法について考える。n入力の多数決論理f(I1,I2,I3,……,In)があるとき、以下の命題は真であると言える。まず、入力I1,I2,I3,……,Inの複製I’1,I’2,I’3,……,I’nがあるとする(任意のkについて、Ik=I’kである)。このとき、f(I1,I2,I3,……,In)の出力は、複製もあわせて入力したf(I1,I2,I3,……,In、I’1,I’2,I’3,……,I’n)と等しい。つまり、各入力変数をそれぞれ2個ずつ入れても、出力は不変である。さらに、入力I1、I2、I3,……,Inの他に、もう一つの入力Ixと、その反転!Ixがあるとする。このとき、f(I1,I2,I3,……,In,Ix,!Ix)の出力は、f(I1,I2,I3,……,In)と等しい。つまり、入力変数とその反転を入力すると、多数決においてその入力変数の影響をキャンセルするように働く。多数決論理のこの性質を利用して係数0を実現する。
Next, consider how to realize the
具体的には、図6に示すように、XNOR回路616を利用して、係数のイネーブルを決めるビット(ビットセルIS0,IU0,IL0,IR0,ID0及びIF0にそれぞれ保持されたビット)の値により、多数決論理回路618に、先に述べたスピンの次の状態の候補となる値の複製か、その反転を同時に入力する。例えば、メモリセル604(IS0)が保持するビットの値が0の場合、メモリセル605(IS1)が保持するビットの値と、メモリセル605(IS1)が保持するビットの値を反転させた値が同時に多数決論理回路618に入力されるので、外部磁場係数の影響は無い(外部磁場係数が0に相当する)ことになる。また、メモリセル604(IS0)が保持するビットの値が1の場合には、メモリセル605(IS1)が保持するビットの値と、その値と同じ値(複製)が同時に多数決論理回路618に入力されることになる。
Specifically, as shown in FIG. 6, according to the value of the bit (the bit cells held in bit cells IS0, IU0, IL0, IR0, ID0 and IF0) which determine the enable of the coefficient using
上述したスピン間の相互作用によるエネルギー最小化で、適用されたイジングモデルの基底状態探索を実現することができるが、これだけでは局所最適解に陥ってしまう可能性がある。基本的に、エネルギーを小さくする方向の動きしかないため、一旦局所最適解に陥るとそこから抜け出すことができず、大域最適解に到達しない。そこで、局所最適解から脱出するための施策として、スピンを表現するメモリセル603の値を確率的に反転させるために、スピンユニット506はインタフェースとして乱数注入線を有する。
Although the energy minimization by the interaction between the spins described above can realize the ground state search of the applied Ising model, this alone may result in a local optimum solution. Basically, there is only movement in the direction of reducing energy, so once it gets into a local optimum it can not get out of it and does not reach a global optimum. Therefore, the
そしてスピンユニット506には、図2に示す乱数発生部128からスピンアレイ405に与えられたRNDがこの乱数注入線に接続され、このRNDが反転論理回路619に入力されることで、スピンの値を確率的に反転される。
Then, in the
以上の図4、図5、図6の構成とそれぞれの動作により、個々の半導体チップ116は、スピンユニット506毎に相互作用を実現し、RNDによる制御を組み合わせることで、イジングモデルの基底状態探索を実現する。
<大規模かつ複雑な問題への対応>The
<Corresponding to Large-scale and Complex Problems>
ここで、大規模かつ複雑な問題への対応について、図7〜図12を用いて説明する。図7〜図8は、イジングモデルで表現された問題データと半導体チップとの関係を示す図である。図9は、半導体チップの実装の一例を示した図である。図10〜図12は、複数の半導体チップで大規模かつ複雑な問題に対応する一例を示した図である。 Here, dealing with large-scale and complicated problems will be described with reference to FIGS. 7 to 12. FIGS. 7-8 is a figure which shows the relationship between the problem data represented by Ising model, and a semiconductor chip. FIG. 9 is a view showing an example of mounting of a semiconductor chip. 10 to 12 are diagrams showing an example corresponding to a large scale and complicated problem with a plurality of semiconductor chips.
例えば、多数のスピンを含む大規模なイジングモデルの基底状態を探索可能な半導体チップを構築するためには、単位素子をスピン数に応じた数だけ半導体チップに搭載する必要がある。そして、図7に示すように、イジングモデルのサイズ(問題201、なお、202及び203はスピン、204は相互作用を示す)より半導体チップ205が対応可能なスピン数が大きく、イジングモデルが漏れなく半導体チップに写像可能であることが望ましい。しかし、解くべき問題の問題サイズが拡大していくことを考慮すると、半導体チップは、チップサイズが大きく、また製造コストも高くなる。従って、大規模な問題206に対応可能な半導体チップを実現するに際しては、図8に示すように、ある程度の数の単位素子が搭載された半導体チップ207及び208を複数使用するようにして構築することが望ましい。
For example, in order to construct a semiconductor chip capable of searching for the ground state of a large scale Ising model including a large number of spins, it is necessary to mount unit elements on the semiconductor chip by the number according to the number of spins. Then, as shown in FIG. 7, the number of spins that the
さらに、同一の半導体チップを複数使用する場合は、例えば、最も単純な2次元格子で説明すると、図9に示すように、半導体チップがX方向とY方向でタイル状に並べられ、隣接する半導体チップ間、例えば半導体チップ701と半導体チップ702は配線にて接続される。この場合、半導体チップの接続は、チップの4方向で実施可能で、隣接チップ間でのデータ伝送は可能であり、上下左右のチップ拡張で大規模な問題を解くことを可能にする。しかし、より複雑な大規模問題を解く場合は、それに合わせて拡張方法の複雑化にも対応する必要がある。問題が複雑化した場合の対応例について、図9を用いて説明すると、チップ1を基準にし、例えば、隣接しているチップ2とチップ5だけでなく、隣接していないチップ3やチップ4、チップ6、…、チップ12への繋がりを構築する。
Furthermore, in the case where a plurality of identical semiconductor chips are used, for example, as illustrated in the simplest two-dimensional lattice, as shown in FIG. 9, semiconductor chips are tiled in the X direction and Y direction and adjacent semiconductors The chips, for example, the
通常、隣接するチップを接続した場合は、それぞれのチップの外周(境界部)同士が接続されることになる。これに対し、図10に示すチップ801,802の外周以外のスピン803とスピン804の接続を考える。具体的には、図11に示すように、スピン803の値でスピン804を上書きすることでスピン805(スピン803=スピン804)の状態を実現する。これにより、通常のチップの外周同士の接続に、スピン805による接続を追加することが可能になる。また、図12に示すように、隣接したチップ801,802同士だけではなく、実装上離れたチップ807とも接続することを考える。具体的には、チップ801上のスピン808の値で、チップ807上のスピン809を上書きする。これにより、隣接するチップ801とチップ802の拡張だけでなく、隣接しないチップ801とチップ807の拡張を実現する。なお、図12において、806は隣接するチップ801,802の外周同士の接続を示す。
Usually, when adjacent chips are connected, the outer peripheries (boundary portions) of the respective chips are connected to each other. On the other hand, connection of the
本実施の形態は、以上の内容を実現するためになされたもので、大規模かつ複雑なイジングモデルの基底状態を探索でき、安価かつ容易に製造可能な半導体システムを提案しようとするものである。かかる半導体システムを実現するために、複数の半導体チップにイジングモデルを表現するパラメータを展開したり、半導体チップ間のデータ伝送を制御するコントローラ106を有し、複数の半導体チップにより単一のイジングモデルの基底状態探索を実施する。
The present embodiment has been made to realize the above contents, and proposes a semiconductor system which can search for the ground state of a large-scale complex Ising model and which can be manufactured inexpensively and easily. . In order to realize such a semiconductor system, it has a
これにより、1つの半導体チップで解くことができるサイズを超過したイジングモデルにおいて、コントローラ106は、半導体チップの各々に内蔵されたアレイ構造の記憶素子に対し、イジングモデルを構成するスピンの値と、当該スピンに付随する相互作用係数及び外部磁場係数を書き込んで展開する。また、コントローラ106は、半導体チップの各々に内蔵されたアレイ構造の記憶素子に格納された値を読み出すことで、イジングモデルの基底状態探索の結果であるスピンの値を回収する。また、コントローラ106は、回収したスピン値を回収元のチップとは異なる、例えば実装上隣接しないチップに対して伝送を可能にすることで、複数の半導体チップで単一のイジングモデルの基底状態探索を実施する。
<コントローラの詳細>As a result, in the Ising model exceeding the size that can be solved by one semiconductor chip, the
<Details of controller>
次に、コントローラ106について、図13〜図17を用いて詳細を説明する。図13は、スピンデータ格納部112のアドレスと、展開先のチップ番号とローカルアドレスの関係の一例を纏めた図である。図14は、チップ間の接続を規定する場合の一例を示した図である。図15〜図16は、隣接チップ間接続部の構成の一例を示したブロック図である。図17は、コントローラ106による全体動作のフローチャートの一例を示した図である。
Next, the
まず、コントローラ106は、データ処理部109を介して、問題データ格納部111とスピンデータ格納部112に格納された各データを複数の半導体チップ116に展開する。
First, the
図13では、コントローラ106から複数設置した半導体チップ群115の各々に対して、問題データとスピンデータの伝送を実現する例を示している。まずは、問題データ格納部111とスピンデータ格納部112には、記憶装置103に格納されたデータがアドレス0x00000から順次転送されるものとする。そして、問題データのサイズは、レジスタ108に含まれる問題設定レジスタ118で設定されており、各半導体チップが対応可能なサイズは、チップ仕様設定レジスタ121で設定される。なお、図13では、説明を簡単にするために、問題は2次元格子構成を前提に、問題設定レジスタ118が問題サイズをX方向とY方向で規定することにし、例えば、X方向を512(dec)、Y方向を80(dec)とした。また、チップ仕様設定レジスタ121もスピンアレイサイズをX方向とY方向で規定することにし、例えば、X方向を256(dec)、Y方向を80(dec)とする。この場合、チップ数設定レジスタ120は2に設定すれば、破綻なくX方向に2つのチップを並べて単一問題を解くことができる。
FIG. 13 illustrates an example in which transmission of problem data and spin data is realized for each of a plurality of
まず、問題データ格納部111とスピンデータ格納部112で使用されるアドレスに着目すると、問題データとスピンデータは40960(=512×80)個で構成され、図13のデータ欄とアドレス欄に示すように、各データはアドレス0x00000から0x09FFFが付与される。このアドレスを問題サイズのX方向の設定値512(dec)で除算して+1すると、解は当該データのY方向のライン数に相当し、その剰余はX方向の位置に相当する。また、前述の剰余の値をスピンアレイサイズのX方向の設定値256(dec)で除算して+1すると、X方向に並べた場合のチップ番号(1、2のいずれか)が導出できる。図13で説明すると、512番目データに対応するアドレス0x001FF(hex)を512(dec)で除算して+1すると、解は1で剰余+1は512(dec)となる。これにより、512番目のデータがグラフ問題において1番目のラインで、X方向で言うと512番のスピンユニットに対応するデータであることが判る。また、剰余+1である512(dec)をスピンアレイサイズのX方向の設定値256(dec)で除算すると、解は2となり、チップ2に展開するデータであることが判る。
First, focusing on the addresses used by the problem
これらの処理により、データ処理部109は、スピンデータ格納部112に格納されたスピンデータに対し、チップ番号を付与することができる。スピンデータ格納部112のアドレスと分配先のチップ番号の関係を明確化できれば、スピンデータ格納部112における任意のアドレスのスピン値を、別の任意アドレスのスピン値で上書きできる。つまりグラフ問題上での接続は、スピンデータ格納部112上のアドレス指定のみで実施できることになる。
By these processes, the
図14では、チップ間接続部122の動作に関連して、スピンデータ格納部112における任意のアドレスのスピン値を、別の任意アドレスのスピン値で上書きすることを前提に、伝送用テーブルを作成した場合の一例を示している。例えば、読み出し側として、スピンデータ格納部における257番目のデータ(アドレス0x00100)を選択し、書き込み側として、40449番目のデータ(アドレス0x9E00)を選択すれば、データ処理部109によりチップ番号とローカルアドレスに変換された後の送受信が実施され、チップ番号2に割り当てられて計算した結果である257番目のデータを、チップ番号1に割り当てられた40449番目のデータに反映させることができることを示している。R(読み出し)/W(書き込み)の設定と、アドレス設定を任意に組み合わせれば、多様のデータ伝送が可能になる。
In FIG. 14, the transmission table is created on the premise that the spin value of an arbitrary address in the spin
なお、本実施の形態では、伝送用テーブルを作成することを前提に、隣接していないチップ間のデータ伝送を実施する方法について説明したが、複数の半導体チップを用いて単一モデルの問題を解く場合に、コントローラを介した接続処理がなされるのであれば、詳細の処理方法が異なっていても構わない。 In the present embodiment, the method of performing data transmission between non-adjacent chips has been described on the premise of creating a transmission table, but the problem of a single model using a plurality of semiconductor chips is described. When the connection processing is performed via the controller in the case of solving, the detailed processing method may be different.
さらに、図13と図14の例では、チップは2個としたが、2個以上も対応可能であり、実装上離れたチップ間においても、コントローラ106を介することでスピンデータの伝送が可能で、伝送元の半導体チップ116での計算結果を伝送先の半導体チップ116での計算に反映させることができる。なお、本実施の形態では、最も単純な例を挙げて、計算用データの分配方法を説明したが、本実施の形態の特徴であるコントローラを介したデータ伝送が実現するのであれば、分配ルールは、これに限るものではない。
Further, although two chips are provided in the example of FIGS. 13 and 14, two or more chips can be supported, and spin data can be transmitted via the
次に、これまで説明した構成を前提に、全体動作について、図17のフローチャートを用いて説明する。図17に示すフローチャートは、任意の初期値にスピン値を設定し、1回の基底状態探索が終了するまでを示しており、基底状態探索1回あたりの計算ステップはN回としている。また、これまで説明してきたチップ間のデータ伝送の周期はPで定義し、Pは計算ステップ単位で設定できるものとする。 Next, the entire operation will be described using the flowchart of FIG. 17 on the premise of the configuration described above. The flowchart shown in FIG. 17 sets the spin value to an arbitrary initial value and shows the process until one ground state search is completed, and the number of calculation steps per ground state search is N times. Further, it is assumed that the data transmission cycle between chips described above is defined by P, and P can be set in calculation step units.
まず、外部より受信して、コントローラ106内のスピンデータ格納部112にスピン値の初期値が設定され、計算ステップの計数値nが「0」に設定される(S1、S2)。次に、スピン値がスピンデータ格納部112から半導体チップ群115に展開される(S3)。そして、半導体チップ116に展開されたスピン値は、図6で説明した多数決論理回路を実行することで、スピン値を更新されて、計算ステップの計数値nがカウントアップしながらNに到達すると、1回の基底状態探索が終了したと判断する(S4〜S7)。S4〜S7の期間を、ここでは半導体チップ動作による探索期間と呼ぶ。探索期間において、1回の基底状態探索が終了したら、半導体チップ群115からスピン値を回収して集計する(S8)。
First, it receives from the outside, the initial value of the spin value is set in the spin
この中で、計算ステップの計数値nがデータ伝送の周期Pの倍数に到達したら、一旦基底状態探索を中断し、コントローラ106でチップ間接続処理を実施する。このチップ間接続処理の期間を、ここではコントローラ処理によるチップ拡張期間と呼ぶ。具体的には、計算ステップの計数値nがデータ伝送の周期Pの倍数に到達したら、コントローラ106が半導体チップ群115からスピン値を回収し、その値でスピンデータ格納部112の値を上書きする(S9、S10)。そして、チップ間接続部122が図14で説明したチップ接続用のデータ処理を実施する(S11)。これにより、隣接していないチップ間でもあたかも接続されているような処理がなされ、処理後のスピンデータが再度半導体チップ群115に展開される。展開後、半導体チップ116では、各々の探索動作を再開することで、別チップからの計算結果を一部反映させて計算することができるようになる。
Among them, when the count value n of the calculation step reaches a multiple of the data transmission period P, the ground state search is temporarily interrupted, and the
以上のように、イジングモデルの基底状態探索を実施する期間には、スピンデータ格納部112に格納される基底状態探索の結果の全てが、基底状態探索の計算ステップ毎、あるいは複数の計算ステップ毎に更新される探索期間と、スピンデータ格納部112に格納される基底状態探索の結果の一部が、基底状態探索の計算ステップ毎、あるいは複数の計算ステップ毎に、スピンデータ格納部112に含まれる、別の一部の値に書き換えられるチップ拡張期間とがある。
As described above, during the ground state search of the Ising model, all the ground state search results stored in the spin
また、探索期間における基底状態探索の結果を更新する間隔と、チップ拡張期間における基底状態探索の一部の結果の書き換えが実施される間隔とは、基底状態探索の計算ステップで表現され、各々外部から調整可能となっている。この場合に、各間隔を設定するレジスタを有しても良い。 Further, an interval for updating the result of the ground state search in the search period and an interval at which the partial result of the ground state search in the chip extension period is rewritten are expressed in the calculation step of the ground state search. It is adjustable from In this case, a register may be provided to set each interval.
また、半導体チップ116が複数設定された場合には、複数の半導体チップ116間を配線して、基底状態探索の結果を伝送する配線伝送期間を設定すると共に、コントローラ106で実施するチップ拡張期間における基底状態探索の結果の書き換えを実施する。
When a plurality of
一方で、図9におけるチップ1とチップ2、またはチップ1とチップ5のように、隣接した半導体チップはコントローラ106を介さずにチップ間でスピンデータの伝送を実施しても構わない。
On the other hand, adjacent semiconductor chips such as the
例えば、図15に示すように、隣接したチップ801とチップ802を接続する場合の接続部に着目し、境界部のスピン1101,1102の数がnの場合、計算を実施するに当たっては、スピンが1ビットならば、nビットをデータ送受信部(パッド)1103とデータ受送信部(パッド)1104に引き出してシームレスに接続するのが望ましい。したがって、境界部のビット幅nが小さい場合は図15に示す接続方法を採用する。
For example, as shown in FIG. 15, paying attention to the connecting portion in the case of connecting the
ただし、境界部のスピン1101,1102の数が多い条件でシームレス接続を実施すると、パッド数が多くなると共に、配線領域が大きくなって、チップコストと実装コストが上昇することが判っている。また、本実施の形態で前提とした半導体チップは、ノイマン型コンピュータではなく非ノイマン型であり、空間的あるいは時間的に間引いた接続が許容できることが判っている。そこで、図16に示すようなブロック構成を採用して、mビット(m<n)の伝送幅を実現し、接続数を削減する。
However, it is known that if the seamless connection is performed under the condition that the number of
ここでは、チップ間の接続数を削減する図16の構成について説明する。図16において、1101と1102は境界部のスピンであり、1105はチップ801のデータ読み出し部、1106はチップ801の送信用バッファ、1107はチップ801の送信部、1108はチップ802の受信部、1109はチップ802のデータ展開部、1110はチップ802のラッチ回路、1111はチップ802のデータ読み出し部、1112はチップ802の送信用バッファ、1113はチップ802の送信部、1114はチップ801の受信部、1115はチップ801のデータ展開部、1116はチップ801のラッチ回路である。
Here, the configuration of FIG. 16 for reducing the number of connections between chips will be described. In FIG. 16, 1101 and 1102 are spins at the boundary, 1105 is a data reading unit of the
チップ801のデータ読み出し部1105は、スピンアレイ405から境界領域のスピンの値を読み出し、mビット毎に送信用バッファ1106に伝送する。送信用バッファ1106は、チップ801の送信部1107と隣接チップであるチップ802の受信部1108を介して、チップ802のデータ展開部1109にmビットのスピンデータを伝送する。データ展開部1109は、入力されたスピンデータをmビットずつシフトしながら、ラッチ回路1110に展開する。これにより、チップ801からチップ802へのスピンデータの伝送を実現する。
The data read
なお、チップ802からチップ801へのスピンデータの伝送は、接続部の回路を2系統ペアで設置することで実現する。ただし、送信部(パッド)と受信部(パッド)を共通化し、双方向のバッファリング動作が衝突しないように、時分割でデータ伝送を実施することでパッド数を削減しても構わない。また、格子状のスピンモデルでX方向の拡張を前提として説明したが、Y方向などへの拡張を実現するためには対応する接続部を複数設置すれば良い。
Transmission of spin data from the
本実施の形態の前半で説明したコントローラ106を介するデータ伝送により、図9で言えば、隣接しないチップ、例えばチップ1とチップ3等でのデータ伝送を可能にすると共に、図15〜図16で説明した隣接チップ間のデータ伝送を組み合わせることが望ましい。また、コントローラ106で隣接したチップ間においても、図10〜図12に示すような境界領域の内側のスピン値のデータ伝送も可能にすると共に、図15〜図16で説明した隣接チップ間のデータ伝送を組み合わせても良い。もちろん、チップ間の配線接続を使用せず、コントローラ106を介して全てのチップ間のデータ伝送を実施しても構わない。
The data transmission via the
また、イジングモデルを前提に説明してきたが、例えばニューラルネットワークのような、他の相互作用モデルを適用した場合であっても構わない。 Also, although the description has been made on the premise of the Ising model, other interaction models such as neural networks may be applied.
以上説明した第1の実施の形態によれば、例えばイジングモデルなどのような大規模かつ複雑な相互作用モデルの計算を行うことができ、安価かつ容易に製造可能な半導体システムを実現することができる。
[第2の実施の形態]According to the first embodiment described above, it is possible to realize an inexpensive and easily manufacturable semiconductor system that can calculate large-scale and complex interaction models such as Ising model, for example. it can.
Second Embodiment
第2の実施の形態は、前記第1の実施の形態に対して、チップ間のデータ伝送で要求される精度や品質を考慮した伝送仕様に制御することを特徴とする。第2の実施の形態においては、前記第1の実施の形態と異なる点を主に説明する。 The second embodiment is characterized in that, with respect to the first embodiment, the transmission specification is controlled in consideration of the accuracy and quality required for data transmission between chips. In the second embodiment, differences from the first embodiment will be mainly described.
本実施の形態は、特に半導体チップ等の基底状態探索計算においては、常に高精度、かつ欠落の無いデータである必要が無いことに着目したものである。特に、局所最適解から脱出するためにRNDを参照するブロックにおいて、計算ステップが小さい領域においては、計算結果をあえて反転させる制御を実施しており、正確なデータ伝送が必要ないとも考えられる。このことから、計算ステップが小さい領域においては、データ伝送を簡略化し、伝送に伴って発生する消費電流の低減を図ると共に、データ伝送によるバス、ネットワークの占有を抑制し、その他の処理を滞りなく実施することに寄与する。 The present embodiment focuses on the fact that there is no need to always have high precision and no missing data, particularly in ground state search calculation of semiconductor chips and the like. In particular, in a block where RND is referred to in order to escape from the local optimum solution, control is performed to intentionally invert the calculation result in a region where the calculation step is small, and it is considered that accurate data transmission is not necessary. From this, in the area where the calculation step is small, data transmission is simplified, current consumption generated along with transmission is reduced, occupation of the bus and network by data transmission is suppressed, and other processes are performed without delay. Contribute to implementation.
図18〜図19は、第2の実施の形態を説明するための図であり、図18は、本実施の形態において前提とする、計算ステップ毎のエネルギーの遷移の一例を示した図であり、図19は、本実施の形態におけるデータ伝送仕様の切り替わりの一例を示した図である。例えば、基底状態探索の計算ステップが進むにつれて、チップ拡張期間における基底状態探索の一部の結果の書き換えを実施する制御仕様と、複数の半導体チップ間の配線により基底状態探索の結果を伝送する制御仕様、あるいはいずれかの制御仕様を変化させる。この仕様を変化させる制御において、制御仕様の変化点に設定する複数の計算ステップ、あるいは計算ステップ間の間隔は、外部から調整可能である。 FIGS. 18 to 19 are diagrams for explaining the second embodiment, and FIG. 18 is a diagram showing an example of energy transition at each calculation step, which is premised in the present embodiment. FIG. 19 is a diagram showing an example of switching of data transmission specifications in the present embodiment. For example, as the calculation step of ground state search progresses, control specifications for performing rewriting of a part of results of ground state search in the chip expansion period and control of transmitting the ground state search results by wiring between a plurality of semiconductor chips Change the specifications or any of the control specifications. In the control of changing this specification, a plurality of calculation steps set at the change point of the control specification or an interval between calculation steps can be adjusted from the outside.
図18では、基底状態探索計算を実施した場合のエネルギー遷移を示しており、1301は横軸に計算ステップ、縦軸にエネルギーを設定してプロットした結果の一例である。結果1301が特定の計算ステップでエネルギーが降下しているのは、基底状態探索計算における、温度パラメータの更新に相当する。半導体チップにおいては、温度パラメータをRNDによる反転確率で表現しており、計算ステップが進むにつれて、スピン値のRNDによる反転確率を低くしている。ここで、計算ステップが小さい領域においては、局所最適解からの脱出が主の目的で、スピン値の反転確率が高く、粗い精度での解探索しか実施していないことに着目したのが本実施の形態である。具体的には、計算ステップの範囲1302、範囲1303、範囲1304、範囲1305、範囲1306に合わせて、データ伝送の仕様を変化させる。
FIG. 18 shows the energy transition in the case of performing the ground state search calculation, and 1301 is an example of the result of plotting with the calculation step on the horizontal axis and the energy on the vertical axis. The
図19では、データ伝送の仕様を計算ステップに合わせて変化させるパラメータの例として、データ伝送用クロック周波数、データ伝送周期、データ伝送圧縮率、伝送ビット数を列挙して表に纏めたものである。 In FIG. 19, the data transmission clock frequency, the data transmission cycle, the data transmission compression rate, and the number of transmission bits are listed in a table as an example of the parameters for changing the data transmission specification in accordance with the calculation step. .
データ伝送用クロック(図2に示したクロック3)の周波数は、計算ステップが小さい範囲1302においては、例えば10MHzに設定し、計算ステップが範囲1303、範囲1304、範囲1305、範囲1306と進むにつれて高周波数化し、範囲1306においては100MHzに設定する。これにより、精度が要求される範囲1306において、データ伝送に割り当てる時間を短縮し、削減できた時間を計算時間に割り当てることが可能になる。
The frequency of the data transmission clock (
データ伝送周期は、計算ステップが小さい範囲1302においては、例えば16ステップ毎にデータ伝送し、計算ステップが範囲1303、範囲1304、範囲1305、範囲1306と進むにつれてデータ伝送間隔を短くする。なお、本内容は、図17に示したフローチャートにおける、チップ間接続周期Pを短くしていくことに相当する。そして、範囲1306において、1ステップ毎の設定にすれば、接続元の計算結果の更新頻度が計算ステップ毎に設定され、あたかもシームレス接続したような条件で計算できるようになる。
The data transmission period is, for example, data transmission every 16 steps in the
伝送データ圧縮率は、計算ステップが小さい範囲1302においては、例えばデータの圧縮率を1/10に高くしてデータ数を削減し、計算ステップが範囲1303、範囲1304、範囲1305、範囲1306と進むにつれて圧縮率を低くし、範囲1306においては1に設定する。
For the transmission data compression rate, in the
伝送ビット数は、計算ステップが小さい範囲1302においては、例えばビット数を1ビットに少なくして、計算ステップが範囲1303、範囲1304、範囲1305、範囲1306と進むにつれてビット数を多くし、範囲1306においては8ビットに設定する。
In the
なお、図19で示した本実施の形態の仕様と数値は一例である。基底状態探索計算におけるパラメータを計算ステップ毎に変化させるという点が共通であれば、仕様内容や数値は異なっていても構わない。 The specifications and numerical values of the present embodiment shown in FIG. 19 are an example. The contents of specification and the numerical values may be different as long as the parameter in the ground state search calculation is common in that the parameter is changed at each calculation step.
以上説明した第2の実施の形態によれば、前記第1の実施の形態と異なる効果として、計算ステップが小さい領域においては、データ伝送を簡略化し、伝送に伴って発生する消費電流の低減を図ると共に、データ伝送によるバス、ネットワークの占有を抑制し、その他の処理を滞りなく実施することができる。
[第3の実施の形態]According to the second embodiment described above, as an effect different from that of the first embodiment, data transmission is simplified in a region where the calculation step is small, and reduction of current consumption generated along with transmission is achieved. At the same time, it is possible to suppress the occupation of the bus and the network by data transmission and to carry out other processing smoothly.
Third Embodiment
第3の実施の形態は、前記第1の実施の形態に対して、コントローラと複数の半導体チップはバスで接続されることを特徴とする。第3の実施の形態においては、前記第1及び第2の実施の形態と異なる点を主に説明する。 The third embodiment is characterized in that the controller and the plurality of semiconductor chips are connected by a bus, with respect to the first embodiment. In the third embodiment, differences from the first and second embodiments will be mainly described.
図20は、第3の実施の形態を説明するための図であり、半導体システム104の構成の一例を示したブロック図である。図20に示す半導体システム104において、コントローラ106及び複数の半導体チップ1402はスイッチに接続されるのではなく、専用バス1401に接続され、スイッチを必要としない。
FIG. 20 is a diagram for explaining the third embodiment, and is a block diagram showing an example of the configuration of the
なお、バス接続であること以外は、前記第1の実施の形態と同様である。したがって、詳細の説明は割愛する。また、本実施の形態のブロック構成を前提にして、前記第2の実施の形態を適用して、チップ間のデータ伝送仕様を制御しても構わない。 The second embodiment is the same as the first embodiment except that it is a bus connection. Therefore, the detailed explanation is omitted. Also, based on the block configuration of the present embodiment, the second embodiment may be applied to control the data transmission specification between chips.
以上説明した第3の実施の形態によれば、前記第1の実施の形態と異なる効果として、コントローラ106及び複数の半導体チップ1402を専用バス1401で接続して半導体システム104を構成することができる。この結果、前記第1及び第2の実施の形態と同様の効果を得ることができる。
[第4の実施の形態]According to the third embodiment described above, as an effect different from the first embodiment, the
Fourth Embodiment
第4の実施の形態は、前記第1、第2、第3の実施の形態と異なり、例えばイジングモデルなどのような大規模かつ複雑な相互作用モデルの計算を行うことができ、安価かつ容易に製造可能な計算システムに関する。 The fourth embodiment differs from the first, second, and third embodiments, and can calculate large-scale and complex interaction models such as Ising model, for example, and is inexpensive and easy. To a computer system that can be manufactured.
図21は、第4の実施の形態を説明するための図であり、計算システムを含むネットワークシステムの全体構成の一例を示したブロック図である。図21に示すネットワークシステムにおいて、1501はホスト、1502は半導体システム群、1503は半導体システム群を構成する複数の半導体システム、1504はネットワークである。本実施の形態は、異なるコンピュータに搭載された半導体システム1503であった場合に、ネットワーク1504を介してホスト1501と各半導体システム1503間でデータ伝送を実施し、大規模の単一問題を解くことを可能にする。半導体システム1503は、前記第1の実施の形態と同様の構成を含む。
FIG. 21 is a diagram for explaining the fourth embodiment, and is a block diagram showing an example of the overall configuration of a network system including a computing system. In the network system shown in FIG. 21, 1501 denotes a host, 1502 denotes a semiconductor system group, 1503 denotes a plurality of semiconductor systems constituting the semiconductor system group, and 1504 denotes a network. The present embodiment solves a large-scale single problem by performing data transmission between the
図21に示した半導体システム1503が複数存在し、それぞれがLANに接続された場合を考える。単一の半導体システム1503に搭載された複数の半導体システムで解くことが不可能なイジングモデルの基底状態探索を実施する場合には、LAN経由で計算資産を共有し、ホスト1501が問題データの展開やデータ伝送を実施する。問題データの展開と半導体システム間のデータ伝送を可能にすれば、前記第1〜第3の実施の形態で説明してきた基底状態探索計算手法で、より大規模の問題を解くことができる。
Consider a case where there are a plurality of
また、ホスト1501がノートPC、あるいはモバイル機器の場合、無線LANなどの回線による接続でデータ伝送を実現して、大規模の問題を解くことも可能にする。例えば、モバイル機器が問題を解くためのコマンドを発行し、遠隔地に存在する複数の半導体システム1503がコマンドを受信する。そして、半導体システム1503上でイジングモデルの基底状態探索を実施した結果から、最適値を導出し、モバイル機器に対して送信する。これにより、小規模の問題であれば、ノートPC上、あるいはモバイル機器上において、半導体システムを使用して問題を解いた結果を参照できるようになる。
Further, when the
以上説明した第4の実施の形態によれば、前記第1〜第3の実施の形態と異なる構成において、前記第1〜第3の実施の形態と同様の効果を得ることができる。 According to the fourth embodiment described above, in the configuration different from the first to third embodiments, the same effect as the first to third embodiments can be obtained.
以上、本発明者によってなされた発明をその実施の形態に基づき具体的に説明したが、本発明は前記実施の形態に限定されるものではなく、その要旨を逸脱しない範囲で種々変更可能であることは言うまでもない。 As mentioned above, although the invention made by the present inventor was concretely explained based on the embodiment, the present invention is not limited to the embodiment, and can be variously changed in the range which does not deviate from the summary. Needless to say.
例えば、上記した実施の形態は、本発明を分かり易く説明するために詳細に説明したものであり、必ずしも説明した全ての構成を備えるものに限定されるものではない。また、ある実施の形態の構成の一部を他の実施の形態の構成に置き換えることが可能であり、また、ある実施の形態の構成に他の実施の形態の構成を加えることも可能である。また、各実施の形態の構成の一部について、他の構成の追加・削除・置換をすることが可能である。 For example, the above-described embodiment is described in detail in order to explain the present invention in an easy-to-understand manner, and is not necessarily limited to one having all the described configurations. Also, part of the configuration of one embodiment can be replaced with the configuration of another embodiment, and the configuration of another embodiment can be added to the configuration of one embodiment. . In addition, with respect to a part of the configuration of each embodiment, it is possible to add, delete, and replace other configurations.
また、上記した実施の形態では、物理学の世界で代表的なイジングモデルを例にあげて説明したが、本発明はこれに限定されるものではなく、種々の物理現象や社会現象を表現することができる相互作用モデル全般に適用できるものである。また、イジングモデルの基底探索を実施する装置として半導体チップを例にあげて説明したが、本発明はこれに限定されるものではなく、同様の動作を行う装置全般に適用できるものである。 In the above-described embodiment, although the Ising model representative in the world of physics has been described as an example, the present invention is not limited to this and various physical phenomena and social phenomena are expressed. It can be applied to all possible interaction models. In addition, although a semiconductor chip has been described as an example of an apparatus for performing base search of the Ising model, the present invention is not limited to this and can be applied to all apparatuses performing the same operation.
101…CPU、102…メモリ、103…記憶装置、104…半導体システム、105…システムバス、106…コントローラ、107…システムI/F、108…レジスタ、109…データ処理部、110…クロック生成部、111…問題データ格納部、112…スピンデータ格納部、113…データI/F、114…スイッチ、115…半導体チップ群、116…半導体チップ、117…チップ間配線、118…問題設定レジスタ、120…チップ数設定レジスタ、121…チップ仕様設定レジスタ、122…チップ間接続部、123…アドレス生成部、124…データ生成部、125…展開部、126…データ集計部、127…相互作用制御信号生成部、128…乱数発生部、
401…I/F、402…チップ間伝送I/F、403…レジスタ、404…メモリコントローラ、405…スピンアレイ、406…相互作用I/F、407…相互作用アドレスデコーダ、408…チップ間伝送部コントローラ、409…境界スピン制御部、410…送信用バッファ、411…受信用バッファ、
1401…専用バス、1402…半導体チップ、
1501…ホスト、1502…半導体システム群、1503…半導体システム、1504…ネットワーク。101 ... CPU, 102 ... memory, 103 ... storage device, 104 ... semiconductor system, 105 ... system bus, 106 ... controller, 107 ... system I / F, 108 ... register, 109 ... data processing unit, 110 ... clock generation unit, 111 problem
401 ... I / F, 402 ... inter-chip transmission I / F, 403 ... register, 404 ... memory controller, 405 ... spin array, 406 ... interaction I / F, 407 ... interaction address decoder, 408 ... inter-chip transmission unit Controller, 409: boundary spin control unit, 410: transmission buffer, 411: reception buffer,
1401: dedicated bus, 1402: semiconductor chip,
1501 ... host, 1502 ... semiconductor system group, 1503 ... semiconductor system, 1504 ... network.
Claims (4)
前記複数の半導体チップの各々は、複数のノード間の相互作用によって処理が実行される相互作用モデルで表現された問題データの各ノードの値が格納される第1のメモリと、前記問題データの各ノードに関する係数が格納される第2のメモリと、前記第1のメモリに格納された前記各ノードの値を更新する演算回路とを含むユニットを複数備え、
前記コントローラは、
処理対象とする問題データの各ノードの値が格納される第3のメモリと、
前記処理対象とする問題データの各ノードに関する係数が格納される第4のメモリと、
前記処理対象とする問題データのサイズと、制御対象とする前記半導体チップのチップ数と、1チップで処理可能な問題データのサイズとを設定するレジスタと、
前記レジスタの設定値に基づき、前記第3及び前記第4のメモリのアドレスと前記複数の半導体チップの各々のアドレスとの対応関係を設定するアドレス生成部と、
前記対応関係に基づき、前記第3及び前記第4のメモリに格納された前記各ノードの値及び前記係数を前記複数の半導体チップへ伝送するデータ展開部と、
前記複数の半導体チップの前記第1のメモリに格納された前記各ノードの値を受信し、前記対応関係に基づき前記第3のメモリへ格納するデータ集計部と、
を備え、
前記コントローラは、
前記第3のメモリの第1のアドレスと第2のアドレスとの対応関係を示すテーブルと、
前記テーブルを参照し、前記第1のアドレスから読み出した値を前記第2のアドレスへ書き込むチップ間接続部と、
を備え、
前記データ展開部の伝送処理の実行後に、前記複数の半導体チップでの演算処理が実行され、前記演算処理の実行後に、前記データ集計部の集計処理が実行され、
前記データ集計部の集計処理の実行後に、前記チップ間接続部による受信及び書込み処理が実行され、前記書込み処理の実行後に、前記伝送処理、前記演算処理、前記集計処理が実行され、
前記集計処理と、前記受信及び書込み処理と、前記伝送処理とが所定の周期で繰り返し実行され、
前記所定の周期は徐々に短くなるように設定されている、
半導体システム。 A semiconductor system comprising: a plurality of semiconductor chips; and a controller connected to the plurality of semiconductor chips,
Each of the plurality of semiconductor chips includes: a first memory in which the value of each node of the problem data represented by the interaction model in which processing is executed by interaction among the plurality of nodes; A plurality of units each including a second memory in which coefficients related to each node are stored, and an arithmetic circuit that updates the value of each node stored in the first memory,
The controller
A third memory in which the value of each node of the problem data to be processed is stored;
A fourth memory storing coefficients related to each node of the problem data to be processed;
A register for setting the size of problem data to be processed, the number of chips of the semiconductor chip to be controlled, and the size of problem data that can be processed by one chip;
An address generation unit configured to set correspondence between the addresses of the third and fourth memories and the respective addresses of the plurality of semiconductor chips based on the setting value of the register;
A data expansion unit for transmitting the values of the nodes and the coefficients stored in the third and fourth memories to the plurality of semiconductor chips based on the correspondence relationship;
A data totaling unit that receives the value of each node stored in the first memory of the plurality of semiconductor chips, and stores the value in the third memory based on the correspondence relationship ;
Bei to give a,
The controller
A table showing the correspondence between the first address and the second address of the third memory;
An inter-chip connection unit which refers to the table and writes a value read from the first address to the second address;
Equipped with
After execution of the transmission process of the data expansion unit, arithmetic processing is performed on the plurality of semiconductor chips, and after execution of the arithmetic process, aggregation processing of the data aggregation unit is performed.
After execution of the aggregation process of the data aggregation unit, reception and write processing by the inter-chip connection unit are executed, and after the execution of the write operation, the transmission process, the arithmetic process, and the aggregation process are executed.
The tallying process, the receiving and writing process, and the transmission process are repeatedly executed in a predetermined cycle.
The predetermined cycle is set to be gradually shorter,
Semiconductor system.
前記相互作用モデルはイジングモデルであり、前記各ノードの値はスピン値であり、前記係数は相互作用係数と外部磁場係数とを含む、半導体システム。 The semiconductor system according to claim 1,
The semiconductor system, wherein the interaction model is an Ising model, the value of each of the nodes is a spin value, and the coefficient includes an interaction coefficient and an external magnetic field coefficient.
前記複数の半導体チップの各々は、複数のノード間の相互作用によって処理が実行される相互作用モデルで表現された問題データの各ノードの値が格納される第1のメモリと、前記問題データの各ノードに関する係数が格納される第2のメモリと、前記第1のメモリに格納された前記各ノードの値を更新する演算回路とを含むユニットを複数備え、
前記コントローラは、処理対象とする問題データの各ノードの値が格納される第3のメモリと、前記処理対象とする問題データの各ノードに関する係数が格納される第4のメモリと、前記処理対象とする問題データのサイズと、制御対象とする前記半導体チップのチップ数と、1チップで処理可能な問題データのサイズとを設定するレジスタと、アドレス生成部と、データ展開部と、データ集計部とを備え、
前記アドレス生成部は、前記レジスタの設定値に基づき、前記第3及び前記第4のメモリのアドレスと前記複数の半導体チップの各々のアドレスとの対応関係を設定し、
前記データ展開部は、前記対応関係に基づき、前記第3及び前記第4のメモリに格納された前記各ノードの値及び前記係数を前記複数の半導体チップへ伝送し、
前記データ集計部は、前記複数の半導体チップの前記第1のメモリに格納された前記各ノードの値を受信し、前記対応関係に基づき前記第3のメモリへ格納し、
前記コントローラは、前記第3のメモリの第1のアドレスと第2のアドレスとの対応関係を示すテーブルと、チップ間接続部とを備え、
前記チップ間接続部は、前記テーブルを参照し、前記第1のアドレスから読み出した値を前記第2のアドレスへ書き込み、
前記データ展開部の伝送処理の実行後に、前記複数の半導体チップでの演算処理を実行し、前記演算処理の実行後に、前記データ集計部の集計処理を実行し、
前記データ集計部の集計処理の実行後に、前記チップ間接続部による受信及び書込み処理を実行し、前記書込み処理の実行後に、前記伝送処理、前記演算処理、前記集計処理を実行し、
前記集計処理と、前記受信及び書込み処理と、前記伝送処理とを所定の周期で繰り返し実行し、
前記所定の周期は徐々に短くなるように設定されている、
計算方法。 A method of calculating a semiconductor system, comprising: a plurality of semiconductor chips; and a controller connected to the plurality of semiconductor chips,
Each of the plurality of semiconductor chips includes: a first memory in which the value of each node of the problem data represented by the interaction model in which processing is executed by interaction among the plurality of nodes; A plurality of units each including a second memory in which coefficients related to each node are stored, and an arithmetic circuit that updates the value of each node stored in the first memory,
The controller is a third memory in which the value of each node of the problem data to be processed is stored, a fourth memory in which a coefficient related to each node of the problem data to be processed is stored, and the processing object A register for setting the size of problem data to be processed, the number of semiconductor chips to be controlled, and the size of problem data that can be processed by one chip, an address generation unit, a data expansion unit, and a data aggregation unit Equipped with
The address generation unit sets the correspondence between the addresses of the third and fourth memories and the addresses of the plurality of semiconductor chips based on the set value of the register.
The data expansion unit transmits the values of the nodes and the coefficients stored in the third and fourth memories to the plurality of semiconductor chips based on the correspondence relationship.
The data tabulation unit, the stored plurality of the first memory of the semiconductor chip receiving said value of each node, and stores into said third memory based on the correspondence relation,
The controller includes a table indicating a correspondence between a first address and a second address of the third memory, and an inter-chip connection unit.
The inter-chip connection unit refers to the table and writes a value read from the first address to the second address;
After execution of the transmission processing of the data expansion unit, arithmetic processing is performed on the plurality of semiconductor chips, and after execution of the arithmetic processing, aggregation processing of the data aggregation unit is performed.
After execution of the aggregation process of the data aggregation unit, the reception and write process by the inter-chip connection unit are executed, and after the execution of the write process, the transmission process, the arithmetic process, and the aggregation process are executed.
Repeatedly executing the counting process, the receiving and writing process, and the transmission process in a predetermined cycle;
The predetermined cycle is set to be gradually shorter,
Method of calculation.
前記相互作用モデルはイジングモデルであり、前記各ノードの値はスピン値であり、前記係数は相互作用係数と外部磁場係数とを含む、計算方法。 The calculation method according to claim 3 , wherein
The calculation method, wherein the interaction model is an Ising model, the value of each of the nodes is a spin value, and the coefficient includes an interaction coefficient and an external magnetic field coefficient.
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
PCT/JP2015/075002 WO2017037903A1 (en) | 2015-09-02 | 2015-09-02 | Semiconductor system and computing method |
Publications (2)
Publication Number | Publication Date |
---|---|
JPWO2017037903A1 JPWO2017037903A1 (en) | 2018-02-08 |
JP6503072B2 true JP6503072B2 (en) | 2019-04-17 |
Family
ID=58186744
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2017537148A Active JP6503072B2 (en) | 2015-09-02 | 2015-09-02 | Semiconductor system and calculation method |
Country Status (2)
Country | Link |
---|---|
JP (1) | JP6503072B2 (en) |
WO (1) | WO2017037903A1 (en) |
Families Citing this family (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP6691297B2 (en) * | 2016-07-13 | 2020-04-28 | 富士通株式会社 | Information processing apparatus, Ising apparatus, and control method of information processing apparatus |
CA3109735A1 (en) | 2018-09-14 | 2020-03-19 | Fujitsu Limited | Optimization device, optimization device control method, and optimization device control program |
JP7155794B2 (en) | 2018-09-19 | 2022-10-19 | 富士通株式会社 | Optimization Problem Calculation Program, Optimization Problem Calculation Method, and Optimization Problem Calculation Device |
JP7087871B2 (en) | 2018-09-19 | 2022-06-21 | 富士通株式会社 | Optimization problem calculation program, optimization problem calculation method and optimization problem calculation device |
JP7196489B2 (en) | 2018-09-19 | 2022-12-27 | 富士通株式会社 | Optimization Problem Calculation Program, Optimization Problem Calculation Method, and Optimization Problem Calculation Device |
JP7152343B2 (en) * | 2019-03-26 | 2022-10-12 | 株式会社日立製作所 | semiconductor equipment |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP6006411B2 (en) * | 2013-05-31 | 2016-10-12 | 株式会社日立製作所 | Semiconductor device |
-
2015
- 2015-09-02 JP JP2017537148A patent/JP6503072B2/en active Active
- 2015-09-02 WO PCT/JP2015/075002 patent/WO2017037903A1/en active Application Filing
Also Published As
Publication number | Publication date |
---|---|
JPWO2017037903A1 (en) | 2018-02-08 |
WO2017037903A1 (en) | 2017-03-09 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6503072B2 (en) | Semiconductor system and calculation method | |
JP5864684B1 (en) | Semiconductor device | |
JP5865456B1 (en) | Semiconductor device | |
JP5922203B2 (en) | Semiconductor device | |
US9804827B2 (en) | Information processing system and management apparatus | |
JP6568222B2 (en) | Semiconductor system and calculation method | |
JP6177993B2 (en) | Semiconductor device and information processing apparatus | |
JP6476292B2 (en) | Information processing apparatus and control method thereof | |
JP6496410B2 (en) | Information processing apparatus and method | |
WO2016006071A1 (en) | Semiconductor device and information processing system | |
JP5894645B1 (en) | Semiconductor device and quality control method thereof | |
JP5851570B1 (en) | Semiconductor device | |
JP6701207B2 (en) | Information processing system | |
US20220006457A1 (en) | Glitch-free multiplexer | |
JP2016066378A (en) | Semiconductor device and information processing method | |
JP7152343B2 (en) | semiconductor equipment | |
JP2016052012A (en) | Semiconductor device and information processing device | |
JP6914872B2 (en) | Information processing equipment and semiconductor integrated circuit equipment | |
Siozios et al. | On designing self-aware reconfigurable platforms |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20171016 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20181211 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20190207 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20190305 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20190322 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6503072 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |