JPH03500585A - Enhanced input/output architecture for toroidally connected distributed storage parallel computers - Google Patents

Enhanced input/output architecture for toroidally connected distributed storage parallel computers

Info

Publication number
JPH03500585A
JPH03500585A JP63508682A JP50868288A JPH03500585A JP H03500585 A JPH03500585 A JP H03500585A JP 63508682 A JP63508682 A JP 63508682A JP 50868288 A JP50868288 A JP 50868288A JP H03500585 A JPH03500585 A JP H03500585A
Authority
JP
Japan
Prior art keywords
channel
buffer
processing
data
computer
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP63508682A
Other languages
Japanese (ja)
Inventor
コック,ロナルド・スティーブン
Original Assignee
イーストマン・コダック・カンパニー
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by イーストマン・コダック・カンパニー filed Critical イーストマン・コダック・カンパニー
Publication of JPH03500585A publication Critical patent/JPH03500585A/en
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F15/00Digital computers in general; Data processing equipment in general
    • G06F15/16Combinations of two or more digital computers each having at least an arithmetic unit, a program unit and a register, e.g. for a simultaneous processing of several programs
    • G06F15/163Interprocessor communication
    • G06F15/173Interprocessor communication using an interconnection network, e.g. matrix, shuffle, pyramid, star, snowflake
    • G06F15/17337Direct connection machines, e.g. completely connected computers, point to point communication networks
    • G06F15/17343Direct connection machines, e.g. completely connected computers, point to point communication networks wherein the interconnection is dynamically configurable, e.g. having loosely coupled nearest neighbor architecture
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F15/00Digital computers in general; Data processing equipment in general
    • G06F15/76Architectures of general purpose stored program computers
    • G06F15/80Architectures of general purpose stored program computers comprising an array of processing units with common control, e.g. single instruction multiple data processors
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F15/00Digital computers in general; Data processing equipment in general
    • G06F15/76Architectures of general purpose stored program computers
    • G06F15/80Architectures of general purpose stored program computers comprising an array of processing units with common control, e.g. single instruction multiple data processors
    • G06F15/8007Architectures of general purpose stored program computers comprising an array of processing units with common control, e.g. single instruction multiple data processors single instruction multiple data [SIMD] multiprocessors
    • G06F15/8023Two dimensional arrays, e.g. mesh, torus

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Hardware Design (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Computing Systems (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Multi Processors (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるため要約のデータは記録されません。 (57) [Summary] This bulletin contains application data before electronic filing, so abstract data is not recorded.

Description

【発明の詳細な説明】 この発明はトロイダル接続された分布記憶装置型並列計算機の入出力能力及び効 率の向上に関する。[Detailed description of the invention] This invention aims to improve the input/output capacity and efficiency of a toroidally connected distributed storage type parallel computer. Concerning rate improvement.

背景技術 計算のための更なる処理能力を達成しようと努力して、多くの計算機設計者は並 列処理に向っている。しかしながら、並列処理を採用した種々の計算機アーキテ クチャがある。Background technology In an effort to achieve more processing power for computation, many computer designers Suitable for column processing. However, various computer architectures that employ parallel processing There is Kucha.

並列処理計算機は二つの一般的な形式、即ち共有記憶装置型処理装置を備えたも の及び分布記憶装置型処理装置を備えたもの、に分類され得る。共有記憶装置型 計算機は同じ記憶装置にアクセスすることのできる多数の処理装置を含む。対照 的に、分布記憶装置型計算機は個々の独立した記憶装置を持った処理装置を備え ている。分布記憶装置型処理装置間の通信は、通信相互接続部によって行われる 。この発明は、明確には分布記憶装置型並列処理計算機に、更に詳細には、トロ イダル接続された計算機に関する。Parallel processing computers come in two general types: those with shared storage processing units; and distributed storage type processing devices. shared storage type A computer includes multiple processing units that can access the same storage device. contrast Generally speaking, a distributed storage computer has a processing unit with each independent storage device. ing. Communication between distributed storage type processing units is carried out by a communication interconnect. . This invention specifically relates to a distributed storage type parallel processing computer, and more specifically to a distributed storage type parallel processing computer. Regarding connected computers.

トロイダル接続された分布記憶装置型並列計算機の性能は、幾つかの因子、即ち 、計算機の全記憶容量、計算機における処理装置の数、所与の問題によって必要 とされる処理装置間の通信、及びデータを計算機に又は計算機から移動し得る速 度、によって制限される。大抵の並列計算機においては、処理装置の数及びその 記憶容量を存在するどのような要求にも適合させるように容易に変更することが できるので、最初の二つの因子は、比較的重要ではない。第3の因子即ち処理装 置相互の通信は、広範且つ集中的な研究の主題である(リン及びモルトパン「M 2メツシュ:拡大メツシュ・アーキテクチャ」並列処理に関する第1回国際会議 議事録、306ページ、並びにカールソン「グローバル・メツシュを備えたメツ シュ:並列計算のためのフレキシブルな高速組織」超高速計算に関する第1回国 際会議議事録、618ページを参照のこと)。The performance of a toroidally connected distributed storage parallel computer depends on several factors: , the total storage capacity of the computer, the number of processing units in the computer, and the amount required by the given problem. communications between processing units that are limited by the degree. In most parallel computers, the number of processing units and their Storage capacity can be easily modified to suit whatever requirements exist. The first two factors are relatively unimportant. The third factor, processing equipment Communication between plants is the subject of extensive and intensive research (Lin and Maltpan "M 2 Mesh: Extended Mesh Architecture” 1st International Conference on Parallel Processing Minutes, page 306, and Carlson, “Metz with a Global Metz” "Flexible high-speed organization for parallel computing" 1st national conference on ultra-high-speed computing (See Minutes of the International Conference, page 618).

大形のデータ集合の利用(例えば、イメージ処理又はデータベース検査など)に 対しては、入出力(1/○)要件も並列計算機の総合スループットを規制する重 要な因子に十分なり得る。For use with large data sets (e.g. image processing or database inspection) In contrast, input/output (1/○) requirements are also important in regulating the overall throughput of parallel computers. This can be a sufficient factor.

この明細書においては語「トロイダル」は語「メツシュ」を含むものと理解され る。In this specification, the word "toroidal" is understood to include the word "metsu". Ru.

しばしば使用される二つの一般的な並列処理モード即ち分布型とパイプライン型 とがある。分布型処理はどの処理装置もデータの異なった部分集合に対して同じ 動作を行うことを必要とする。パイプライン処理はどの処理装置も同じ集合のデ ータに対して異なった動作を行うことを必要とする。トロイダル接続された計算 機は両モードで動作するのに特に適しているが、問題もある。Two common parallelism modes often used: distributed and pipelined There is. Distributed processing means that every processing device handles different subsets of data in the same way. Requires performing an action. Pipeline processing means that every processing device processes the same set of data. require different actions on the data. toroidally connected computation Although the machine is particularly suited to operating in both modes, there are problems.

適切なIloを提供する試みは、一般に各処理装置のノードにI10チャンネル を設けること、及び制御チャンネルを介して種々の処理装置への書き込みを行わ せることを含む。この方法は分布型処理に向いているが、チップ費用(chjp  cost)及び回路板面積の点からみると、比較的高価である(ナギの米国特 許第4.514,807号「並列計算機」、及びシンキング・マシーンズ社製「 コネクション・マシーン」、インテル・サイエンティフィック・コンピュータズ 社製「ハイパキューブ」及びエヌキューブ(N cube)製「エヌキューブ( Ncube) /IOJの市販製品を参照のこと)。更に、I10チャンネルに フィードする装置は別の隘路を与える。Attempts to provide adequate Ilo generally include an I10 channel for each processing unit node. and writing to various processing devices via control channels. Including making. This method is suitable for distributed processing, but the chip cost (chjp cost) and circuit board area, it is relatively expensive (Nagi's US special Patent No. 4.514,807 “Parallel Computer” and Thinking Machines Inc. “ Connection Machine”, Intel Scientific Computers "Hyper Cube" manufactured by the company and "N Cube" manufactured by N cube (N cube) Ncube) / IOJ commercial products). Furthermore, on the I10 channel Feeding devices present another bottleneck.

時折取り上げられる代替的方法は、一つの処理装置とのみIloを行い、並列処 理装置の相互接続網を用いてデータを更に分布させることである。この方法は安 価ではあるが、帯域幅の制約を受ける。An alternative approach that is sometimes taken up is to perform Ilo with only one processing unit and avoid parallel processing. further distributing data using an interconnected network of physical devices. This method is cheap However, it is subject to bandwidth constraints.

これらの一般的方法は、多数のデータ源又は行先とのIloを行うことができな い。これにより、他の計算機及びデータ記憶又は発生装置と共働するときの有用 性が制限される。これらの方法のいずれもがパイプライン型及び分布型並列処理 の両方に対して同等に有効ではあり得ない。これらの方法のいずれも、フレキシ ブルナI / O速度を提供することができない。並列システムの主要な利点の 一つはその性能のフレキシビリティ (計算性能を改善するために処理装置を追 加すること)であるので、I10性能及びハ・・−ドウエアを同じようにスケー ル(scale)することは重要である。These general methods cannot perform Ilo with multiple data sources or destinations. stomach. This makes it useful when working with other computing and data storage or generation devices. Sexuality is restricted. Both of these methods involve pipelined and distributed parallel processing. cannot be equally valid for both. Both of these methods Unable to provide Bruna I/O speeds. The main advantages of parallel systems One is its performance flexibility (additional processing units can be added to improve calculation performance). I10 performance and hardware should be scaled in the same way. It is important to scale.

この発明の目的は、上述の諸問題を除去するトロイダル接続された分布記憶装置 型並列計算機のための一層有効なアーキテクチャを提供することである。The purpose of this invention is to provide a toroidally connected distributed storage device which eliminates the above-mentioned problems. The purpose of this invention is to provide a more effective architecture for type parallel computers.

発明の開示 この目的は、各々が独立した記憶装置を有する複数行の処理装置を備えたトロイ ダル接続された分布記憶装置型並列計算機において、 a)少なくとも一つの共通I10チャンネルと、b)前記共通I10チャンネル に接続されるようになされた1行の処理装置( 1 10)と、 C)各々が前記の110行の特定の処理装置と関連した複数のバッファ機構であ って、各バッファ機構が、110行の任意の所与のI10処理装置が、I10チ ャンネルによるバッファ機構へのアクセスとは無関係に、且つ、前記の110行 における他の処理装置のバッファ機構へのアクセスとは無関係に、そのバッファ 機構にアクセスすることができるように、■10チャンネルを処理装置に接続す るようになされ、データ分布が有効に容易化される複数のバッファ機構と、を含 む改良によって達成される。Disclosure of invention The goal is to create a Trojan with multiple rows of processing units, each with independent storage. In a parallel parallel computer with distributed memory connected in parallel, a) at least one common I10 channel; and b) said common I10 channel. a one-line processing device (1 10) connected to the C) a plurality of buffer mechanisms, each associated with a particular processing unit of said 110 lines. Thus, each buffer mechanism allows any given I10 processing unit of 110 rows to Regardless of the channel's access to the buffer mechanism, and line 110 above. that buffer, regardless of its access to the buffer mechanism of other processing units in Connect the ■10 channels to the processing unit so that you can access the mechanism. and a plurality of buffer mechanisms, which are configured to effectively facilitate data distribution. This is achieved through improvements.

メツシュ又はトロイドはそのトポロジー的構造(topologicalstr ucture)を破壊することなく大きさを変え又は回転させることができるの で、一つの行の処理装置への言及は一列の処理装置への言及と考えることができ る。A mesh or toroid is defined by its topological structure (topological structure). The structure can be resized or rotated without destroying it. , a reference to a processor in one row can be thought of as a reference to a processor in a column. Ru.

図面の簡単な説明 第1図は、一つの行に挿入された制御処理装置を存する従来技術のトロイダル接 続された計算機を示す。Brief description of the drawing FIG. 1 shows a prior art toroidal connection with a control processor inserted in one row. Shows a connected computer.

第2図は、I10チャンネルを持った入/出ノノ(Ilo)行と一つのI10バ ッファ機構が110行における各処理装置と関連している関連のI10バッファ 機構とを用いたこの発明に係るトロイダル接続された分布記憶装置型並列計算機 を示す。Figure 2 shows an input/output (Ilo) row with an I10 channel and one I10 channel. An associated I10 buffer is associated with each processing unit in line 110. A toroidally connected distributed storage parallel computer according to the present invention using a mechanism shows.

第3図は、個別のI10チャンネルに接続された二つのI10処理装置の行を含 むこの発明に係るトロイダル接続された計算機を示す。Figure 3 includes two rows of I10 processing units connected to separate I10 channels. 1 shows a toroidally connected computer according to this invention.

第4図は、この発明に従って使用され、通常の記憶、仲裁及び母線方法を使用す るI10バッファ機構を示す。FIG. 4 shows the method used in accordance with this invention, using conventional storage, arbitration and busbar methods. The I10 buffer mechanism is shown.

第5図は、この発明に従って使用され、通常の二重ポート記憶装置を使用する別 のI10バッファ機構を示す。FIG. 5 shows another example of a conventional dual-port storage device used in accordance with the present invention. The I10 buffer mechanism of FIG.

第6図は、ハンドシェイク制御論理部と共に先入れ先出しくF r FO)バッ ファの双方向性ラッチを用いて、処理装置に高速並列データI10ポートを接続 するようになされた更に別のI10バッファ機構を示す。FIG. 6 shows a first-in, first-out buffer with handshake control logic. Connect high-speed parallel data I10 ports to processing equipment using bidirectional latches in 3 shows yet another I10 buffer scheme adapted to do so.

第7図は、通常の母線として実現されたI10チャンネルに一つの110行が接 続されている、第3図に類似したこの発明の一実施例を示す。Figure 7 shows that one 110 row is connected to the I10 channel realized as a normal busbar. 3 shows an embodiment of the invention, similar to FIG.

第8図は、110行が高速並列入力に接続され、別の110行が高速並列出力に 接続された、並列処理装置を有するこの発明の一実施例を示す。Figure 8 shows that 110 rows are connected to high-speed parallel inputs and another 110 rows are connected to high-speed parallel outputs. 1 shows an embodiment of the invention with parallel processing devices connected;

発明を実施するための形態 この発明は、トロイダル接続された並列計W機で改良された入出力動作を行うた めのアーキテクチャに関係する。Mode for carrying out the invention This invention provides improved input/output operation in a toroidally connected parallel meter W machine. related to the architecture of

第1図は通信チャンネル14と相互接続された多くの処理装置12、及び一つの 行に挿入されたノード制御器16を備えた従来技術の配列10を示している。各 処理装置12は独立した記憶装置を持っている。ノード制御器16はトロイダル 処理装置の閉じた面へのエントリ・ポイントとして働く。配列の任意の行を11 0行として選択し得る。これらの行の数は、意図される特定の応用に依存する。FIG. 1 shows a number of processing units 12 interconnected with a communication channel 14, and one 1 shows a prior art array 10 with node controllers 16 inserted in rows; each Processing unit 12 has independent storage. The node controller 16 is toroidal Serves as an entry point to the closed side of the processing unit. 11 any row of the array It can be selected as row 0. The number of these lines depends on the particular application intended.

第2図は、この発明に従って接続された特定の110行を示している。この処理 装置の行20はI10チャンネル26から直接にアクセスされ得る。I10チャ ンネルは、大量の情報を迅速に転送し得る任意の機構である。典型的には、I1 0チャンネルは第4図及び第5図に示された標準計算機母線又は並列I10ボー トである。110行は、各処理装置を異なったバッファ機構24に直接に接続さ せている。各バッファ機構は、■10チャンネルがバッファの任意の一つと高速 で独立に通信することができるように、記憶・制御装置を提供する。FIG. 2 shows 110 particular rows connected in accordance with the present invention. This process Device row 20 can be accessed directly from I10 channel 26. I10cha A channel is any mechanism that can rapidly transfer large amounts of information. Typically, I1 0 channel is the standard computer bus or parallel I10 board shown in Figures 4 and 5. It is. Line 110 connects each processing unit directly to a different buffer mechanism 24. It's set. Each buffer mechanism has ■10 channels fast with any one of the buffers Provides storage and control equipment so that communication can be performed independently.

任意の所与の処理装置は、入力サイクル又は出力サイクルを完了するためにその 関連のバッファ機構と通信する。任意の処理装置は、他のバッファ機構とのI1 0チャンネル又は処理装置の活動とは無関係にその関連するバッファをアクセス することができる必要がある。関連の処理装置の他には、I10チャンネルだけ がバッファへアクセスでき、他の処理装置はそれ自身のバッファとのみ通信する ことができる。I10チャンネル及び処理装置は同時に一つのバッファと通信し ようとすることがあるので、それらの通信を仲裁するための装置が設けられなけ ればならない。I10チャンネル又は処理装置をバッファの主(fflaste r of the buffer)に指定することができ、従って適切な仲裁機 構を含まなければならない。処理装置が一つのデータ集合を処理している間にr 10チャンネルが別のデータ集合を通信することができるほどバッファが大形に 作られていれば、それも又有用であり得る。Any given processing device can complete its input cycle or output cycle. Communicate with the associated buffer mechanism. Any processing device may have I1 with other buffer mechanisms. 0 accesses its associated buffer independent of channel or processing unit activity need to be able to. In addition to the related processing equipment, only the I10 channel has access to the buffer, and other processing units communicate only with its own buffer. be able to. The I10 channel and processing unit communicate with one buffer at a time. equipment to arbitrate these communications must be provided. Must be. The I10 channel or processing unit is the main buffer (fflaste). r of the buffer), and therefore an appropriate arbitration mechanism must include structure. While the processing unit is processing one data set, r The buffer is large enough that 10 channels can communicate different data sets. If made, it can also be useful.

任意の特定の応用に対するI10チャンネルと各チャンネルにおける処理装置と の組合せは設計上の考慮事項である。第3図は、二つの行がIloに対して使用 されている形態を示している。多数の行を同じI10チャンネルに接続すること も又可能である。I10 channels and processing units in each channel for any particular application. The combination of is a design consideration. Figure 3 shows that two rows are used for Ilo. It shows the form in which it is used. Connecting multiple rows to the same I10 channel It is also possible.

第4図に移ると、仲裁・制御回路32及び記憶装置34を備えた機構24が示さ れている。この構成は処理装置12又はチャンネル26から記憶装置34へのア クセスを可能にする。このような構成24はすでに作られており、記憶装置34 のための標準ランダム・アクセス記憶装置(RAM)と共に、また、仲裁・制御 回路32を実現する標準母線要求/許可及びデータ読出し/書込み信号と共に首 尾よく用いられている。処理装置は回路24の主(themaster)であっ て、記憶装置への情報の読出し、書込みをする。Turning to FIG. 4, a mechanism 24 with an arbitration and control circuit 32 and a storage device 34 is shown. It is. This configuration provides access to storage device 34 from processing unit 12 or channel 26. access. Such a configuration 24 has already been created and the storage device 34 Along with standard random access storage (RAM) for arbitration and control The standard bus request/grant and data read/write signals that implement the circuit 32 The tail is often used. The processing unit is the master of the circuit 24. to read and write information to the storage device.

例えば、I10チャンネル26が記憶装置34と通信することを望むときには、 I10チャンネルはまず処理装置に要求の信号を送る。そこで処理装置は記憶装 置34との通信を止め、I10チャンネル26にアクノリジ信号を送り返す。For example, when I10 channel 26 desires to communicate with storage device 34, The I10 channel first sends a request signal to the processing unit. Therefore, the processing unit It stops communication with the device 34 and sends an acknowledge signal back to the I10 channel 26.

第5図において、二重ポート記憶装置36は二重バッファ記憶装置(doubl cd−buffOred mcmory”)を提供する。二重バッファ記憶装置 は、その二つの別個の機構(この場合にはI10チャンネル及び処理装置)が同 時且つ独立にアクセスすることのできる記憶装置である。これにより、第6図に 示されたような特別の仲裁・制御回路の必要性をなくする。In FIG. 5, dual port storage 36 is double buffer storage (double buffer storage). cd-buffOred mcmory”). Double buffer storage , the two separate mechanisms (in this case the I10 channel and the processing unit) are the same. A storage device that can be accessed simultaneously and independently. This results in Figure 6. Eliminating the need for special arbitration and control circuitry as shown.

第6図には、以下のように一時的に、動作するラッチ/FIFOメモリバッファ 38を含む別の機構24が示されている。Figure 6 shows a latch/FIFO memory buffer that temporarily operates as shown below. Another mechanism 24 is shown including 38.

データ転送の方向に依存して処理装置又はポートによりデータがバッファ38に 与えられる。FIFO(先入れ先出しバッファ)はデータ利用可能信号の受信時 にデータをバッファへ読込む。Data is transferred to buffer 38 by the processing unit or port depending on the direction of data transfer. Given. FIFO (first in, first out buffer) is used when receiving a data available signal. reads the data into the buffer.

データ要求信号の受信時に、FIFOはデータを書き出す。Upon receiving a data request signal, the FIFO writes out the data.

ポート及び処理装置は(上述のハンドシェイクの信号を用いて)直接通信するこ とができるけれども、バッファが満杯になるまで、FIFOは処理装置又はポー トが短時間の間異なる速度でデータを転送することを可能にする。Ports and processing units may communicate directly (using the handshake signals described above). However, the FIFO is not used by the processing unit or port until the buffer is full. allows clients to transfer data at different speeds for short periods of time.

この発明を構成する種々の素子は、モジニール状に配列し、分布型又はパイプラ イン型の動作を与えるように相互接続することができる。例えば、単一の印刷配 線板を用いて、処理装置の行及びそのバッファ・制御機構24と共働する関連の チャンネルを備えた110行を提供することができる。処理装置を別個の印刷配 線板上に設けることもできる。第7図では、分布型動作モードが実現されている 。第8図においては、種々の素子は、分布型及びパイプライン型の両モードにお いて採用され得る構成を与えるように選択される。この配置においては、二つの 別個のI10チャンネル印刷配線板が使用される。任意数のI10ボードを母線 上に配置し、処理装置配列の一つの行として相互接続することができる。配列の 任意の行は一組のI10ボードと関連のチャンネルとを有することができる。The various elements constituting this invention are arranged in a modular manner, distributed type or pipeline type. can be interconnected to provide in-type operation. For example, a single printing layout A wire board is used to create a line of the processing unit and its associated buffer and control mechanism 24. 110 rows with channels can be provided. If the processing unit is a separate printing It can also be provided on a wire plate. In Figure 7, the distributed mode of operation is realized. . In Figure 8, various elements are shown in both distributed and pipelined modes. selected to provide a configuration that can be employed. In this arrangement, two A separate I10 channel printed wiring board is used. Any number of I10 boards as busbars and interconnected as one row of a processing device array. array of Any row can have a set of I10 boards and associated channels.

第7図には、計算機50に結合された母線の形のチャンネル26が示されている 。表示装置52も計算機5oに接続されている。この構造は、分布型及びパイプ ライン型の処理モードに構成され、良好に作動した。英国ブリストルのインモス 社によって製造される「インモス・トランスピユータ(Inmos Trans puter)Jが処理装置として使用された。制御ノードも同じトランスピユー タテアった。機構24はダイナミック・ランダム・アクセス記憶装置であった。FIG. 7 shows a channel 26 in the form of a bus bar coupled to a calculator 50. . A display device 52 is also connected to the computer 5o. This structure is distributed type and pipe It was configured in line type processing mode and worked well. Inmos, Bristol, UK "Inmos Transputer" manufactured by putter) J was used as the processing device. The control node also has the same transp It was Tatea. Facility 24 was a dynamic random access storage device.

I10チャンネル26は工業標準VME母線で実現された。使用されたホスト計 算機50は[サン(Sun)Jワークステーションであった。仲裁は、母線要求 /許可、読圧し/書込み、データ利用可能/要求及びアクノリジ信号を用いた定 義された母線プロトコルによって通常の方法で達成された。I10 channel 26 was implemented with an industry standard VME bus. Host used Computer 50 was a Sun J workstation. Arbitration is busbar request /permit, read/write, data available/configuration using request and acknowledge signals This was accomplished in the usual way by a defined busbar protocol.

各記憶装置と関連した異なった記憶容量をそれぞれ有する三つの個別の印刷配線 板が実現された。更に、これらの印刷配線板の一つは、第2図に示すように四つ の処理装置を備えた110行を実現した。これらの印刷配線板は上記のように相 互接続され、トロイダル配列における種々の行長さ及び列高さを持った4個の処 理装置から96個の処理装置に及ぶ種々の大きさの計算機を構成する。これらの 計算機は、大全のデータ集合を処理する間、並列処理装置に対する重大な通信上 の隘路に遭遇することなく、ワークステーション・ホスト(workstati on host)の性能の70倍もの性能を示した。Three separate printed wires, each with a different storage capacity associated with each storage device The board was realized. Furthermore, one of these printed wiring boards has four parts as shown in Figure 2. A 110-line system was realized with a processing device of. These printed wiring boards are compatible as described above. Four treatments are interconnected and have various row lengths and column heights in a toroidal arrangement. We configure computers of various sizes, ranging from physical units to 96 processing units. these While processing a large data set, the computer uses critical communication connections to parallel processing units. workstation host (workstati) without encountering bottlenecks. on host).

この発明を用いると、処理装置配列のI10侑造を容易に変更することができる 。パイプライン型の応用に対しては、第8図に示されたように、一つの行におけ る一つのI10チャンネルはデータ入力として機能し、別のI10チャンネルは データ出力として機能することができる。そこで、データは各段で処理されて構 造を流れる。より高速又はより低速のデータ、スループットが要求される場合に は、配列(及び関連の110行)は、処理装置の数を一定に保ちながら、より広 く又はより狭くされる。その代りに、処理速度が変わり、I10スルーブツト速 度が一定に保たれる場合には、配列は処理装置の非I10行(non −I /  OroνS)を除去し又は追加することによって、より高く又はより短くする ことができる。処理装置の追加又は削除により、処理速度が変わるが、I10ハ ードウェアは追加されない。これは、計算能力及びI10スループットの両方に 対して費用効率がよくフレキシブルな性能を与える。Using this invention, it is possible to easily change the I10 arrangement of processing equipment. . For pipelined applications, in one row, as shown in Figure 8, One I10 channel serves as the data input and another I10 channel serves as the data input. Can function as data output. Therefore, data is processed in each stage. flowing through the structure. When faster or slower data or throughput is required The array (and associated 110 rows) can be made more spacious while keeping the number of processing units constant. narrower or narrower. Instead, the processing speed changes, increasing the I10 throughput speed. If the degree is kept constant, the array will be make it higher or shorter by removing or adding OroνS) be able to. Processing speed changes by adding or removing processing devices, but No hardware is added. This increases both computational power and I10 throughput. cost-effective and flexible performance.

上述のように、第8図は分布型処理に対しても同様に十分に使用し得る。異なる I10チャンネルをデータ源及び/又は行先として使用し得る。As mentioned above, FIG. 8 can be used equally well for distributed processing. different The I10 channel may be used as a data source and/or destination.

複数のI10チャンネルを持つことにより、付加的な能力が提供される。処理装 置配列全体はスイッチング回路網として動作することができる。データをソース I10チャンネルから読み込んで別のI10チャンネルへ向けることができる。Having multiple I10 channels provides additional capabilities. processing equipment The entire array can operate as a switching network. source data It can read from an I10 channel and direct it to another I10 channel.

効 果 この発明は、トロイダル接続された分布記憶型並列計算機のための改善されたI 10性能を提供する。この発明は、処理装置とI10ハードウェアとの要件の間 に費用効率よく均衡を保って、多命令・多データ(MIMD)並列処理装置の実 用的且つフレキシブルな実現を示す。この発明は処理装置配列を利用する。配列 をより広く又はより狭くして、より多(の又はより少ない処理装置がI10行上 のデータを受け入れるようにする(バッファ用ハードウェアはこの速度に適応す ることができなければならない)ことにより、データ速度を変更することができ る。単純なトーラス又はメッシユは、少なくとも一つの行又は列が各110経路 に対するようにして、多数の行又は列を用いることによって、任意の数のデータ I10経路を持つことができる。上の考察は、種々の必要性をパイプライン型及 び分布型の処理に対する大きなIloの要件に合致させる際に、大きなフレキシ ビリティを与える。共通の行と関連したバッファも、異なる応用の要件を満たす ように110行を拡張又は追加することによって大きさを適応させることができ るデータ記憶装置のためのローカル・キャッシュ(local cache)と して機能することができる。行に対して高速インターフェースを設けることによ って、個々の処理装置及びその相互接続部を比較的低速、簡単且つ安価にするこ とができる。effect This invention provides improved I for toroidally connected distributed memory parallel computers. 10 performance. This invention provides a solution between the requirements of the processing unit and the I10 hardware. cost-effectively balance the implementation of multi-instruction, multi-data (MIMD) parallel processors. It shows a practical and flexible implementation. The invention utilizes a processing device array. array wider or narrower so that more (or fewer) processing units are on the I10 line. data (the buffering hardware has to adapt to this speed). (must be able to change the data rate) Ru. A simple torus or mesh has at least one row or column of 110 paths each. Any number of data by using a large number of rows or columns, such as It can have an I10 route. The above considerations explain the various needs of pipeline type and large flexibility in meeting large Ilo requirements for distributed and distributed processing. Gives you the ability. Common rows and associated buffers also meet the requirements of different applications You can adapt the size by extending or adding 110 lines like so: local cache for data storage and function. By providing a fast interface to This makes the individual processing devices and their interconnections relatively slow, simple, and inexpensive. I can do it.

更に、複数のI10チャンネルが使用される場合には、処理装置配列は単純なス イッチング回路網として機能することができる。Furthermore, if multiple I10 channels are used, the processing unit array can be reduced to a simple It can function as a switching network.

FIG、 5 ¥コイ7゛ルたコ里根I FIG、 7 FIG、 8 国際調査報告 m+’mm+a’1keNtn−1t@、PCT/US ElB103340国 際調査報告FIG. 5 ¥Koi 7゛ru Tako Rine I FIG. 7 FIG.8 international search report m+’mm+a’1keNtn-1t@, PCT/US ElB103340 country international investigation report

Claims (5)

【特許請求の範囲】[Claims] 1.各々が独立した記憶装置を有する処理装置の行を備えたトロイダル接続され た分布記憶型並列計算機において、a)少なくとも一つの共通I/Oチャンネル と、b)前記共通のI/Oチャンネルに接続されるようになされた前記処理装置 (I/O)の行と、 c)各々が前記I/O行の特定の処理装置と関連した複数のバッファ機構であっ て、各バッファ機構が、I/O行の任意の所与のI/O処理装置がそのバッファ 機構を、I/Oチャンネルによるバッファ機構へのアクセスとは無関係に且つ前 記I/O行における他の処理装置のバッファ機構へのアクセスとは無関係に、ア クセスすることができるように、I/Oチャンネルに処理装置を接続するように なされ、もってデータ分布が有効に容易化される複数のバッファ機構と、を具備 することを特徴とする計算機。1. Toroidally connected with rows of processing units, each with independent storage In a distributed memory parallel computer, a) at least one common I/O channel and b) the processing device adapted to be connected to the common I/O channel. (I/O) line and c) a plurality of buffer mechanisms, each associated with a particular processing unit of said I/O line; Each buffer mechanism specifies that any given I/O processing device in an I/O row The mechanism can be configured independently and before access to the buffer mechanism by the I/O channel. access to the buffer mechanism of other processing units on the I/O line. Connect the processing device to the I/O channel so that it can access and multiple buffer mechanisms, thereby effectively facilitating data distribution. A calculator characterized by: 2.各々が異なるI/O行をアクセスする二つのI/Oチャンネルと、各I/O チャンネル及びその特定のI/O行とに、関連する複数のバッファ機構とを備え る請求項1記載の計算機。2. Two I/O channels, each accessing a different I/O row, and each I/O A channel and its particular I/O line have associated multiple buffer mechanisms. 2. The computer according to claim 1. 3.各バッファ桜樹が二重ポート記憶装置を含む請求項1記載の計算機。3. 2. The computer of claim 1, wherein each buffer tree includes dual port storage. 4.各バッファ機構がラッチ型にFIFOバッファを含む請求項1記載の計算機 。4. The computer according to claim 1, wherein each buffer mechanism includes a FIFO buffer in a latch type. . 5.第1のI/Oチヤンネルが入力データを並列に受信して該データをそのI/ O行に供給し、第2のI/OチャンネルがそのI/O行から処理済みのデータを 受信して該データを並列出力として送出する請求項2記載の計算機。5. A first I/O channel receives input data in parallel and transfers the data to its I/O channel. O row, and a second I/O channel receives processed data from that I/O row. 3. A computer according to claim 2, wherein the computer receives and sends the data as parallel output.
JP63508682A 1987-10-08 1988-09-29 Enhanced input/output architecture for toroidally connected distributed storage parallel computers Pending JPH03500585A (en)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US105,836 1987-10-08
US07/105,836 US4942517A (en) 1987-10-08 1987-10-08 Enhanced input/output architecture for toroidally-connected distributed-memory parallel computers

Publications (1)

Publication Number Publication Date
JPH03500585A true JPH03500585A (en) 1991-02-07

Family

ID=22308046

Family Applications (1)

Application Number Title Priority Date Filing Date
JP63508682A Pending JPH03500585A (en) 1987-10-08 1988-09-29 Enhanced input/output architecture for toroidally connected distributed storage parallel computers

Country Status (5)

Country Link
US (1) US4942517A (en)
EP (1) EP0334943B1 (en)
JP (1) JPH03500585A (en)
DE (1) DE3867837D1 (en)
WO (1) WO1989003564A1 (en)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008502029A (en) * 2004-03-16 2008-01-24 テクノロジー プロパティーズ リミテッド Computer processor array
JP4820095B2 (en) * 2002-12-19 2011-11-24 アドバンスト・マイクロ・ディバイシズ・インコーポレイテッド Method and system for programming a hypertransport routing table in a multiprocessor system

Families Citing this family (80)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO1990001192A1 (en) * 1988-07-22 1990-02-08 United States Department Of Energy Data flow machine for data driven computing
EP0362840B1 (en) * 1988-10-06 1995-05-10 Kabushiki Kaisha Toshiba Neural network system
DE68927474T2 (en) * 1988-12-29 1997-05-22 Sharp Kk Neuro calculator
US5594866A (en) * 1989-01-18 1997-01-14 Intel Corporation Message routing in a multi-processor computer system with alternate edge strobe regeneration
US5347450A (en) * 1989-01-18 1994-09-13 Intel Corporation Message routing in a multiprocessor computer system
US5689647A (en) * 1989-03-14 1997-11-18 Sanyo Electric Co., Ltd. Parallel computing system with processing element number setting mode and shortest route determination with matrix size information
US5243704A (en) * 1989-05-19 1993-09-07 Stratus Computer Optimized interconnect networks
US5181017A (en) * 1989-07-27 1993-01-19 Ibm Corporation Adaptive routing in a parallel computing system
US5274745A (en) * 1989-07-28 1993-12-28 Kabushiki Kaisha Toshiba Method of processing information in artificial neural networks
US5157785A (en) * 1990-05-29 1992-10-20 Wavetracer, Inc. Process cell for an n-dimensional processor array having a single input element with 2n data inputs, memory, and full function arithmetic logic unit
US5963745A (en) * 1990-11-13 1999-10-05 International Business Machines Corporation APAP I/O programmable router
US5765011A (en) * 1990-11-13 1998-06-09 International Business Machines Corporation Parallel processing system having a synchronous SIMD processing with processing elements emulating SIMD operation using individual instruction streams
US5588152A (en) * 1990-11-13 1996-12-24 International Business Machines Corporation Advanced parallel processor including advanced support hardware
US5828894A (en) * 1990-11-13 1998-10-27 International Business Machines Corporation Array processor having grouping of SIMD pickets
US5630162A (en) * 1990-11-13 1997-05-13 International Business Machines Corporation Array processor dotted communication network based on H-DOTs
US5734921A (en) * 1990-11-13 1998-03-31 International Business Machines Corporation Advanced parallel array processor computer package
US5617577A (en) * 1990-11-13 1997-04-01 International Business Machines Corporation Advanced parallel array processor I/O connection
US5815723A (en) * 1990-11-13 1998-09-29 International Business Machines Corporation Picket autonomy on a SIMD machine
US5590345A (en) * 1990-11-13 1996-12-31 International Business Machines Corporation Advanced parallel array processor(APAP)
US5765015A (en) * 1990-11-13 1998-06-09 International Business Machines Corporation Slide network for an array processor
US5963746A (en) * 1990-11-13 1999-10-05 International Business Machines Corporation Fully distributed processing memory element
US5765012A (en) * 1990-11-13 1998-06-09 International Business Machines Corporation Controller for a SIMD/MIMD array having an instruction sequencer utilizing a canned routine library
US5966528A (en) * 1990-11-13 1999-10-12 International Business Machines Corporation SIMD/MIMD array processor with vector processing
EP0485690B1 (en) * 1990-11-13 1999-05-26 International Business Machines Corporation Parallel associative processor system
US5794059A (en) * 1990-11-13 1998-08-11 International Business Machines Corporation N-dimensional modified hypercube
US5752067A (en) * 1990-11-13 1998-05-12 International Business Machines Corporation Fully scalable parallel processing system having asynchronous SIMD processing
US5809292A (en) * 1990-11-13 1998-09-15 International Business Machines Corporation Floating point for simid array machine
GB9027663D0 (en) * 1990-12-20 1991-02-13 Sandoz Ltd Light-stabilizing compositions
GB2251320A (en) * 1990-12-20 1992-07-01 Motorola Ltd Parallel processor
EP0539595A4 (en) * 1991-04-09 1994-07-20 Fujitsu Ltd Data processor and data processing method
US5594918A (en) * 1991-05-13 1997-01-14 International Business Machines Corporation Parallel computer system providing multi-ported intelligent memory
US5386540A (en) * 1991-09-18 1995-01-31 Ncr Corporation Method and apparatus for transferring data within a computer using a burst sequence which includes modified bytes and a minimum number of unmodified bytes
WO1993009502A1 (en) * 1991-10-30 1993-05-13 I-Cube Design Systems, Inc. Field programmable logic module
US5715391A (en) * 1991-11-15 1998-02-03 International Business Machines Corporation Modular and infinitely extendable three dimensional torus packaging scheme for parallel processing
WO1993011503A1 (en) 1991-12-06 1993-06-10 Norman Richard S Massively-parallel direct output processor array
US5271014A (en) * 1992-05-04 1993-12-14 International Business Machines Corporation Method and apparatus for a fault-tolerant mesh with spare nodes
JP2572522B2 (en) * 1992-05-12 1997-01-16 インターナショナル・ビジネス・マシーンズ・コーポレイション Computing device
JP2642039B2 (en) * 1992-05-22 1997-08-20 インターナショナル・ビジネス・マシーンズ・コーポレイション Array processor
US5495618A (en) * 1992-08-26 1996-02-27 Eastman Kodak Company System for augmenting two dimensional data sets in a two dimensional parallel computer system
US5414642A (en) * 1992-08-26 1995-05-09 Eastman Kodak Company Method and apparatus for combining data sets in a multiprocessor
US5566341A (en) * 1992-10-05 1996-10-15 The Regents Of The University Of California Image matrix processor for fast multi-dimensional computations
US5513313A (en) * 1993-01-19 1996-04-30 International Business Machines Corporation Method for generating hierarchical fault-tolerant mesh architectures
US5717947A (en) * 1993-03-31 1998-02-10 Motorola, Inc. Data processing system and method thereof
JPH06325005A (en) * 1993-05-14 1994-11-25 Fujitsu Ltd Reconstructible torus network system
JPH076146A (en) * 1993-06-18 1995-01-10 Fujitsu Ltd Parallel data processing system
AT400786B (en) * 1993-09-15 1996-03-25 Fendt Johann Mag DEVICE FOR TRANSMITTING DATA BETWEEN A FAX MACHINE AND A REMOTE STATION
AU700629B2 (en) * 1994-03-22 1999-01-07 Hyperchip Inc. Efficient direct cell replacement fault tolerant architecture supporting completely integrated systems with means for direct communication with system operator
US6408402B1 (en) 1994-03-22 2002-06-18 Hyperchip Inc. Efficient direct replacement cell fault tolerant architecture
US5544330A (en) * 1994-07-13 1996-08-06 Emc Corporation Fault tolerant interconnect topology using multiple rings
JP3365705B2 (en) * 1995-05-24 2003-01-14 インターナショナル・ビジネス・マシーンズ・コーポレーション Distributed data processing system
FR2742560B1 (en) * 1995-12-19 1998-01-16 Commissariat Energie Atomique MULTI-PARALLEL PROCESSOR TABLE ARCHITECTURE
US5859983A (en) * 1996-07-01 1999-01-12 Sun Microsystems, Inc Non-hypercube interconnection subsystem having a subset of nodes interconnected using polygonal topology and other nodes connect to the nodes in the subset
US5884046A (en) * 1996-10-23 1999-03-16 Pluris, Inc. Apparatus and method for sharing data and routing messages between a plurality of workstations in a local area network
WO1999030245A1 (en) * 1997-12-10 1999-06-17 Pavel Davydovich Merkel Data processing system
ES2209233T3 (en) * 1997-12-19 2004-06-16 Bae Systems Plc BINARY CODE CONVERTER AND COMPARATOR.
JPH11353288A (en) * 1998-06-04 1999-12-24 Toshiba Corp Parallel computer and memory device
US6862689B2 (en) 2001-04-12 2005-03-01 Stratus Technologies Bermuda Ltd. Method and apparatus for managing session information
US6802022B1 (en) 2000-04-14 2004-10-05 Stratus Technologies Bermuda Ltd. Maintenance of consistent, redundant mass storage images
US6901481B2 (en) 2000-04-14 2005-05-31 Stratus Technologies Bermuda Ltd. Method and apparatus for storing transactional information in persistent memory
US6948010B2 (en) * 2000-12-20 2005-09-20 Stratus Technologies Bermuda Ltd. Method and apparatus for efficiently moving portions of a memory block
US6886171B2 (en) * 2001-02-20 2005-04-26 Stratus Technologies Bermuda Ltd. Caching for I/O virtual address translation and validation using device drivers
US6766413B2 (en) 2001-03-01 2004-07-20 Stratus Technologies Bermuda Ltd. Systems and methods for caching with file-level granularity
US6874102B2 (en) * 2001-03-05 2005-03-29 Stratus Technologies Bermuda Ltd. Coordinated recalibration of high bandwidth memories in a multiprocessor computer
US6971043B2 (en) * 2001-04-11 2005-11-29 Stratus Technologies Bermuda Ltd Apparatus and method for accessing a mass storage device in a fault-tolerant server
US6996750B2 (en) * 2001-05-31 2006-02-07 Stratus Technologies Bermuda Ltd. Methods and apparatus for computer bus error termination
GB2395299B (en) * 2002-09-17 2006-06-21 Micron Technology Inc Control of processing elements in parallel processors
US8805981B2 (en) 2003-03-25 2014-08-12 Advanced Micro Devices, Inc. Computing system fabric and routing configuration and description
US7596678B2 (en) * 2003-04-23 2009-09-29 Micron Technology, Inc. Method of shifting data along diagonals in a group of processing elements to transpose the data
US7581080B2 (en) * 2003-04-23 2009-08-25 Micron Technology, Inc. Method for manipulating data in a group of processing elements according to locally maintained counts
US7676648B2 (en) 2003-04-23 2010-03-09 Micron Technology, Inc. Method for manipulating data in a group of processing elements to perform a reflection of the data
US7913062B2 (en) * 2003-04-23 2011-03-22 Micron Technology, Inc. Method of rotating data in a plurality of processing elements
US7712080B2 (en) * 2003-05-21 2010-05-04 The Regents Of The University Of California Systems and methods for parallel distributed programming
US20040255096A1 (en) * 2003-06-11 2004-12-16 Norman Richard S. Method for continuous linear production of integrated circuits
US7779177B2 (en) * 2004-08-09 2010-08-17 Arches Computing Systems Multi-processor reconfigurable computing system
US7581079B2 (en) * 2005-03-28 2009-08-25 Gerald George Pechanek Processor composed of memory nodes that execute memory access instructions and cooperate with execution nodes to execute function instructions
US7966481B2 (en) 2006-02-16 2011-06-21 Vns Portfolio Llc Computer system and method for executing port communications without interrupting the receiving computer
FR2949879B1 (en) * 2009-09-04 2014-07-18 Kalray INPUTS OF INPUT / OUTPUT OF A NETWORK ON TORIC CHIP.
US8572276B2 (en) 2010-04-29 2013-10-29 International Business Machines Corporation Pipelining protocols in misaligned buffer cases
FR2979444A1 (en) * 2011-08-23 2013-03-01 Kalray EXTENSIBLE CHIP NETWORK
US10741226B2 (en) 2013-05-28 2020-08-11 Fg Src Llc Multi-processor computer architecture incorporating distributed multi-ported common memory modules

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO1987002156A2 (en) * 1985-10-04 1987-04-09 Saxpy Computer Corporation Multizone processor

Family Cites Families (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US3984819A (en) * 1974-06-03 1976-10-05 Honeywell Inc. Data processing interconnection techniques
JPS56164464A (en) * 1980-05-21 1981-12-17 Tatsuo Nogi Parallel processing computer
US4426679A (en) * 1980-09-29 1984-01-17 Honeywell Information Systems Inc. Communication multiplexer using a random access memory for storing an acknowledge response to an input/output command from a central processor
US4381542A (en) * 1980-10-20 1983-04-26 Digital Equipment Corporation System for interrupt arbitration
US4456956A (en) * 1981-08-24 1984-06-26 Data General Corp. Method and apparatus for controlling access of a network transmission bus between a plurality of spaced apart computer stations
US4484263A (en) * 1981-09-25 1984-11-20 Data General Corporation Communications controller
NL8204038A (en) * 1982-10-20 1984-05-16 Philips Nv MULTIPROCESSOR CALCULATOR SYSTEM, CONTAINING N PARALLEL OPERATING CALCULATOR MODULES, AND CALCULATOR MODULE FOR USE IN SUCH A MULTIPROCESSOR CALCULATOR SYSTEM.
US4785395A (en) * 1986-06-27 1988-11-15 Honeywell Bull Inc. Multiprocessor coherent cache system including two level shared cache with separately allocated processor storage locations and inter-level duplicate entry replacement
US4783730A (en) * 1986-09-19 1988-11-08 Datapoint Corporation Input/output control technique utilizing multilevel memory structure for processor and I/O communication

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO1987002156A2 (en) * 1985-10-04 1987-04-09 Saxpy Computer Corporation Multizone processor

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4820095B2 (en) * 2002-12-19 2011-11-24 アドバンスト・マイクロ・ディバイシズ・インコーポレイテッド Method and system for programming a hypertransport routing table in a multiprocessor system
JP2008502029A (en) * 2004-03-16 2008-01-24 テクノロジー プロパティーズ リミテッド Computer processor array

Also Published As

Publication number Publication date
EP0334943B1 (en) 1992-01-15
WO1989003564A1 (en) 1989-04-20
EP0334943A1 (en) 1989-10-04
DE3867837D1 (en) 1992-02-27
US4942517A (en) 1990-07-17

Similar Documents

Publication Publication Date Title
JPH03500585A (en) Enhanced input/output architecture for toroidally connected distributed storage parallel computers
US5428803A (en) Method and apparatus for a unified parallel processing architecture
EP0126976B1 (en) Multiprocessor system with communicating random access shared memory
US7373440B2 (en) Switch/network adapter port for clustered computers employing a chain of multi-adaptive processors in a dual in-line memory module format
US5379440A (en) Parallel processor with array of clustered processing elements having inputs seperate from outputs and outputs limited to a maximum of two per dimension
JPH0713945A (en) Bus structure of multiprocessor system with separated arithmetic processing part and control/storage part
JPH03211689A (en) Processor arrangement system
JPS6324315A (en) Back playne structure for superposition computer of scalar and vector computation
EP1381957A2 (en) Data processing apparatus and system and method for controlling memory access
US6092136A (en) Multi-processor central processing unit
US7386689B2 (en) Method and apparatus for connecting a massively parallel processor array to a memory array in a bit serial manner
JPH04257949A (en) Cache memory apparatus
JP2006294049A (en) Sorting sequential data prior to distribution over parallel processor in random access manner
JP2831083B2 (en) Multiprocessor system and interrupt controller
US5261056A (en) N-port wide bandwidth cross-link register
JPH0675930A (en) Parallel processor system
JPH0646413B2 (en) Data processing processor
Sharif et al. Design and simulations of a serial-link interconnection network for a massively parallel computer system
US20050071576A1 (en) Data processing apparatus and system and method for controlling memory access
JP2602852B2 (en) Modularized parallel computer
JPS6258349A (en) Memory device with plural ports
Asgari Multiport memory as a medium for interprocessor communication in multiprocessors
Maruyama et al. Architecture of a parallel machine: Cenju‐3
Dickey et al. Interconnection network switch architectures and combining strategies
JPS62274346A (en) Memory access circuit