JP4828006B2 - Image processing device - Google Patents
Image processing device Download PDFInfo
- Publication number
- JP4828006B2 JP4828006B2 JP31813498A JP31813498A JP4828006B2 JP 4828006 B2 JP4828006 B2 JP 4828006B2 JP 31813498 A JP31813498 A JP 31813498A JP 31813498 A JP31813498 A JP 31813498A JP 4828006 B2 JP4828006 B2 JP 4828006B2
- Authority
- JP
- Japan
- Prior art keywords
- data
- circuit
- address
- image data
- texture
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Landscapes
- Image Generation (AREA)
- Controls And Circuits For Display Device (AREA)
- Image Processing (AREA)
Description
【0001】
【発明の属する技術分野】
本発明は、画像処理装置に関する。
【0002】
【従来の技術】
種々のCAD(Computer Aided Design) システムや、アミューズメント装置などにおいて、コンピュータグラフィックスがしばしば用いられている。特に、近年の画像処理技術の進展に伴い、3次元コンピュータグラフィックスを用いたシステムが急速に普及している。
このような3次元コンピュータグラフィックスでは、各画素(ピクセル)に対応する色を決定するときに、各画素の色の値を計算し、この計算した色の値を、当該画素に対応するディスプレイバッファ(フレームバッファ)のアドレスに書き込むレンダリング(Rendering) 処理を行う。
【0003】
レンダリング処理の手法の一つに、ポリゴン(Polygon)レンダリングがある。この手法では、立体モデルを三角形の単位図形(ポリゴン)の組み合わせとして表現しておき、このポリゴンを単位として描画を行うことで、表示画面の色を決定する。
【0004】
ポリゴンレンダリングでは、物理座標系における三角形の各頂点についての、座標(x,y,z)と、色データ(R,G,B)と、張り合わせのイメージパターンを示すテクスチャデータの同次座標(s,t)および同次項qの値とを入力とし、これらの値を三角形の内部で補間する処理が行われる。
ここで、同次項qは、簡単にいうと、拡大縮小率のようなもので、実際のテクスチャバッファのUV座標系における座標、すなわち、テクスチャ座標データ(u,v)は、同次座標(s,t)を同次項qで除算した「s/q」および「t/q」に、それぞれテクスチャサイズUSIZEおよびVSIZEを乗じたものとなる。
【0005】
図28は、3次元コンピュータグラフィックスシステムの基本的な概念を示すシステム構成図である。
【0006】
この3次元コンピュータグラフィックスシステムにおいては、グラフィックス描画等のデータは、メインプロセッサ1のメインメモリ2、あるいは外部からのグラフィックスデータを受けるI/Oインタフェース回路3からメインバス4を介してレンダリングプロセッサ5a、フレームバッファメモリ5bを有するレンダリング回路5に与えられる。
【0007】
レンダリングプロセッサ5aには、表示するためのデータを保持することを目的とするフレームバッファ5bと、描画する図形要素(たとえば三角形)の表面に張り付けるテクスチャデータを保持しているテクスチャメモリ6が結合されている。
そして、レンダリングプロセッサ5aによって、図形要素毎に表面にテクスチャを張り付けた図形要素を、フレームバッファ5bに描画するという処理が行われる。
【0008】
フレームバッファ5bとテクスチャメモリ6は、一般的にDRAM(Dynamic Random Access Memory)により構成される。
そして、図28のシステムにおいては、フレームバッファ5bとテクスチャメモリ6は、物理的に別々のメモリシステムとして構成されている。
【0009】
【発明が解決しようとする課題】
ところで、上述したような3次元コンピュータグラフィックシステムなどでは、DRAMの読み出し動作および書き込み動作を効率よく行うために、例えば、グラフィック処理の特色を考慮してDRAMへのアクセス時のアドレス指定に制限を設けることが考えられる。
しかしながら、このような制限を設けると、図28に示すシステムにおいて、レンダリングプロセッサ5aおよびメインプロセッサ1と、フレームバッファメモリ5bおよびテクスチャメモリ6との間でデータ送受信を行う際に、DRAMに対してのアクセス時のアドレス指定の制限によって生じる種々の課題を解決する必要がある。
【0010】
本発明は、かかる事情に鑑みてなされたものであり、メモリへのアクセス時のアドレス指定に制限を設けた場合でも、メモリへのアクセスを正確に行うことができる画像処理装置を提供することを目的とする。
【0011】
【課題を解決するための手段】
本発明によれば、
単位図形の頂点について、3次元座標(x,y,z)、R(赤),G(緑),B(青)データ、テクスチャ同次座標(s,t)および同次項qを含むポリゴンレンダリングデータを用いてレンダリング処理を行って、複数の画素からなる画像データを生成する画像処理回路と、
所定の大きさのブロックを単位として前記レンダリング処理によって生成された、前記複数の画素からなる画像データの書き込みが行われる複数の記憶回路であって、前記書き込みは代表点を基準とする第1の矩形領域を単位として行われ、当該第1の矩形領域の直交する第1および第2方向について第1の数の倍数のアドレスしか指定できないという制約がある、複数の記憶回路と、
前記画像処理回路から入力した前記レンダリング処理によって生成された前記複数の画素からなる画像データを含む前記ブロックの前記代表点のアドレスを前記制限に基づいて指定したときに、前記前記画像処理回路から入力した前記画像データが前記制約に基づいて前記複数の記憶回路内の該当する記憶回路の該当する前記第1の矩形領域に書き込まれるように、前記画像データを、画素データ単位で並べ替える、データ並べ替え回路と、
書き込み回路と
を具備し、
前記並べ替え回路は、前記画像処理回路から入力した前記レンダリング処理によって生成された前記複数の画素からなる画像データを前記複数の記憶回路に転送して記憶する第1の転送モードにおいて、
前記画像処理回路から入力した前記レンダリング処理された第1のビット幅の第1の画像データを第2のビット幅の第2の画像データ内に配置し、
前記第2の画像データを含む前記ブロックの前記代表点のアドレスを前記制限に基づいて指定したときに、前記第1の画像データが前記複数の記憶回路の該当する記憶回路の該当する前記第1の矩形記憶領域に書き込まれるように、前記第2の画像データを、制御信号に基づいてシフト処理、選択処理、保持処理を反復して、並べ替え、
前記書き込み回路は、前記並べ替えられた前記第2の画像データを含む前記ブロックを、前記複数の記憶回路の該当する記憶回路に分散して書き込む、
画像処理装置が提供される。
【0012】
また本発明によれば、
単位図形の頂点について、3次元座標(x,y,z)、R(赤),G(緑),B(青)データ、テクスチャ同次座標(s,t)および同次項qを含むポリゴンレンダリングデータが、それぞれ分散して記憶されている、所定の大きさのブロックを単位として記憶領域に記憶されたレンダリング処理によって生成された、複数の画素データからなる画像データの書き込みおよび読み出しが行われる複数の記憶回路であって、前記書き込みは代表点を基準とする第1の矩形領域を単位として行われ、当該第1の矩形領域の直交する第1および第2方向について第1の数の倍数のアドレスしか指定できないという第1の制約があり、前記読み出しは代表点を基準とする第2の矩形領域を単位として行われ、当該第2の矩形領域の直交する第1方向については任意のアドレスを指定できるが第2方向については第2の数の倍数でしかアドレスを指定できないという第2の制約がある、複数の記憶回路と、
第1のビット幅の第1の画像データを入力し、当該第1の画像データについてレンダリング処理を行う画像処理回路と、
前記第2の制限に基づいて代表点を指定して前記ブロック単位で前記複数の記憶回路から前記画像データを読み出す読み出し回路と、
前記読み出しによって得られた第2のビット幅の第2の画像データを、画素データ単位で並べ替えて生成した第1ビット幅の前記第1の画像データを前記画像処理回路に出力するデータ並べ替え回路と
を具備し、
前記並べ替え回路は、前記記憶回路から前記画像処理回路に画像データを転送する第2の転送モードにおいて、
前記画像処理回路から入力したアドレスに応じたアドレスを生成して前記読み出し回路に出力して前記複数の記憶回路から該当する画像データを読み出し、
前記画像処理回路で規定する前記第1のビット幅の画像データに変換して前記画像処理回路に出力する、
画像処理装置が提供される。
【0013】
本発明によれば、
単位図形の頂点について、3次元座標(x,y,z)、R(赤),G(緑),B(青)データ、テクスチャ同次座標(s,t)および同次項qを含むポリゴンレンダリングデータがそれぞれ分散して、所定の大きさのブロックを単位としてレンダリング処理によって生成された画像データの書き込みが行われ、および、前記それぞれ分散した書き込まれた前記レンダリング処理によって生成された画像データの読出しが行われる、複数の記憶回路であって、前記書き込みは代表点を基準とする第1の矩形領域を単位として行われ、当該第1の矩形領域の直交する第1および第2方向について第1の数の倍数のアドレスしか指定できないという第1の制約があり、前記読み出しは代表点を基準とする第2の矩形領域を単位として行われ、当該第2の矩形領域の直交する第1方向については任意のアドレスを指定できるが第2方向については第2の数の倍数でしかアドレスを指定できないという第2の制約がある、複数の記憶回路と、
前記第2の制限に基づいて代表点を指定して前記ブロックを単位として前記複数の記憶回路から前記画像データを読み出す読み出し回路と、
前記画像処理回路から前記記憶回路に画像データを転送する第1の転送モードと、前記記憶回路から前記画像処理回路に画像データを転送する第2の転送モードとのいずれかに応じた処理を行う、並べ替え回路であって、前記読み出された画像データを含む前記ブロックの前記代表点のアドレスを前記第1の制限に基づいて指定したときに、前記読み出された画像データが該当する記憶回路内の該当する第1の矩形領域に書き込まれるように、前記読み出された画像データを画素データ単位で並べ替える、データ並べ替え回路と、
前記第1の制限に基づいて代表点を指定して、前記並べ替えられた画像データを含む前記ブロックを前記記憶回路に書き込む書き込み回路と
を具備し、
前記並べ替え回路は、前記画像処理回路から前記複数の記憶回路に前記画像データを転送して記憶する第1の転送モードにおいて、
前記画像処理回路から入力した前記レンダリング処理された第1のビット幅の第1の画像データを第2のビット幅の第2の画像データ内に配置し、
前記第2の画像データを含む前記ブロックの前記代表点のアドレスを前記第1の制限に基づいて指定したときに、前記第1の画像データが前記複数の記憶回路の該当する記憶回路の該当する矩形領域に書き込まれるように、前記第2の画像データを、制御信号に基づいてシフト処理、選択処理、保持処理を反復して、並べ替え、
前記書き込み回路は、前記並べ替えられた前記第2の画像データを含む前記ブロックを、前記複数の記憶回路の該当する記憶回路に分散して書き込み、
前記並べ替え回路は、前記記憶回路から前記画像処理回路に画像データを転送する第2の転送モードにおいて、
前記画像処理回路から入力したアドレスに応じたアドレスを生成して前記読み出し回路に出力して前記複数の記憶回路から該当する画像データを読み出し、
前記画像処理回路で規定する前記第1のビット幅の画像データ内に配置して前記画像処理回路に出力する、
画像処理装置が提供される。
【0014】
本発明によれば、
単位図形の頂点について、3次元座標(x,y,z)、R(赤),G(緑),B(青)データ、テクスチャ同次座標(s,t)および同次項qを含むポリゴンレンダリングデータを用いてレンダリング処理を行う画像処理装置であって、
複数の記憶回路であって、複数の画素ビットからなる表示データと少なくとも一つの図形要素が必要とするテクスチャデータとを当該複数の記憶回路に分散して記憶し、所定の大きさのブロックを単位として上記レンダリング処理によって生成された画像データの書き込みが行われる、複数の記憶回路であって、前記書き込みは代表点を基準とする第1の矩形領域を単位として行われ、当該第1の矩形領域の直交する第1および第2方向について第1の数の倍数のアドレスしか指定できないという第1の制約があり、前記読み出しは代表点を基準とする第2の矩形領域を単位として行われ、当該第2の矩形領域の直交する第1方向については任意のアドレスを指定できるが第2方向については第2の数の倍数でしかアドレスを指定できないという第2の制約がある、複数の記憶回路と、
前記単位図形の頂点のポリゴンレンダリングデータを補間して、前記単位図形内に位置する画素の補間データを生成する補間データ生成回路と、
前記補間データに含まれるテクスチャ同次座標(s,t)を同次項qで除算して「s/q」および「t/q」を生成し、当該「s/q」および「t/q」に応じたテクスチャアドレスを用いて、前記複数の記憶回路からテクスチャデータを読み出し、図形要素の表面への前記読み出したテクスチャデータの張り付け処理を行って複数の画素ビットからなる表示データを生成するテクスチャ処理回路と、
前記テクスチャー処理回路から前記記憶回路に画像データを転送する第1の転送モードに応じたデータ並べ替え処理を行う、データ並べ替え回路であって、前記テクスチャ処理回路から入力した複数の画素ビットからなる表示データを含む前記ブロックの前記代表点のアドレスを前記第1の制限に基づいて指定したときに、前記表示データが前記複数の記憶回路内の該当する記憶回路に分散して書き込まれるように、画像データ単位で、前記表示データを並べ替えるデータ並べ替え回路と、
前記並べ替えられた前記表示データを含む前記ブロックを、前記複数の記憶回路に分散して書き込む書き込み回路と
を具備し、
前記並べ替え回路は、前記画像処理回路から前記複数の記憶回路に前記画像データを転送して記憶する第1の転送モードにおいて、
前記画像処理回路から入力した前記レンダリング処理された第1のビット幅の第1の画像データを第2のビット幅の第2の画像データ内に配置し、
前記第2の画像データを含む前記ブロックの前記代表点のアドレスを前記第1の制限に基づいて指定したときに、前記第1の画像データが前記複数の記憶回路の所定の記憶領域に書き込まれるように、前記第2の画像データを、制御信号に基づいてシフト処理、選択処理、保持処理を反復して、並べ替え、
前記書き込み回路は、前記並べ替えられた前記第2の画像データを含む前記ブロックを、前記複数の記憶回路の該当する記憶回路に分散して書き込む、
画像処理装置が提供される。
【0015】
本発明によれば、
単位図形の頂点について、3次元座標(x,y,z)、R(赤),G(緑),B(青)データ、テクスチャ同次座標(s,t)および同次項qを含むポリゴンレンダリングデータを用いてレンダリング処理を行う画像処理装置であって、
複数の記憶回路であって、表示データと少なくとも一つの図形要素が必要とするテクスチャデータとを当該複数の記憶回路に分散して記憶し、所定の大きさのブロックを単位として上記レンダリング処理によって生成された画像データの書き込みが行われる複数の記憶回路であって、前記書き込みは代表点を基準とする第1の矩形領域を単位として行われ、当該第1の矩形領域の直交する第1および第2方向について第1の数の倍数のアドレスしか指定できないという第1の制約があり、前記読み出しは代表点を基準とする第2の矩形領域を単位として行われ、当該第2の矩形領域の直交する第1方向については任意のアドレスを指定できるが第2方向については第2の数の倍数でしかアドレスを指定できないという第2の制約がある、複数の記憶回路と、
前記単位図形の頂点のポリゴンレンダリングデータを補間して、前記単位図形内に位置する画素の補間データを生成する補間データ生成回路と、
前記補間データに含まれるテクスチャ同次座標(s,t)を同次項qで除算して「s/q」および「t/q」を生成し、当該「s/q」および「t/q」に応じたテクスチャアドレスを用いて前記複数の記憶回路から読み出されたテクスチャデータを、図形要素の表面への張り付け処理を行って表示データを生成するテクスチャ処理回路と、
前記第2の制限に基づいて代表点を指定して前記ブロック単位で前記複数の記憶回路から前記テクスチャデータを読み出す読み出し回路と、
インタフェース回路と、
前記記憶回路から読みだした表示データを前記テクスチャー処理回路に転送する第2の転送モードに応じたデータの並べ替えを行うデータ並べ替え回路であって、前記読み出されたテクスチャデータを、前記インタフェース回路の出力フォーマットに応じて並べ替えて、前記インタフェース回路に出力するデータ並べ替え回路と
を具備し、
前記並べ替え回路は、前記第2の転送モードにおいて、前記インタフェースを経由して前記テクスチャー回路から画像処理回路から入力したアドレスに応じたアドレスを生成して前記読み出し回路に出力して前記複数の記憶回路から該当する画像データを読み出し、前記画像処理回路で規定する前記第1のビット幅の画像データ内に配置して前記画像処理回路に出力する、
画像処理装置が提供される。
【0016】
【発明の実施の形態】
以下、本実施形態においては、パーソナルコンピュータなどに適用される、任意の3次元物体モデルに対する所望の3次元画像をCRT(Cathode Ray Tube)などのディスプレイ上に高速に表示する3次元コンピュータグラフィックスシステムについて説明する。
【0017】
図1は、本発明に係る画像処理装置としての3次元コンピュータグラフィックスシステム10のシステム構成図である。
【0018】
3次元コンピュータグラフィックスシステム10は、立体モデルを単位図形である三角形(ポリゴン)の組み合わせとして表現し、このポリゴンを描画することで表示画面の各画素の色を決定し、ディスプレイに表示するポリゴンレンダリング処理を行うシステムである。
また、3次元コンピュータグラフィックスシステム10では、平面上の位置を表現する(x,y)座標の他に、奥行きを表すz座標を用いて3次元物体を表し、この(x,y,z)の3つの座標で3次元空間の任意の一点を特定する。
【0019】
図1に示すように、3次元コンピュータグラフィックスシステム10は、メインプロセッサ11、メインメモリ12、I/Oインタフェース回路13、およびレンダリング回路14が、メインバス15を介して接続されている。
以下、各構成要素の機能について説明する。
【0020】
メインプロセッサ11は、例えば、アプリケーションの進行状況などに応じて、メインメモリ12から必要なグラフィックデータを読み出し、このグラフィックデータに対してクリッピング(Clipping)処理、ライティング(Lighting)処理などのジオメトリ(Geometry)処理などを行い、ポリゴンレンダリングデータを生成する。メインプロセッサ11は、ポリゴンレンダリングデータS11を、メインバス15を介してレンダリング回路14に出力する。
【0021】
I/Oインタフェース回路13は、必要に応じて、外部から動きの制御情報またはポリゴンレンダリングデータなどを入力し、これをメインバス15を介してレンダリング回路14に出力する。
【0022】
ここで、ポリゴンレンダリングデータは、ポリゴンの各3頂点の(x,y,z,R,G,B,s,t,q)のデータを含んでいる。
ここで、(x,y,z)データは、ポリンゴの頂点の3次元座標を示し、(R,G,B)データは、それぞれ当該3次元座標における赤、緑、青の輝度値を示している。
(s,t,q)データのうち、(s,t)は、対応するテクスチャの同次座標を示しており、qは同次項を示している。ここで、「s/q」および「t/q」に、それぞれテクスチャサイズUSIZEおよびVSIZEを乗じてテクスチャ座標データ(u,v)が得られる。テクスチャバッファ147aに記憶されたテクスチャデータへのアクセスは、テクスチャ座標データ(u,v)を用いて行われる。
すなわち、ポリゴンレンダリングデータは、三角形の各頂点の物理座標値と、それぞれの頂点の色とテクスチャデータである。
【0023】
以下、レンダリング回路14について詳細に説明する。
図1に示すように、レンダリング回路14は、ホストインタフェース回路149、DDA(Digital Differential Anarizer) セットアップ回路141、トライアングルDDA回路142、テクスチャエンジン回路143、メモリインタフェース(I/F)回路144、CRTコントロール回路145、RAMDAC回路146、DRAM147およびSRAM(Static RAM)148を有する。
本実施形態におけるレンダリング回路14は、一つの半導体チップ内にロジック回路と少なくとも表示データとテクスチャデータとを記憶するDRAM147とが混載されている。
【0024】
DRAM147
DRAM147は、テクスチャバッファ147a、ディスプレイバッファ147b、zバッファ147cおよびテクスチャCLUT(Color Look Up Table) バッファ147dとして機能する。
また、DRAM147は、後述するように、同一機能を有する複数(本実施形態では4個)のモジュールに分割されている。
【0025】
また、DRAM147には、より多くのテクスチャデータを格納するために、インデックスカラーにおけるインデックスと、そのためのカラールックアップテーブル値が、テクスチャCLUTバッファ147dに格納されている。
インデックスおよびカラールックアップテーブル値は、テクスチャ処理に使われる。すなわち、通常はR,G,Bそれぞれ8ビットの合計24ビットでテクスチャ要素を表現するが、それではデータ量が膨らむため、あらかじめ選んでおいた例えば256色等の中から一つの色を選んで、そのデータをテクスチャ処理に使う。このことで256色であればそれぞれのテクスチャ要素は8ビットで表現できることになる。インデックスから実際のカラーへの変換テーブルは必要になるが、テクスチャの解像度が高くなるほど、よりコンパクトなテクスチャデータとすることが可能となる。
これにより、テクスチャデータの圧縮が可能となり、内蔵DRAMの効率良い利用が可能となる。
【0026】
さらにDRAM147には、描画と同時並行的に隠れ面処理を行うため、描画しようとしている物体の奥行き情報が格納されている。
なお、表示データと奥行きデータおよびテクスチャデータの格納方法としては、メモリブロックの先頭から連続して表示データが格納され、次に奥行きデータが格納され、残りの空いた領域に、テクスチャの種類毎に連続したアドレス空間でテクスチャデータが格納される。これにより、テクスチャデータを効率よく格納できることになる。
【0027】
図2は、DRAM147、SRAM148、並びに、DRAM147およびSRAM148へアクセスするメモリI/F回路144の具体的な構成例を示すブロック図である。
【0028】
図2に示すように、図1に示すDRAM147およびSRAM148は、前述したように4個のメモリモジュール200,210,220,230に分割されている。
【0029】
メモリモジュール200は、メモリ201,202を有する。
メモリ201は、DRAM147の一部を構成するバンク201A,201Bと、SRAM148の一部を構成するバンク201C,201Dとを有する。
また、メモリ202は、DRAM147の一部を構成するバンク202A,202Bと、SRAM148の一部を構成するバンク202C,202Dとを有する。
なお、SRAM148を構成するバンク201C,201D,202C,202Dに対しては同時アクセスが可能である。
【0030】
メモリモジュール210は、メモリ211,212を有する。
メモリ211は、DRAM147の一部を構成するバンク211A,211Bと、SRAM148の一部を構成するバンク211C,211Dとを有する。
また、メモリ212は、DRAM147の一部を構成するバンク212A,212Bと、SRAM148の一部を構成するバンク212C,212Dとを有する。
なお、SRAM148を構成するバンク211C,211D,212C,212Dに対しては同時アクセスが可能である。
【0031】
メモリモジュール220は、メモリ221,222を有する。
メモリ221は、DRAM147の一部を構成するバンク221A,221Bと、SRAM148の一部を構成するバンク221C,221Dとを有する。
また、メモリ222は、DRAM147の一部を構成するバンク222A,222Bと、SRAM148の一部を構成するバンク222C,222Dとを有する。
なお、SRAM148を構成するバンク221C,221D,222C,222Dに対しては同時アクセスが可能である。
【0032】
メモリモジュール230は、メモリ231,232を有する。
メモリ231は、DRAM147の一部を構成するバンク231A,231Bと、SRAM148の一部を構成するバンク231C,231Dとを有する。
また、メモリ232は、DRAM147の一部を構成するバンク232A,232Bと、SRAM148の一部を構成するバンク232C,232Dとを有する。
なお、SRAM148を構成するバンク231C,231D,232C,232Dに対しては同時アクセスが可能である。
【0033】
ここで、メモリモジュール200,210,220,230の各々は、図1に示すテクスチャバッファ147a、ディスプレイバッファ147b、Zバッファ147cおよびテクスチャCLUTバッファ147dの全ての機能を持つ。
すなわち、メモリモジュール200,210,220,230の各々は、対応する画素のテクスチャデータ、描画データ((R,G,B)データ)、zデータおよびテクスチャカラールックアップテーブルデータの全てを記憶する。
ただし、メモリモジュール200,210,220,230は、相互で異なる画素についてのデータを記憶する。
ここで、同時に処理される16画素についてのテクスチャデータ、描画データ、zデータおよびテクスチャカラールックアップテーブルデータが、相互に異なるバンク201A,201B,202A,202B,211A,211B,212A,212B,221A,221B,222A,222B,231A,231B,232A,232Bに記憶される。
これにより、メモリI/F回路144は、DRAM147に対して、例えば8(X方向)×2画素(Y方向)の16画素についてのデータが同時に書き込むことが可能になる。
なお、読み出しは、例えば、8(X方向)×1画素(Y方向)の8画素についてデータが同時に読み出すことが可能になる。
なお、メモリI/F回路144は、後述するように、いわゆる所定のインターリーブ方式のアドレッシングに基づいてDRAM147へのアクセス(書き込み)を行う。
【0034】
図3は、DRAM147のバッファ(例えばテクスチャバッファ)としての構成例を示す概略図である。
図3に示すように、2×8画素(ピクセル)の領域でメモリアクセスされたデータは、ページ(ロウ)やブロック(カラム)と呼ばれる領域に格納される。
各ロウROW0〜ROWn+1 は、図3(a)に示すように、それぞれ4個のカラム(ブロック)M0A,M0B,M1A,M1Bに区分けされている。
そして、書き込み時には、X方向およびY方向について偶数のバウンダリ、読み出し時には、X方向について8の倍数のバウンダリ、Y方向については任意バウンダリの領域でアクセスが行われる。
【0035】
なお、バンク201C,201D,202C,202D,211C,211D,212C,212D,221C,221D,222C,222D,231C,231D,232C,232Dには、それぞれバンク201A,201B,202A,202B,211A,211B,212A,212B,221A,221B,222A,222B,231A,231B,232A,232Bに記憶されているテクスチャデータが記憶される。
【0036】
次に、インターリーブ方式のアドレッシングに基づくテクスチャバッファ147aにおけるテクスチャデータの記憶パターンについて、図4〜図6に関連付けてさらに詳細に説明する。
図4はテクスチャデータに含まれる同時にアクセスが行われるカラーデータ(画素データ)を説明するための図、図5はテクスチャデータを構成する単位ブロックを説明するための図、図6はテクスチャバッファのアドレス空間を説明するするための図である。
【0037】
本実施形態の場合、図4に示すように、テクスチャデータに含まれる、2×8のマトリクス状に配置された画素の色データを示すカラーデータpix0 〜pix15が、同時にアクセスされる。
【0038】
カラーデータpix0 〜pix15は、テクスチャバッファ147aを構成するSRAM148の異なるバンクに記憶される必要がある。
本実施形態では、カラーデータpix0 ,pix1 ,pix8 ,pix9 が、それぞれ図2に示すメモリ201のバンク201C,201Dおよびメモリ202のバンク202C,202Dに記憶される。また、カラーデータpix2 ,pix3 ,pix10,pix11が、それぞれ図2に示すメモリ211のバンク211C,211Dおよびメモリ212のバンク212C,212Dに記憶される。また、カラーデータpix4 ,pix5 ,pix12,pix13が、それぞれ図2に示すメモリ221のバンク221C,221Dおよびメモリ222のバンク222C,222Dに記憶される。さらに、カラーデータpix6 ,pix7 ,pix14,pix15が、それぞれ図2に示すメモリ231のバンク231C,231Dおよびメモリ232のバンク232C,232Dに記憶される。
【0039】
本実施形態では、同時に処理される矩形領域内に位置する画素のカラーデータpix0 〜pix15の組を単位ブロックRi と呼び、例えば、1枚のイメージを示すテクスチャデータは、図5に示すように、B×Aのマトリクス状に配置された単位ブロックR0 〜RBA-1からなる。
単位ブロックR0 〜RBA-1は、図6に示すように、1次元のアドレス空間で連続したアドレスを持つように、テクスチャバッファ147aを構成するDRAM147に記憶されている。また、各単位ブロックR0 〜RBA-1内のカラーデータpix0 〜pix15は、1次元のアドレス空間内で連続したアドレスを持つように、SRAM148の相互に異なるバンクに記憶される。
すなわち、テクスチャバッファ147aには、同時にアクセスが行われるカラーデータからなる単位ブロックが、一次元のアドレス空間で連続したアドレスを持つように記憶される。
【0040】
ホストインタフェース回路149
ホストインタフェース回路149は、レンダリング回路14の外部でメインバス15に接続され、レンダリング回路14の内部でDDAセットアップ回路141およびメモリI/F回路144に接続されている。
ホストインタフェース回路149は、後述するように、メモリI/F回路144と、メインプセッサ11およびI/Oインタフェース回路13との間で通信を行う際のインタフェースとなる。
【0041】
DDAセットアップ回路141
DDAセットアップ回路141は、後段のトライアングルDDA回路142において物理座標系上の三角形の各頂点の値を線形補間して、三角形の内部の各画素の色と深さ情報を求めるに先立ち、ポリゴンレンダリングデータS11が示す(z,R,G,B,s,t,q)データについて、三角形の辺と水平方向の差分などを求めるセットアップ演算を行う。
このセットアップ演算は、具体的には、開始点の値と終点の値と、開始点と終点との距離を用いて、単位長さ移動した場合における、求めようとしている値の変分を算出する。
DDAセットアップ回路141は、算出した変分データS141をトライアングルDDA回路142に出力する。
【0042】
トライアングルDDA回路142
トライアングルDDA回路142は、DDAセットアップ回路141から入力した変分データS141を用いて、三角形内部の各画素における線形補間された(z,R,G,B,s,t,q)データを算出する。
トライアングルDDA回路11は、各画素の(x,y)データと、当該(x,y)座標における(z,R,G,B,s,t,q)データとを、DDAデータ(補間データ)S142としてテクスチャエンジン回路143に出力する。
例えば、トライアングルDDA回路142は、並行して処理を行う矩形内に位置する8(=2×4)画素分のDDAデータS142をテクスチャエンジン回路143に出力する。
【0043】
テクスチャエンジン回路143
テクスチャエンジン回路143は、「s/q」および「t/q」の算出処理、テクスチャ座標データ(u,v)の算出処理、テクスチャバッファ147aからの(R,G,B)データの読み出し処理等をパイプライン方式で行う。
なお、テクスチャエンジン回路143は、例えば所定の矩形内に位置する8画素についての処理を同時に並行して行う。
【0044】
テクスチャエンジン回路143は、DDAデータS142が示す(s,t,q)データについて、sデータをqデータで除算する演算と、tデータをqデータで除算する演算とを行う。
テクスチャエンジン回路143には、例えば図示しない除算回路が8個設けられており、8画素についての除算「s/q」および「t/q」が同時に行われる。
【0045】
また、テクスチャエンジン回路143は、除算結果である「s/q」および「t/q」に、それぞれテクスチャサイズUSIZEおよびVSIZEを乗じて、テクスチャ座標データ(u,v)を生成する。
また、テクスチャエンジン回路143は、メモリI/F回路144を介して、SRAM148あるいはDRAM147に、生成したテクスチャ座標データ(u,v)を含む読み出し要求を出力し、メモリI/F回路144を介して、SRAM148あるいはテクスチャバッファ147aに記憶されているテクスチャデータを読み出すことで、(s,t)データに対応したテクスチャアドレスに記憶された(R,G,B)データS148を得る。
ここで、SRA5148には、前述したようにテクスチャバッファ147aに格納されているテクスチャデータが記憶される。
テクスチャエンジン回路143は、読み出した(R,G,B)データS148の(R,G,B)データと、前段のトライアングルDDA回路142からのDDAデータS142に含まれる(R,G,B)データとを、それぞれ掛け合わせるなどして、カラーデータS143を生成する。
テクスチャエンジン回路143は、このカラーデータS143をメモリI/F回路144に出力する。
【0046】
なお、テクスチャバッファ147aには、MIPMAP(複数解像度テクスチャ)などの複数の縮小率に対応したテクスチャデータが記憶されている。ここで、何れの縮小率のテクスチャデータを用いるかは、所定のアルゴリズムを用いて、前記三角形単位で決定される。
【0047】
テクスチャエンジン回路143は、フルカラー方式の場合には、テクスチャバッファ147aから読み出した(R,G,B)データを直接用いる。
一方、テクスチ7エンジン回路143は、インデックスカラー方式の場合には、あらかじめ作成したカラールックアップテーブル(CLUT)をテクスチャCLUTバッファ147dから読み出して、内蔵するSRAMに転送および記憶し、このカラールックアップテーブルを用いて、テクスチャバッファ147aから読み出したカラーインデックスに対応する(R,G,B)データを得る。
【0048】
メモリI/F回路144
メモリI/F回路144は、テクスチャエンジン回路143から入力したカラーデータS143に対応するzデータと、zバッファ147cに記憶されているzデータとの比較を行い、入力したカラーデータS143によって描画される画像が、前回、ディスプレイバッファ147bに書き込まれた画像より、手前(視点側)に位置するか否かを判断し、手前に位置する場合には、画像データS143に対応するzデータでzバッファ147cに記憶されたzデータを更新する。
また、メモリI/F回路144は、(R,G,B)データをディスプレイバッファ147bに書き込む。
さらに、メモリI/F回路144は、テクスチャエンジン回路143からのSRAM148に、生成されたテクスチャ座標データ(u,v)を含む読み出し要求を受けた場合には、SRAM148に記憶された(R,G,B)データS148を読み出す。
また、メモリI/F回路144は、CRTコントロール回路145から表示データを読み出す要求を受けた場合には、この要求に応じて、ディスプレイバッファ147bから一定の固まり、例えば8画素あるいは16画素単位で表示データを読み出す。
【0049】
また、メモリI/F回路144は、DRAM147から読み出したデータをホストインタフェース回路149に出力する。
【0050】
メモリI/F回路144は、DRAM147およびSRAM148へのアクセス(書き込みまたは読み出し)を行うが、書き込み経路と読み出し経路とが別経路として構成されている。
すなわち、書き込みの場合には書き込みアドレスADRWとカラーデータcdwが書き込み系回路で処理されてDRAM147に書き込み、読み出しの場合には読み出し系回路で処理されてDRAM147またはSRAM148から読み出す。
そして、メモリI/F回路144は、所定のインターリーブ方式のアドレッシングに基づいてDRAM147へのアクセスを、書き込みを16画素単位、読み出しを8画素単位で行う。
【0051】
以下に、メモリI/F回路144の具体的な構成例について、図2にを参照しながら説明する。
【0052】
メモリI/F回路144は、図2に示すように、ディストリビュータ300、アドレスコンバータ310,320,330,340、メモリコントローラ350,360,370,380、読み出しコントローラ390およびデータ並べ替え部400を有する。
【0053】
〔ディストリビュータ300〕
ディストリビュータ300は、書き込み時に、データ並べ替え部400から8画素分のカラーデータcwdおよび書き込みアドレスADRW2 を入力し、これらから16画素分のカラーデータを生成した後に、各々4画素分のデータからなる4つの画像データS301,S302,S303,S304に分割し、その画像データおよび書き込みアドレスをそれぞれアドレスコンバータ310,320,330,340に出力する。
ここで、1画素分の(R,G,B)データは各々32ビット、zデータは32ビットからなる。
【0054】
〔アドレスコンバータ310,320,330,340〕
アドレスコンバータ310,320,330,340は、書き込み時に、ディストリビュータ300から入力した(R,G,B)データおよびzデータに対応したアドレスを、それぞれメモリモジュール200,210,220,230内のアドレスに変換し、それぞれ変換したアドレスS310,S320,S330,S340と分割された画像データをメモリコントローラ350,360,370,380に出力する。
【0055】
図7は、このディストリビュータ300の画像データ処理(ピクセル処理)を模式的に示す図である。
この図は、前述した図3〜図6に対応するものであり、ディストリビュータ300は、DRAM147に対して、例えば2×8画素の16画素についてのデータが同時にアクセス可能になるように画像データ処理を行う。
そして、読み出し動作では、X方向について8の倍数のバウンダリ、かつY方向について任意のバウンダリでの領域でアクセスを行い、書き込み動作では、X方向およびY方向について偶数のバウンダリの領域でアクセスを行うようなアドレッシングとなるように画像データの処理を行う。
これによりDRAM147は、アクセスの先頭がメモリセル番号MCN「1」,「2」,「3」にはならず、必ずメモリセル番号MCN「0」となり、ページ違反の発生等が防止される。
また、ディストリビュータ300は、各DRAMモジュール220〜230に対して、カラーデータを、表示領域において隣接した部分は、異なるDRAMモジュールとなる配置するとなるように画像データの処理を行う。
これにより、三角形のような平面を描画する場合には面で同時に処理できることになるため、それぞれのDRAMモジュールの動作確率は非常に高くなっている。
【0056】
〔メモリコントローラ350,360,370,380〕
メモリコントローラ350,360,370,380は、それぞれ書き込み系配線群401W,402W,411W,412W,421W,422W,431W,432W、並びに読み出し系配線群401R,402R,411R,412R,421R,422R,431R,432Rを介してメモリモジュール200,210,220,230に接続されており、書き込み時および読み出し時にメモリモジュール200,210,220,230に対してのアクセスを制御する。
【0057】
具体的には、書き込み時には、メモリコントローラ350,360,370,380は、ディストリビュータ300から出力され、アドレスコンバータ350,360,370,380から入力した4画素分の(R,G,B)データおよびzデータを、書き込み系配線群401W,402W,411W,412W,421W,422W,431W,432Wを介してメモリモジュール200,210,220,230に同時に書き込む。
このとき、例えば、メモリモジュール200では、前述したように、バンク201A,201B,202A,202Bの各々に、1画素分の(R,G,B)データおよびzデータが記憶される。メモリモジュール210,220,230についても同じである。
【0058】
また、各メモリコントローラ350,360,370,380は、自身のステートマシンがいわゆるアイドル(IDLE)状態にあるときに、アイドル信号S350,S360,S370,S380を読み出しコントローラ390にアクティブで出力し、このアイドル信号S350,S360,S370,S380に応答した読み出しコントローラ390による読み出しアドレスおよび読み出し要求信号S391を受けて、読み出し系配線群401R,402R,411R,412R,421R,422R,431R,432Rを介してデータの読み出しを行い、読み出し系配線群351,361,371,381、並びに配線群440を介して読み出しコントローラ390に出力する。
【0059】
なお、本実施形態では、書き込み系配線群401W,402W,411W,412W,421W,422W,431W,432W、並びに読み出し系配線群401R,402R,411R,412R,421R,422R,431R,432Rの配線本数は128本(128ビット)、読み出し系配線群351,361,371,381の配線本数は256本(256ビット)、ならびに読み出し系配線群440の配線本数は1024本(1024ビット)である。
【0060】
〔読み出しコントローラ390〕
読み出しコントローラ390は、アドレスコンバータ391およびデータ演算処理部392により構成されている。
アドレスコンバータ391は、読み出しアドレスADRR2 を受けた場合、メモリコントローラ350,360,370,380からのアイドル信号S350,S360,S370,S380をすべてアクティブで受けると、このアイドル信号S350,S360,S370,S380に応答して、8画素単位で読み出しを行うように、読み出しアドレスおよび読み出し要求信号S391を各メモリコントローラ350,360,370,380に出力する。
データ演算部392は、読み出しアドレスおよび読み出し要求信号S391に応答して各メモリコントローラ350,360,370,380で読み出された8画素あるいは16画素単位の、テクスチャデータ、(R,G,B)データ、zデータおよびテクスチャカラールックアップテーブルデータを配線群440を介して入力し、所定の演算処理を行って、データ並べ替え部400でデータ並べ替えを行った後に、要求先、例えばホストインタフェース回路149に出力する。
また、DRAM147の記憶領域内において一の矩形領域からデータを読み出して他の矩形領域に書き込む場合にも、読み出しコントローラ390、データ並べ替え部400およびディストリビュータ300を介してデータ転送が行われる。
【0061】
読み出しコントローラ390は、上述したように、メモリコントローラ350,360,370,380のすべてがアイドル状態にあるときに、読み出しアドレスおよび読み出し要求信号S391をメモリコントローラ350,360,370,380に出力して読み出しデータを受けることから、読み出すデータの同期をとることができる。
したがって、読み出しコントローラ390は、データを一時的に保持するFIFO(First In First Out)回路等の保持回路を設ける必要がなく、回路規模の縮小化が図られている。
【0062】
〔データ並べ替え部400〕
データ並べ替え部400は、「Host to Local」、「Localto Host」、「Local to Local」の3つの転送モードを有し、各々の転送モードに応じてデータの並べ替えを行う。
データ並べ替え部400は、例えば、テクスチャエンジン回路143から入力した転送モード指示信号および画素データ長指示信号に基づいて、転送モードおよび1画素のデータ長を判断する。
なお、1画素のデータ長としては、例えば、32ビット、16ビット、8ビットおよび4ビットがある。
ここで、1画素のデータ長32ビットおよび16ビットは、テクスチャデータなどに用いられ、1画素のデータ長8ビットおよび4ビットは、インデックスデータなどに用いられる。
【0063】
データ並べ替え部400は、「Host to Local」転送モードにおいて、テクスチャエンジン回路143から入力した64ビット幅の転送データhwd(カラーデータS143)と書き込みアドレスADRW1 とから、256ビット幅のカラーデータcwdと、代表点座標(btrx,btry)およびバリッドフラグbtrvldを含むアドレスADRW2 とを生成し、これらをディストリビュータ300に出力する。
【0064】
また、データ並べ替え部400は、「Local to Host」転送モードにおいて、ホストインタフェース回路149から入力したアドレスADRR1 に応じたアドレスADRR2 を生成し、当該アドレスADRR2 に基づいて行われた読み出し動作によって、コントローラ390から入力した8画素分の256ビットのカラーデータmc_0dtr〜mc_7dtrを、パッキングして64ビット幅の転送データhrdを生成し、これをホストインタフェース回路149に出力する。
【0065】
さらに、データ並べ替え部400は、「Local to Local」転送モードにおいて、DRAM147の記憶領域内で一の矩形記憶領域からデータを読み出して他の矩形記憶領域に転送する(書き込む)際に、読み出しコントローラ390から8画素分の256ビットのカラーデータmc_0dtr〜mc_7dtrを入力し、これを転送先の矩形記憶領域の起点座標にあわせてシフトしてカラーデータcwdを生成し、当該カラーデータcwdと、転送先の書き込み動作で使用される代表点座標(btrx,btry)およびバリッドフラグbtrvldを含むアドレスADRW2 とをディストリビュータ300に出力する。
【0066】
図8は、図2に示すデータ並べ替え部400の構成図である。
図8に示すように、データ並べ替え部400は、FIFO(First In First Out)回路4101 〜4103 、ラッチ回路4104 データ並べ替え回路420、アドレス生成部430およびコントローラ440を有する。
【0067】
FIFO回路4101 は、例えば、64ビット幅で深さ3段のFIFO回路であり、コントローラ440からの制御信号S4401 に基づいて、テクスチャエンジン回路143から入力した64ビット幅の転送データhwdをFIFO方式でデータ並べ替え回路420に出力する。
FIFO回路4102 は、例えば、64ビット幅で深さ3段のFIFO回路であり、コントローラ440からの制御信号S4402 に基づいて、データ並べ替え回路420から入力した64ビット幅の転送データhrdをFIFO方式でホストインタフェース回路149に出力する。
【0068】
FIFO回路4103 は、例えば、64ビット幅で深さ16段のFIFO回路であり、コントローラ440からの制御信号S4403 に基づいて、読み出しコントローラ390から入力した各々32ビットの8画素分のカラーデータmc_0dtr〜mc_7dtrをFIFO方式でデータ並べ替え回路420に出力する。
FIFO回路4103 へのカラーデータmc_0dtr〜mc_7dtrの入力は、後述するように、コントローラ440によって制御される。
ラッチ回路4104 は、例えば、256ビット幅であり、コントローラ440からの制御信号S4404 に基づいて、データ並べ替え回路420から入力した256ビット幅のカラーデータcwd_aを図2に示すディストリビュータ300に出力する。
【0069】
図9は、図8に示すデータ並べ替え回路420の構成図である。
図9に示すように、データ並べ替え回路420は、シフト回路4501 ,4502 、セレクタ4510 〜4517 、ラッチ回路4520 〜4527 およびラッチ回路4530 〜4537 を有する。
【0070】
シフト回路4501 は、「Host to Local」転送を行う場合に、コントローラ440から入力した制御信号S4406 に基づいて、64ビット幅の転送データhwd、すなわち2画素分のカラーデータをLSB側に配置した256ビット(8画素)分のカラーデータをテクスチャエンジン回路143から入力し、当該カラーデータを32ビット単位でシフト処理して生成した256ビットのカラーデータmc_0a〜mc_7aを出力する。
【0071】
セレクタ4510 〜4517 は、制御信号S4406 に基づいて、それぞれ入力端子aを介して入力した32ビットのカラーデータmc_0a〜mc_7aと、入力端子bを介して入力した32ビットのカラーデータmc_0a〜mc_7aとのうち一方を選択して、出力端子aからラッチ回路4520 〜4527 に出力する。
【0072】
ラッチ回路4520 〜4527 は、制御信号S4406 に基づいて、それぞれセレクタ4510 〜4517 の出力端子cから出力した32ビットのカラーデータを、図8に示すFIFO回路4102 あるいはラッチ回路4104 に出力する。
ラッチ回路4530 〜4537 は、制御信号S4406 に基づいて、それぞれシフト回路4501 から入力したカラーデータmc_0a〜mc_7aを、シフト回路4502 と、図8に示すFIFO回路4102 あるいはラッチ回路4104 に出力する。
ここで、ラッチ回路4520 〜4527 の各々の32ビットの出力線は、それぞれラッチ回路4530 〜4537 の各々の32ビットの出力線と同じであり、それぞれラッチ回路4520 〜4527 とラッチ回路4530 〜4537 とのうち一方から32ビットのカラーデータが出力されるように制御される。
【0073】
シフト回路4502 は、ラッチ回路4530 〜4537 から入力した256ビットのカラーデータを32ビット単位でシフト処理して生成した各々32ビットのカラーデータmc_0b〜mc_7bを、それぞれセレクタ4510 〜4517 の入力端子bに出力する。
【0074】
以下、図8に示すデータ並べ替え部400におけるデータ並べ替え処理とアドレス生成部430におけるアドレス生成処理とを、各転送モードに分けて説明する。
なお、前述したように、DRAM147に対しての書き込みは、代表点を基準とした8画素(X方向)×2画素(Y方向)の16画素のカラーデータが記憶されている矩形記憶領域を単位として行われる。一方、DRAM147からの読み出しは、代表点を基準とした8画素(X方向)×1画素(Y方向)の8のカラーデータが記憶されている矩形記憶領域を単位として行われる。
【0075】
また、代表点のアドレスは、読み出し動作では、Y方向については任意のアドレスを指定できるが、X方向について8の倍数のアドレスしか指定できない。一方、代表点のアドレスは、書き込み動作では、X方向およびY方向の双方とも、2の倍数のアドレスしか指定できない。
【0076】
以下に示す並べ替え処理では、DRAM147の記憶領域における、図10に示すような、幅「3」、高さ「3」で起点座標が(5,5)の矩形記憶領域500に対してのカラーデータの読み出し動作および書き込み動作を伴う場合を例示して説明する。
【0077】
<「Host to Local」転送モード>
以下、テクスチャエンジン回路143から入力した図11に示す64ビット幅の転送データhwd0 〜hwd4 に含まれる8画素分の各々32ビット(1画素のデータ長が32ビット)のカラーデータpix0 〜pix8 を、図10に示す矩形記憶領域500に転送して書き込む場合の動作を説明する。
【0078】
この場合には、テクスチャエンジン回路143から、転送データhwdが、矩形記憶領域500の図10中左上端点からスキャンライン方向にX座標が増加する順番で与えられ、1スキャンライン終了後、次のスキャンラインのデータがX座標が増加する順番で与えられる。このとき、スキャンラインが異なるデータも64ビット内にパックされて与えられる。
【0079】
先ず、テクスチャエンジン回路143からの図11に示す各々64ビット幅の転送データhwd0 〜hwd4 が、図8に示すFIFO回路4101 を介して、データ並べ替え回路420に順に出力される。
そして、転送データhwd0 のカラーデータpix0 ,pix1 をLSBから順に配置した256ビットのカラーデータが、図9に示すシフト回路4501 において、図12(A)に示すように、32ビット単位でMSBに向けて「1」だけシフトされ、当該シフト後のカラーデータcwd_a0 が、図9に示すラッチ回路4530 〜4537 から図13(A)に示すカラーデータcwd0 として出力され、カラーデータcwd0 が図8に示すラッチ回路4104 を介して図2に示すディストリビュータ300に出力される。
【0080】
次に、転送データhwd1 のカラーデータpix2 ,pix3 をLSBから順に配置した256ビットのカラーデータが、図9に示すシフト回路4501 において、図12(B)に示すように、32ビット単位でMSBに向けて「1」だけシフトされ、当該シフト後のカラーデータcwd_a1 が、図9に示すラッチ回路4530 〜4537 から図13(B)に示すカラーデータcwd1 として出力され、カラーデータcwd1 が図8に示すラッチ回路4104 を介して図2に示すディストリビュータ300に出力される。
また、シフト後のカラーデータcwd_a1 は、セレクタ4510 〜4517 およびラッチ回路4520 〜4527 を介して、シフト回路4502 に出力される。
【0081】
次に、転送データhwd2 のカラーデータpix4 ,pix5 をLSBから順に配置した256ビットのカラーデータが、図9に示すシフト回路4501 において、図12(C)に示すように、32ビット単位でMSBに向けて「2」だけシフトされた後に、図9に示すセレクタ4510 〜4517 を介してラッチ回路4530 〜4537 に記憶される。
このとき、カラーデータpix4 ,pix5 が、ラッチ回路4532 ,4533 に記憶される。
また、前述したシフト回路4502 に出力された、図12(B)に示す256ビットのカラーデータcwd_a1 が、LSBに向けて「1」だけシフトされた後に、セレクタ4510 〜4517 を介してラッチ回路4520 〜4527 に記憶される。このとき、カラーデータpix3 が、ラッチ回路4521 に記憶される。
そして、ラッチ回路4530 ,4521 ,4532 〜4537 からの出力によって、図13(C)に示すように、カラーデータpix3 ,pix4 ,pix5 を含むカラーデータcwd2 が、図8に示すラッチ回路4104 を介して図2に示すディストリビュータ300に出力される。
【0082】
次に、転送データhwd3 のカラーデータpix6 ,pix7 をLSBから順に配置した256ビットのカラーデータが、図9に示すシフト回路4501 において、図12(D)に示すように、32ビット単位でMSBに向けて「1」だけシフトされ、当該シフト後のカラーデータcwd_a3 が、図9に示すラッチ回路4530 〜4537 から図13(D)に示すカラーデータcwd3 として出力され、カラーデータcwd3 が図8に示すラッチ回路4104 を介して図2に示すディストリビュータ300に出力される。
【0083】
次に、転送データhwd4 のカラーデータpix8 をLSBから順に配置した256ビットのカラーデータが、図9に示すシフト回路4501 において、図12(E)に示すように、32ビット単位でMSBに向けて「1」だけシフトされ、当該シフト後のカラーデータcwd_a4 が、図9に示すラッチ回路4530 〜4537 から図13(E)に示すカラーデータcwd4 として出力され、カラーデータcwd4 が図8に示すラッチ回路4104 を介して図2に示すディストリビュータ300に出力される。
【0084】
また、データ並べ替え部400では、上述したカラーデータcwd0 〜cwd4 に対応する代表点座標(btrx,btry)およびバリッドフラグbtrvldをアドレス生成部430において生成する。
代表点座標(btrx,btry)およびバリッドフラグbtrvldは、アドレスADRW2 内に含められ、ディストリビュータ300に出力される。
ここで、カラーデータcwd0 〜cwd4 に対応する、代表点座標を(btrx0 ,btry0 )〜(btrx4 ,btry4 )とし、バリッドフラグをbtrvld0 〜btrvld4 とする。
なお、アドレス生成部430における、アドレスADRW2 の生成は、図8に示すコントローラ440からの制御信号S4405 に基づいて行われる。
【0085】
また、バリッドフラグbtrvldは、16ビットからなり、前述したように8画素(X方向)×2画素(Y方向)の16画素分の矩形記憶領域(256×2ビット)を単位としてDRAM147に書き込みを行う際に、記憶内容の書き換えを行うか否かを、各画素の記憶領域毎に示している。バリッドフラグbtr座標vldの各ビットは、書き込みを行う単位である16画素分の記憶領域の各1画素分の記憶領域に対応している。バリッドフラグbtrvldの各ビットは、対応する記憶領域をマスクする場合(書き換えを行わない場合)に論理値「0」を示し、マスクしない場合(書き換えを行う場合)に論理値「1」を示している。
【0086】
ここで、1回の書き込みで使用されるカラーデータは8画素分の256ビットのデータであるため、当該カラーデータを、書き込みを行う記憶領域のうちY方向のアドレスが偶数の記憶領域に書き込む場合には、16ビットのバリッドフラグbtrvldのうち上位8ビットを論理値「0」にし、書き込みを行う記憶領域のうちY方向のアドレスが奇数の記憶領域に書き込む場合には、16ビットのバリッドフラグbtrvldのうち下位8ビットを論理値「0」にする。
【0087】
図13(A)〜(E)に示すように、カラーデータcwd0 〜cwd4 のそれぞれについて、バリッドフラグbtrvld0 〜btrvld4 が、アドレス生成部430において生成される。
ここで、例えば、バリッドフラグbtrvld0 は、下位8ビットが論理値「0」になっているため、カラーデータcwd0 は、書き込みを行う記憶領域のうちY方向のアドレスが奇数の記憶領域に書き込まれる。
【0088】
また、アドレス生成部430は、図12(A)〜(E)に示すカラーデータcwd0 〜cwd4 のそれぞれを、前述した8画素(X方向)×2画素(Y方向)の16画素分の矩形記憶領域を単位としてDRAM147に書き込む際の図13(A)〜(E)に示す代表点座標(btrx0 ,btry0 )〜(btrx4 ,btry4 )をそれぞれ生成する。
【0089】
上述したように図2にデータ並べ替え部400の図8に示すデータ並べ替え回路420で生成された図13(A)〜(E)に示すカラーデータcwd0 〜cwd4 は、上述したように図8に示すアドレス生成部430において生成されたアドレスADRW2 に含まれる図13(A)〜(E)に示す代表点座標(btrx0 ,btry0 )〜(btrx4 ,btry4 )およびバリッドフラグをbtrvld0 〜btrvld4 に基づいた図2に示すディストリビュータ300、アドレスコンバータ310およびメモリコントローラ350,360,370,380の処理を経て、以下に示すように、図2に示すDRAM147に書き込まれる。
【0090】
先ず、図14(A)に示すように、代表点座標(btrx0 ,btry0 )=(4,4)によって規定される16画素分の矩形記憶領域500内のY座標が「5」(奇数)の記憶領域に、当該記憶領域内のX座標が最も小さいアドレスに図13(A)に示すカラーデータcwd0 のLSBが書き込まれるように、カラーデータcwd0 が書き込まれる。このとき、前述したように、バリッドフラグbtrvld0 の下位8ビットが全て論理値「0」の場合にはY座標が奇数の記憶領域にカラーデータcwd0 が書き込まれ、バリッドフラグbtrvld0 の上位8ビットが全て論理値「0」の場合にはY座標が偶数の記憶領域にカラーデータcwd0 が書き込まれる。
また、カラーデータcwd0 の書き込みは、バリッドフラグbtrvld0 のうち、論理値「1」のビットに対応する各々32ビットの記憶領域に対してのみ行われる。この場合には、バリッドフラグbtrvld0 は、「0x0600」、すなわち「0000011000000000」であり、論理値「1」のビットは、(X,Y)座標が(5,5)および(6,5)の記憶領域に対応しているため、図14(A)に示すように、当該記憶領域に対してのみカラーデータpix0 ,pix1 が書き込まれる。
【0091】
次に、図14(B)に示すように、代表点座標(btrx1 ,btry1 )=(6,4)によって規定される16画素分の矩形記憶領域500内のY座標が「5」(奇数)の記憶領域に、図13(B)に示すカラーデータcwd1 のカラーデータpix2 が書き込まれる。書き込み方法は、前述した図14(A)に示す場合と同じである。
【0092】
次に、同様に、図14(C)に示すように、代表点座標(btrx2 ,btry2 )=(4,6)によって規定される16画素分の矩形記憶領域500内のY座標が「6」(偶数)の記憶領域に、図13(C)に示すカラーデータcwd2 のカラーデータpix3 ,pix4 ,pix5 が書き込まれる。
【0093】
次に、同様に、図15(D)に示すように、代表点座標(btrx3 ,btry3 )=(4,6)によって規定される16画素分の矩形記憶領域500内のY座標が「7」(奇数)の記憶領域に、図13(D)に示すカラーデータcwd3 のカラーデータpix6 ,pix7 が書き込まれる。
【0094】
次に、同様に、図15(F)に示すように、代表点座標(btrx4 ,btry4 )=(6,6)によって規定される16画素分の矩形記憶領域500内のY座標が「7」(奇数)の記憶領域に、図13(E)に示すカラーデータcwd4 のカラーデータpix8 が書き込まれる。
【0095】
これにより、テクスチャエンジン回路143から入力した図11に示す64ビット幅の転送データhwd0 〜hwd4 に含まれる各々32ビットの8画素分のカラーデータpix0 〜pix8 が、図10に示す矩形記憶領域500に書き込まれる。
【0096】
なお、上述した図11〜図15に示す例では、1画素のデータ長が32ビットのカラーデータpix0 〜pix8 を、テクスチャエンジン回路143から入力して図10に示す矩形記憶領域500に書き込む場合を例示したが、1画素のデータ長は任意であり、例えば16ビットであってもよい。
以下、1画素のデータ長が16ビットのカラーデータpix0 〜pix8 を、テクスチャエンジン回路143から入力して図10に示す矩形記憶領域500に書き込む場合の処理について説明する。
この場合には、図16に示すように、テクスチャエンジン回路143から入力される64ビット幅の転送データには、各々4画素分のカラーデータが含まれる。
この場合には、図16に示す転送データhwd0 に含まれるカラーデータpix0 〜pix3 を含む256ビットのカラーデータが、図9に示すデータ並べ替え回路420のシフト回路4501 においてMSB方向に1ビットだけシフトされ、図17(A)に示す256ビットのカラーデータcwd_a0 が生成され、当該カラーデータcwd_a0 に応じてラッチ回路4530 〜4537 から、図18(A)に示すカラーデータcwd0 がディストリビュータ300に出力される。
次に、図16に示す転送データhwd1 に含まれるカラーデータpix4 〜pix7 を含む256ビットのカラーデータが、図9に示すデータ並べ替え回路420のシフト回路4501 においてMSB方向に2ビットだけシフトされ、さらに、転送データhwd0 に含まれるカラーデータpix3 を追加することで、図17(B)に示す256ビットのカラーデータcwd_a1 が生成され、当該カラーデータcwd_a1 に応じた図18(B)に示すカラーデータcwd1 がディストリビュータ300に出力される。
【0097】
次に、図16に示す転送データhwd2 に含まれるカラーデータpix8 を含む256ビットのカラーデータが、図9に示すデータ並べ替え回路420のシフト回路4501 においてMSB方向に3ビットだけシフトされ、さらに、転送データhwd1 に含まれるカラーデータpix6 、pix7 を追加することで、図17(C)に示す256ビットのカラーデータcwd_a2 が生成され、当該カラーデータcwd_a2 に応じた図18(C)に示すカラーデータcwd2 がディストリビュータ300に出力される。
【0098】
また、カラーデータcwd0 〜cwd3 に対応する図18(A)〜(C)に示す代表点座標(btrx,btry)およびバリッドフラグbtrvldが、アドレス生成部430において生成される。
【0099】
これにより、テクスチャエンジン回路143から入力した図16に示す64ビット幅の転送データhwd0 〜hwd2 に含まれる各々16ビットの8画素分のカラーデータpix0 〜pix8 が、図10に示す矩形記憶領域500に書き込まれる。
【0100】
<「Local to Host」転送モード>
以下、DRAM147から読み出した8画素分のカラーデータmc_0dtr〜mc_7dtrを、64ビット幅の転送データにパッキングして、ホストインタフェース回路149に出力する場合の動作を説明する。
なお、前述したように、DRAM147からの読み出しは、代表点を基準とした8画素(X方向)×1画素(Y方向)の8のカラーデータが記憶されている矩形記憶領域を単位として行われる。また、代表点のアドレスは、読み出し動作では、Y方向については任意のアドレスを指定できるが、X方向について8の倍数のアドレスしか指定できない。
【0101】
この場合に、図8に示すデータ並べ替え部400のアドレス生成部430は、、ホストインタフェース回路149から入力したアドレスADRR1 に基づいて、DRAM147内の読み出しを行う矩形記憶領域について、図19に示すX,Y座標系における図19中左上端からスキャンライン方向にX座標が増大する順番で代表点座標(sbx,sby)を算出する。そして、当該代表点座標(sbx,sby)を含むアドレスADRR2 をディストリビュータ300に出力する。
【0102】
また、データ並べ替え回路420は、アドレスADRR2 に応じてDRAM147から読み出された8画素分のカラーデータmc_0dtr〜mc_7dtrを、図2に示す読み出しコントローラ390から図8に示すデータ並べ替え部400のFIFO回路4103 を介して入力し、これを64ビット幅の転送データhwdにパッキングして、FIFO回路4101 を介して、ホストインタフェース回路149に出力する。
このとき、カラーデータmc_0dtrが、当該読み出しを行う矩形記憶領域の代表点座標に記憶されていたカラーデータであり、カラーデータmc_7dtrが、当該矩形記憶領域内のX座標が最大の座標に記憶されていたカラーデータである。
【0103】
以下、一例として、図19に示す幅13、高さ3、起点座標が(5,5)のDRAM147内の矩形記憶領域600から読み出したカラーデータpix0 〜pix38を、4画素分のカラーデータを含む64ビット幅の転送データにパッキングしてホストインタフェース回路149に出力する場合の動作を説明する。
【0104】
先ず、アドレス生成部430に、アドレスADRR1 が、ホストインタフェース回路149から入力される。
そして、アドレス生成部430において、図19に示す矩形記憶領域600の読み出し動作を行うために、図19および図20(A)〜(I)に示す代表点座標(sbx0 ,sby0 )〜(sbx8 ,sby8 )を含むアドレスADRR2 が、図2に示すディストリビュータ300に順に出力され、アドレスコンバータ310およびおよびメモリコントローラ350,360,370,380の処理を経て、図20(A)〜(I)に示すカラーデータmc_0dtr〜mc_7dtrが、図2に示す読み出しコントローラ390から図8に示すデータ並べ替え部400のFIFO回路4103 を介してデータ並べ替え回路420に順に出力される。
【0105】
図9に示すデータ並べ替え回路420では、コントローラ440からの制御信号S4406 に基づいて以下に示す処理が行われる。
なお、図9に示すシフト回路4501 は、セレクタ4510 〜4517 の入力端子aに接続されている256(=32×8)ビットの出力用記憶領域と、当該出力用記憶領域の上位ビットに位置する224(=32×8)ビットの内部記憶領域とを有し、32ビット単位でシフト動作を行う。
【0106】
先ず、図20(A)に示す256ビットのカラーデータmc_0dtr〜mc_7dtrがシフト回路4501 に入力され、32ビット単位で、LSBに向けて「5」だけシフトされた後に、カラーデータpix0 〜pix2 が、ラッチ回路4530 〜4532 に記憶される。
【0107】
次に、図20(B)に示す256ビットのカラーデータmc_0dtr〜mc_7dtrが、シフト回路4501 に入力され、32ビット単位で、MSBに向けて「3」だけシフトされ、出力用記憶領域に記憶されているカラーデータpix3 〜pix7 が、セレクタ4513 〜4517 の入力端子aおよび出力端子cを介して、ラッチ回路4523 〜4527 に書き込まれる。
これにより、ラッチ回路4530 〜4537 に、図21(B)の出力用記憶領域に対応する部分に示されるカラーデータcwd_b1 が記憶される。
【0108】
そして、ラッチ回路4530 〜4533 に記憶されているカラーデータpix0 〜pix3 が、図22に示す64ビットの転送データhrd0 として、図8に示すFIFO回路4102 を介して、ホストインタフェース回路149に出力される。
次に、ラッチ回路4534 〜4537 に記憶されているカラーデータpix4 〜pix7 が、図22に示す64ビットの転送データhrd1 として、図8に示すFIFO回路4102 を介して、ホストインタフェース回路149に出力される。
【0109】
また、シフト回路4501 の内部記憶領域に記憶されているカラーデータpix8 〜pix10が、32ビット単位で、LSBに向けて「8」だけシフトされた後に、ラッチ回路4530 〜4532 に書き込まれる。
次に、図20(C)に示すカラーデータmc_0dtr〜mc_7dtrがシフト回路4501 に入力され、32ビット単位で、MSBに向けて「3」だけシフトされた後に出力され、カラーデータpix11,pix12が、ラッチ回路4533 ,4534 に書き込まれる。
次に、図20(D)に示すカラーデータmc_0dtr〜mc_7dtrが、シフト回路4501 に入力され、シフトされずに出力され、カラーデータpix13〜pix15が、ラッチ回路4535 〜4537 に書き込まれる。
これにより、ラッチ回路4530 〜4537 に、図21(D)の出力用記憶領域に対応する部分に示されるカラーデータcwd_b3 が記憶される。
【0110】
そして、ラッチ回路4530 〜4533 に記憶されているカラーデータpix8 〜pix11が、図22に示す64ビットの転送データhrd2 として、図8に示すFIFO回路4102 を介して、ホストインタフェース回路149に出力される。
次に、ラッチ回路4534 〜4537 に記憶されているカラーデータpix12〜pix15が、図22に示す64ビットの転送データhrd3 として、図8に示すFIFO回路4102 を介して、ホストインタフェース回路149に出力される。
【0111】
また、次に、図20(E)に示す256ビットのカラーデータmc_0dtr〜mc_7dtrが、シフト回路4501 に入力され、シフトされずに出力され、カラーデータpix16〜pix23が、ラッチ回路4530 〜4537 に書き込まれる。
これにより、ラッチ回路4530 〜4537 に、図21(E)の出力用記憶領域に対応する部分に示されるカラーデータcwd_b4 が記憶される。
【0112】
そして、ラッチ回路4530 〜4533 に記憶されているカラーデータpix16〜pix19が、図22に示す64ビットの転送データhrd4 として、図8に示すFIFO回路4102 を介して、ホストインタフェース回路149に出力される。
次に、ラッチ回路4534 〜4537 に記憶されているカラーデータpix20〜pix23が、図22に示す64ビットの転送データhrd5 として、図8に示すFIFO回路4102 を介して、ホストインタフェース回路149に出力される。
【0113】
また、次に、図20(F)に示す256ビットのカラーデータmc_0dtr〜mc_7dtrがシフト回路4501 に入力され、シフトされずに、カラーデータpix24,pix25が、ラッチ回路4530 ,4531 に記憶される。
【0114】
次に、図20(G)に示す256ビットのカラーデータmc_0dtr〜mc_7dtrが、シフト回路4501 に入力され、32ビット単位で、LSBに向けて「3」だけシフトされ、カラーデータpix26〜pix28が、ラッチ回路4532 〜4534 に書き込まれる。
【0115】
次に、図20(H)に示す256ビットのカラーデータmc_0dtr〜mc_7dtrが、シフト回路4501 に入力され、32ビット単位で、MSBに向けて「5」だけシフトされ、カラーデータpix29〜pix36のうち、出力用記憶領域に記憶されているカラーデータpix29〜pix31が、ラッチ回路4535 〜4537 に書き込まれる
これにより、ラッチ回路4530 〜453に、図21(H)の出力用記憶領域に対応する部分に示されるカラーデータcwd_b7 が記憶される。
【0116】
そして、ラッチ回路4530 〜4533 に記憶されているカラーデータpix24〜pix27が、図22に示す64ビットの転送データhrd6 として、図8に示すFIFO回路4102 を介して、ホストインタフェース回路149に出力される。
次に、ラッチ回路4534 〜4537 に記憶されているカラーデータpix28〜pix31が、図22に示す64ビットの転送データhrd7 として、図8に示すFIFO回路4102 を介して、ホストインタフェース回路149に出力される。
【0117】
次に、シフト回路4501 の内部記憶領域に記憶されているカラーデータpix32〜pix36が、32ビット単位で、LSBに向けて「8」だけシフトされた後に、ラッチ回路4530 〜4534 に書き込まれる。
次に、図20(I)に示すカラーデータmc_0dtr〜mc_7dtrがシフト回路4501 に入力され、32ビット単位で、MSBに向けて「5」だけシフトされた後に出力され、カラーデータpix37,pix38が、ラッチ回路4535 ,4536 に書き込まれる。
これにより、ラッチ回路4530 〜4536 に、図21(I)に示されるカラーデータcwd_b8 が記憶される。
【0118】
そして、ラッチ回路4530 〜4533 に記憶されているカラーデータpix32〜pix35が、図22に示す64ビットの転送データhrd8 として、図8に示すFIFO回路4102 を介して、ホストインタフェース回路149に出力される。
次に、ラッチ回路4534 〜4536 に記憶されているカラーデータpix36〜pix38が、図22に示す64ビットの転送データhrd9 として、図8に示すFIFO回路4102 を介して、ホストインタフェース回路149に出力される。
【0119】
以上説明したように、図19に示す幅13、高さ3、起点座標が(5,5)のDRAM147内の矩形記憶領域600から読み出したカラーデータpix0 〜pix38が、図22に示すように、4画素分のカラーデータを含む64ビット幅の転送データhrd0 〜hrd9 にパッキングされてホストインタフェース回路149に出力される。
【0120】
<「Local to Local」転送モード>
この場合には、DRAM147内の転送元の記憶領域から代表点座標(sbx,sby)を基準として読み出した8画素分のカラーデータmc_0dtr〜mc_7dtrを、書き込み先(転送先)の記憶領域に、代表点座標(btrx,btry)を基準として書き込む。
このとき、転送元の矩形記憶領域の代表点座標の算出順番は、前述した「Host to Local」転送モードのように、一方向ではなく、指定された方向で行われる。
【0121】
以下、代表点座標(sbx,sby)を右から左、下から上に順に生成して、DRAM147の図19に示す矩形記憶領域600から読み出したカラーデータpix0 〜pix38を、幅13、高さ3で起点座標が(10,7)の矩形記憶領域に、代表点座標(btrx,btry)を右から左、下から上に順に生成して書き込む場合の動作を説明する。
【0122】
先ず、図8に示すアドレス生成部430において、図19に示す矩形記憶領域600の読み出し動作を行うために、図23(A)〜(I)に示す代表点座標(sbx8 ,sby8 )〜(sbx0 ,sby0 )を含むアドレスADRR2 が、図2に示すディストリビュータ300に順に出力され、アドレスコンバータ310およびおよびメモリコントローラ350,360,370,380の処理を経て、図23(A)〜(I)に示すカラーデータmc_0dtr〜mc_7dtrが、図2に示す読み出しコントローラ390から図8に示すデータ並べ替え部400のFIFO回路4103 を介してデータ並べ替え回路420に順に出力される。
すなわち、前述した図20に示す場合と比べて代表点座標が逆の順序で、ディストリビュータ300に出力される。
【0123】
次に、図9に示すデータ並べ替え回路420では、コントローラ440からの制御信号S4406 に基づいて以下に示す処理が行われる。
先ず、図23(A)に示すカラーデータmc_0dtr〜mc_7dtrが、図9に示すシフト回路4501 において、32ビット単位でMSBに向けて「1」だけシフトされ、当該シフト後のカラーデータが図9に示すラッチ回路4530 〜4537 から図24(A)に示すカラーデータcwd0 として出力され、カラーデータcwd0 が図8に示すラッチ回路4104 を介して図2に示すディストリビュータ300に出力される。
【0124】
次に、図23(B)に示すカラーデータmc_0dtr〜mc_7dtrが、図9に示すシフト回路4501 においてシフトされずに、ラッチ回路4530 〜4537 に書き込まれた後に、シフト回路4502 に出力され、シフト回路4502 において、32ビット単位でLSBに向けて「1」だけシフトされ、当該シフト後のカラーデータが、セレクタ4510 〜4517 を介して、ラッチ回路4520 〜4527 に書き込まれる。
そして、ラッチ回路4520 〜4527 から、図24(A)に示すカラーデータcwd1 が、図8に示すラッチ回路4104 を介して、ディストリビュータ300に出力される。
【0125】
次に、ラッチ回路4530 〜4537 に記憶されている図23(B)に示すカラーデータが、さらに、シフト回路4502 に出力され、シフト回路4502 において、32ビット単位でMSBに向けて「3」だけシフトされ、当該シフト後のカラーデータが、セレクタ4510 〜4517 を介して、ラッチ回路4520 〜4527 に書き込まれる。これにより、ラッチ回路4523 に、カラーデータpix29が記憶される。
また、図23(C)に示すカラーデータmc_0dtr〜mc_7dtrが、図9に示すシフト回路4501 において、LSBに向けて「5」だけシフトされ、ラッチ回路4530 〜4537 に書き込まれる。これにより、ラッチ回路4530 〜4532 に、カラーデータpix26〜pix28が記憶される。
そして、ラッチ回路4523 ,4530 〜4532 から、図24(C)に示すカラーデータcwd2 が、図8に示すラッチ回路4104 を介して、ディストリビュータ300に出力される。
【0126】
次に、図23(D)に示すカラーデータmc_0dtr〜mc_7dtrが、図9に示すシフト回路4501 において、32ビット単位でMSBに向けて「1」だけシフトされ、当該シフト後のカラーデータが図9に示すラッチ回路4530 〜4537 から図24(D)に示すカラーデータcwd3 として出力され、カラーデータcwd3 が図8に示すラッチ回路4104 を介して図2に示すディストリビュータ300に出力される。
【0127】
次に、図23(E)に示すカラーデータmc_0dtr〜mc_7dtrが、図9に示すシフト回路4501 においてシフトされずに、ラッチ回路4530 〜4537 に書き込まれた後に、シフト回路4502 に出力され、シフト回路4502 において、32ビット単位でLSBに向けて「1」だけシフトされ、当該シフト後のカラーデータが、セレクタ4510 〜4517 を介して、ラッチ回路4520 〜4527 に書き込まれる。
そして、ラッチ回路4520 〜4527 から、図24(E)に示すカラーデータcwd4 が、図8に示すラッチ回路4104 を介して、ディストリビュータ300に出力される。
【0128】
次に、ラッチ回路4530 〜4537 に記憶されている図23(E)に示すカラーデータが、さらに、シフト回路4502 に出力され、シフト回路4502 において、32ビット単位でMSBに向けて「3」だけシフトされ、当該シフト後のカラーデータが、セレクタ4510 〜4517 を介して、ラッチ回路4520 〜4527 に書き込まれる。これにより、ラッチ回路4523 に、カラーデータpix16が記憶される。
また、図23(F)に示すカラーデータmc_0dtr〜mc_7dtrが、図9に示すシフト回路4501 において、LSBに向けて「5」だけシフトされ、ラッチ回路4530 〜4537 に書き込まれる。これにより、ラッチ回路4530 〜4532 に、カラーデータpix13〜pix15が記憶される。
そして、ラッチ回路4523 ,4530 〜4532 から、図24(F)に示すカラーデータcwd5 が、図8に示すラッチ回路4104 を介して、ディストリビュータ300に出力される。
【0129】
次に、図23(G)に示すカラーデータmc_0dtr〜mc_7dtrが、図9に示すシフト回路4501 において、32ビット単位でMSBに向けて「1」だけシフトされ、当該シフト後のカラーデータが図9に示すラッチ回路4530 〜4537 から図24(G)に示すカラーデータcwd6 として出力され、カラーデータcwd6 が図8に示すラッチ回路4104 を介して図2に示すディストリビュータ300に出力される。
【0130】
次に、図23(H)に示すカラーデータmc_0dtr〜mc_7dtrが、図9に示すシフト回路4501 においてシフトされずに、ラッチ回路4530 〜4537 に書き込まれた後に、シフト回路4502 に出力され、シフト回路4502 において、32ビット単位でLSBに向けて「1」だけシフトされ、当該シフト後のカラーデータが、セレクタ4510 〜4517 を介して、ラッチ回路4520 〜4527 に書き込まれる。
そして、ラッチ回路4520 〜4527 から、図24(H)に示すカラーデータcwd7 が、図8に示すラッチ回路4104 を介して、ディストリビュータ300に出力される。
【0131】
次に、ラッチ回路4530 〜4537 に記憶されている図23(H)に示すカラーデータが、さらに、シフト回路4502 に出力され、シフト回路4502 において、32ビット単位でMSBに向けて「3」だけシフトされ、当該シフト後のカラーデータが、セレクタ4510 〜4517 を介して、ラッチ回路4520 〜4527 に書き込まれる。これにより、ラッチ回路4523 に、カラーデータpix3 が記憶される。
また、図23(I)に示すカラーデータmc_0dtr〜mc_7dtrが、図9に示すシフト回路4501 において、LSBに向けて「5」だけシフトされ、ラッチ回路4530 〜4537 に書き込まれる。これにより、ラッチ回路4530 〜4532 に、カラーデータpix0 〜pix3 が記憶される。
そして、ラッチ回路4523 ,4530 〜4532 から、図24(I)に示すカラーデータcwd8 が、図8に示すラッチ回路4104 を介して、ディストリビュータ300に出力される。
【0132】
また、データ並べ替え部400では、図24(A)〜(I)に示されるように、上述したカラーデータcwd0 〜cwd8 に対応する代表点座標(btrx0 ,btry0 )〜(btrx8 ,btry8 )およびバリッドフラグbtrvld0 〜btrvld8 が、アドレス生成部430において生成される。代表点座標(btrx0 ,btry0 )〜(btrx8 ,btry8 )およびバリッドフラグbtrvld0 〜btrvld8 は、アドレスADRW2 内に含められ、ディストリビュータ300に出力される。
【0133】
そして、代表点座標(btrx0 ,btry0 )〜(btrx8 ,btry8 )およびバリッドフラグbtrvld0 〜btrvld8 を基準として、8画素(X方向)×2画素(Y方向)の16画素を単位として、図24(A)〜(I)に示すカラーデータcwd0 〜cwd8 に含まれるカラーデータpix0 〜pix38が、DRAM147内の矩形記憶領域700に書き込まれる。
これにより、DRAM147の図19に示す矩形記憶領域600から読み出したカラーデータpix0 〜pix38が、図25に示す矩形記憶領域に700に転送される。
以上が、図8に示すデータ並べ替え回路420およびアドレス生成部430の説明である。
【0134】
コントローラ440は、テクスチャエンジン回路143から入力した転送モード指示信号S800および画素データ長指示信号S801に基づいて、制御信号S4401 〜S4406 を生成する。
コントローラ440は、FIFO回路4101 〜4103 およびラッチ回路4104 をそれぞれ制御する制御信号S4401 〜S4404 を出力する。
また、コントローラ440は、アドレス生成部430を制御する制御信号S4405 を出力する。
また、コントローラ440は、データ並べ替え回路420を制御する制御信号S4406 を出力する。
【0135】
また、コントローラ440は、FIFO回路4103 への入力、すなわちDRAM147からのカラーデータmc_0dtr〜mc_7dtrの読み出しを以下に示すようにして制御する。
コントローラ440は、FIFO回路4103 の記憶領域を監視し、各々64ビット幅の16段の記憶回路のうち半分の8段の記憶回路が空(有効データの未記憶状態)になったことを検出すると、画素データ長指示信号S801に応じた回数だけ連続して読み出しを行うことを指示する制御信号S4405 をアドレス生成部430に出力する。
ここで、1回の読み出しによって、8画素分の256ビットのカラーデータmc_0dtr〜mc_7dtrがDRAM147から読み出される。
【0136】
具体的には、コントローラ440は、画素データ長指示信号S801が示す画素データ長に応じて、図26に示す読み出し指示回数を示す制御信号S4405 をアドレス生成部430に出力する。
すなわち、コントローラ440は、1画素のデータ長が32ビット、16ビット、8ビットおよび4ビットの場合に、それぞれ2回、4回、8回および16回の読み出し指示回数を示す制御信号S4405 をアドレス生成部430に出力する。
【0137】
図26に示す読み出し指示回数を示す制御信号S4405 を出力することで、FIFO回路4103 の空(未記憶)の8段の記憶回路に、DRAM147から読み出されたカラーデータmc_0dtr〜mc_7dtrを記憶させることができる。このとき、FIFO回路4103 の8段の記憶回路は、8×64ビットのカラーデータを記憶する。
【0138】
すなわち、画素データ長が32ビットの場合には、1回の読み出し動作で読み出されるカラーデータmc_0dtr〜mc_7dtrには、図27(A)に示すように、32×8ビットのカラーデータが含まれているため、これを2回連続して読み出すことで、32×8×2(=8×64)ビットの読み出しを行うことができる。
また、画素データ長が16ビットの場合には、1回の読み出し動作で読み出されるカラーデータmc_0dtr〜mc_7dtrには、図27(B)に示すように、16×8ビットのカラーデータが含まれているため、これを4回連続して読み出すことで、16×8×4(=8×64)ビットの読み出しを行うことができる。
また、画素データ長が8ビットの場合には、1回の読み出し動作で読み出されるカラーデータmc_0dtr〜mc_7dtrには、図27(C)に示すように、8×8ビットのカラーデータが含まれているため、これを8回連続して読み出すことで、8×8×8(=8×64)ビットの読み出しを行うことができる。
また、画素データ長が4ビットの場合には、1回の読み出し動作で読み出されるカラーデータmc_0dtr〜mc_7dtrには、図27(D)に示すように、4×8ビットのカラーデータが含まれているため、これを16回連続して読み出すことで、4×8×16(=8×64)ビットの読み出しを行うことができる。
【0139】
以上説明したように、コントローラ440が、FIFO回路4103 の記憶領域を監視し、各々64ビット幅の16段の記憶回路のうち半分の8段の記憶回路が空になったときに、画素データ長指示信号S801に応じた回数だけ連続してDRAM147から読み出しを行うことで、コントローラ440によるFIFO回路4103 の制御を簡単にでき、コントローラ440の負担を軽減できる。そのため、コントローラ440が行うその他の処理が、FIFO回路4103 の制御に待たされる状態を回避できる。
すなわち、上述したようなコントローラ440による制御を行っていない一般的な従来のFIFO回路のでは、例えば、空き(未記憶)状態の記憶回路が存在する間、メモリからの読み出しを連続して行い、全ての記憶回路が記憶状態になったときに読み出しを停止するように入力制御を行う。しかしながら、このように制御を行うと、読み出しを停止したときに、1回の読み出しで読み出される8画素分のカラーデータのうち一部のデータのみがFIFO回路に書き込まれる状態が発生する。そのため、次に前回と同じ8画素のカラーデータを読み出し、当該読み出した8画素のカラーデータのうち前回にFIFO回路に書き込まれなかった画素のカラーデータを特定し、当該特定したカラーデータのみをFIFO回路に書き込むように制御を行う必要があり、制御が複雑になる。
【0140】
CRTコントロール回路145
CRTコントロール回路145は、与えられた水平および垂直同期信号に同期して、図示しないCRTに表示するアドレスを発生し、ディスプレイバッファ147bから表示データを読み出す要求をメモリI/F回路144に出力する。この要求に応じて、メモリI/F回路144は、ディスプレイバッファ147bから一定の固まりで表示データを読み出す。CRTコントローラ回路145は、ディスプレイバッファ147bから読み出した表示データを記憶するFIFO回路を内蔵し、一定の時間間隔で、RAMDAC回路146に、RGBのインデックス値を出力する。
【0141】
RAMDAC回路146
RAMDAC回路146は、各インデックス値に対応するR,G,Bデータを記憶しており、CRTコントローラ回路145から入力したRGBのインデックス値に対応するデジタル形式のR,G,Bデータを、図示しないD/Aコンバータ(Digital/Analog Converter)に転送し、アナログ形式のR,G,Bデータを生成する。RAMDAC回路146は、この生成されたR,G,BデータをCRTに出力する。
【0142】
以下、上述した3次元コンピュータグラフィックシステム10の全体動作について説明する。
3次元コンピュータグラフィックシステム10において、グラフィック描画等のデータは、メインプロセッサ11のメインメモリ12、あるいは外部からのグラフィックスデータを受けるI/Oインタフェース回路13からメインバス15を介してレンダリング回路14に与えられる。
なお、必要に応じて、グラフィックス描画等のデータは、メインプロセッサ11等において、座標変換、クリップ処理、ライティング処理等のジオメトリ処理が行われる。
ジオメトリ処理が終わったグラフィックスデータは、三角形の各3頂点の頂点座標x,y,z、輝度値R,G,B、描画しようとしている画素と対応するテクスチャ座標s,t,qとからなるポリゴンレンダリングデータS11となる。
【0143】
このポリゴンレンダリングデータS11は、レンダリング回路14のDDAセットアップ回路141に入力される。
DDAセットアップ回路141においては、ポリゴンレンダリングデータS11に基づいて、三角形の辺と水平方向の差分などを示す変分データS141が生成される。具体的には、開始点の値と終点の値、並びに、その間の距離を用いて、単位長さ移動した場合における、求めようとしている値の変化分である変分が算出され、変分データS141としてトライアングルDDA回路142に出力される。
【0144】
トライアングルDDA回路142においては、変分データS141を用いて、、三角形内部の各画素における線形補間された(z,R,G,B,s,t,q)データが算出される。
そして、この算出された(z,R,G,B,s,t,q)データと、三角形の各頂点の(x,y)データとが、DDAデータS142として、トライアングルDDA回路142からテクスチャエンジン回路143に出力される。
【0145】
テクスチャエンジン回路143においては、DDAデータS142が示す(s,t,q)データについて、sデータをqデータで除算する演算と、tデータをqデータで除算する演算とが行われる。そして、除算結果「s/q」および「t/q」に、それぞれテクスチャサイズUSIZEおよびVSIZEが乗算され、テクスチャ座標データ(u,v)が生成される。
【0146】
次に、テクスチャエンジン回路143からメモリI/F回路144に対して、アドレスADRR1 を含む読み出し要求S143が出力され、メモリI/F回路144を介して、DRAM147(SRAM148)に記憶された(R,G,B)データS148が読み出される。
【0147】
次に、テクスチャエンジン回路143において、読み出した(R,G,B)データS148の(R,G,B)データと、前段のトライアングルDDA回路142からのDDAデータS142に含まれる(R,G,B)データとが掛け合わされ、カラーデータS143として生成される。
このカラーデータS143は、テクスチャエンジン回路143からメモリI/F回路144に出力される。
【0148】
フルカラーの場合には、テクスチャバッファ147aからのデータ(R,G,B)を直接用いればよいが、インデックスカラーの場合には、あらかじめ作成しておいたカラーインデックステーブル(Color Index Table )のデータが、テクスチャCLUT(Color Look Up Table)バッファ147dより、SRAM等で構成される一時保管バッファへ転送され、この一時保管バッファのCLUTを用いてカラーインデックスから実際のR,G,Bカラーが得られる。
なお、CULTがSRAMで構成された場合は、カラーインデックスをSRAMのアドレスに入力すると、その出力には実際のR,G,Bカラーが出てくるといった使い方となる。
【0149】
そして、メモリI/F回路144において、テクスチャエンジン回路143から入力したカラーデータS143に対応するzデータと、zバッファ147cに記憶されているzデータとの比較が行われ、入力したカラーデータS12によって描画される画像が、前回、ディスプレイバッファ21に書き込まれた画像より、手前(視点側)に位置するか否かが判断される。
判断の結果、手前に位置する場合には、画像データS143に対応するzデータでzバッファ147cに記憶されたzデータが更新される。
【0150】
次に、メモリI/F回路144において、(R,G,B)データがディスプレイバッファ147bに書き込まれる。
これら書き込む(更新も含む)べきデータは、書き込み系回路である、図2に示すデータ並べ替え部400、ディストリビュータ300、アドレスデコーダ310,320,330,340を介してメモリコントローラ350,360,370,380に供給され、メモリコントローラ350,360,370,380によって、それぞれ書き込み系配線群401W,402W,411W,412W,421W,422W,431W,432Wを介し所定のメモリに対して並列的に書き込まれる。
【0151】
メモリI/F回路144においては、今から描画しようとしている画素におけるテクスチャアドレスに対応したテクスチャを格納しているメモリブロックがそのテクスチャアドレスにより算出され、そのメモリブロックにのみ読みだし要求が出され、テクスチャデータが読み出される。
この場合、該当するテクスチャデータを保持していないメモリブロックにおいては、テクスチャ読み出しのためのアクセスが行われないため、描画により多くのアクセス時間を提供することが可能となっている。
【0152】
このとき、メモリI/F回路144における、テクスチャエンジン回路143からの画像データS143をDRAM147に書き込む処理は、例えば、図11〜図18を参照して前述したように、64ビット幅の転送データhwdを、256ビット幅のカラーデータcwdに変換して行われる。
【0153】
また、描画においても同様に、今から描画しようとしている画素アドレスに対応するカラーデータを格納しているメモリブロックに対して、該当アドレスからカラーデータがモディファイ書き込み(Modify Write)を行うために読み出され、モディファイ後、同じアドレスへ書き戻される。
【0154】
隠れ面処理を行う場合には、やはり同じように今から描画しようとしている画素アドレスに対応する奥行きデータを格納しているメモリブロックに対して、該当アドレスから奥行きデータがモディファイ書き込み(Modify Write)を行うために読み出され、必要ならばモディファイ後、同じアドレスへ書き戻される。
【0155】
このようなメモリI/F回路144に基づくDRAM147とのデータのやり取りにおいては、それまでの処理を複数並行処理することで、描画性能を向上させることができる。
特に、トライアングルDDA回路142とテクスチャエンジン143の部分を並列実行形式で、同じ回路に設ける(空間並列)か、または、パイプラインを細かく挿入する(時間並列)ことで、部分的に動作周波数を増加させるという手段により、複数画素の同時算出が行われる。
【0156】
また、カラーデータは、メモリI/F回路144の制御のもと、表示領域において隣接した部分は、異なるDRAMモジュールとなるように配置される。
これにより、三角形のような平面を描画する場合には面で同時に処理される。このため、それぞれのDRAMモジュールの動作確率は非常に高い。
【0157】
そして、図示しないCRTに画像を表示する場合には、CRTコントロール回路145において、与えられた水平垂直同期周波数に同期して、表示アドレスが発生され、メモリI/F回路144へ表示データ転送の要求が出される。
メモリI/F回路144では、その要求に従い、一定のまとまった固まりで、表示データがCRTコントロール回路145に転送される。
CRTコントロール回路145では、図示しないディスプレイ用FIFO(First In First Out)等にその表示データが貯えられ、一定の間隔でRAMDAC146へRGBのインデックス値が転送される。
【0158】
また、図1に示すホストインタフェース回路149を介して、メインプロセッサ11からメモリI/F回路144に対してDRAM147あるいはSRAM148に格納されているデータの読み出し要求があった場合、読み出しコントローラ390のアドレスコンバータ391に読み出しアドレスADRR2 が入力される。
このとき、アドレスコンバータ391ではメモリコントローラ350,360,370,380からのアイドル信号S350,S360,S370,S380をすべてアクティブで入力された否かのチェックが行われる。そして、アイドル信号S350,S360,S370,S380がすべてアクティブで入力されると、アイドル信号S350,S360,S370,S380に応答して、8画素あるいは16画素単位で読み出しを行うように、読み出しアドレスおよび読み出し要求信号S391が各メモリコントローラ350,360,370,380に出力される。
【0159】
読み出しアドレスおよび読み出し要求信号S391を受けて、各メモリコントローラ350,360,370,380で8画素あるいは16画素単位の、テクスチャデータ、(R,G,B)データ、zデータおよびテクスチャカラールックアップテーブルデータが読み出し系配線群401R,402R,411R,412R,421R,422R,431R,432Rを介して並列的に読み出され、さらに読み出し系配線群351,361,371,381,配線群440を介してデータ演算部392に入力される。
そして、データ演算部392で所定の演算処理が行われた後に、データ並べ替え部400において、256ビット幅のカラーデータmc_0dtr〜mc_7dtrから64ビット幅の転送データhrdに変換され、要求先、例えばメインプロセッサ11にホストインタフェース回路149を介して出力される。
【0160】
RAMDAC146においては、RAM内部にRGBのインデックスに対するRGB値が記憶されていて、インデックス値に対するRGB値が図示しないD/Aコンバータへ転送される。
そして、D/Aコンバータでアナログ信号に変換されたRGB信号がCRTへ転送される。
【0161】
以上説明したように、本実施形態によれば、図1に示すホストインタフェース回路149およびテクスチャエンジン回路143と、DRAM147との間でのデタフォーマットが異なる場合でも、図2に示すデータ並べ替え部400においてデータの並べ替えを行うことで、テクスチャエンジン回路143およびホストインタフェース回路149とDRAM147との間でのデータ転送を正確に行うことができる。
また、本実施形態によれな、DRAM147に対してアクセスするアドレスパターンに制限がある場合でも、データ並べ替え部400において当該制限を考慮してデータの並べ替えを行うことで、DRAM147に対してのカラーデータの書き込みおよび読み出しを正確に行うことができる。
【0162】
また、本実施形態によれば、図8に示すデータ並べ替え部400において、コントローラ440が、FIFO回路4103 の記憶領域を監視し、各々64ビット幅の16段の記憶回路のうち半分の8段の記憶回路が空になったときに、画素データ長指示信号S801に応じた回数だけ連続してDRAM147から読み出しを行うことで、コントローラ440によるFIFO回路4103 の制御を簡単にでき、コントローラ440の負担を軽減できる。そのため、コントローラ440が行うその他の処理が、FIFO回路4103 の制御処理によって待たされる状態を回避できる。
【0163】
また、本実施形態によれば、DRAM147およびSRAM148へのアクセス(書き込みまたは読み出し)を行うメモリI/F回路144において、書き込み経路と読み出し経路とを別経路として構成し、書き込みの場合には書き込みアドレスADRWとカラーデータcwdを書き込み系回路であるデータ並べ替え部400、ディストリビュータ300、アドレスコンバータ310,320,330,340およびメモリコントローラ350,360,370,380で処理してDRAM147に書き込み、読み出しの場合には読み出し系回路であるデータ並べ替え部400、読み出しコントローラ390、メモリコントローラ350,360,370,380で処理してDRAM147またはSRAM148から読み出すことから、例えば読み出しの割り込みが入った時等に早いタイミングで切り替えることができ、読み出しの際の性能向上を図れる利点がある。
【0164】
また、メモリI/F回路144は、所定のインターリーブ方式のアドレッシングに基づいてDRAM147へのアクセスを、例えば16画素単位あるいは8画素単位で行い、アクセスを行う領域に制限を加えていることから、ペ−ジ違反を起こさない画像処理装置を実現できる。
【0165】
さらに、本実施形態によれば、半導体チップ内部に内蔵されたDRAM147に、表示データと少なくとも一つの図形要素が必要とするテクスチャデータを記憶させた構成を有することから、表示領域以外の部分にテクスチャデータを格納できることになり、内蔵DRAMの有効利用が可能となり、高速処理動作、並びに低消費電力化を並立させるようにした画像処理装置が実現可能となる。
そして、単一メモリシステムを実現でき、すべてが内蔵された中だけで処理ができる。その結果、ア−キテクチャとしても大きなパラダイムシフトとなる。
また、メモリの有効利用ができることで、内部に持っているDRAMのみでの処理が可能となり、内部にあるがゆえのメモリと描画システムの間の大きなバンド幅が、十分に活用可能となる。また、DRAMにおいても特殊な処理を組み込むことが可能となる。
【0166】
さらに、表示アドレス空間において、隣接するアドレスにおける表示要素が、それぞれ異なるDRAMのブロックになるように配置するので、さらにビット線の有効利用が可能となり、グラフィックス描画におけるような、比較的固まった表示領域へのアクセスが多い場合には、それぞれのモジュ−ルが同時に処理できる確率が増加し、描画性能の向上が可能となる。
【0167】
また、チップ内部にDRAMを内蔵することで、その高速なインタ−フェ−ス部分がチップの内部だけで完結することになるため、大きな付加容量のI/Oバッファであるとか、チップ間配線容量をドライブする必要がなくなり、消費電力は内蔵しない場合に比較して小さくなる。
よって、さまざまな技術を使って、一つのチップの中だけですべてができるような仕組みは、今後の携帯情報端末等の身近なデジタル機器のためには、必要不可欠な技術要素となっている。
【0168】
本発明は上述した実施形態には限定されない。
例えば、DRAM147に対してのアクセスパターンの制限は、上述したものに制限されず、その他のアクセスパターンの制限がある場合でも、本発明を適用可能である。
また、図8に示すデータ並べ替え部400の構成や、図9に示すデータ並べ替え回路420の構成も、これらに限定されるものではない。
【0169】
また、図8に示すFIFO回路4101 〜4103 の段数は任意である。
また、コントローラ440が、FIFO回路4103 の記憶状態を開始して読み出し要求を出すタイミングは、空領域が半分になったとき以外でもよい。
【0170】
また、上述した図1に示す3次元コンピュータグラフィックスシステム10では、SRAM148を用いる構成を例示したが、SRAM148を設けない構成にしてもよい。
【0171】
さらに、図1に示す3次元コンピュータグラフィックスシステム10では、ポリゴンレンダリングデータを生成するジオメトリ処理を、メインプロセッサ11で行う場合を例示したが、レンダリング回路14で行う構成にしてもよい。
【0172】
【発明の効果】
以上説明したように、本発明の画像処理装置によれば、記憶回路へのアクセス時のアドレス指定に制限がある場合でも、画像処理回路と記憶回路の間のデータ送受信を正確に行うことができる。
また、本発明の画像処理装置によれば、記憶回路へのアクセス時のアドレス指定に制限がある場合でも、記憶回路の記憶領域内でのデータ転送を正確に行うことができる。
【図面の簡単な説明】
【図1】本発明に係る3次元コンピュータグラフィックスシステムの構成を示すブロック図である。
【図2】本発明に係るレンダリング回路におけるDRAM、SRAM、並びに、DRAMおよびSRAMへアクセスするメモリI/F回路の具体的な構成例を示すブロック図である。
【図3】本発明に係るDRAMバッファの構成例を示す概略図である。
【図4】テクスチャデータに含まれる同時にアクセスが行われるカラーデータを説明するための図である。
【図5】テクスチャデータを構成する単位ブロックを説明するための図である。
【図6】テクスチャバッファのアドレス空間を説明するするための図である。
【図7】本発明に係るメモリI/F回路におけるディストリビュータの画像データ処理を説明するための図である。
【図8】図8は、図2に示すデータ並べ替え部400の構成図である。
【図9】図9は、図8に示すデータ並べ替え回路420の構成図である。
【図10】図10は、図1に示すDRAM内の記憶領域を示す図である。
【図11】図11は、図2に示すデータ並べ替え部における1画素のデータ長が32ビットの場合の「Host to Local」転送モードの動作を説明するための図である。
【図12】図12は、図2に示すデータ並べ替え部における1画素のデータ長が32ビットの場合の「Host to Local」転送モードの動作を説明するための図である。
【図13】図13は、図2に示すデータ並べ替え部における1画素のデータ長が32ビットの場合の「Host to Local」転送モードの動作を説明するための図である。
【図14】図14は、図13に示すカラーデータを図1に示すDRAMに書き込む動作を説明するための図である。
【図15】図15は、図13に示すカラーデータを図1に示すDRAMに書き込む動作を説明するための図である。
【図16】図16は、図2に示すデータ並べ替え部における1画素のデータ長が16ビットの場合の「Host to Local」転送モードの動作を説明するための図である。
【図17】図17は、図2に示すデータ並べ替え部における1画素のデータ長が16ビットの場合の「Host to Local」転送モードの動作を説明するための図である。
【図18】図18は、図2に示すデータ並べ替え部における1画素のデータ長が16ビットの場合の「Host to Local」転送モードの動作を説明するための図である。
【図19】図19は、図2に示すデータ並べ替え部における「Local to Host」転送モードの動作を説明するための図である。
【図20】図20は、図2に示すデータ並べ替え部における「Local to Host」転送モードの動作を説明するための図である。
【図21】図21は、図2に示すデータ並べ替え部における「Local to Host」転送モードの動作を説明するための図である。
【図22】図22は、図2に示すデータ並べ替え部における「Local to Host」転送モードの動作を説明するための図である。
【図23】図23は、図2に示すデータ並べ替え部における「Local to Loacl」転送モードの動作を説明するための図である。
【図24】図24は、図2に示すデータ並べ替え部における「Local to Local」転送モードの動作を説明するための図である。
【図25】図25は、図2に示すデータ並べ替え部における「Local to Local」転送モードの動作を説明するための図である。
【図26】図26は、図8に示すコントローラからアドレス生成部に出力する制御信号の読み出し要求に示される読み出し指示回数と、1画素のデータ長との関係を説明するための図である。
【図27】図27は、1画素のデータ長が32ビット、16ビット、8ビットおよび4ビットの場合における、1回の読み出し動作によってDRAMから読み出されるカラーデータを説明するための図である。
【図28】3次元コンピュータグラフィックスシステムの基本的な概念を示すシステム構成図である。
【符号の説明】
10…3次元コンピュータグラフィックスシステム、11…メインプロセッサ、12…メインメモリ、13…I/Oインタフェース回路、14…レンダリング回路、141…DDAセットアップ回路、142…トライアングルDDA回路、143…テクスチャエンジン回路、144…メモリI/F回路、145…CRTコントローラ回路、146…RAMDAC回路、147…DRAM、147a…テクスチャバッファ、147b…ディスプレイバッファ、147c…zバッファ、147d…テクスチャCLUTバッファ、148…SRAM、200,210,220,230…メモリモジュール、300…ディストリビュータ、310,320,330,340…アドレスデコーダ、350,360,370,380…メモリコントローラ、390…読み出しコントローラ、391…アドレスデコーダ、392…データ演算処理部、400…データ並べ替え部、4101 〜4103 …FIFO回路、4104 …ラッチ回路、420…データ並べ替え回路、430…アドレス生成部、440…コントローラ[0001]
BACKGROUND OF THE INVENTION
The present invention relates to an image processing apparatus.
[0002]
[Prior art]
Computer graphics are often used in various CAD (Computer Aided Design) systems and amusement machines. In particular, with the recent development of image processing technology, systems using three-dimensional computer graphics are rapidly spreading.
In such 3D computer graphics, when determining the color corresponding to each pixel (pixel), the color value of each pixel is calculated, and the calculated color value is used as the display buffer corresponding to the pixel. Rendering processing to write to the (frame buffer) address.
[0003]
One of the rendering processing methods is polygon rendering. In this method, a three-dimensional model is expressed as a combination of triangular unit graphics (polygons), and the color of the display screen is determined by drawing with the polygon as a unit.
[0004]
In the polygon rendering, the coordinates (x, y, z), color data (R, G, B), and the coordinate coordinates (s) of the texture data indicating the image pattern of pasting for each vertex of the triangle in the physical coordinate system. , T) and the value of the homogeneous term q are input, and a process of interpolating these values inside the triangle is performed.
Here, the homogeneous term q is simply an enlargement / reduction ratio, and the coordinates of the actual texture buffer in the UV coordinate system, that is, the texture coordinate data (u, v) are represented by the homogeneous coordinates (s , T) divided by the homogeneous term q is multiplied by the texture sizes USIZE and VSIZE, respectively, and “t / q”.
[0005]
FIG. 28 is a system configuration diagram showing a basic concept of a three-dimensional computer graphics system.
[0006]
In this three-dimensional computer graphics system, graphics rendering data is rendered via a
[0007]
The
Then, the
[0008]
The
In the system of FIG. 28, the
[0009]
[Problems to be solved by the invention]
By the way, in the above-described three-dimensional computer graphic system or the like, in order to efficiently perform the read operation and write operation of the DRAM, for example, the address designation at the time of accessing the DRAM is limited in consideration of the characteristics of graphic processing. It is possible.
However, when such a restriction is provided, in the system shown in FIG. 28, when data is transmitted / received between the rendering
[0010]
The present invention has been made in view of such circumstances, and it is an object of the present invention to provide an image processing apparatus capable of accurately accessing a memory even when there is a restriction on address designation when accessing the memory. Objective.
[0011]
[Means for Solving the Problems]
According to the present invention,
Polygon rendering including three-dimensional coordinates (x, y, z), R (red), G (green), B (blue) data, texture homogeneous coordinates (s, t) and homogeneous term q for the vertices of the unit graphic An image processing circuit that performs rendering processing using data and generates image data including a plurality of pixels;
Writing of image data composed of the plurality of pixels generated by the rendering process in units of a block having a predetermined sizeThe writing is performed in units of the first rectangular area with the representative point as a reference, and the first and second directions orthogonal to the first rectangular area are the first. There is a restriction that only addresses that are a multiple of the number can be specified.A plurality of memory circuits;
When the address of the representative point of the block including the image data composed of the plurality of pixels generated by the rendering process input from the image processing circuit is specified based on the restriction,Input from the image processing circuitThe image data isBased on the constraintsIn the plurality of memory circuitsThe corresponding first rectangular area of the corresponding memory circuitTo be written on,in frontA data rearrangement circuit for rearranging the image data in units of pixel data;
bookWith a built-in circuit
Comprising
The rearrangement circuit is connected to the image processing circuit.Image data composed of the plurality of pixels generated by the input rendering processThe plurality of memory circuitsSwitch toIn the first transfer mode for sending and storing,
The rendered first image data having the first bit width input from the image processing circuit is converted into second image data having the second bit width.Placed in the
When the address of the representative point of the block including the second image data is designated based on the restriction, the first image data is stored in the plurality of storage circuits.The corresponding first rectangular storage area of the corresponding storage circuitThe second image data is written toBased on the control signal, the shift process, selection process, and hold process are repeated,Sorting,
The writing circuit distributes and writes the blocks including the rearranged second image data to corresponding storage circuits of the plurality of storage circuits;
An image processing apparatus is provided.
[0012]
Also according to the invention,
Polygon rendering including three-dimensional coordinates (x, y, z), R (red), G (green), B (blue) data, texture homogeneous coordinates (s, t) and homogeneous term q for the vertices of the unit graphic Writing and reading of image data composed of a plurality of pixel data generated by a rendering process in which data is stored in a distributed manner and stored in a storage area in units of blocks of a predetermined size are performed.A plurality of storage circuits, wherein the writing is performed in units of a first rectangular area with a representative point as a reference, and a multiple of a first number in the first and second directions orthogonal to the first rectangular area There is a first restriction that only the address of the second rectangular area can be specified, and the reading is performed in units of the second rectangular area with the representative point as a reference, and an arbitrary address is set in the first direction perpendicular to the second rectangular area. There is a second restriction that the address can be specified only in multiples of the second number in the second direction.A plurality of memory circuits;
An image processing circuit for inputting first image data having a first bit width and performing a rendering process on the first image data;
SaidSecond restrictionA readout circuit for designating a representative point based on the block and reading out the image data from the plurality of storage circuits in units of the block;
Data rearrangement for outputting the first image data of the first bit width generated by rearranging the second image data of the second bit width obtained by the reading in units of pixel data to the image processing circuit Circuit and
Comprising
In the second transfer mode in which the rearrangement circuit transfers image data from the storage circuit to the image processing circuit,
An address corresponding to the address input from the image processing circuit is generated and output to the reading circuit to read out corresponding image data from the plurality of storage circuits,
Converting to image data of the first bit width defined by the image processing circuit and outputting to the image processing circuit;
An image processing apparatus is provided.
[0013]
According to the present invention,
Polygon rendering including three-dimensional coordinates (x, y, z), R (red), G (green), B (blue) data, texture homogeneous coordinates (s, t) and homogeneous term q for the vertices of the unit graphic The data is distributed, the image data generated by the rendering process is written in units of a predetermined size block, and the image data generated by the distributed writing process is read. Is doneA plurality of memory circuits, wherein the writing is performed in units of a first rectangular area with a representative point as a reference, and a first number of first and second directions orthogonal to the first rectangular area There is a first restriction that only multiple addresses can be specified, and the reading is performed in units of the second rectangular area with the representative point as a reference, and the first direction orthogonal to the second rectangular area is arbitrary. There is a second restriction that the address can be specified but the address can only be specified in multiples of the second number in the second direction.A plurality of memory circuits;
SaidSecondA readout circuit that reads out the image data from the plurality of storage circuits in units of the blocks by designating representative points based on restrictions;
Processing is performed according to either a first transfer mode in which image data is transferred from the image processing circuit to the storage circuit, or a second transfer mode in which image data is transferred from the storage circuit to the image processing circuit. A rearrangement circuit, wherein the address of the representative point of the block including the read image data isFirst limitWhen the image data is specified based onApplicableIn memory circuitThe corresponding first rectangular areaA data rearrangement circuit for rearranging the read image data in units of pixel data so as to be written to
SaidFirstA writing circuit that designates a representative point based on a restriction and writes the block including the rearranged image data to the storage circuit;
Comprising
In the first transfer mode, the rearrangement circuit transfers and stores the image data from the image processing circuit to the plurality of storage circuits.
The rendered first image data having the first bit width input from the image processing circuit is converted into second image data having the second bit width.Placed inside,
The address of the representative point of the block including the second image data isFirst limitThe first image data is stored in the plurality of storage circuits when designated based onThe corresponding rectangular area of the corresponding memory circuitThe second image data is written toBased on the control signal, the shift process, selection process, and hold process are repeated,Sorting,
The writing circuit distributes and writes the blocks including the rearranged second image data to corresponding storage circuits of the plurality of storage circuits,
In the second transfer mode in which the rearrangement circuit transfers image data from the storage circuit to the image processing circuit,
An address corresponding to the address input from the image processing circuit is generated and output to the reading circuit to read out corresponding image data from the plurality of storage circuits,
Image data of the first bit width defined by the image processing circuitPlaced insideOutput to the image processing circuit;
An image processing apparatus is provided.
[0014]
According to the present invention,
Polygon rendering including three-dimensional coordinates (x, y, z), R (red), G (green), B (blue) data, texture homogeneous coordinates (s, t) and homogeneous term q for the vertices of the unit graphic An image processing apparatus that performs rendering processing using data,
A plurality of storage circuits, wherein display data consisting of a plurality of pixel bits and texture data required by at least one graphic element are distributed and stored in the plurality of storage circuits, and a block of a predetermined size is unit The image data generated by the rendering process is written asA plurality of storage circuits, wherein the writing is performed in units of a first rectangular area with a representative point as a reference, and a multiple of a first number in the first and second directions orthogonal to the first rectangular area There is a first restriction that only the address of the second rectangular area can be specified, and the reading is performed in units of the second rectangular area with the representative point as a reference, and an arbitrary address is set in the first direction perpendicular to the second rectangular area. There is a second restriction that the address can be specified only in multiples of the second number in the second direction.A plurality of memory circuits;
An interpolation data generation circuit that interpolates polygon rendering data at the vertices of the unit graphic and generates interpolation data of pixels located in the unit graphic;
The texture homogeneous coordinates (s, t) included in the interpolation data are divided by the homogeneous term q to generate “s / q” and “t / q”, and the “s / q” and “t / q”. Texture processing that reads texture data from the plurality of storage circuits using a texture address according to the image, and pastes the read texture data on the surface of the graphic element to generate display data composed of a plurality of pixel bits Circuit,
A data rearrangement circuit for performing data rearrangement processing according to a first transfer mode for transferring image data from the texture processing circuit to the storage circuit, and comprising a plurality of pixel bits input from the texture processing circuit The address of the representative point of the block containing display data isFirst limitThe display data is stored in the plurality of storage circuits when specified based onApplicable memory circuitA data rearrangement circuit for rearranging the display data in units of image data so as to be written in a distributed manner;
A writing circuit that writes the blocks including the rearranged display data in a distributed manner to the plurality of storage circuits;
Comprising
In the first transfer mode, the rearrangement circuit transfers and stores the image data from the image processing circuit to the plurality of storage circuits.
The rendered first image data having the first bit width input from the image processing circuit is converted into second image data having the second bit width.Placed inside,
The address of the representative point of the block including the second image data isFirst limitThe second image data so that the first image data is written into a predetermined storage area of the plurality of storage circuits when designated based onBased on the control signal, the shift process, selection process, and hold process are repeated,Sorting,
The writing circuit distributes and writes the blocks including the rearranged second image data to corresponding storage circuits of the plurality of storage circuits;
An image processing apparatus is provided.
[0015]
According to the present invention,
Polygon rendering including three-dimensional coordinates (x, y, z), R (red), G (green), B (blue) data, texture homogeneous coordinates (s, t) and homogeneous term q for the vertices of the unit graphic An image processing apparatus that performs rendering processing using data,
A plurality of storage circuits, wherein display data and texture data required by at least one graphic element are distributed and stored in the plurality of storage circuits, and generated by the above rendering process in units of a predetermined size block. Written image data is writtenA plurality of memory circuits, wherein the writing is performed in units of a first rectangular area with a representative point as a reference, and a first number of first and second directions orthogonal to the first rectangular area There is a first restriction that only multiple addresses can be specified, and the reading is performed in units of the second rectangular area with the representative point as a reference, and the first direction orthogonal to the second rectangular area is arbitrary. There is a second restriction that the address can be specified but the address can only be specified in multiples of the second number in the second direction.A plurality of memory circuits;
An interpolation data generation circuit that interpolates polygon rendering data at the vertices of the unit graphic and generates interpolation data of pixels located in the unit graphic;
The texture homogeneous coordinates (s, t) included in the interpolation data are divided by the homogeneous term q to generate “s / q” and “t / q”, and the “s / q” and “t / q”. A texture processing circuit that generates display data by applying a texture data read from the plurality of storage circuits to a surface of a graphic element using a texture address according to
SaidSecond restrictionA readout circuit that designates a representative point based on the block and reads the texture data from the plurality of storage circuits in units of the block;
An interface circuit;
A data rearrangement circuit for rearranging data according to a second transfer mode for transferring display data read from the storage circuit to the texture processing circuit, wherein the read texture data is transferred to the interface. A data rearrangement circuit for rearranging according to the output format of the circuit and outputting to the interface circuit;
Comprising
The rearrangement circuit includes:SaidIn the second transfer mode, an address corresponding to an address input from the image processing circuit from the texture circuit via the interface is generated and output to the readout circuit, and corresponding image data is output from the plurality of storage circuits. Read and image data of the first bit width defined by the image processing circuitPlaced insideOutput to the image processing circuit;
An image processing apparatus is provided.
[0016]
DETAILED DESCRIPTION OF THE INVENTION
Hereinafter, in the present embodiment, a 3D computer graphics system that is applied to a personal computer or the like and displays a desired 3D image of an arbitrary 3D object model on a display such as a CRT (Cathode Ray Tube) at high speed. Will be described.
[0017]
FIG. 1 is a system configuration diagram of a three-dimensional
[0018]
The three-dimensional
The three-dimensional
[0019]
As shown in FIG. 1, a three-dimensional
Hereinafter, the function of each component will be described.
[0020]
For example, the
[0021]
The I /
[0022]
Here, the polygon rendering data includes data of (x, y, z, R, G, B, s, t, q) of each of the three vertices of the polygon.
Here, the (x, y, z) data indicates the three-dimensional coordinates of the top of the apple, and the (R, G, B) data indicates the red, green, and blue luminance values in the three-dimensional coordinates, respectively. Yes.
Of the (s, t, q) data, (s, t) indicates the homogeneous coordinates of the corresponding texture, and q indicates the homogeneous term. Here, “s / q” and “t / q” are multiplied by the texture sizes USIZE and VSIZE, respectively, to obtain texture coordinate data (u, v). Access to the texture data stored in the
That is, the polygon rendering data is a physical coordinate value of each vertex of the triangle, a color of each vertex, and texture data.
[0023]
Hereinafter, the
As shown in FIG. 1, the
In the
[0024]
DRAM147
The
The
[0025]
In addition, in order to store more texture data, the
The index and color lookup table values are used for texture processing. That is, the texture element is usually expressed by 24 bits in total of 8 bits for each of R, G, and B. However, since the data amount is expanded, one color is selected from, for example, 256 colors selected in advance, The data is used for texture processing. Thus, if there are 256 colors, each texture element can be expressed by 8 bits. Although a conversion table from an index to an actual color is necessary, the texture data becomes more compact as the texture resolution increases.
Thereby, the texture data can be compressed, and the built-in DRAM can be used efficiently.
[0026]
The
Note that the display data, depth data, and texture data are stored as follows: display data is stored continuously from the beginning of the memory block, then depth data is stored, and the remaining space is stored for each texture type. Texture data is stored in a continuous address space. Thereby, texture data can be stored efficiently.
[0027]
FIG. 2 is a block diagram illustrating a specific configuration example of the
[0028]
As shown in FIG. 2, the
[0029]
The
The
The
It should be noted that the banks 201C, 201D, 202C, 202D constituting the
[0030]
The
The memory 211 includes banks 211A and 211B that constitute a part of the
The
Note that the banks 211C, 211D, 212C and 212D constituting the
[0031]
The
The memory 221 includes banks 221A and 221B that constitute a part of the
The
Note that the banks 221C, 221D, 222C, and 222D constituting the
[0032]
The
The
The
Note that the banks 231C, 231D, 232C, and 232D constituting the
[0033]
Here, each of the
That is, each of the
However, the
Here, texture data, drawing data, z data, and texture color look-up table data for 16 pixels processed simultaneously are different from each other in banks 201A, 201B, 202A, 202B, 211A, 211B, 212A, 212B, 221A, 221B, 222A, 222B, 231A, 231B, 232A, 232B.
As a result, the memory I /
For example, data can be read simultaneously for 8 pixels of 8 (X direction) × 1 pixel (Y direction).
Note that the memory I /
[0034]
FIG. 3 is a schematic diagram illustrating a configuration example of the
As shown in FIG. 3, data accessed in a memory area of 2 × 8 pixels (pixels) is stored in an area called a page (row) or a block (column).
Each row ROW0 to ROWn + 1 is divided into four columns (blocks) M0A, M0B, M1A, and M1B as shown in FIG.
Then, at the time of writing, an even number of boundaries in the X direction and the Y direction is accessed, and at the time of reading, an access is made in a boundary that is a multiple of 8 in the X direction and an arbitrary boundary in the Y direction.
[0035]
Banks 201C, 201D, 202C, 202D, 211C, 211D, 212C, 212D, 221C, 221D, 222C, 222D, 231C, 231D, 232C, and 232D are included in banks 201A, 201B, 202A, 202B, 211A, and 211B, respectively. , 212A, 212B, 221A, 221B, 222A, 222B, 231A, 231B, 232A, and 232B are stored.
[0036]
Next, the texture data storage pattern in the
4 is a diagram for explaining color data (pixel data) included in the texture data and accessed simultaneously, FIG. 5 is a diagram for explaining unit blocks constituting the texture data, and FIG. 6 is an address of the texture buffer. It is a figure for demonstrating space.
[0037]
In the case of the present embodiment, as shown in FIG. 4, color data pix indicating the color data of pixels arranged in a 2 × 8 matrix included in the texture data.0~ Pix15Are accessed simultaneously.
[0038]
Color data pix0~ Pix15Need to be stored in different banks of the
In this embodiment, the color data pix0, Pix1, Pix8, Pix9Are stored in the banks 201C and 201D of the
[0039]
In the present embodiment, color data pix of pixels located in a rectangular area that is processed simultaneously.0~ Pix15Unit block RiFor example, texture data indicating one image is represented by unit blocks R arranged in a B × A matrix as shown in FIG.0~ RBA-1Consists of.
Unit block R0~ RBA-1Is stored in the
That is, the
[0040]
The
As will be described later, the
[0041]
Prior to obtaining the color and depth information of each pixel inside the triangle by linearly interpolating the value of each vertex of the triangle on the physical coordinate system in the
Specifically, this set-up calculation uses the start point value, end point value, and distance between the start point and end point to calculate the variation of the value to be obtained when the unit length is moved. .
The
[0042]
The
The
For example, the
[0043]
The
Note that the
[0044]
The
The
[0045]
Also, the
Further, the
Here, the texture data stored in the
The
The
[0046]
The
[0047]
The
On the other hand, in the case of the index color method, the
[0048]
Memory I /
The memory I /
Further, the memory I /
Further, when the memory I /
Further, when the memory I /
[0049]
Further, the memory I /
[0050]
The memory I /
That is, in the case of writing, the write address ADRW and the color data cdw are processed by the writing system circuit and written to the
Then, the memory I /
[0051]
A specific configuration example of the memory I /
[0052]
As shown in FIG. 2, the memory I /
[0053]
[Distributor 300]
At the time of writing, the
Here, (R, G, B) data for one pixel is 32 bits each, and z data is 32 bits.
[0054]
[
[0055]
FIG. 7 is a diagram schematically showing image data processing (pixel processing) of the
This figure corresponds to FIG. 3 to FIG. 6 described above, and the
Then, in the read operation, access is made in an area of a boundary that is a multiple of 8 in the X direction and in an arbitrary boundary in the Y direction, and in the write operation, access is made in an even boundary area in the X direction and the Y direction. The image data is processed so as to achieve proper addressing.
As a result, the
The
As a result, when a plane such as a triangle is drawn, processing can be performed simultaneously on the plane, so that the operation probability of each DRAM module is very high.
[0056]
[
The
[0057]
Specifically, at the time of writing, the
At this time, for example, in the
[0058]
Further, each of the
[0059]
In the present embodiment, the number of wirings of the write system wiring groups 401W, 402W, 411W, 412W, 421W, 422W, 431W, 432W and the read
[0060]
[Read controller 390]
The
The
The
Even when data is read from one rectangular area in the storage area of the
[0061]
As described above, the
Therefore, the
[0062]
[Data rearrangement unit 400]
The
For example, the
The data length of one pixel includes, for example, 32 bits, 16 bits, 8 bits, and 4 bits.
Here, the data length of 32 bits and 16 bits per pixel is used for texture data, and the data length of 8 bits and 4 bits per pixel is used for index data.
[0063]
In the “Host to Local” transfer mode, the
[0064]
In addition, the
[0065]
Furthermore, in the “Local to Local” transfer mode, the
[0066]
FIG. 8 is a configuration diagram of the
As shown in FIG. 8, the
[0067]
FIFO circuit 4101Is a FIFO circuit having a 64-bit width and a three-stage depth, and a control signal S440 from the
FIFO circuit 4102Is a FIFO circuit having a 64-bit width and a three-stage depth, and a control signal S440 from the
[0068]
FIFO circuit 410ThreeIs, for example, a 64-bit FIFO circuit having a depth of 16 stages, and a control signal S440 from the controller 440.ThreeBased on the above, color data mc_0dtr to mc_7dtr for 8 pixels each having 32 bits input from the read
FIFO circuit 410ThreeThe color data mc_0dtr to mc_7dtr are input to the
Latch circuit 410FourIs, for example, 256 bits wide and a control signal S440 from the controller 440.FourThe color data cwd_a having a 256-bit width input from the
[0069]
FIG. 9 is a configuration diagram of the
As shown in FIG. 9, the
[0070]
Shift circuit 4501The control signal S440 input from the
[0071]
Selector 4510~ 4517Control signal S4406Are selected from among the 32-bit color data mc_0a to mc_7a input via the input terminal a and the 32-bit color data mc_0a to mc_7a input via the input terminal b, respectively, and the output terminal a to latch circuit 4520~ 4527Output to.
[0072]
Latch circuit 4520~ 4527Control signal S4406Based on the selectors 451 respectively.0~ 4517The 32-bit color data output from the output terminal c of the FIFO circuit 410 shown in FIG.2Alternatively, the latch circuit 410FourOutput to.
Latch circuit 4530~ 4537Control signal S4406Based on the shift circuit 450 respectively.1The color data mc_0a to mc_7a input from the shift circuit 4502And the FIFO circuit 410 shown in FIG.2Alternatively, the latch circuit 410FourOutput to.
Here, the latch circuit 4520~ 4527Each of the 32-bit output lines is connected to a latch circuit 453, respectively.0~ 4537Are the same as the 32-bit output lines of the latch circuit 452 respectively.0~ 4527And latch circuit 4530~ 4537Control is performed so that 32-bit color data is output from one of the two.
[0073]
Shift circuit 4502The latch circuit 4530~ 4537Each of the 32-bit color data mc_0b to mc_7b generated by shifting the 256-bit color data input from is shifted in units of 32 bits.0~ 4517To the input terminal b.
[0074]
Hereinafter, the data rearrangement process in the
As described above, writing to the
[0075]
As the representative point address, an arbitrary address can be specified in the Y direction in the read operation, but only an address that is a multiple of 8 in the X direction can be specified. On the other hand, the address of the representative point can specify only an address that is a multiple of 2 in both the X direction and the Y direction in the write operation.
[0076]
In the rearrangement processing shown below, the color for the
[0077]
<"Host to Local" transfer mode>
Hereinafter, the 64-bit width transfer data hwd shown in FIG. 11 input from the
[0078]
In this case, the transfer data hwd is given from the
[0079]
First, the 64-bit-wide transfer data hwd shown in FIG. 11 from the
And transfer data hwd0Color data pix0, Pix1Are arranged in order from the LSB, and the 256-bit color data is converted into the shift circuit 450 shown in FIG.1As shown in FIG. 12A, the color data cwd_a after the shift is shifted by “1” toward the MSB in units of 32 bits.0Is the latch circuit 453 shown in FIG.0~ 4537To color data cwd shown in FIG.0Output as color data cwd0Is a latch circuit 410 shown in FIG.FourTo the
[0080]
Next, transfer data hwd1Color data pix2, PixThreeAre arranged in order from the LSB, and the 256-bit color data is converted into the shift circuit 450 shown in FIG.1In FIG. 12B, as shown in FIG. 12B, the color data cwd_a is shifted by “1” toward the MSB in units of 32 bits.1Is the latch circuit 453 shown in FIG.0~ 4537To color data cwd shown in FIG.1Output as color data cwd1Is a latch circuit 410 shown in FIG.FourTo the
In addition, the color data cwd_a after the shift1The selector 4510~ 4517And latch circuit 4520~ 4527Via the shift circuit 4502Is output.
[0081]
Next, transfer data hwd2Color data pixFour, PixFiveAre arranged in order from the LSB, and the 256-bit color data is converted into the shift circuit 450 shown in FIG.112C, after being shifted by “2” toward the MSB in 32-bit units, the selector 451 shown in FIG.0~ 4517Through the latch circuit 4530~ 4537Is remembered.
At this time, the color data pixFour, PixFiveHowever, the latch circuit 4532453ThreeIs remembered.
Further, the shift circuit 450 described above is used.2The 256-bit color data cwd_a shown in FIG.1Is shifted by “1” toward the LSB, then the selector 4510~ 4517Via the latch circuit 4520~ 4527Is remembered. At this time, the color data pixThreeIs latch circuit 4521Is remembered.
Then, the latch circuit 4530, 45214532~ 4537As shown in FIG. 13C, the color data pixThree, PixFour, PixFiveColor data cwd including2Is the latch circuit 410 shown in FIG.FourTo the
[0082]
Next, transfer data hwdThreeColor data pix6, Pix7Are arranged in order from the LSB, and the 256-bit color data is converted into the shift circuit 450 shown in FIG.1As shown in FIG. 12D, the color data cwd_a after the shift is shifted by “1” toward the MSB in units of 32 bits.ThreeIs the latch circuit 453 shown in FIG.0~ 4537To color data cwd shown in FIG.ThreeOutput as color data cwdThreeIs a latch circuit 410 shown in FIG.FourTo the
[0083]
Next, transfer data hwdFourColor data pix8Are arranged in order from the LSB, and the 256-bit color data is converted into the shift circuit 450 shown in FIG.1In FIG. 12E, as shown in FIG. 12E, the color data cwd_a is shifted by “1” toward the MSB in units of 32 bits.FourIs the latch circuit 453 shown in FIG.0~ 4537To color data cwd shown in FIG.FourOutput as color data cwdFourIs a latch circuit 410 shown in FIG.FourTo the
[0084]
In the
The representative point coordinates (btrx, btry) and the valid flag btrvld are stored in the address ADRW.2And output to the
Here, the color data cwd0~ CwdFourThe representative point coordinates corresponding to (btrx0, Btry0) To (btrxFour, BtryFour) And the valid flag is btrvld0~ BtrvldFourAnd
The address ADRW in the
[0085]
The valid flag btrvld is composed of 16 bits and, as described above, writes to the
[0086]
Here, since the color data used in one writing is 256-bit data for 8 pixels, the color data is written in a storage area where the address in the Y direction is an even number among the storage areas to be written. When the upper 8 bits of the 16-bit valid flag btrvld are set to the logical value “0” and the address in the Y direction is written to the odd-numbered storage area among the storage areas to be written, the 16-bit valid flag btrvld The lower 8 bits are set to the logical value “0”.
[0087]
As shown in FIGS. 13A to 13E, the color data cwd0~ CwdFourFor each of the valid flags btrvld0~ BtrvldFourIs generated by the
Here, for example, a valid flag btrvld0Since the lower 8 bits are the logical value “0”, the color data cwd0Is written in a memory area where the address in the Y direction is odd among the memory areas to be written.
[0088]
Further, the
[0089]
As described above, the color data cwd shown in FIGS. 13A to 13E generated by the
[0090]
First, as shown in FIG. 14A, the representative point coordinates (btrx0, Btry0) = (4, 4), the storage area of the
Also, color data cwd0Is written as a valid flag btrvld.0Of these, only the 32-bit storage area corresponding to the bit of the logical value “1” is performed. In this case, the valid flag btrvld0Is “0x0600”, that is, “000001000000000”, and the bits of the logical value “1” correspond to the storage areas with the (X, Y) coordinates of (5, 5) and (6, 5). As shown in FIG. 14A, color data pix only for the storage area.0, Pix1Is written.
[0091]
Next, as shown in FIG. 14B, the representative point coordinates (btrx1, Btry1) = (6, 4) The color data cwd shown in FIG. 13B is stored in the storage area where the Y coordinate in the
[0092]
Next, similarly, as shown in FIG. 14C, the representative point coordinates (btrx2, Btry2) = (4, 6) The color data cwd shown in FIG. 13C is stored in the storage area where the Y coordinate in the
[0093]
Next, similarly, as shown in FIG. 15D, the representative point coordinates (btrxThree, BtryThree) = (4, 6), the color data cwd shown in FIG. 13D is stored in the storage area where the Y coordinate in the
[0094]
Next, similarly, as shown in FIG. 15 (F), the representative point coordinates (btrxFour, BtryFour) = (6, 6), the color data cwd shown in FIG. 13E is stored in the storage area where the Y coordinate in the
[0095]
As a result, the 64-bit width transfer data hwd shown in FIG. 11 input from the
[0096]
In the example shown in FIGS. 11 to 15 described above, color data pix having a data length of one pixel of 32 bits.0~ Pix8Is input from the
Hereinafter, color data pix having a data length of 16 bits per pixel0~ Pix8Is input from the
In this case, as shown in FIG. 16, the 64-bit width transfer data input from the
In this case, the transfer data hwd shown in FIG.0Color data pix included in0~ PixThree256-bit color data including the shift data 450 of the
Next, the transfer data hwd shown in FIG.1Color data pix included inFour~ Pix7256-bit color data including the shift data 450 of the
[0097]
Next, the transfer data hwd shown in FIG.2Color data pix included in8256-bit color data including the shift data 450 of the
[0098]
Also, color data cwd0~ CwdThreeThe representative point coordinates (btrx, btry) and the valid flag btrvld shown in FIGS. 18A to 18C corresponding to are generated in the
[0099]
As a result, the 64-bit width transfer data hwd shown in FIG. 16 input from the
[0100]
<"Local to Host" transfer mode>
Hereinafter, an operation when the color data mc_0dtr to mc_7dtr for 8 pixels read from the
As described above, reading from the
[0101]
In this case, the
[0102]
In addition, the
At this time, the color data mc_0dtr is the color data stored in the representative point coordinates of the rectangular storage area to be read out, and the color data mc_7dtr is stored in the coordinates having the maximum X coordinate in the rectangular storage area. Color data.
[0103]
Hereinafter, as an example, the color data pix read from the
[0104]
First, the address ADRR is sent to the address generator 430.1Is input from the
Then, in order to perform the read operation of the
[0105]
In the
Note that the shift circuit 450 shown in FIG.1The selector 4510~ 4517A 256 (= 32 × 8) -bit output storage area connected to the input terminal “a”, and a 224 (= 32 × 8) -bit internal storage area located in the upper bits of the output storage area. The shift operation is performed in units of 32 bits.
[0106]
First, 256-bit color data mc_0dtr to mc_7dtr shown in FIG.1Color data pix after being shifted by “5” toward the LSB in units of 32 bits.0~ Pix2However, the latch circuit 4530~ 4532Is remembered.
[0107]
Next, 256-bit color data mc_0dtr to mc_7dtr shown in FIG.1The color data pix that is input to the MSB, shifted by “3” toward the MSB in units of 32 bits, and stored in the output storage areaThree~ Pix7Is selector 451Three~ 4517Through the input terminal a and the output terminal c of the latch circuit 452.Three~ 4527Is written to.
As a result, the latch circuit 4530~ 4537The color data cwd_b shown in the portion corresponding to the output storage area in FIG.1Is memorized.
[0108]
Then, the latch circuit 4530~ 453ThreeColor data pix stored in0~ PixThreeIs the 64-bit transfer data hrd shown in FIG.0As shown in FIG.2Is output to the
Next, the latch circuit 453Four~ 4537Color data pix stored inFour~ Pix7Is the 64-bit transfer data hrd shown in FIG.1As shown in FIG.2Is output to the
[0109]
The shift circuit 4501Color data pix stored in the internal storage area8~ PixTenIs shifted by “8” toward the LSB in units of 32 bits, and then the latch circuit 4530~ 4532Is written to.
Next, the color data mc_0dtr to mc_7dtr shown in FIG.1Is output after being shifted by “3” toward the MSB in units of 32 bits, and the color data pix11, Pix12However, the latch circuit 453Three453FourIs written to.
Next, the color data mc_0dtr to mc_7dtr shown in FIG.1Is output without being shifted, and the color data pix13~ Pix15However, the latch circuit 453Five~ 4537Is written to.
As a result, the latch circuit 4530~ 4537The color data cwd_b shown in the portion corresponding to the output storage area in FIG.ThreeIs memorized.
[0110]
Then, the latch circuit 4530~ 453ThreeColor data pix stored in8~ Pix11Is the 64-bit transfer data hrd shown in FIG.2As shown in FIG.2Is output to the
Next, the latch circuit 453Four~ 4537Color data pix stored in12~ Pix15Is the 64-bit transfer data hrd shown in FIG.ThreeAs shown in FIG.2Is output to the
[0111]
Next, 256-bit color data mc_0dtr to mc_7dtr shown in FIG.1Is output without being shifted, and the color data pix16~ Pixtwenty threeHowever, the latch circuit 4530~ 4537Is written to.
As a result, the latch circuit 4530~ 4537The color data cwd_b shown in the portion corresponding to the output storage area in FIG.FourIs memorized.
[0112]
Then, the latch circuit 4530~ 453ThreeColor data pix stored in16~ Pix19Is the 64-bit transfer data hrd shown in FIG.FourAs shown in FIG.2Is output to the
Next, the latch circuit 453Four~ 4537Color data pix stored in20~ Pixtwenty threeIs the 64-bit transfer data hrd shown in FIG.FiveAs shown in FIG.2Is output to the
[0113]
Next, 256-bit color data mc_0dtr to mc_7dtr shown in FIG.1Color data pix without being shifted totwenty four, Pixtwenty fiveHowever, the latch circuit 45304531Is remembered.
[0114]
Next, 256-bit color data mc_0dtr to mc_7dtr shown in FIG.1Is shifted by “3” toward the LSB in units of 32 bits, and the color data pix26~ Pix28However, the latch circuit 4532~ 453FourIs written to.
[0115]
Next, 256-bit color data mc_0dtr to mc_7dtr shown in FIG.1Is shifted by “5” toward the MSB in units of 32 bits, and the color data pix29~ Pix36Color data pix stored in the output storage area29~ Pix31However, the latch circuit 453Five~ 4537Written to
As a result, the latch circuit 4530˜453, the color data cwd_b shown in the portion corresponding to the output storage area of FIG.7Is memorized.
[0116]
Then, the latch circuit 4530~ 453ThreeColor data pix stored intwenty four~ Pix27Is the 64-bit transfer data hrd shown in FIG.6As shown in FIG.2Is output to the
Next, the latch circuit 453Four~ 4537Color data pix stored in28~ Pix31Is the 64-bit transfer data hrd shown in FIG.7As shown in FIG.2Is output to the
[0117]
Next, the shift circuit 4501Color data pix stored in the internal storage area32~ Pix36Is shifted by “8” toward the LSB in units of 32 bits, and then the latch circuit 4530~ 453FourIs written to.
Next, the color data mc_0dtr to mc_7dtr shown in FIG.1Is output after being shifted by “5” toward the MSB in units of 32 bits, and the color data pix37, Pix38However, the latch circuit 453Five4536Is written to.
As a result, the latch circuit 4530~ 4536In addition, the color data cwd_b shown in FIG.8Is memorized.
[0118]
Then, the latch circuit 4530~ 453ThreeColor data pix stored in32~ Pix35Is the 64-bit transfer data hrd shown in FIG.8As shown in FIG.2Is output to the
Next, the latch circuit 453Four~ 4536Color data pix stored in36~ Pix38Is the 64-bit transfer data hrd shown in FIG.9As shown in FIG.2Is output to the
[0119]
As described above, the color data pix read from the
[0120]
<"Local to Local" transfer mode>
In this case, the 8-pixel color data mc_0dtr to mc_7dtr read out from the transfer source storage area in the
At this time, the calculation order of the representative point coordinates of the rectangular storage area of the transfer source is performed in a designated direction instead of one direction as in the “Host to Local” transfer mode described above.
[0121]
Hereinafter, the representative point coordinates (sbx, sby) are generated in order from right to left and from bottom to top, and the color data pix read out from the
[0122]
First, in order to perform the read operation of the
That is, the representative point coordinates are output to the
[0123]
Next, in the
First, the color data mc_0dtr to mc_7dtr shown in FIG. 23A is converted into the shift circuit 450 shown in FIG.19 is shifted by “1” toward the MSB in units of 32 bits, and the color data after the shift is the latch circuit 453 shown in FIG.0~ 4537To color data cwd shown in FIG.0Output as color data cwd0Is a latch circuit 410 shown in FIG.FourTo the
[0124]
Next, the color data mc_0dtr to mc_7dtr shown in FIG. 23B is converted into the shift circuit 450 shown in FIG.1Without being shifted in the latch circuit 4530~ 4537Is written to the shift circuit 450.2Output to the shift circuit 4502, The data is shifted by “1” toward the LSB in units of 32 bits, and the color data after the shift is the selector 451.0~ 4517Through the latch circuit 4520~ 4527Is written to.
The latch circuit 4520~ 4527To the color data cwd shown in FIG.1Is the latch circuit 410 shown in FIG.FourIs output to the
[0125]
Next, the latch circuit 4530~ 4537The color data shown in FIG. 23B stored in FIG.2Output to the shift circuit 4502In FIG. 5, the shift is performed by “3” toward the MSB in units of 32 bits, and the color data after the shift is converted to the selector 451.0~ 4517Through the latch circuit 4520~ 4527Is written to. Thus, the latch circuit 452ThreeAnd color data pix29Is memorized.
Further, the color data mc_0dtr to mc_7dtr shown in FIG. 23C is converted into the shift circuit 450 shown in FIG.1, The latch circuit 453 is shifted by “5” toward the LSB.0~ 4537Is written to. As a result, the latch circuit 4530~ 4532And color data pix26~ Pix28Is memorized.
The latch circuit 452Three4530~ 4532To color data cwd shown in FIG.2Is the latch circuit 410 shown in FIG.FourIs output to the
[0126]
Next, the color data mc_0dtr to mc_7dtr shown in FIG. 23D is converted into the shift circuit 450 shown in FIG.19 is shifted by “1” toward the MSB in units of 32 bits, and the color data after the shift is the latch circuit 453 shown in FIG.0~ 4537To color data cwd shown in FIG.ThreeOutput as color data cwdThreeIs a latch circuit 410 shown in FIG.FourTo the
[0127]
Next, the color data mc_0dtr to mc_7dtr shown in FIG. 23E is converted into the shift circuit 450 shown in FIG.1Without being shifted in the latch circuit 4530~ 4537Is written to the shift circuit 450.2Output to the shift circuit 4502, The data is shifted by “1” toward the LSB in units of 32 bits, and the color data after the shift is the selector 451.0~ 4517Through the latch circuit 4520~ 4527Is written to.
The latch circuit 4520~ 4527To the color data cwd shown in FIG.FourIs the latch circuit 410 shown in FIG.FourIs output to the
[0128]
Next, the latch circuit 4530~ 4537The color data shown in FIG. 23E stored in FIG.2Output to the shift circuit 4502In FIG. 5, the shift is performed by “3” toward the MSB in units of 32 bits, and the color data after the shift is converted to the selector 451.0~ 4517Through the latch circuit 4520~ 4527Is written to. Thus, the latch circuit 452ThreeAnd color data pix16Is memorized.
Further, the color data mc_0dtr to mc_7dtr shown in FIG. 23F is converted into the shift circuit 450 shown in FIG.1, The latch circuit 453 is shifted by “5” toward the LSB.0~ 4537Is written to. As a result, the latch circuit 4530~ 4532And color data pix13~ Pix15Is memorized.
The latch circuit 452Three4530~ 4532To the color data cwd shown in FIG.FiveIs the latch circuit 410 shown in FIG.FourIs output to the
[0129]
Next, the color data mc_0dtr to mc_7dtr shown in FIG. 23G is converted into the shift circuit 450 shown in FIG.19 is shifted by “1” toward the MSB in units of 32 bits, and the color data after the shift is the latch circuit 453 shown in FIG.0~ 4537To color data cwd shown in FIG.6Output as color data cwd6Is a latch circuit 410 shown in FIG.FourTo the
[0130]
Next, the color data mc_0dtr to mc_7dtr shown in FIG. 23 (H) is converted into the shift circuit 450 shown in FIG.1Without being shifted in the latch circuit 4530~ 4537Is written to the shift circuit 450.2Output to the shift circuit 4502, The data is shifted by “1” toward the LSB in units of 32 bits, and the color data after the shift is the selector 451.0~ 4517Through the latch circuit 4520~ 4527Is written to.
The latch circuit 4520~ 4527To color data cwd shown in FIG.7Is the latch circuit 410 shown in FIG.FourIs output to the
[0131]
Next, the latch circuit 4530~ 4537The color data shown in FIG. 23 (H) stored in FIG.2Output to the shift circuit 4502In FIG. 5, the shift is performed by “3” toward the MSB in units of 32 bits, and the color data after the shift is converted to the selector 451.0~ 4517Through the latch circuit 4520~ 4527Is written to. Thus, the latch circuit 452ThreeAnd color data pixThreeIs memorized.
Further, the color data mc_0dtr to mc_7dtr shown in FIG. 23 (I) is converted into the shift circuit 450 shown in FIG.1, The latch circuit 453 is shifted by “5” toward the LSB.0~ 4537Is written to. As a result, the latch circuit 4530~ 4532And color data pix0~ PixThreeIs memorized.
The latch circuit 452Three4530~ 4532To the color data cwd shown in FIG.8Is the latch circuit 410 shown in FIG.FourIs output to the
[0132]
In the
[0133]
And the representative point coordinates (btrx0, Btry0) To (btrx8, Btry8) And valid flag btrvld0~ Btrvld824A, the color data cwd shown in FIGS. 24A to 24I with 16 pixels of 8 pixels (X direction) × 2 pixels (Y direction) as a unit.0~ Cwd8Color data pix included in0~ Pix38Is written into the
As a result, the color data pix read from the
The above is the description of the
[0134]
The
The
Further, the
In addition, the
[0135]
The
The
Here, 256-bit color data mc_0dtr to mc_7dtr for 8 pixels is read from the
[0136]
Specifically, the
That is, when the data length of one pixel is 32 bits, 16 bits, 8 bits, and 4 bits, the
[0137]
A control signal S440 indicating the number of read instructions shown in FIG.FiveIs output from the FIFO circuit 410.ThreeThe color data mc_0dtr to mc_7dtr read from the
[0138]
That is, when the pixel data length is 32 bits, the color data mc_0dtr to mc_7dtr read out in one readout operation includes 32 × 8-bit color data as shown in FIG. Therefore, it is possible to read out 32 × 8 × 2 (= 8 × 64) bits by continuously reading this twice.
Further, when the pixel data length is 16 bits, the color data mc_0dtr to mc_7dtr read out in one readout operation includes 16 × 8-bit color data as shown in FIG. Therefore, it is possible to read out 16 × 8 × 4 (= 8 × 64) bits by continuously reading this four times.
Further, when the pixel data length is 8 bits, the color data mc_0dtr to mc_7dtr read out in one readout operation includes 8 × 8-bit color data as shown in FIG. Therefore, it is possible to read out 8 × 8 × 8 (= 8 × 64) bits by continuously reading this out eight times.
Further, when the pixel data length is 4 bits, the color data mc_0dtr to mc_7dtr read out by one readout operation includes 4 × 8-bit color data as shown in FIG. Therefore, 4 × 8 × 16 (= 8 × 64) bits can be read by continuously reading this 16 times.
[0139]
As described above, the
That is, in a general conventional FIFO circuit that is not controlled by the
[0140]
The
[0141]
The
[0142]
Hereinafter, the overall operation of the above-described three-dimensional computer
In the three-dimensional computer
If necessary, data such as graphics drawing is subjected to geometry processing such as coordinate conversion, clip processing, and lighting processing in the
The graphics data that has been subjected to the geometry processing includes vertex coordinates x, y, and z of each of the three vertices of the triangle, luminance values R, G, and B, and texture coordinates s, t, and q corresponding to the pixel to be rendered. This is polygon rendering data S11.
[0143]
The polygon rendering data S11 is input to the
In the
[0144]
In the
Then, the calculated (z, R, G, B, s, t, q) data and (x, y) data of each vertex of the triangle are used as DDA data S142 from the
[0145]
In the
[0146]
Next, the address ADRR is sent from the
[0147]
Next, in the
The color data S143 is output from the
[0148]
In the case of full color, the data (R, G, B) from the
When the CULT is configured by SRAM, when the color index is input to the SRAM address, the actual R, G, B color is output as the output.
[0149]
Then, the memory I /
As a result of the determination, if it is located on the near side, the z data stored in the
[0150]
Next, in the memory I /
These data to be written (including update) are
[0151]
In the memory I /
In this case, in the memory block that does not hold the corresponding texture data, access for texture reading is not performed, so that it is possible to provide more access time for drawing.
[0152]
At this time, the process of writing the image data S143 from the
[0153]
Similarly, in drawing, the color data is read from the corresponding address to modify write (Modify Write) to the memory block storing the color data corresponding to the pixel address to be drawn. And after modification, it is written back to the same address.
[0154]
When performing hidden surface processing, the depth data is modified and written from the corresponding address to the memory block storing the depth data corresponding to the pixel address to be drawn. It is read to do, and if necessary, after modification, it is written back to the same address.
[0155]
In such data exchange with the
In particular, the
[0156]
The color data is arranged so that adjacent portions in the display area are different DRAM modules under the control of the memory I /
As a result, when drawing a plane such as a triangle, the plane is processed simultaneously. For this reason, the operation probability of each DRAM module is very high.
[0157]
When an image is displayed on a CRT (not shown), the
In the memory I /
In the
[0158]
When there is a request for reading data stored in the
At this time, the
[0159]
Upon receipt of the read address and read request signal S391, the texture data, (R, G, B) data, z data, and texture color lookup table in units of 8 pixels or 16 pixels in each of the
Then, after a predetermined calculation process is performed by the
[0160]
In the
Then, the RGB signal converted into an analog signal by the D / A converter is transferred to the CRT.
[0161]
As described above, according to the present embodiment, even if the data format between the
In addition, even when there is a restriction on the address pattern for accessing the
[0162]
Further, according to the present embodiment, in the
[0163]
Further, according to the present embodiment, in the memory I /
[0164]
Further, the memory I /
[0165]
Furthermore, according to the present embodiment, the
And, a single memory system can be realized, and processing can be performed only when everything is built in. As a result, the architecture is a big paradigm shift.
In addition, since the memory can be used effectively, the processing can be performed only with the internal DRAM, and the large bandwidth between the memory and the drawing system can be fully used because it is inside. Also, special processing can be incorporated in the DRAM.
[0166]
Furthermore, in the display address space, display elements at adjacent addresses are arranged so as to be different DRAM blocks, so that bit lines can be used more effectively, and a relatively solid display as in graphics drawing. When there are many accesses to the area, the probability that each module can be processed simultaneously increases, and the drawing performance can be improved.
[0167]
In addition, since the DRAM is built in the chip, the high-speed interface part is completed only inside the chip, so that it is an I / O buffer with a large additional capacity, or an inter-chip wiring capacity. It is no longer necessary to drive the drive, and the power consumption is smaller than when not built in.
Therefore, a mechanism that can do everything in one chip using various technologies is an indispensable technical element for familiar digital devices such as portable information terminals in the future.
[0168]
The present invention is not limited to the embodiment described above.
For example, the access pattern restrictions on the
Further, the configuration of the
[0169]
Further, the FIFO circuit 410 shown in FIG.1~ 410ThreeThe number of stages is arbitrary.
The
[0170]
Further, in the above-described three-dimensional
[0171]
Further, in the three-dimensional
[0172]
【The invention's effect】
As described above, according to the image processing apparatus of the present invention, data transmission / reception between the image processing circuit and the storage circuit can be performed accurately even when there is a limitation in addressing when accessing the storage circuit. .
Further, according to the image processing apparatus of the present invention, even when there is a restriction on address designation when accessing the storage circuit, data transfer within the storage area of the storage circuit can be performed accurately.
[Brief description of the drawings]
FIG. 1 is a block diagram showing a configuration of a three-dimensional computer graphics system according to the present invention.
FIG. 2 is a block diagram showing a specific configuration example of a DRAM, SRAM, and a memory I / F circuit for accessing the DRAM and SRAM in the rendering circuit according to the present invention.
FIG. 3 is a schematic diagram showing a configuration example of a DRAM buffer according to the present invention.
FIG. 4 is a diagram for explaining color data included in texture data and accessed simultaneously.
FIG. 5 is a diagram for explaining unit blocks constituting texture data.
FIG. 6 is a diagram for explaining an address space of a texture buffer.
FIG. 7 is a diagram for explaining image data processing of a distributor in the memory I / F circuit according to the present invention.
FIG. 8 is a configuration diagram of the
9 is a configuration diagram of the
FIG. 10 is a diagram showing a storage area in the DRAM shown in FIG. 1;
11 is a diagram for explaining an operation in a “Host to Local” transfer mode when the data length of one pixel in the data rearrangement unit shown in FIG. 2 is 32 bits.
12 is a diagram for explaining the operation in “Host to Local” transfer mode when the data length of one pixel in the data rearrangement unit shown in FIG. 2 is 32 bits. FIG.
13 is a diagram for explaining an operation in a “Host to Local” transfer mode in a case where the data length of one pixel in the data rearrangement unit shown in FIG. 2 is 32 bits.
14 is a diagram for explaining an operation of writing the color data shown in FIG. 13 to the DRAM shown in FIG. 1;
15 is a diagram for explaining an operation of writing the color data shown in FIG. 13 to the DRAM shown in FIG. 1;
16 is a diagram for explaining an operation in a “Host to Local” transfer mode when the data length of one pixel in the data rearrangement unit shown in FIG. 2 is 16 bits.
17 is a diagram for explaining an operation in a “Host to Local” transfer mode when the data length of one pixel in the data rearrangement unit shown in FIG. 2 is 16 bits.
18 is a diagram for explaining an operation in “Host to Local” transfer mode when the data length of one pixel in the data rearrangement unit shown in FIG. 2 is 16 bits.
FIG. 19 is a diagram for explaining an operation in a “Local to Host” transfer mode in the data rearrangement unit shown in FIG. 2;
FIG. 20 is a diagram for explaining the operation in the “Local to Host” transfer mode in the data rearrangement unit shown in FIG. 2;
FIG. 21 is a diagram for explaining the operation in the “Local to Host” transfer mode in the data rearrangement unit shown in FIG. 2;
FIG. 22 is a diagram for explaining an operation in a “Local to Host” transfer mode in the data rearrangement unit shown in FIG. 2;
FIG. 23 is a diagram for explaining an operation in a “Local to Loacl” transfer mode in the data rearrangement unit shown in FIG. 2;
24 is a diagram for explaining the operation in the “Local to Local” transfer mode in the data rearrangement unit shown in FIG. 2; FIG.
FIG. 25 is a diagram for explaining the operation in the “Local to Local” transfer mode in the data rearrangement unit shown in FIG. 2;
FIG. 26 is a diagram for explaining the relationship between the number of read instructions indicated in the read request for the control signal output from the controller shown in FIG. 8 to the address generation unit and the data length of one pixel.
FIG. 27 is a diagram for explaining color data read from a DRAM by one read operation when the data length of one pixel is 32 bits, 16 bits, 8 bits, and 4 bits;
FIG. 28 is a system configuration diagram showing a basic concept of a three-dimensional computer graphics system.
[Explanation of symbols]
DESCRIPTION OF
Claims (15)
所定の大きさのブロックを単位として前記レンダリング処理によって生成された、前記複数の画素からなる画像データの書き込みが行われる複数の記憶回路であって、前記書き込みは代表点を基準とする第1の矩形領域を単位として行われ、当該第1の矩形領域の直交する第1および第2方向について第1の数の倍数のアドレスしか指定できないという制約がある、複数の記憶回路と、
前記画像処理回路から入力した前記レンダリング処理によって生成された前記複数の画素からなる画像データを含む前記ブロックの前記代表点のアドレスを前記制限に基づいて指定したときに、前記前記画像処理回路から入力した前記画像データが前記制約に基づいて前記複数の記憶回路内の該当する記憶回路の該当する前記第1の矩形領域に書き込まれるように、前記画像データを、画素データ単位で並べ替える、データ並べ替え回路と、
書き込み回路と
を具備し、
前記並べ替え回路は、前記画像処理回路から入力した前記レンダリング処理によって生成された前記複数の画素からなる画像データを前記複数の記憶回路に転送して記憶する第1の転送モードにおいて、
前記画像処理回路から入力した前記レンダリング処理された第1のビット幅の第1の画像データを第2のビット幅の第2の画像データ内に配置し、
前記第2の画像データを含む前記ブロックの前記代表点のアドレスを前記制限に基づいて指定したときに、前記第1の画像データが前記複数の記憶回路の該当する記憶回路の該当する前記第1の矩形記憶領域に書き込まれるように、前記第2の画像データを、制御信号に基づいてシフト処理、選択処理、保持処理を反復して、並べ替え、
前記書き込み回路は、前記並べ替えられた前記第2の画像データを含む前記ブロックを、前記複数の記憶回路の該当する記憶回路に分散して書き込む、
画像処理装置。Polygon rendering including three-dimensional coordinates (x, y, z), R (red), G (green), B (blue) data, texture homogeneous coordinates (s, t) and homogeneous term q for the vertices of the unit graphic An image processing circuit that performs rendering processing using data and generates image data including a plurality of pixels;
A plurality of storage circuits to which image data composed of the plurality of pixels generated by the rendering process in units of a predetermined size block is written , wherein the writing is based on a representative point as a first A plurality of storage circuits which are performed in units of rectangular areas and have a restriction that only addresses that are multiples of the first number can be specified in the first and second directions orthogonal to each other in the first rectangular area ;
When the address of the representative point of the block including the image data composed of the plurality of pixels generated by the rendering process input from the image processing circuit is specified based on the restriction, the input from the image processing circuit above so that the image data is written in the first rectangular area corresponding to the appropriate memory circuits of said plurality of memory circuits, based on the constraints were, previous SL image data, rearranged by the pixel data unit, data A reordering circuit;
; And a written can lump circuit,
The rearrangement circuit, in the first transfer mode for storing image data composed of the plurality of pixels generated by the rendering processing input from the image processing circuit is transferred to the plurality of memory circuits,
Placing the rendered first image data of the first bit width input from the image processing circuit in the second image data of the second bit width ;
When the address of the representative point of the block including the second image data is designated based on the restriction, the first image data corresponds to the corresponding storage circuit of the plurality of storage circuits . The second image data is rearranged so as to be written in the rectangular storage area by repeating shift processing, selection processing, and holding processing based on a control signal ,
The writing circuit distributes and writes the blocks including the rearranged second image data to corresponding storage circuits of the plurality of storage circuits;
Image processing device.
請求項1に記載の画像処理装置。In each of the storage circuits, the address of the representative point is designated at a predetermined address interval for each of two orthogonal directions in the two-dimensional address space.
The image processing apparatus according to claim 1.
前記第2の画像データの前記第2のビット幅は前記ブロックの一辺の長さと同じであり、
前記記憶回路の記憶領域における前記ブロックの前記一辺の方向のアドレスをX方向のアドレスとし、当該X方向と直交する方向のアドレスをY方向のアドレスとした場合に、前記データ並べ替え回路は、同一の前記第1の画像データに含まれる複数の画素データのうち、前記所定の記憶領域における異なるY方向のアドレスに書き込まれる画素データを、相互に異なる前記第2の画像データ内に配置する、
請求項1または2に記載の画像処理装置。The block is rectangular;
The second bit width of the second image data is the same as the length of one side of the block;
When the address in the one side direction of the block in the storage area of the storage circuit is the address in the X direction and the address in the direction orthogonal to the X direction is the address in the Y direction, the data rearrangement circuits are the same Among the plurality of pieces of pixel data included in the first image data, pixel data written at different Y-direction addresses in the predetermined storage area are arranged in the second image data different from each other.
The image processing apparatus according to claim 1.
前記書き込み回路は、前記アドレスに含まれる前記有効性指示データに基づいて、前記ブロック内の有効性が指示されている画素データに基づいて、前記画像データを含む前記ブロックを、前記複数の記憶回路に分散して書き込む、
請求項1に記載の画像処理装置。The data rearrangement circuit generates validity instruction data for specifying valid pixel data in the block, and includes the validity instruction data in the generated address.
The writing circuit is configured to store the block including the image data on the basis of pixel data on which the validity in the block is instructed based on the validity instruction data included in the address. To distribute and write
The image processing apparatus according to claim 1 .
請求項1に記載の画像処理装置。Wherein the storage circuitry, the image processing apparatus according to claim 1, and data rearrangement circuit are mixed in one semiconductor chip.
第1のビット幅の第1の画像データを入力し、当該第1の画像データについてレンダリング処理を行う画像処理回路と、
前記第2の制限に基づいて代表点を指定して前記ブロック単位で前記複数の記憶回路から前記画像データを読み出す読み出し回路と、
前記読み出しによって得られた第2のビット幅の第2の画像データを、画素データ単位で並べ替えて生成した第1ビット幅の前記第1の画像データを前記画像処理回路に出力するデータ並べ替え回路と
を具備し、
前記並べ替え回路は、前記記憶回路から前記画像処理回路に画像データを転送する第2の転送モードにおいて、
前記画像処理回路から入力したアドレスに応じたアドレスを生成して前記読み出し回路に出力して前記複数の記憶回路から該当する画像データを読み出し、
前記画像処理回路で規定する前記第1のビット幅の画像データに変換して前記画像処理回路に出力する、
画像処理装置。Polygon rendering including three-dimensional coordinates (x, y, z), R (red), G (green), B (blue) data, texture homogeneous coordinates (s, t) and homogeneous term q for the vertices of the unit graphic plurality data are stored respectively distributed and was generated by the rendering processing stored in the storage area in units of predetermined size of the block, the writing and reading of image data composed of a plurality of pixel data is performed The writing is performed in units of the first rectangular area with the representative point as a reference, and is a multiple of the first number in the first and second directions orthogonal to the first rectangular area. There is a first restriction that only an address can be specified, and the reading is performed in units of a second rectangular area with a representative point as a reference, and in the first direction perpendicular to the second rectangular area. Can specify any address In its for the second direction is a second limitation that can address only in multiples of the second number, and a plurality of storage circuits,
An image processing circuit for inputting first image data having a first bit width and performing a rendering process on the first image data;
A readout circuit for designating a representative point based on the second restriction and reading out the image data from the plurality of storage circuits in the block unit;
Data rearrangement for outputting the first image data of the first bit width generated by rearranging the second image data of the second bit width obtained by the reading in units of pixel data to the image processing circuit Circuit and
In the second transfer mode in which the rearrangement circuit transfers image data from the storage circuit to the image processing circuit,
An address corresponding to the address input from the image processing circuit is generated and output to the reading circuit to read out corresponding image data from the plurality of storage circuits,
Converting to image data of the first bit width defined by the image processing circuit and outputting to the image processing circuit;
Image processing device.
請求項6に記載の画像処理装置。In each of the storage circuits, the address of the representative point is designated at a predetermined address interval for each of two orthogonal directions in the two-dimensional address space.
The image processing apparatus according to claim 6.
請求項6に記載の画像処理装置。The image processing apparatus according to claim 6, wherein the storage circuit, the readout circuit, and the data rearrangement circuit are mixedly mounted in one semiconductor chip.
前記第2の制限に基づいて代表点を指定して前記ブロックを単位として前記複数の記憶回路から前記画像データを読み出す読み出し回路と、
前記画像処理回路から前記記憶回路に画像データを転送する第1の転送モードと、前記記憶回路から前記画像処理回路に画像データを転送する第2の転送モードとのいずれかに応じた処理を行う、並べ替え回路であって、前記読み出された画像データを含む前記ブロックの前記代表点のアドレスを前記第1の制限に基づいて指定したときに、前記読み出された画像データが該当する記憶回路内の該当する第1の矩形領域に書き込まれるように、前記読み出された画像データを画素データ単位で並べ替える、データ並べ替え回路と、
前記第1の制限に基づいて代表点を指定して、前記並べ替えられた画像データを含む前記ブロックを前記記憶回路に書き込む書き込み回路と
を具備し、
前記並べ替え回路は、前記画像処理回路から前記複数の記憶回路に前記画像データを転送して記憶する第1の転送モードにおいて、
前記画像処理回路から入力した前記レンダリング処理された第1のビット幅の第1の画像データを第2のビット幅の第2の画像データ内に配置し、
前記第2の画像データを含む前記ブロックの前記代表点のアドレスを前記第1の制限に基づいて指定したときに、前記第1の画像データが前記複数の記憶回路の該当する記憶回路の該当する矩形領域に書き込まれるように、前記第2の画像データを、制御信号に基づいてシフト処理、選択処理、保持処理を反復して、並べ替え、
前記書き込み回路は、前記並べ替えられた前記第2の画像データを含む前記ブロックを、前記複数の記憶回路の該当する記憶回路に分散して書き込み、
前記並べ替え回路は、前記記憶回路から前記画像処理回路に画像データを転送する第2の転送モードにおいて、
前記画像処理回路から入力したアドレスに応じたアドレスを生成して前記読み出し回路に出力して前記複数の記憶回路から該当する画像データを読み出し、
前記画像処理回路で規定する前記第1のビット幅の画像データ内に配置して前記画像処理回路に出力する、
画像処理装置。Polygon rendering including three-dimensional coordinates (x, y, z), R (red), G (green), B (blue) data, texture homogeneous coordinates (s, t) and homogeneous term q for the vertices of the unit graphic The data is distributed, the image data generated by the rendering process is written in units of a predetermined size block, and the image data generated by the distributed writing process is read. In the plurality of memory circuits, the writing is performed in units of a first rectangular area with a representative point as a reference, and the first and second directions orthogonal to the first rectangular area are first described. There is a first restriction that only addresses that are multiples of the number can be specified, and the reading is performed in units of a second rectangular area with the representative point as a reference. Although for the first direction of the orthogonal of the rectangular area may be set to any address for the second direction is a second limitation that can address only in multiples of the second number, and a plurality of storage circuits,
A readout circuit for designating a representative point based on the second restriction and reading out the image data from the plurality of storage circuits in units of the block;
Processing is performed according to either a first transfer mode in which image data is transferred from the image processing circuit to the storage circuit, or a second transfer mode in which image data is transferred from the storage circuit to the image processing circuit. A rearrangement circuit that stores the corresponding image data when the address of the representative point of the block including the read image data is designated based on the first restriction. A data rearrangement circuit for rearranging the read image data in units of pixel data so as to be written in a corresponding first rectangular area in the circuit;
A writing circuit that designates a representative point based on the first restriction and writes the block including the rearranged image data to the storage circuit;
In the first transfer mode, the rearrangement circuit transfers and stores the image data from the image processing circuit to the plurality of storage circuits.
Placing the rendered first image data of the first bit width input from the image processing circuit in the second image data of the second bit width;
When the address of the representative point of the block including the second image data is designated based on the first restriction , the first image data corresponds to the corresponding storage circuit of the plurality of storage circuits. The second image data is rearranged by repeating the shift process, the selection process, and the holding process based on the control signal so as to be written in the rectangular area .
The writing circuit distributes and writes the blocks including the rearranged second image data to corresponding storage circuits of the plurality of storage circuits,
In the second transfer mode in which the rearrangement circuit transfers image data from the storage circuit to the image processing circuit,
An address corresponding to the address input from the image processing circuit is generated and output to the reading circuit to read out corresponding image data from the plurality of storage circuits,
Arranged in the image data of the first bit width defined by the image processing circuit and outputting to the image processing circuit;
Image processing device.
前記書き込み回路は、前記アドレスに含まれる前記有効性指示データに基づいて、前記ブロック内の有効性が指示されている画素データに基づいて、前記画像データを含む前記ブロックを、前記複数の記憶回路に分散して書き込む、
請求項9に記載の画像処理装置。The data rearrangement circuit generates validity instruction data for specifying valid pixel data in the block, and includes the validity instruction data in the generated address.
The writing circuit is configured to store the block including the image data on the basis of pixel data on which the validity in the block is instructed based on the validity instruction data included in the address. To distribute and write
The image processing apparatus according to claim 9.
請求項9または10記載の画像処理装置。In each of the storage circuits, the address of the representative point is designated at a predetermined address interval for each of two orthogonal directions in the two-dimensional address space.
The image processing apparatus according to claim 9 or 10.
請求項9に記載の画像処理装置。Each of the storage circuits is different in the size of the block and the designation of the representative point address between the reading and the writing,
The image processing apparatus according to claim 9.
請求項9に記載の画像処理装置。The image processing apparatus according to claim 9, wherein the storage circuit, the read circuit, the data rearrangement circuit, and the write circuit are mounted together in one semiconductor chip.
複数の記憶回路であって、複数の画素ビットからなる表示データと少なくとも一つの図形要素が必要とするテクスチャデータとを当該複数の記憶回路に分散して記憶し、所定の大きさのブロックを単位として上記レンダリング処理によって生成された画像データの書き込みが行われる、複数の記憶回路であって、前記書き込みは代表点を基準とする第1の矩形領域を単位として行われ、当該第1の矩形領域の直交する第1および第2方向について第1の数の倍数のアドレスしか指定できないという第1の制約があり、前記読み出しは代表点を基準とする第2の矩形領域を単位として行われ、当該第2の矩形領域の直交する第1方向については任意のアドレスを指定できるが第2方向については第2の数の倍数でしかアドレスを指定できないという第2の制約がある、複数の記憶回路と、
前記単位図形の頂点のポリゴンレンダリングデータを補間して、前記単位図形内に位置する画素の補間データを生成する補間データ生成回路と、
前記補間データに含まれるテクスチャ同次座標(s,t)を同次項qで除算して「s/q」および「t/q」を生成し、当該「s/q」および「t/q」に応じたテクスチャアドレスを用いて、前記複数の記憶回路からテクスチャデータを読み出し、図形要素の表面への前記読み出したテクスチャデータの張り付け処理を行って複数の画素ビットからなる表示データを生成するテクスチャ処理回路と、
前記テクスチャー処理回路から前記記憶回路に画像データを転送する第1の転送モードに応じたデータ並べ替え処理を行う、データ並べ替え回路であって、前記テクスチャ処理回路から入力した複数の画素ビットからなる表示データを含む前記ブロックの前記代表点のアドレスを前記第1の制限に基づいて指定したときに、前記表示データが前記複数の記憶回路内の該当する記憶回路に分散して書き込まれるように、画像データ単位で、前記表示データを並べ替えるデータ並べ替え回路と、
前記並べ替えられた前記表示データを含む前記ブロックを、前記複数の記憶回路に分散して書き込む書き込み回路と
を具備し、
前記並べ替え回路は、前記画像処理回路から前記複数の記憶回路に前記画像データを転送して記憶する第1の転送モードにおいて、
前記画像処理回路から入力した前記レンダリング処理された第1のビット幅の第1の画像データを第2のビット幅の第2の画像データ内に配置し、
前記第2の画像データを含む前記ブロックの前記代表点のアドレスを前記第1の制限に基づいて指定したときに、前記第1の画像データが前記複数の記憶回路の所定の記憶領域に書き込まれるように、前記第2の画像データを、制御信号に基づいてシフト処理、選択処理、保持処理を反復して、並べ替え、
前記書き込み回路は、前記並べ替えられた前記第2の画像データを含む前記ブロックを、前記複数の記憶回路の該当する記憶回路に分散して書き込む、
画像処理装置。Polygon rendering including three-dimensional coordinates (x, y, z), R (red), G (green), B (blue) data, texture homogeneous coordinates (s, t) and homogeneous term q for the vertices of the unit graphic An image processing apparatus that performs rendering processing using data,
A plurality of storage circuits, wherein display data consisting of a plurality of pixel bits and texture data required by at least one graphic element are distributed and stored in the plurality of storage circuits, and a block of a predetermined size is unit A plurality of storage circuits to which the image data generated by the rendering process is written , wherein the writing is performed in units of a first rectangular area with a representative point as a reference, and the first rectangular area In the first and second directions orthogonal to each other, there is a first restriction that only an address that is a multiple of the first number can be specified. An arbitrary address can be specified for the first direction orthogonal to the second rectangular area, but an address can only be specified by a multiple of the second number for the second direction. Cormorants there is a second constraint, a plurality of storage circuits,
An interpolation data generation circuit that interpolates polygon rendering data at the vertices of the unit graphic and generates interpolation data of pixels located in the unit graphic;
The texture homogeneous coordinates (s, t) included in the interpolation data are divided by the homogeneous term q to generate “s / q” and “t / q”, and the “s / q” and “t / q”. Texture processing that reads texture data from the plurality of storage circuits using a texture address according to the image, and pastes the read texture data on the surface of the graphic element to generate display data composed of a plurality of pixel bits Circuit,
A data rearrangement circuit for performing data rearrangement processing according to a first transfer mode for transferring image data from the texture processing circuit to the storage circuit, and comprising a plurality of pixel bits input from the texture processing circuit When the address of the representative point of the block including display data is designated based on the first restriction , the display data is written in a distributed manner in the corresponding storage circuits in the plurality of storage circuits. A data rearrangement circuit for rearranging the display data in units of image data;
A writing circuit that distributes and writes the blocks including the rearranged display data to the plurality of storage circuits, and
In the first transfer mode, the rearrangement circuit transfers and stores the image data from the image processing circuit to the plurality of storage circuits.
Placing the rendered first image data of the first bit width input from the image processing circuit in the second image data of the second bit width;
When the address of the representative point of the block including the second image data is designated based on the first restriction , the first image data is written to a predetermined storage area of the plurality of storage circuits. As described above, the second image data is rearranged by repeating shift processing, selection processing, and holding processing based on the control signal ,
The writing circuit distributes and writes the blocks including the rearranged second image data to corresponding storage circuits of the plurality of storage circuits;
Image processing device.
複数の記憶回路であって、表示データと少なくとも一つの図形要素が必要とするテクスチャデータとを当該複数の記憶回路に分散して記憶し、所定の大きさのブロックを単位として上記レンダリング処理によって生成された画像データの書き込みが行われる複数の記憶回路であって、前記書き込みは代表点を基準とする第1の矩形領域を単位として行われ、当該第1の矩形領域の直交する第1および第2方向について第1の数の倍数のアドレスしか指定できないという第1の制約があり、前記読み出しは代表点を基準とする第2の矩形領域を単位として行われ、当該第2の矩形領域の直交する第1方向については任意のアドレスを指定できるが第2方向については第2の数の倍数でしかアドレスを指定できないという第2の制約がある、複数の記憶回路と、
前記単位図形の頂点のポリゴンレンダリングデータを補間して、前記単位図形内に位置する画素の補間データを生成する補間データ生成回路と、
前記補間データに含まれるテクスチャ同次座標(s,t)を同次項qで除算して「s/q」および「t/q」を生成し、当該「s/q」および「t/q」に応じたテクスチャアドレスを用いて前記複数の記憶回路から読み出されたテクスチャデータを、図形要素の表面への張り付け処理を行って表示データを生成するテクスチャ処理回路と、
前記第2の制限に基づいて代表点を指定して前記ブロック単位で前記複数の記憶回路から前記テクスチャデータを読み出す読み出し回路と、
インタフェース回路と、
前記記憶回路から読みだした表示データを前記テクスチャー処理回路に転送する第2の転送モードに応じたデータの並べ替えを行うデータ並べ替え回路であって、前記読み出されたテクスチャデータを、前記インタフェース回路の出力フォーマットに応じて並べ替えて、前記インタフェース回路に出力するデータ並べ替え回路と
を具備し、
前記並べ替え回路は、前記第2の転送モードにおいて、前記インタフェースを経由して前記テクスチャー回路から画像処理回路から入力したアドレスに応じたアドレスを生成して前記読み出し回路に出力して前記複数の記憶回路から該当する画像データを読み出し、前記画像処理回路で規定する前記第1のビット幅の画像データ内に配置して前記画像処理回路に出力する、
画像処理装置。Polygon rendering including three-dimensional coordinates (x, y, z), R (red), G (green), B (blue) data, texture homogeneous coordinates (s, t) and homogeneous term q for the vertices of the unit graphic An image processing apparatus that performs rendering processing using data,
A plurality of storage circuits, wherein display data and texture data required by at least one graphic element are distributed and stored in the plurality of storage circuits, and generated by the above rendering process in units of a predetermined size block. a plurality of storage circuits writing Ru performed of the image data, the writing is performed a first rectangular area relative to the representative point as a unit, the first and perpendicular to the first rectangular region There is a first restriction that only addresses that are multiples of the first number can be specified in the second direction, and the reading is performed in units of the second rectangular area based on the representative point, and the second rectangular area Although in the first direction perpendicular can specify any address for the second direction is a second limitation that can address only in multiples of the second number, a plurality A memory circuit,
An interpolation data generation circuit that interpolates polygon rendering data at the vertices of the unit graphic and generates interpolation data of pixels located in the unit graphic;
The texture homogeneous coordinates (s, t) included in the interpolation data are divided by the homogeneous term q to generate “s / q” and “t / q”, and the “s / q” and “t / q”. A texture processing circuit that generates display data by applying a texture data read from the plurality of storage circuits to a surface of a graphic element using a texture address according to
A readout circuit for designating a representative point based on the second restriction and reading the texture data from the plurality of storage circuits in units of blocks;
An interface circuit;
A data rearrangement circuit for rearranging data according to a second transfer mode for transferring display data read from the storage circuit to the texture processing circuit, wherein the read texture data is transferred to the interface. A data rearrangement circuit that rearranges the output according to the output format of the circuit and outputs the data to the interface circuit,
The rearrangement circuit, in the second transfer mode, via to generate and said plurality of storage and output to the read circuit an address corresponding to an address inputted from the image processing circuit from said texture circuit the interface reads out the image data corresponding the circuit, and outputs the arranged in the image data of the first bit width specified by the image processing circuit to the image processing circuit,
Image processing device.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP31813498A JP4828006B2 (en) | 1998-11-09 | 1998-11-09 | Image processing device |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP31813498A JP4828006B2 (en) | 1998-11-09 | 1998-11-09 | Image processing device |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2000148975A JP2000148975A (en) | 2000-05-30 |
JP4828006B2 true JP4828006B2 (en) | 2011-11-30 |
Family
ID=18095891
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP31813498A Expired - Fee Related JP4828006B2 (en) | 1998-11-09 | 1998-11-09 | Image processing device |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP4828006B2 (en) |
Families Citing this family (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR100687916B1 (en) * | 2005-06-08 | 2007-02-27 | 삼성전자주식회사 | Image processing apparatus and image processing method for displaying image on webpage |
JP4863306B2 (en) * | 2008-06-11 | 2012-01-25 | Necシステムテクノロジー株式会社 | Vector image drawing apparatus, vector image drawing method and program |
US8989242B2 (en) | 2011-02-10 | 2015-03-24 | Nec Corporation | Encoding/decoding processor and wireless communication apparatus |
-
1998
- 1998-11-09 JP JP31813498A patent/JP4828006B2/en not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
JP2000148975A (en) | 2000-05-30 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US6222563B1 (en) | Graphic processing apparatus and method | |
JPH08278779A (en) | Frame memory controller for graphics | |
JP4182575B2 (en) | Storage device and image data processing device | |
JP4568950B2 (en) | Graphics drawing device | |
US6480199B1 (en) | Image processing apparatus | |
JP3687945B2 (en) | Image processing apparatus and method | |
JP4828006B2 (en) | Image processing device | |
JP4314655B2 (en) | Image processing device | |
JP3260913B2 (en) | Image playback device | |
JP4081860B2 (en) | Image processing device | |
JP4665268B2 (en) | Image processing device | |
JP4232234B2 (en) | Image processing device | |
US7245303B2 (en) | Image processing apparatus | |
JP4069486B2 (en) | Memory circuit control device and graphic operation device | |
US7583270B2 (en) | Image processing apparatus | |
JPH11272548A (en) | Storage circuit control device and graphic operation device | |
JP2647073B2 (en) | Graphic display device | |
JP4580475B2 (en) | Arithmetic processing unit and graphic arithmetic unit | |
JP2003085038A (en) | Image processing device | |
JPH05257793A (en) | Computer system | |
JP2008181559A (en) | Image processing device | |
JPH09305157A (en) | Picture control display device |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20050802 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20081205 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20081216 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20090216 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20090421 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20090721 |
|
A911 | Transfer to examiner for re-examination before appeal (zenchi) |
Free format text: JAPANESE INTERMEDIATE CODE: A911 Effective date: 20090803 |
|
A912 | Re-examination (zenchi) completed and case transferred to appeal board |
Free format text: JAPANESE INTERMEDIATE CODE: A912 Effective date: 20090911 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20110801 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20110914 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20140922 Year of fee payment: 3 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
LAPS | Cancellation because of no payment of annual fees |