# (19) **日本国特許庁(JP)**

# (12) 公 表 特 許 公 報(A)

(11)特許出願公表番号

特表2005-504390 (P2005-504390A)

(43) 公表日 平成17年2月10日(2005.2.10)

| (51) Int.C1. <sup>7</sup> |      | FI   |      |      | テーマコード(参考) |
|---------------------------|------|------|------|------|------------|
| G06F                      | 9/45 | G06F | 9/44 | 320C | 5BO13      |
| G06F                      | 9/38 | G06F | 9/38 | 330A | 5BO81      |
|                           |      | GO6F | 9/38 | 330K |            |

# 審査請求 未請求 予備審査請求 未請求 (全 42 頁)

|               |                              | m = H444 |                     |
|---------------|------------------------------|----------|---------------------|
| (21) 出願番号     | 特願2003-533105 (P2003-533105) | (71) 出願人 | 590000248           |
| (86) (22) 出願日 | 平成14年9月9日(2002.9.9)          |          | コーニンクレッカ フィリップス エレク |
| (85) 翻訳文提出日   | 平成16年1月30日 (2004.1.30)       |          | トロニクス エヌ ヴィ         |
| (86) 国際出願番号   | PCT/1B2002/003646            |          | Koninklijke Philips |
| (87) 国際公開番号   | W02003/029961                |          | Electronics N.V.    |
| (87) 国際公開日    | 平成15年4月10日 (2003.4.10)       |          | オランダ国 5621 ベーアー アイン |
| (31) 優先権主張番号  | 01402545.6                   |          | ドーフェン フルーネヴァウツウェッハ  |
| (32) 優先日      | 平成13年10月2日 (2001.10.2)       |          | 1                   |
| (33) 優先権主張国   | 欧州特許庁 (EP)                   |          | Groenewoudseweg 1,5 |
|               |                              |          | 621 BA Eindhoven, T |
|               |                              |          | he Netherlands      |
|               |                              | (74) 代理人 | 100087789           |
|               |                              |          | 弁理士 津軽 進            |
|               |                              | (74) 代理人 | 100114753           |
|               |                              |          | 弁理士 宮崎 昭彦           |
|               |                              |          | 最終頁に続く              |

#### (54) 【発明の名称】ジャバハードウェアアクセラレータ用の投機的実行

# (57)【要約】

条件付き分岐バイトコードは仮想マシンインタープリタ (VMI)ハードウェアアクセラレータにより処理され 、該アクセラレータは分岐予測方法を使用して、CPU が条件制御変数を戻すのを待つ間にバイトコードを投機 的に処理すべきかを決定する。或る分岐予測方法におい ては、上記VMIは、条件付き分岐バイトコードが後方 ジャンプを求める場合は分岐条件が満たされると仮定し 、条件付き分岐バイトコードが前方ジャンプを求める場 合は分岐条件が満たされないと仮定する。他の分岐予測 方法においては、上記VMIは条件付き分岐バイトコー ドが後方ジャンプを求める場合にのみ仮定を行う。更に 他の投機的実行方法において、上記VMIは、条件付き 分岐バイトコードを処理する場合は常に分岐条件が満た されると仮定する。該VMIは、容易に元に戻すことが 可能なバイトコード (例えば、単純なスタック操作を表 すバイトコード)のみを投機的に処理し、容易に元に戻 すことができないバイトコードに出会うと、バイトコー ドの投機的処理を保留する。該VMIによりなされた仮 定は、上記条件制御変数が入力された際に確認又は無効



# 【特許請求の範囲】

# 【請求項1】

仮想マシン命令を処理する方法において、該方法が、

処 理 が 条 件 制 御 変 数 の 値 に 条 件 的 に 依 存 す る よ う な 仮 想 マ シ ン 命 令 の 部 分 集 合 を 識 別 す る ス テ ッ プ と 、

一連の仮想マシン命令を取り込むと共に、これら仮想マシン命令をプロセッサにより実行可能なネイティブ命令へと処理するステップであって、前記一連の仮想マシン命令における仮想マシン命令を処理し、実行のために前記プロセッサにディスパッチした後に仮想マシン命令カウンタがインクリメントされ、当該ステップを前記仮想マシン命令の部分集合のメンバに出会うまで継続するようなステップと、

前記メンバに出会うと、該メンバにより表されるネイティブ命令を実行のために前記プロセッサにディスパッチすることにより制御値取出処理を開始するステップと、

前記条件制御変数の実際値の仮定値に関して仮定がなされた場合に仮想マシン命令の投機的シーケンスを処理するステップであって、該投機的シーケンスを、

投機モードスイッチをオンに切り換え、

前記条件制御変数の前記実際値が入力されるまで、前記仮想マシン命令の投機的シーケンスにおける各仮想マシン命令をネイティブ命令へと処理するために前記仮定値に従って前記仮想マシン命令カウンタを更新し、前記各仮想マシン命令が処理された後に前記仮想マシン命令カウンタをインクリメントすると共に前記ネイティブ命令をディスパッチし、

前記実際値を前記仮定値と比較し、

前記実際値が前記仮定値と等しくない場合に、前記仮想マシン命令の投機的シーケンスの処理を元に戻し、投機モード履歴を除去し、前記仮想マシン命令カウンタの前記更新を元に戻すか、又は

前記実際値が前記仮定値に等しい場合に、前記投機モードスイッチをオフに切り換えると共に、前記投機モード履歴を除去する、

ことにより処理するようなステップと、

前記条件制御変数の実際値の仮定値に関して仮定がなされない場合に、前記一連の仮想マシン命令の更なる取り込み及び処理を前記条件制御変数の前記実際値が入力されるまで遅らせ、次いで次の仮想マシン命令を該実際値に従って処理するステップと、

を有することを特徴とする方法。

### 【請求項2】

請求項1に記載の方法において、前記一連の仮想マシン命令を取り込み及びプロセッサにより実行可能なネイティブ命令へと処理するステップが、仮想マシンインタプリタ(VMI)の仮想マシンハードウェアアクセラレータによりなされることを特徴とする方法。

# 【請求項3】

請求項1に記載の方法において、前記仮想マシン命令の投機的シーケンスを処理するステップが.

前記投機的シーケンスの各仮想マシン命令を、該仮想マシン命令が容易に元に戻すことができるものである場合にのみ処理するステップと、

次の仮想マシン命令がスタック操作を表していない場合は、前記仮想マシン命令の投機的シーケンスの処理を、前記条件制御変数の実際値が入力されるまで保留するステップと、を有していることを特徴とする方法。

# 【請求項4】

請求項3に記載の方法において、前記投機的シーケンスの処理を保留するステップが、前記条件制御変数の実際値が入力されるまで、前記プロセッサに対して一連の"ノーオペレーション"命令をディスパッチするステップを有していることを特徴とする方法。

#### 【請求項5】

請求項 2 に記載の方法において、前記条件制御変数の実際値の仮定値に関して仮定を行うべきかを決定するステップが、

識別された前記仮想マシン命令の部分集合の前記メンバにより求められる前記仮想マシン

20

10

30

40

命令カウンタに対する変位を決定するステップと、

前記識別された仮想マシン命令の部分集合の前記メンバが前記仮想マシン命令カウンタの 負の変位(オフセット<0)を求める場合に、前記条件制御変数の前記仮定値を分岐条件 が満たされることを示すように設定するステップと、

を有していることを特徴とする方法。

#### 【請求項6】

請求項5に記載の方法において、前記識別された仮想マシン命令の部分集合の前記メンバが前記仮想マシン命令カウンタの正の変位(オフセット>0)を求める場合に、前記条件制御変数の前記仮定値を前記分岐条件が満たされないことを示すように設定するステップを更に有していることを特徴とする方法。

【請求項7】

請求項5に記載の方法において、前記識別された仮想マシン命令の部分集合の前記メンバが前記仮想マシン命令カウンタの正の変位(オフセット>0)を求める場合に、前記条件制御変数の前記実際値に関して仮定を行わないステップを更に有していることを特徴とする方法。

#### 【請求項8】

請求項 2 に記載の方法において、前記条件制御変数の実際値の仮定値に関して仮定を行うべきかを決定するステップが、前記条件制御変数の前記仮定値を分岐条件が満たされることを示すように設定するステップを更に有していることを特徴とする方法。

# 【請求項9】

請求項 2 に記載の方法において、前記条件制御変数の実際値の仮定値に関して仮定を行うべきかを決定するステップが、前記条件制御変数の前記仮定値を分岐予測方法に従って設定するステップを更に有していることを特徴とする方法。

#### 【請求項10】

請求項 2 に記載の方法において、前記条件制御変数の実際値の仮定値に関して仮定を行うべきかを決定するステップが、前記条件制御変数の前記仮定値を投機的実行方法に従って 設定するステップを更に有していることを特徴とする方法。

#### 【請求項11】

仮想マシン命令を処理する方法において、該方法が、

一連の仮想マシン命令を取り込むと共に、これら仮想マシン命令をプロセッサにより実行可能なネイティブ命令へと処理するステップであって、当該ステップを条件付き分岐命令に出会うまで継続するようなステップと、

前記条件付き分岐命令に出会うと、該条件付き分岐命令により表されるネイティブ命令を 前記プロセッサに実行のためにディスパッチすることにより制御値取出処理を開始するステップと、

条件制御変数の値に関して仮定を行うかを決定するステップと、

前 記 条 件 制 御 変 数 の 値 に 関 し て 仮 定 が 行 わ れ た 場 合 に 、 仮 想 マ シ ン 命 令 の 投 機 的 シ ー ケ ン ス を 処 理 す る ス テ ッ プ で あ っ て 、 該 投 機 的 シ ー ケ ン ス を 、

前記仮想マシン命令の投機的シーケンスにおける仮想マシン命令を、該仮想マシン命令が容易に元に戻すことが可能である場合にのみ、予備的ネイティブ命令へと処理し、

該仮想マシン命令がスタック操作を表さない場合に、前記仮想マシン命令の投機的シーケンスの処理を前記条件制御変数の値が入力されるまで保留する、

ことによって処理するステップと、

前記条件制御変数の値に関して仮定がなされない場合に、前記一連の仮想マシン命令の更なる取り込み及び処理を前記条件制御変数の値が入力されるまで遅らせ、次いで次の仮想マシン命令を該入力された値に従って処理するステップと、

を有することを特徴とする方法。

# 【請求項12】

請求項11に記載の方法において、前記仮想マシン命令の投機的シーケンスを処理するステップが、

10

20

30

40

前記入力された条件制御変数の値を仮定値と比較するステップと、

前記条件制御変数の値が前記仮定値と等しくない場合に、前記仮想マシン命令の投機的シーケンスの処理を元に戻すと共に、投機モード履歴を除去するステップと、

前記条件制御変数の値が前記仮定値と等しい場合に、投機モードスイッチをオフに切り換えると共に、前記投機モード履歴を除去するステップと、

を更に有することを特徴とする方法。

# 【請求項13】

仮想マシン命令を処理する装置において、

ネイティブ命令セットを有すると共にネイティブ命令を実行するように構成されたプロセッサと、

仮想マシン命令を記憶するように構成された命令メモリと、

前記命令メモリから仮想マシン命令を取り込むと共に該取り込まれた仮想マシン命令を前記プロセッサにより実行可能なネイティブ命令へと処理し、条件付き仮想マシン命令を識別し、前記プロセッサにより条件制御変数の値が送られつつある間に仮想マシン命令を投機的に処理すべきかを決定し、これら投機的に処理された仮想マシン命令を前記条件制御変数が入力された際に確認するか又は元に戻すように構成されたプリプロセッサと、を有し、前記プリプロセッサが、更に、

前記プロセッサから入力された前記条件制御変数の値を記憶するように構成された制御レジスタと、

シスタと、 処理されるべき次の仮想マシン命令を示すように構成された仮想マシン命令カウンタと、

仮 定 さ れ た 制 御 変 数 の 値 を 記 憶 す る よ う に 構 成 さ れ た 仮 定 変 数 レ ジ ス タ と 、

当該プリプロセッサが前記条件制御変数の値に関して仮定を行ったかを示すように構成された投機モードビットと、

前記条件制御変数の値が送られつつある間に投機モードビットを記憶するように構成された投機モード履歴と、

を有していることを特徴とする装置。

# 【請求項14】

請求項13に記載の装置において、前記プリプロセッサが仮想マシンインタープリタ(VMI)の仮想マシンハードウェアアクセラレータであることを特徴とする装置。

#### 【請求項15】

請求項13に記載の装置において、前記プリプロセッサは、容易に元に戻すことができる仮想マシン命令のみを投機的に処理し、容易に元に戻すことができない仮想マシン命令に出会った場合は仮想マシン命令の投機的シーケンスの処理を前記条件制御変数の値が入力されるまで保留するように更に構成されていることを特徴とする装置。

# 【請求項16】

請求項15に記載の装置において、前記プリプロセッサは、投機的処理が保留されている間において、且つ、前記条件制御変数の値が入力されるまで、一連の"ノーオペレーション"命令をディスパッチするように更に構成されていることを特徴とする装置。

# 【請求項17】

請求項15に記載の装置において、前記プリプロセッサは、スタック操作を表すような仮想マシン命令のみを投機的に処理し、スタック操作でない仮想マシン命令に出会った場合は仮想マシン命令の投機的シーケンスの処理を前記条件制御変数の値が入力されるまで保留するように更に構成されていることを特徴とする装置。

# 【請求項18】

請求項17に記載の装置において、前記プリプロセッサは、投機的処理が保留されている間において、且つ、前記条件制御変数の値が入力されるまで、一連の"ノーオペレーション"命令をディスパッチするように更に構成されていることを特徴とする装置。

# 【発明の詳細な説明】

# 【技術分野】

[0001]

20

10

30

50

30

50

本発明は、広くはコンピュータプログラミング言語に係り、更に詳細には仮想マシン言語の翻訳及び実行に関する。

#### 【背景技術】

# [0002]

コンピュータプログラミング言語は、コンピュータが実行する命令を表すような人が読むことが可能なソースコードからなるアプリケーションを作成するために使用される。しかしながら、コンピュータが理解することができる前に、上記ソースコードはコンピュータが読み取り可能な二進マシンコードに翻訳されねばならない。

#### [0003]

C、C++又はコボルのようなプログラミング言語は、典型的には、上記ソースコードからアセンブリ言語を発生し、次いで該アセンブリ言語をマシンコードに変換されるマシン言語に変換するためにコンパイラを使用している。このように、ソースコードの最終的翻訳は実行時の前に行われる。異なるコンピュータは異なるマシン言語を必要とするので、例えばC++で書かれたプログラムは、該プログラムが書かれた特定のハードウェアプラットフォーム上のみで実行することができる。

#### [0004]

### [0005]

国際特許出願公開第W09918484号に開示されているように、メモリとCPUとの間にプリプロセッサ(仮想マシンインタープリタ(VMI))を付加することにより、仮想マシン 命令の処理が改善される。本質的に、仮想マシンは物理的構造ではなく、むしろ、VM内又はCPU内に記憶された対応するネイティブマシン言語命令を選択することにより、内内に記憶された対応するネイティブマシン言語の令を選択することにより、内内に記憶された対応するネイティブラットフォームのCPUに供給を実行である。の場合、上記ネイティブ命令は当該ハードウェアプラットフォームのCPUに供給を実行される。中型的な仮想マシンは、FDD系列の処理を設づれていて、バイトコード当たり20ないし60サイクルの処理時間を必要とする(当時のででで、バイトコードの質及のに、VMIは該取り込まれたバイトコードの複数のプロパティは、当該のストコードの質及でである)。VMIによりアクセスされたプロパティは、当該のアップする(デコードする)。VMIによりアクセスされたプロパティは、当該のアップする(デコードする)。VMIによりアクセスされたプロパティは、当該のアップするである。VMIは単純なバイトコードを取り込み、該バイトコードをCPU命令に処理する。VMIは単純なバイトコードを1ないし4サイクルで処理することができる。

#### [0006]

一連のバイトコードを解釈している間に、仮想マシンは、条件付き分岐命令(以下、CBIと呼ぶ)を表すバイトコードに出会う可能性がある。CBIに出会うと、VMIは、CPUに当該条件が満たされているかを判定させる一連のネイティブ命令を発生する。従っ

30

40

50

て、当該分岐を実行するとの決定は以前の計算に依存し、斯かる計算はVMIの概念では CPUレジスタに残存している結果によりCPUで実行されたものである。例えば、ジャ バ (登録商標)のバイトコード"ifeg n"はバイトコードカウンタを"n "だけオフセットす る が 、 こ れ は 当 該 ス タ ッ ク の 最 上 部 が 零 で あ る ( 即 ち 、 前 の 計 算 が 該 ス タ ッ ク に 値 零 を 残 した)場合のみである。分岐条件(ここでは、スタックの最上部)の値は取り出され、V MIの制御レジスタ(分岐条件のために特別に確保される)に書き込まれなければならな い。条件が満たされている場合は、該CBIはVMIバイトカウンタに対する更新を生じ させ(ジャンプ)、該カウンタが実行されるべきバイトコードのシーケンスを変更させる 。典型的には、1つの命令がVMIで処理されつつある場合、処理されるべき次の命令は 既にVMIパイプライン内にあるので、或る命令が分岐となる場合、VMIパイプライン 内に既にあるバイトコードは流されねばならない。更に、プロセッサハードウェアの"パ イプライン化 " 構造は、命令及び / 又はデータがプロセッサにディスパッチされる時点と プ ロ セ ッ サ が 実 効 的 に 斯 か る 命 令 を 実 行 し 及 び / 又 は 斯 か る デ ー タ を 処 理 す る 時 点 と の 間で斯かる命令及びデータを移送する固有の遅延を生じる。詳細には、典型的なCPUは 多段(典型的には、3ないし8段)のパイプラインを有しているので、書込命令は該命令 が送出された直後には実行されないであろう。CBIの場合、CPUが条件が満たされる かを判定し、この判定の結果をVMIに転送する間に付加的な遅延を生じる。分岐条件の 値(制御値)が当該分岐条件が満たされていることを示す場合、幾つかの(CPUパイプ ラインの大きさに依存する)命令が既にCPUパイプラインに入っているであろう。CP U及び命令キャッシュをビジーに維持するために、当該条件が満たされるかを示す制御値 を 待 つ 間 に 、 一 連 の " ノ ー オ ペ レ ー シ ョ ン " ( N O P ) コ マ ン ド を 発 生 さ せ る こ と が で き る 。制御値は、CPUが最後より1つ前のNOPを実行し、VMIが最後のNOPを発生す る間に入力される。上記判定を行った後、VMIパイプラインは、VMIが次の命令を表 すバイトコードをVMIキャッシュから取り出すのに数サイクルを要する。

# [ 0 0 0 7 ]

他の方法は、命令が結果として他のロケーションへの分岐となるかを予測することにより、可能性のある分岐命令を投機的に実行する。この方法の一例はRISC(縮小命令をおり、計算)マイクロプロセッサに関するもので、どの条件付き分岐が予測するのが "容易"であるかを判断するために分岐命令ビットを設け、これらの分岐に対してはジャンプを実にする。かを判断するためにソフトウェア分岐予測を使用する。ソフトウェア分岐予測は、ソフトウェア分岐予測である。分岐が予測するのが "困難"であると判断されたら、該分岐はハードウェア分岐予測(分岐予測アレイのようなが、1を再いて予測される。この方法は、オフセットが零より小さい(後方分岐)なら分岐がとられないと予測するような、オフセットが零より大きければ(前方分岐)分岐がとられないと予測するような、前記予測の容易該分岐がとられるかを判断する場合に重要であるか否かに基づくような、前記予測の容易さの判断を行い且つ更新するためにプロセッサの資源を消費する点にある。

## [0008]

他の分岐予測方法においては、可能性のある分岐命令のアドレスからのビットが、ローカル分岐履歴テーブル及び全体履歴レジスタから連結されたビットと比較される。該比較の結果は分岐予測テーブルを読み取るために使用される。この方法の問題点は、上記連結及び比較処理を実行し、上記分岐予測テーブルを記憶及びアクセスするために要する資源の消費である。更に、該方法は予測誤りを補正する手段を開示していない。同様の方法論が米国特許第5,136,696号に開示されており、該方法において分岐予測は分岐キャッシュにより可能性のある分岐命令のアドレスに基づいて実行される。該開示によれば、予測が誤っている場合、対応する命令は無効化されるが、いずれにせよ実行されるので、分岐キャッシュは同一の命令に再び出会う場合に正しい予測により更新することができる。CPUパイプラインは、上記分岐キャッシュ更新と同一のサイクルの間において、当該パイプラインの最初の7段の命令の全てを無効化し、プログラムカウンタレジスタの内容をロードすることにより流される。

#### 【発明の開示】

【発明が解決しようとする課題】

#### [0009]

条件付き分岐は頻繁に発生し(全仮想マシン命令のうちの約10%)、高い精度は達成するがプロセッサ資源を消費するような既存の方法により処理される場合に処理が大変であるので、条件付き分岐命令バイトコードにより意図される命令を正確且つ効率的に実行し、それでいて処理速度を向上させるような、プログラミング言語を解釈するシステムへの要求が存在する。

# 【課題を解決するための手段】

#### [0010]

本発明は、仮想マシンハードウェアアクセラレータ(VMIのような)を、条件付きバイトコード(CBI)に出会った場合に該VMIが分岐予測を実行すると共に投機的実行処理を開始すべきかを決定するように構成することにより、上述した要求を満たす。決定された場合、投機的に実行されたバイトコードが容易に元に戻し得る(reversible)限り、又は予測が確認されるまで、継続する。殆どの場合予測は正しく、これにより、予測が確認された後VMI及びCPUが投機的に選択されたバイトコードのシーケンスに沿って動作し続けるのを可能にする。予測が正しくない場合(従って無効化されたり、VMI及びCPUで実行された投機的処理は流され、VMIは当該分岐の直前の状態に戻される。効率性は、仮想マシンハードウェア加速技術の性能利得と分岐で引きる限りにおいてのある投機的に実行することにより実現される。正確さは、如何なる予測誤りも補正することにより達成される。従って、平均すると、条件付き分岐(CBI)は比較的少ない遅延しか生じない。

## [0011]

本発明は、より複雑な分岐予測方法論(オブジェクト指向技術及びシステムに関する第5回USENIX会議(1999)の原稿集、第217~228頁の"ジャバにおける仮想方法呼出をサポートするための分岐予測器のチューニング"で推奨されているハッシング方法及び経路履歴方法論のような)及び出会った各潜在的分岐命令のタイプに基づいて簡単な(しかし確かな)予測を行う方法に匹敵する。

#### [ 0 0 1 2 ]

簡単に述べると、本発明は条件付き分岐仮想マシン命令を処理するシステム及び方法を含むもので、斯かる命令は本発明の実施例においてはジャバ(登録商標)プログラミングラミングレベルにおいては、ジャバ(登録商標)ソースコードは、バイトコードと呼ばれる中間言語にコンパイルされる。バイトコードは、プロセッサにより実行することができるように仮想マシンによって解釈することができるように仮想マシンによって解釈することができるような仮想マシン命令からなる。本発明の実施例によれば、ランタイム時において、仮想マシンの実施例では、VMI)は初期化される。各バイトコードの特定のプロパティの識別を可能にするパラメータが初期化される。例えば、バイトコードは単純又は複雑なものとして特徴付けることができ、更に条件付き又は再帰的として特徴付けることができる。条件付きバイトコードは、実行されるべきバイトコードのシーケンスを、分岐条件が満たされる場合にのみ、変更する仮想マシン命令である。

#### [ 0 0 1 3 ]

VMIは、一連のバイトコードの各々を1以上のネイティブ命令に処理するよう進行する。VMIは、各バイトコードが命令メモリから取り出される毎にインクリメントされるバイトコードカウンタを維持する。CBIに出会うと、VMIはCPUに分岐条件制御値を取り出すことにより分岐条件が満たされているかを判断させるようなネイティブ命令のシーケンスを発生する。本発明の実施例のシステム及び方法によれば、制御値の取り出しが完了するまで処理を一次中止するというよりは、VMIは分岐予測を実行し、投機的実行を実行すべきか、即ち分岐条件が満たされるであろうかについて仮定を行うべきか、を決定する。仮定が行われた場合、該仮定が確認若しくは無効化されるまで、又は容易に元に

10

20

30

30

40

50

戻すのができないバイトコードに出会うまで、バイトコード系列は投機的に実行される。

[0014]

本発明の最初の3つの実施例においては、上記判断はCBIにより指定された分岐のタイプに基づくものである。第1の実施例によれば、VMIはCBIが後方分岐を指定しているなら分岐条件は真であると仮定し、該分岐により目標とされる次のバイトコードにジャンプするようバイトカウンタを更新する。当該CBIが前方分岐を指定する場合、VMIは分岐条件が満たされないであろうと仮定し、該分岐を実行しない。代替実施例は、CBIが後方分岐を求める場合、当該分岐条件は満たされると仮定するが、該CBIが前方分岐を求める場合は仮定を行わない。他の代替実施例においては、VMIは分岐条件が常に満たされると仮定し、投機的分岐に沿うバイトコードが容易に元に戻せるものである限り、及び当該仮定が確認又は無効化されるまで、該投機的分岐に沿ってバイトコードを処理する。

[0015]

更に他の実施例においては、分岐を投機的に実行すべきかを判断するのに既知の分岐予測方法を使用するが、VMIは容易に元に戻すことが可能なバイトコードを、当該仮定が確認又は無効化されるまでしか、投機的に処理しない。この方法論は、VMIを用いた実施化に関して後に詳細に説明されるが、より多くの分岐予測又は投機的実行方法を用いて実施化することができる。

[0016]

本 発 明 の 実 施 例 に よ れ ば 、 仮 定 が な さ れ た 場 合 、 V M I は 投 機 的 に 実 行 さ れ る 分 岐 に 沿 う か 又 は バ イ ト コ ー ド の 元 の シ ー ケ ン ス に 沿 う か の 何 れ か の 順 次 の バ イ ト コ ー ド の 翻 訳 で あ るネイティブ命令を、これらのネイティブ命令が、例えばスタック操作に関わる命令(ス タックプッシュのような)のような、容易に元に戻すことができるものである限り、 CP Uに対してディスパッチし続ける。容易に元に戻すことができないような命令に出会うと 、制御値が入力されるまでCPUをビジーに維持するために、VMIにより一連の"ノー オペレーション"(NOP)コマンドが発生され、ディスパッチされる。続いて入力され た制御値が仮定は正しいことを示すなら、VMIはVMIパイプラインに存在するバイト コードを処理し続け、CPUはCPUパイプライン内のネイティブ命令を処理し続ける。 続いて入力された制御値が当該仮定は正しくない(即ち、予測誤りがあった)ことを示し ている場合は、CPUは当該分岐の直前の状態に戻され、これにより、当該投機的に実行 された容易に元に戻すことが可能な(逆転可能な)バイトコードを元に戻す。この様に、 正しくない仮定による予測誤りの逆転は、VMI及びCPUの両者を当該分岐の直前の各 状態に戻すことを必要とし、投機的に実行されたバイトコードの特徴により容易に達成さ れる。 例えば、 本 発 明 の 一 実 施 例 に お い て は、 " 容 易 に 元 に 戻 す こ と が 可 能 な バ イ ト コ ー ド "とは、スタック操作のみを実行するか又はVMI外の如何なる状態も変更しないよう なバイトコードと定義され、従って斯様なバイトコードのシーケンスの実行は、VMIに お け る バ イ ト コ ー ド カ ウ ン タ 及 び レ ジ ス タ ス タ ッ ク ポ イ ン タ を リ セ ッ ト す る こ と に よ り 逆 転 す る こ と が で き る 。 本 発 明 に よ れ ば " 容 易 に 元 に 戻 す こ と が 可 能 な " の 他 の 定 義 を 実 施 す ることもでき、これらの定義の幾つかは、投機的に実行されたバイトコードを元に戻すた めにVMI及びCPUのパイプラインが流されることを必要とし得る。

[ 0 0 1 7 ]

本発明の他の態様は、ジャバ(登録商標)のような解釈言語からの仮想マシン命令を実行するシステムである。該システムは、プロセッサ(CPU)及びプリプロセッサ(VMI)、命令メモリ、並びにトランスレータ(JVM)を含む。上記プロセッサは、ハードウェアに固有の命令(以下、ネイティブ命令と呼ぶ)を含み且つ斯かる命令を実行するように構成される。上記プリプロセッサは、上記命令メモリからバイトコードを取り込むと共に該バイトコードをネイティブCPU命令に翻訳するように構成された仮想マシン(例えば、VMI)である。該VMIは制御レジスタ、バイトコードカウンタBCC、仮定変数レジスタ及び投機的モードスイッチ履歴を含む。本発明の実施例においては、上記VMIは、各バイトコードにより呼ばれるネイティブ命令を処理のためにCPUにディスパッチ

30

40

50

[0018]

本発明の方法を種々のタイプの条件付き分岐命令を処理するように実施化することは可能であるが、本発明の実施例は、ジャバ(登録商標)の条件付き分岐バイトコードの処理に向けられている。

[0019]

本発明は、ジャバ(登録商標)バイトコードをサンマイクロシステムズにより作成された JVMのような仮想マシンを用いて実行するようなシステムにおいて実施化することがで きる。しかしながら、本発明は、マイクロソフト仮想マシンのような他のジャバ(登録商 標)仮想マシンを使用しても実施化することができ、ビジュアルベーシック、 d B A S E 、ベーシック及び.N E T 等の他の解釈言語を実行するシステムにも適用可能である。

[0020]

本発明の更なる目的、利点及び新規な特徴は、下記の記載に一部述べられ、当業者にとっては下記の説明を調べることにより一部明らかとなり、又は本発明の実施により知ることができるであろう。

[0021]

明細書に組み込まれると共にその一部を形成する添付図面は、下記の説明を参照して見ることにより本発明を解説するものである。

【発明を実施するための最良の形態】

[ 0 0 2 2 ]

ここでは、必要に応じて、本発明の実施例が開示されるが、開示された斯かる実施例は種々の且つ代わりの形態で実施化することができるような本発明の単なる例示に過ぎないことに注意すべきである。また、各図は必ずしも寸法通りではなく、特定の構成要素の細部を示すために幾つかの特徴は誇張され又は極小化されている。従って、ここに開示された特定の構造的及び機能的詳細は、制限するものとしてではなく、単なる請求項の基礎として及び当業者に本発明を多様に使用することを教示するための代表的基礎として解釈されるべきものである。

[0023]

添付図面(これら図面において、同様の符号は同様の構成要素を示す)に示された本発明の実施例を詳細に参照すると、図1は本発明の環境の実施例のブロック図である。該環境の基本的構成要素はハードウェアプラットフォーム100であり、該プラットフォームはプロセッサ110、プリプロセッサ120及び命令メモリ150を含み、これらは全てシステムバス160に接続されている。プリプロセッサ120は制御レジスタ130とトランスレータ140とを含んでいる。ハードウェアプラットフォーム100は、典型的には、中央処理装置(CPU)、基本周辺機器及びオペレーティングシステム(OS)を含んでいる。本発明のプロセッサ110は、MIPS、ARM、インテル×86、パワーPC又はSPARC型マイクロプロセッサであり、ハードウェア固有の命令(以下、ネイティブ命令と称す)を含むと共に、斯かる命令を実行するように構成されている。本発明の実施例

30

40

50

において、トランスレータ140は例えばサンマイクロシステムズによるKVM等のジャバ(登録商標)仮想マシン(JVM)である。命令メモリ150は例えばジャバ(登録商標)バイトコードのような仮想マシン命令を含んでいる。当該実施例におけるプリプロセッサ120は国際特許出願公開第W09918486号に開示された仮想マシンインタープリタ(VMI)であり、仮想マシン命令(例えば、バイトコード170)を命令メモリ150から取り込むと共に、該仮想マシン命令をネイティブCPU命令のシーケンスに変換するよう構成されている。VMI120は、バス160上の周辺機器であって、メモリマップ型周辺機器として動作することができ、そこでは、所定の範囲のCPUアドレスがVMI120に割り当てられる。VMI120は、命令メモリ150における現在の(又は次の)仮想マシン命令を示す独立の仮想マシン命令ポインタ180を管理する。また、該VMIは投機的モードスイッチ履歴及び仮定変数(図示略)も管理する。

[ 0 0 2 4 ]

ここで図2を参照すると、本発明の実施例によれば、プロセッサ110はマシン命令の実行が連続したクロックサイクルの間において並列且つ密集行進的に行われるように多段パイプライン200を含んでいる。言い換えると、第1命令 I 1 が当該パイプラインの段2に入る時、後続の命令 I 2 は段1に入り、等々となる。理想的には、各命令は連続するサイクルにおいて当該パイプラインに入り続け、これにより、8つの命令の同時的処理を可能にし、ここで、1つの命令はクロックサイクル毎に完全に実行される。しかしながら、典型的には、平均的命令の実行は実際には2クロックサイクル以上を必要とする。

[0025]

本発明の動作の一例として、VMI120は第1系列310のバイトコードの各々を1以 上のネイティブ命令に翻訳して進む。ここで図3を参照すると、バイトコードB0ないし B 2 は非条件付きであるので、V M I 1 2 0 は命令メモリ 1 5 0 から B 0 ないし B 2 を単 に取り込み、各バイト170に対して定義されたネイティブ命令又は複数の命令を選択し 、斯かる命令(又は複数の命令)を実行のためにプロセッサ110に供給する。Bnは条 件付き分岐命令(CBI330)であるので、分岐条件が満たされるならBnは当該VM Iを第1系列310から系列320におけるバイトコードBrへジャンプさせる。分岐条 件が評価されている(即ち、VMI20がCPU110から返送されるべき制御値を待つ )間に、分岐予測方法に従い当該分岐条件が満たされるかについて予測がなされ、VMI 1 2 0 は該予測を検証することができるまで命令を投機的に実行すべきかを決定する。分 岐 予 測 方 法 は 、 分 岐 条 件 が 満 た さ れ る か に つ い て の 予 測 を 与 え る よ う な 多 様 な 複 雑 さ の 発 見的処理及び、多分、予測の精度の統計的評価である。本発明の一実施例によれば、VM I 1 2 0 は、 C B I 3 3 0 ( B n ) が後方分岐 ( 即ち、バイトコードカウンタ B C C に対 して負のオフセット)を求める場合は分岐条件が満たされると仮定するような分岐予測方 法を実施し、VMI120はバイトコードBrへのジャンプを実行する。VMI120は 、同時的に、CPU110に当該分岐条件が満たされているかを示す制御値を取り出させ る よ う な ネ イ テ ィ ブ 命 令 の シ ー ケ ン ス を デ ィ ス パ ッ チ す る 。 他 の 実 施 例 の 分 岐 予 測 方 法 に よれば、CBI330(Bn)が前方分岐(即ち、BCCに対して正のオフセット)を求 める場合、VMI120は当該分岐条件が満たされないと仮定し、ジャンプを実行しない 。更に他の実施例の分岐予測方法によれば、CBI330が分岐を求める場合、VMI1 20は当該分岐条件が満たされると仮定し、ジャンプを実行する。

[0026]

本発明の一実施例によれば、当該分岐予測方法が結果としてバイトコードのシーケンス320を投機的に実行することになる場合、不正確な予測の影響は、容易に元に戻す(逆転する)ことが可能なバイトコード170のみを投機的に実行することにより最小化される。逆転の容易さは、バイトコード170がデコードされる(即ち、該コードのプロパティがアクセスされる)際にVMI120により判断される。CPU110は、ディスパッチされる各命令を投機的に実行する。例えば、多くの場合、分岐にはスタックプッシュ処理(即ち、定数又は変数がスタックにプッシュされる)が後続し、該処理はスタックポインタ値(VMI120内に保持される)を当該分岐前の状態に再設定することにより容易に

30

40

50

逆転させることができる。斯様なネイティブ命令(通常、"スタックプッシュ"と呼ばれる)は、制御値が入力されるまで、投機的に実行することができる。何故なら、該投機的実行の逆転は単にレジスタを再設定することにより達成され、従って、予測誤りの悪い影響は無視することができるからである。

# [0027]

このように、VMI120が分岐条件は満足されると仮定する場合、バイトコードBrないしBzの処理(投機的分岐)が、VMI120が該投機的分岐に沿って容易に逆転することができないネイティブ命令のシーケンスを表すようなバイトコードに出会うまで、引き続いて第2のシーケンス320において継続する。該投機的分岐に沿うバイトコード170が容易に逆転することができないものである場合、投機的実行は一時中止される。次いで、VMI120が当該分岐条件は満たされなかったことを示すような制御値を入力すると、VMI120は当該ジャンプを逆転するためにBCC及びレジスタスタックポインタを再設定する(もし必要なら、CPU110に対してCPUパイプライン200を浄化するネイティブ命令を送出する)。VMI120が分岐条件は満たされないと仮定する場合は、BCCはインクリメントされ、分岐が投機的に処理されることはない。非分岐バイトコードを投機的に処理している間に、VMI120は入力された制御値が制御レジスタ130に書き込まれたかを継続的にチェックする。

#### [0028]

図 4 のブロック 4 1 0 に示すように、VMI120 は、ブロック 4 2 0 において命令メモ リ 1 5 0 から各バイトコード 1 7 0 を取り込む前に、仮想マシンカウンタBCCをインク リメントする。ブロック430において、VMI120は各バイトコード170を当該バ イトコード 1 7 0 に関するプロパティにアクセスすることによりデコードする。シーケン スの最初のバイトコード170がデコードされた時に、投機モードスイッチSMSはオフ であるから、VMI120は(ブロック435において)当該バイトコード170に対応 するネイティブ命令のシーケンスをディスパッチする。ブロック445において、当該バ イトコード170がСВІ330でないと判断された場合は、当該方法はブロック410 に戻り、ここで仮想マシンカウンタ(BCC)180がインクリメントされ、取り込み処 理に戻る(ブロック420)。しかしながら、ブロック445において当該バイトコード 170が条件付きであると判断されたなら、ブロック435でディスパッチされたネイテ ィブ命令はブロック 4 5 0 内で制御値取込処理を表すようになる。該制御値取込処理を構 成するネイティブ命令は、CPU110に、CBI330により求められた分岐が実行さ れるべきであるか(即ち、現在実行されているバイトコードのシーケンス外にある目標バ イトコード 1 7 0 にジャンプすべきか)を示すような制御値を送出させ、且つ、該制御値 を制御レジスタ130に書き込ませる。上記制御値取込処理と同時的に、VMI120は 当該分岐条件が満たされるか又は満たされないかの仮定をなすべきかを決定する(ブロッ ク470)。該決定は、使用されている特定の分岐予測又は投機実行方法に基づくもので ある。

## [0029]

VMI120が当該分岐条件の満足に関する仮定を行うと決定すると、投機モードスイッチ(SMS)がオンされ、仮定された制御値(AVC)がVMIレジスタに記憶される(仮定変数195)。ブロック475において、当該分岐が投機的にとられた場合、BCCが更新される(CBI330により求められたジャンプを反映するために)。分岐がクリメントされるかに関係なく、当該方法はブロック410に進み、ここでBCCはインクリメントされる。投機的に決定されたバイトコードのシーケンスに沿う次のバイトコード170は、該バイトコードが逆転可能(例えば、該次のバイトコード170に対応するのよっである。逆転の容易性のバイティブ命令が、単純なスタック操作を構成する)ならば、処理される。逆転の容易性がイティブ命令が、単純なスタック操作を構成する)ならば、処理される。逆転の容易性がイティブは該バイトコード170のプロパティに基づくものである。容易に逆転可能なバイトコードは、典型的には、CBI330の翻訳の直後のスタック最上部より上のスタック位置上で生じる処理であって、当該システム(特に、VMI120の外側)の状態を変更するものではないような処理を表す。バイトコード170はブロック420において取り

30

40

50

込まれ、ブロック430においてデコードされる。SMSはオンである。何故なら、VMI120は仮定を行うように決定したからである(当該シーケンスは投機的に実行されている)。従って、制御値が未だ返送されておらず(ブロック485)、且つ、デコードされたプロパティが取り込まれたバイトコード170は容易に逆転可能であることを示している場合は、該取り込まれたバイトコードに対応するネイティブ命令がブロック435においてディスパッチされる。次いで、取り込まれるバイトコード170が他のCBI330でない限り(ブロック445)、BCCがインクリメントされ(ブロック410)、投機的シーケンスに沿う次のバイトコードが取り込まれ、デコードされる(ブロック420及び430)。このように、投機的シーケンスの処理は、次の各バイトコード170が容易に逆転可能なものである限り、且つ、分岐条件が入力されていない限り、ブロック410、420、430、432、485、486、460及び435を経てループする。

[ 0 0 3 0 ]

ブ ロ ッ ク 4 6 0 に お い て 、 投 機 的 シ ー ケ ン ス の 処 理 の 間 に お い て 容 易 に 逆 転 可 能 で な い バ イトコード 1 7 0 に出会うと、ブロック 4 6 1 において S M S をオフに切り換えることに より投機が中止され、VMI120はプロック485において制御値の入力を待たされる 。入力された制御値RCVはVMI120の制御レジスタ130に記憶される。ブロック 487において、当該分岐条件が評価される。ブロック494においてRCVが当該分岐 条件は満たされたことを示し、且つ、SMS履歴が現シーケンスは投機的に処理されてい たことを示す(SMS履歴190が、当該SMSが現シーケンスの間における何処かでオ ンであったことを示す)場合、仮定変数195として記憶された仮定制御値ACVが、制 御レジスタ130に記憶された入力制御値RCVと比較され、VMI120によりなされ た仮定が正しかったか(即ち、上記投機的シーケンスが処理されるべきであったか)を判 断する。仮定が正しかった場合(即ち、ACV=RCV)、現分岐シーケンスの投機的実 行は確認されたことになる。言い換えると、VMI120は、当該分岐がなされるべきと 正しく仮定した。そして、BCCがブロック410においてインクリメントされ、取り込 みに戻る。仮定が正しくなかった場合は、VMI120は当該分岐を処理し損ない、VM I 1 2 0 及び C P U 1 1 0 は、投機的に処理された非分岐シーケンスのバイトコードを逆 転するために浄化される。そして、当該方法はブロック495においてジャンプを反映す るためにBCCを更新し、次いでブロック410に戻ってBCCをインクリメントし、当 該分岐シーケンスに沿う次のバイトコードを処理する。

[0031]

プロック494において、上記RCVが当該分岐条件は満足されなかったことを示し、且つ、上記SMS履歴190が現シーケンスは投機的に処理されていたことを示す場合、仮定制御値ACVは入力制御値RCVと比較され、VMI120によりなされた仮定が正しかったかを判断する。仮定が正しかった場合は、現非分岐シーケンスの投機的実行は確認されたことになる。言い換えると、VMI120は分岐がされるべきでないことを正しく仮定した。そして、BCCがブロック410においてインクリメントされ、取り込みに戻る。上記仮定が正しくなかった場合は、当該分岐はなされるべきでなかったことになり、投機的に処理された分岐に沿う全てのバイトコードは、ブロック495においてBCC及びスタックレジスタポインタを再設定することにより逆転される。もし必要なら、VMI120及びCPU110のパイプラインがブロック495において浄化される。

[0032]

SMS履歴190は制御値が入力される際に常にリセットされる。何故なら、分岐条件が解明され、かくして如何なる投機的処理も確認又は除去するからである。

[0033]

ブロック 4 7 0 において、 V M I 1 2 0 が分岐条件の満足に関して仮定を行わないと決定する場合、 V M I 1 2 0 は、ブロック 4 8 5 において制御値の入力をチェックすることにより、実際の制御値が入力されるまで待つ。 S M S はオフのままなので、ブロック 4 8 6 はブロック 4 8 5 に戻り、制御値が入力されるまでチェックを継続する。制御値が入力されると、当該方法はブロック 4 8 7 に進み、そこにおいて、当該分岐条件が評価される。

30

40

50

該制御値が分岐条件は満たされたことを示す場合、当該バイトコードシーケンスの実行の間において何の投機も生じていないので、当該方法はブロック495に進み、そこでは、CBI330により求められたジャンプを反映するためにBCCが更新され、次いでブロック410においてバイトコードの取り込みに戻る。上記制御値が分岐条件は満たされなかったことを示す場合、当該方法はブロック410に戻り、バイトコードの取り込みに復帰する。このようにして、VMI120が仮定を行わないと決定すると、VMI120はCBI330を通常のように処理する(分岐条件が満たされる場合にのみ、分岐を行う)

## [0034]

上述したように、分岐条件の満足に関して仮定を行うべきかの判断は、下記に示すように、実施される分岐予測方法に基づくものとなる。

#### 【表1】

| 分岐予測方法 |           |       |  |  |  |  |
|--------|-----------|-------|--|--|--|--|
|        | 後方分岐      | 前方分岐  |  |  |  |  |
| 第1実施例  | 仮定する      | 仮定しない |  |  |  |  |
| 第2実施例  | 仮定する      | 仮定無し  |  |  |  |  |
| 第3実施例  | 仮定する      | 仮定する  |  |  |  |  |
| 第4実施例  | 予測方法に依存する |       |  |  |  |  |

# [ 0 0 3 5 ]

本発明の第1実施例において、VMI120は、後方分岐はなされ、前方分岐はなされないと仮定するような投機的実行方法を使用する。第2の代替実施例において、VMI120は、後方分岐のみを投機的に実行し、前方分岐に関しては仮定を行わない。第3の代替実施例において、VMI120は、全ての分岐がなされると仮定するような一層単純な投機的実行方法を使用する。更に、第4の代替実施例によれば、VMI120は、分岐予測方法を使用して、分岐がなされるべきかを決定する。上述した実施例の何れによっても、投機的実行は容易に逆転が可能なバイトコードに対してのみ進行する。

# [0036]

本発明の第1実施例によれば、VMI120はCBI330により示される分岐条件の結果に関する仮定を常に行うが、投機はCBI330により求められる分岐のタイプに基づかせる。CBI330が前方分岐を求める(BCCオフセット>0)場合、VMI120 は分岐条件が満足されないと仮定し、容易に反転可能である限り、非分岐バイトコードシーケンスの処理を投機的に継続する。CBI330が後方分岐を求める(BCCオフセット<0)場合、VMI120は分岐条件が満足されると仮定し、容易に逆転可能である限りにおいて、分岐バイトコードシーケンスを投機的に処理する。

# [ 0 0 3 7 ]

本発明の第2実施例によれば、VMI120は、CBI330が後方分岐を求める場合にのみ、CBI330により示される分岐条件の結果に関する仮定を行う。CBI330が前方分岐を求める場合、VMI120は分岐条件を通常のように処理する。即ち、VMI120は制御値の入力を待ち、それに従ってバイトコードの適切なシーケンスを処理する

# [0038]

本発明の第3実施例においては、CBIに出会った場合に常に分岐がなされるように投機

30

40

する。RISCコードを処理する場合、この投機的実行方法は時間の約70%となる。何故なら、分岐は通常はループの最下部で生じ、ループは典型的には繰り返して実行されるからである。該分岐予測は、VMIの全体としてのRISCコード処理性能を約35%はイトコード処理速度を7~20%上昇させるであろう。分岐予測及び投機的処理を使用して、分岐のオーバーへッドは、ネイティブに実行するCPUと比較して10~20サイクルがら約2~4サイクルに減少させることができる。第3実施例の態様によれば、VMI120が分岐条件は満足されたと仮定する場合、VMI120は分岐オフセットを反いまためにバイトコードカウンタBCCCを更新し、該オフセットアドレスからの取り込みを開始し、該VMIのパイプラインを回復する。しかしながら、本発明のこの実施例に要する時間は約5サイクルに低減される。しかしながら、本発明のこの実施例といまが必要時間を全ての分岐に関して約3なるファクタにより低減する(14又は15サイクルから)と結論することはできない。何故なら、全ての分岐のうちの約10%はキャッシュミスに終わるからである。

[0039]

第4実施例においては、各CBI330を処理するために、何れかの既知の分岐予測方法がVMI120との組み合わせで使用される。

[0040]

本発明のシステム及び方法の利点の多くを述べたが、当業者であれば他の利点もあることを認識するであろう。例えば、最適なバス利用のために、CPU110はネイティブ命令をバースト(典型的には、少なくとも4サイクルからなる)で読み取る。従って、CPU110は、制御値をVMI120に戻す前に、全バーストを読み取らねばならない。VMI120は、制御値取出コマンドを含むバーストを充填するために幾つかのNOPを発生して、該VMI120が投機的分岐を処理する間にCPU110が該取出コマンドを処理することを保証しなければならない。本発明の利点は、VMI120が、CPUバーストを満たすためにプロセッサ時間をNOPにより占有しなければならないというよりは、各命令の効果を逆転することができる限りにおいて投機的シーケンス320から次の命令を投機的にディスパッチすることによりCPU110及びVMI120のパイプラインを意味のある命令で満たし続ける点にある。

[0041]

上記の点から、本発明が条件付き分岐仮想マシン命令を正確且つ効率的に処理するシステム及び方法を提供することが理解されるだろう。しかしながら、上記は本発明の実施例にのみ関するものであって、添付請求項に記載された本発明の趣旨及び範囲から逸脱すること無しに種々の変更をなすことができると理解されるべきである。

【図面の簡単な説明】

[0042]

【 図 1 】 図 1 は、 本 発 明 の 環 境 の 実 施 例 の 機 能 的 エ レ メ ン ト を 示 す ブ ロ ッ ク 図 で あ る 。

【図2】図2は、典型的なCPUパイプラインにおける命令の処理を示す概念図である。

【図3】図3は、一例としてのバイトコード処理シーケンスを示す。

【図4】図4は、本発明の一実施例による方法のフローチャートである。

# 【図2】

|   | CPU   |      |    |    |    |    |    |           |    |
|---|-------|------|----|----|----|----|----|-----------|----|
| 1 | ペイプライ | ン    |    |    |    |    |    |           |    |
|   | 200   |      |    |    |    |    |    |           |    |
|   | 段1    | ] I1 | 12 | 13 | 14 | 15 | 16 | <b>I7</b> | 18 |
|   | 段2    | 1    | I1 | 12 | 13 | 14 | 15 | 16        | 17 |
|   | 段3    | 1    |    | 11 | 12 | 13 | 14 | 15        | 16 |
|   | 段4    | 1    |    |    | 11 | 12 | 13 | 14        | 15 |
|   | 段5    |      |    |    |    | 11 | 12 | 13        | 14 |
|   | 段6    | 1    |    |    |    |    | 11 | 12        | 13 |
|   | 段7    | ]    |    |    |    |    |    | I1        | 12 |
|   | 段8    | İ    |    |    |    |    |    |           | I1 |
| i | :     |      |    |    |    |    |    |           |    |
|   |       |      |    |    |    |    |    |           |    |

## 【国際公開パンフレット】

#### (12) INTERNATIONAL APPLICATION PUBLISHED UNDER THE PATENT COOPERATION TREATY (PCT)

(19) World Intellectual Property Organization International Bureau



PCT



# (43) International Publication Date 10 April 2003 (10.04.2003)

# WO 03/029961 A1

(26) Publication Language:

(30) Priority Data: 01402545.6

2 October 2001 (02.10.2001) IP

(71) Applicant: KONINKLIJKE PHILIPS ELECTRONICS N.V. [NL/NL]; Groenewoudseweg 1, NL-5621 BA Eindhoven (NL).

(51) International Patent Classification<sup>7</sup>: G06F 9/38, 9/318
(81) Designated States (national): All, AG, Al, AM, AT, All, AZ, BA, BB, BG, BR, BY, BZ, CA, CIL CN, CO, CR, CU, CZ, DE, DK, DM, DZ, EC, EE, ES, TI, BB, GD, GE, GII, GM, IIR, IIU, DI, II, N, S, PF, KE, GK, BK, RZ, LC.
(22) International Filing Date:
9 September 2002 (09.09.2002)
WX, MZ, NO, NZ, OM, PH, PL, PT, RO, RU, SD, SE, SG, SL, SK, ST, TT, MT, NT, TR, TT, TZ, UA, UG, UZ, VC, VN, YU, ZA, ZM, ZW.

English

(84) Designated States (regional): ARIPO patent (GH, GM, KE, LS, MW, MZ, SD, SI, SZ, TZ, UG, ZM, ZW), Eurasian patent (AM, AZ, BY, KG, KZ, MD, RU, TJ, TM), European patent (AT, BE, BG, CH, CY, CZ, DE, DK, EE, SE, PI, PR, GB, GR, HE, TT, LU, MC, NL, PT, SE, SK, TR), OAPI patent (BF, BE, CF, GG, CI, CM, GA, GN, GQ, GW, ML, MR, NE, SN, TD, TG).

# (72) Inventor: LINDWER, Menno, M.; Prof. Holstlaan 6, Published: NL-5656 AA Hindhoven (NL).

with international search report

(74) Agent: GROENENDAAL, Antonius, W., M.; International Octrocibureau B.V., Prof. IIolsilaun 6, NL-5656

AA Eindhoven (NL).

For two-letter codes and other abbreviations: refer to the "Guidance Notes on Codes and Abbreviations" appearing at the beginning of each regular issue of the PCT Gazette.

(54) Title: SPECULATIVE EXECUTION FOR JAVA HARDWARE ACCELERATOR



(57) Abstract: Conditional branch bytecodes are processed by a Virtual Machine Interpreter (VMI) hardware accelerator that utilizes a branch prediction scheme to determine whether to speculatively process bytecodes while waiting for the CPU to return a condition control variable. In one branch prediction scheme, the VMI assumes the branch condition will be fulfilled if a conditional branch bytecode calls for a backward jump. In another branch prediction scheme the VMI makes an assumption only if a conditional branch bytecode calls for a forward jump. In another branch prediction scheme, the VMI makes an assumption only if a conditional branch bytecode calls for a bockward jump. In yet another speculative execution scheme, the VMI assumes that the branch condition will be fulfilled whenever it processes a conditional branch bytecode. The VMI only speculatively processes bytecodes that are easily reversible, (for example, bytecodes representing simple stack manipulations), and suspends speculative processing of bytecodes upon encountering a bytecode that is not easily reversible. The assumptions made by the VMI are confirmed or invalidated upon receipt of the condition control variable. If an assumption is invalidated, any speculatively processes bytecodes are reversed.

A

WO 03/029961 PCT/IB02/03646

Speculative execution for java hardware accelerator

#### FIELD OF THE INVENTION

The present invention relates generally to computer programming languages, and more particularly to the translation and execution of a virtual machine language.

#### 5 BACKGROUND OF THE INVENTION

10

15

Computer programming languages are used to create applications consisting of human-readable source code that represents instructions for a computer to perform. Before a computer can follow the instructions however, the source code must be translated into computer-readable binary machine code.

A programming language such as C, C++, or COBOL typically uses a compiler to generate assembly language from the source code, and then to translate the assembly language into machine language which is converted to machine code. Thus, the final translation of the source code occurs before runtime. Different computers require different machine languages, so a program written in C++ for example, can only run on the specific hardware platform for which the program was written.

Interpreted programming languages are designed to create applications with source code that will run on multiple hardware platforms. Java<sup>TM</sup> is an interpreted programming language that accomplishes platform independence by generating source code that is converted before runtime to an intermediate language known as "bytecode" or "virtual machine language." At runtime, the bytecode is translated into platform-appropriate machine code via interpreter software, as disclosed in U.S. Patent No. 4,443,865. To interpret each bytecode, interpreter software performs a "fetch, decode, and dispatch" (FDD) series of operations. For each bytecode instruction the interpreter software contains a corresponding execution program expressed in native central processing unit (CPU) instructions. The interpreter software causes the CPU to fetch or read a virtual machine instruction from memory, to decode the CPU address of the execution program for the bytecode instruction, and to dispatch by transferring control of the CPU to that execution program. The interpretation process can be time-consuming.

15

PCT/IB02/03646

As disclosed in PCT Patent Application No. WO9918484 adding a preprocessor (a virtual machine interpreter (VMI)) between a memory and a CPU improves the processing of virtual machine instructions. In essence, the virtual machine is not a physical structure, but rather is a self-contained operating environment that interprets bytecode for the hardware platform by selecting the corresponding native machine language instructions that are stored within the VM or in the CPU. The native instructions are then supplied to and consecutively executed in the CPU of the hardware platform. A typical virtual machine requires 20-60 cycles of processing time per bytecode (depending on the quality and complexity of the bytecode) to perform an FDD series of operations. First, a VMI reads (fetches) a bytecode from memory. Next, the VMI looks up a number of properties of (decodes) the fetched bytecode. The properties accessed by the VMI determine how the bytecode will be processed into native instructions for execution in the CPU. While the CPU is executing an instruction, the VMI fetches and processes the next bytecode into CPU instructions. The VMI can process simple bytecodes in 1-4 cycles.

While interpreting a sequence of bytecodes, a virtual machine may encounter a bytecode that represents a conditional branch instruction, hereinafter referred to as a CBI. When a CBI is encountered, the VMI generates a sequence of native instructions that causes the CPU to determine whether the condition is fulfilled. The decision to execute the branch therefore depends on earlier computations, which in the VMI concept were executed in the CPU with the results remaining in CPU registers. For example, the Java™ bytecode "ifeq n" 20 offsets the bytecode counter by "n", but only if the top of the stack is zero (i.e., the previous computation left the value 0 on the stack). The value of the branch condition (here, the top of the stack) must be retrieved and written to the control register of the VMI (which is reserved specifically for branch conditions). If the condition has been fulfilled, the CBI causes an update to the VMI bytecode counter (a jump) which alters the sequence of bytecodes to be executed. Typically, when one instruction is being processed in the VMI the next instructions to be processed are already in the VMI pipeline, so if an instruction results in a branch the bytecodes already in the VMI pipeline must be flushed. Additionally, the "pipelined" structure of processor hardware creates an inherent delay for transporting instructions and data between the instant that the instructions and/or data are dispatched to the processor and the instant when the processor effectively executes the instruction and/or processes the data. Specifically, because the typical CPU has a multistage (typically, 3 to 8 stages) pipeline the write operation will not be executed immediately after the instruction is issued. In the case of a CBI, additional delay occurs while the CPU determines whether the

10

PCT/IB02/03646

condition is fulfilled and transfers the result of this determination to the VMI. If the value of the branch condition (the control value) indicates that the branch condition is fulfilled, several (depending on the size of the CPU pipeline) instructions will already have entered the CPU pipeline. To keep the CPU and instruction cache busy, a series of "no operation" (NOP) commands can be generated while waiting for the control value that indicates whether

the condition is fulfilled. The control value is received while the CPU executes the next to the last NOP and the VMI generates the last NOP. After making the determination, the VMI's pipeline requires several cycles for the VMI to retrieve the bytecode representing the next instruction from the VMI's cache.

Other approaches speculatively execute potential branch instructions by predicting whether an instruction will result in a branch to another location. An example of this approach is directed to RISC (Reduced Instruction Set Computing) microprocessors, and provides a branch instruction bit to determine which conditional branches are "easy" to predict, and for those branches, uses software branch prediction to determine whether to execute the jump. Software branch prediction predicts branches using a software-controlled prediction bit. If the branch is determined to be "hard" to predict, the branch is predicted using hardware branch prediction (such as a branch prediction array). This approach discloses using a branch prediction scheme which predicts that a branch will be taken if the offset is less than zero (a backward branch) and that a branch will not be taken if the offset is greater than zero (a forward branch). A disadvantage of this approach is the consumption of processor resources for the making and updating the ease-of-prediction determination, which is based upon whether historical operation of the branch taken is important in determining whether the branch will be taken.

In another branch prediction approach, bits from the address of the potential branch instruction are compared to bits concatenated from a local branch history table and a global history register. The result of the comparison is used to read a branch prediction table. A disadvantage of this approach is the consumption of resources required to perform the concatenation and comparison operations and to store and access the branch prediction table. Furthermore, the approach does not disclose a means of correcting mispredictions. A similar methodology is disclosed in U.S. Patent No. 5,136,696, wherein a branch prediction is made by the branch cache based on the address of a potential branch instruction. According to that disclosure, where the prediction is wrong the corresponding instruction is invalidated but is executed anyway, so that the branch cache can be updated with the correct prediction in case the same instruction is encountered again. The CPU pipeline is flushed during the same

WO 03/029961 PCT/IB02/03646

cycle as the branch cache update by invalidating all of the instructions in the first seven stages of the pipeline and loading the contents of a program counter register.

Because conditional branches occur frequently (approximately 10% of all virtual machine instructions) and are process-intensive when processed according to existing approaches which achieve high accuracies but consume processor resources, there is a need for a system of interpreting programming languages that accurately and efficiently executes instructions intended by conditional branch instruction bytecodes while increasing the processing speed.

#### 10 SUMMARY OF THE INVENTION

25

The present invention fulfills the needs described above by configuring a virtual machine hardware accelerator (such as the VMI) such that when a conditional bytecode (CBI) is encountered the VMI performs branch prediction and elects whether to commence a speculative execution process. If elected, speculative execution continues as long as the speculatively executed bytecodes are easily reversible or until the prediction is confirmed. In most cases the prediction is correct, thereby enabling the VMI and CPU to continue operating along the sequence of bytecodes that was speculatively chosen after the prediction is confirmed. If the prediction is incorrect (and thus invalidated) the speculative processes executed in the VMI and the CPU are flushed and the VMI is returned to the state just before the branch. Efficiency is realized by combining the performance gains of virtual machine hardware acceleration technology with branch prediction schemes and potential speculative execution, and by speculatively executing instructions only as long as the effects can easily be reversed. Accuracy is achieved by correcting any misprediction. On average therefore, a conditional branch instruction (CBI) will introduce only a relatively small delay.

The present invention comports with more complex branch prediction methodologies (such as the hashing scheme and path history methodologies suggested in *Tuning Branch Predictors to Support Virtual Method Invocation in Java*, Proceedings of the Fifth USENIX Conference on Object-Oriented Technologies and Systems (1999), pp. 217-228), as well as with schemes that make simple (but probable) predictions based upon the type of each potential branch instruction encountered.

Briefly, the present invention includes systems and methods for processing conditional branch virtual machine instructions, which in the exemplary embodiment of the present invention are generated by the Java™ programming language. At the programming level, Java™ source code is compiled into an intermediate language called bytecode.

20

PCT/IB02/03646

Bytecode consists of virtual machine instructions that can be interpreted by a virtual machine for execution by a processor. According to the exemplary embodiment of the present invention, at runtime a virtual machine (in the exemplary embodiments, a VMI) is initialized. Parameters are initialized which enable the identification of certain properties of each bytecode. For example, bytecodes may be characterized as simple or complex, and can further characterized as conditional or recursive. A conditional bytecode is a virtual machine instruction that alters the sequence of bytecodes to be executed, but only if a branch condition is fulfilled.

The VMI proceeds to process each of a series of bytecodes into one or more native instructions. The VMI maintains a bytecode counter which is incremented after each bytecode is retrieved from an instruction memory. When a CBI is encountered, the VMI generates a sequence of native instructions that causes the CPU to determine whether the branch condition has been fulfilled, by retrieving the branch condition control value. According to the systems and methods of the exemplary embodiments of the present invention, rather than suspending processing until the control value retrieval is complete the VMI performs branch prediction and elects whether to perform speculative execution, i.e., whether to make an assumption as to whether the branch condition will be fulfilled. When an assumption is made, a bytecode sequence is speculatively executed until the assumption is confirmed or invalidated or until a bytecode that is not easily reversible is encountered.

In the first three embodiments of the present invention, the determination is based upon the type of branch that is designated by the CBI. According to the first embodiment, the VMI assumes that the branch condition is true if the CBI designates a backward branch, and updates the bytecode counter to jump to the next bytecode targeted by the branch. If the CBI designates a forward branch, the VMI assumes that the branch condition will not be fulfilled, and does not execute the branch. An alternative embodiment assumes that the branch condition is fulfilled if the CBI calls for a backward branch, but makes no assumption if the CBI calls for a forward branch. In another alternative embodiment, the VMI assumes that the branch condition is always fulfilled, and thus processes bytecodes along the speculative branch as long as the bytecodes along the speculative branch are easily reversible and until the assumption has been confirmed or invalidated.

In yet another embodiment a known branch prediction scheme is used to determine whether to speculatively execute a branch, but the VMI only speculatively processes bytecodes that are easily reversible, and then only until the assumption has been

PCT/IB02/03646

confirmed or invalidated. This methodology is described in detail below with respect to implementation with a VMI, but can be implemented with more branch prediction or speculative execution schemes.

According to the embodiments of the present invention, when an assumption 5 has been made the VMI continues to dispatch native instructions to the CPU which are translations of successive bytecodes either along the speculatively executed branch or along the original sequence of bytecodes as long as these native instructions are easily reversible, such as instructions that involve stack manipulations (such as stack pushes). When an instruction that is not easily reversed is encountered, a series of "no operation" (NOP) commands are generated and dispatched by the VMI to keep the CPU busy until the control value is received. If the subsequently received control value indicates that the assumption is correct, the VMI thus continues to operate on the bytecodes present in the VMI pipeline and the CPU continues to operate on the native instructions in the CPU pipeline. If the subsequently received control value indicates that the assumption is incorrect (i.e., there has been a misprediction) the CPU is caused to return to the state just before the branch, thereby reversing the speculatively executed easily reversible bytecodes. Thus, reversal of a misprediction due to an incorrect assumption requires returning both the VMI and the CPU to their respective states just prior to the branch and is easily accomplished according to the characteristics of the speculatively executed bytecodes. For instance, in an embodiment of the present invention "easily reversible bytecode" is defined as a bytecode that performs only stack manipulations or that does not modify any state outside the VMI, so execution of a sequence of such bytecodes can be reversed by resetting the bytecode counter and the register stack pointer in the VMI. Other definitions of "easily reversible" can be implemented according to the present invention and some of those definitions may require that the 25 pipelines of the VMI and the CPU be flushed to reverse speculatively executed bytecodes.

Another aspect of the present invention is the system for executing virtual machine instructions from an interpreted language such as Java<sup>TM</sup>. The system includes a processor (the CPU) and a preprocessor (the VMI), an instruction memory, and a translator (a JVM). The processor contains and is configured to execute hardware-specific instructions, hereinafter referred to as native instructions. The preprocessor is a virtual machine, for example a VMI, configured to fetch bytecode from the instruction memory and to translate the bytecode into native CPU instructions. The VMI includes a control register, a bytecode counter BCC, an assumption variable register, and a speculation mode switch history. In the exemplary embodiment of the present invention, the VMI is configured to dispatch native

PCT/IB02/03646

instructions called for by each bytecode to the CPU for processing. Where the processed bytecode is a CBI, the native instructions dispatched by the VMI cause the CPU to send a control value that indicates whether a branch is to be executed. The VMI is also configured to update the BCC to execute the jump called for by a CBI when it has been speculated or confirmed that the branch condition is fulfilled. While waiting for a control value, the VMI is configured to speculatively process or decline to process a branch based upon a branch prediction scheme according to the methods listed as the embodiments above. The VMI is configured to update the value of an assumption variable upon making or declining to make an assumption, by storing an assumed control value ACV. The VMI is configured to maintain a speculative mode switch history, which is updated when a sequence is speculatively executed or when speculative execution ceases, and is purged when a control value is received. After making the assumption that a branch should be speculatively executed, the VMI is configured to identify and process bytecodes that are reversible, to receive the control value, and to reverse speculatively executed bytecodes if the VMI subsequently receives a control value that indicates that the earlier assumption was incorrect.

Although it is possible to implement the methods of the present invention to process various types of conditional branch instructions, the exemplary embodiment of the present invention is directed to the processing of  $Java^{TM}$  conditional branch bytecodes.

The present invention can be implemented in systems that execute Java<sup>TM</sup> bytecode using virtual machines, such as JVMs made by Sun Microsystems. However, the invention can also be implemented using other Java<sup>TM</sup> virtual machines such as the Microsoft Virtual Machine, and is also applicable to systems that execute other interpreted languages such as Visual Basic, dBASE, BASIC, and .NET.

Additional objects, advantages and novel features of the invention will be set forth in part in the description which follows, and in part will become more apparent to those skilled in the art upon examination of the following, or may be learned by practice of the invention.

# BRIEF DESCRIPTION OF THE DRAWINGS

30

The accompanying drawings, which are incorporated in and form part of the specification, illustrate the present invention when viewed with reference to the description, wherein:

 $\label{FIG.1} {\bf FIG.~1~is~a~block~diagram~that~shows~the~functional~elements~of~an~exemplary~embodiment~of~the~environment~of~the~present~invention.}$ 

the present invention.

PCT/IB02/03646

 $\label{eq:Fig.2} FIG.~2~is~a~chart~that~shows~processing~of~instructions~in~the~typical~CPU$  pipeline.

FIG. 3 illustrates an exemplary bytecode processing sequence.

FIG. 4 charts the flow of a method according to an exemplary embodiment of

#### DESCRIPTION OF PREFERRED EMBODIMENTS

As required, detailed embodiments of the present invention are disclosed herein; however, it is to be understood that the disclosed embodiments are merely exemplary of the invention that may be embodied in various and alternative forms. The figures are not necessarily to scale; some features may be exaggerated or minimized to show details of particular components. Therefore, specific structural and functional details disclosed herein are not to be interpreted as limiting, but merely as a basis for the claims and as a representative basis for teaching one skilled in the art to variously employ the present invention.

Referring now in detail to an exemplary embodiment of the present invention, which is illustrated in the accompanying drawings in which like numerals designate like components, FIG. 1 is a block diagram of the exemplary embodiment of the environment of the present invention. The basic components of the environment are a hardware platform 100 which includes a processor 110, a preprocessor 120, and an instruction memory 150 which are all connected by a system bus 160. The preprocessor 120 includes control register 130 and a translator 140. A hardware platform 100 typically includes a central processing unit (CPU), basic peripherals, an operating system (OS). The processor 110 of the present invention is a CPU such as MIPS, ARM, Intel x86, PowerPC, or SPARC type 25 microprocessors, and contains and is configured to execute hardware-specific instructions, hereinafter referred to as native instructions. In the exemplary embodiment of the present invention, the translator 140 is a Java™ virtual machine (JVM), such as the KVM by Sun Microsystems. The instruction memory 150 contains virtual machine instructions, for example, Java™ bytecode 170. The preprocessor 120 in the exemplary embodiment is the Virtual Machine Interpreter (VMI) disclosed in WO9918486, and is configured to fetch a virtual machine instruction (for example, a bytecode 170) from the instruction memory 150 and to translate the virtual machine instruction into a sequence of native CPU instructions. The VMI 120 is a peripheral on the bus 160 and may act as a memory-mapped peripheral, where a predetermined range of CPU addresses is allocated to the VMI 120. The VMI 120

20

PCT/IB02/03646

manages an independent virtual machine instruction pointer 180 indicating the current (or next) virtual machine instruction in the instruction memory 150. The VMI also manages a speculation mode switch history and an assumption variable (not shown).

Referring now to FIG. 2 and according the exemplary embodiment of the present invention, the processor 110 includes an multi-stage pipeline 200 such that execution of machine instructions occurs in parallel and lockstep fashion during consecutive clock cycles. In other words, when a first instruction I1 enters stage two of the pipeline, the following instruction I2 enters stage one, and so on. Ideally, the instructions continue to enter the pipeline in consecutive cycles thereby enabling the concurrent processing of eight instructions where one instruction is completely executed every clock cycle. Typically however, execution of the average instruction actually requires more than one clock cycle.

As an example of the operation of the present invention, the VMI 120 proceeds to translate each of a first series 310 of bytecodes 170 into one or more native instructions. Referring now to FIG. 3, bytecodes B0 through B2 are non-conditional, so the VMI 120 simply fetches B0 through B2 from the instruction memory 150, selects the native instruction or instructions defined for each bytecode 170, and supplies the instruction(s) to the processor 110 for execution. Bn is a conditional branch instruction (CBI 330), therefore if the branch condition is fulfilled Bn causes the VMI to jump from the first sequence 310 to a bytecode Br in a sequence 320. While the branch condition is being evaluated (i.e., the VMI 120 waits for a control value to be returned from the CPU 110), a prediction is made according branch prediction scheme as to whether the branch condition will be fulfilled and the VMI 120 elects whether to speculatively execute instructions until the prediction can be verified. Branch prediction schemes are heuristic processes of varying complexities that provide predictions as to whether a branch condition will be fulfilled and possibly a statistical assessment of accuracy of the prediction. According to one embodiment of the present invention, the VMI 120 implements a branch prediction scheme that assumes that if the CBI 330 (Bn) calls for a backward branch (i.e., a negative offset to the bytecode counter BCC), the branch condition is fulfilled and the VMI 120 executes the jump to bytecode Br. The  $VMI\ 120$  concurrently dispatches the sequence of native instructions that causes the CPU 110retrieve the control value that indicates whether the branch condition has been fulfilled. According to the branch prediction scheme of another embodiment, if the CBI 330 (Bn) calls for a forward branch (i.e., a positive offset to the BCC), the VMI 120 assumes that the branch condition is not fulfilled and does not execute the jump. According to the branch prediction

15

PCT/IB02/03646

scheme of yet another embodiment, if the CBI 330 calls for a branch at all, the VMI 120 assumes that the branch condition is fulfilled and executes the jump.

10

According an exemplary embodiment of the present invention, if the branch prediction scheme results in speculative execution of a sequence 320 of bytecodes, the impact of an inaccurate prediction is minimized by speculatively executing only easily reversible bytecodes 170. Ease of reversal is determined when the bytecode 170 is decoded (i.e., its properties are accessed) by the VMI 120. The CPU 110 speculatively executes each dispatched instruction. For example, in many cases a branch is followed by a stack push operation (i.e. a constant or variable gets pushed on the stack), which can easily be reversed by resetting the stack pointer value (which is maintained in the VMI 120) to its state prior to the branch. Such native instructions (commonly referred to as "stack pushes") can be speculatively executed until the control value has been received, because reversing the speculative execution is accomplished by merely resetting a register, and thus the negative effects of a misprediction are neglicible.

Thus, when the VMI 120 assumes that a branch condition will be fulfilled, processing of bytecodes Br through Bz (the speculative branch) subsequently continues in the second sequence 320 unless the VMI 120 encounters a bytecode along the speculative branch that represents a sequence of native instructions that cannot be easily reversed. When a bytecode 170 along the speculative branch cannot easily be reversed, speculative execution is suspended. If the VMI 120 subsequently receives a control value that indicates that the branch condition has not been fulfilled, the VMI 120 resets the BCC and the register stack pointer to reverse the jump (and if necessary, issues a native instruction to the CPU 110 to purge the CPU pipeline 200). If the VMI 120 assumes that a branch condition will not be fulfilled, the BCC is incremented and the branch is speculatively not processed. While speculatively processing non-branch bytecodes, the VMI 120 continuously checks whether the received control value has been written to its control register 130.

As shown in block 410 of FIG. 4, the VMI 120 increments a virtual machine counter BCC before proceeding in block 420 to fetch each bytecode 170 from the instruction memory 150. In block 430, the VMI 120 decodes each bytecode 170 by accessing the properties for the bytecode 170. Because the speculation mode switch SMS is off when the first bytecode 170 of a sequence has been decoded, the VMI 120 (in block 435) dispatches the sequence of native instructions that corresponds to the bytecode 170. If in block 445 it is determined that the bytecode 170 is not a CBI 330, the method returns to block 410 where the virtual machine counter (BCC) 180 is incremented, and the fetching process resumes (block

PCT/IB02/03646

420). However, if it is determined in block 445 that the bytecode 170 is conditional, the native instructions dispatched in block 435 will represent a control value retrieval process within block 450. The native instructions that constitute the control value retrieval process will cause the CPU 110 to send a control value that indicates whether the branch called for by the CBI 330 is to be executed (i.e., whether to jump to a target bytecode 170 that is outside of the current sequence of bytecodes being executed), and to write that control value to the control register 130. Concurrently with the control value retrieval process, the VMI 120 elects (in block 470) whether to make an assumption that the branch condition will or will not be fulfilled. The election is based upon the particular branch prediction or speculative execution scheme in use.

11

If the VMI 120 elects to make an assumption as to the fulfillment of the branch condition, the speculation mode switch (SMS) is turned on and an assumed control value (ACV) is stored in a VMI register (the assumption variable 195). In block 475, the BCC is updated (to reflect the jump called for by the CBI 330) if the branch is speculatively taken. Regardless of whether the branch is speculatively taken, the method proceeds to block 410 where the BCC is incremented. The next bytecode 170 along the speculatively elected sequence of bytecodes is processed if it is reversible (e.g., the native instructions corresponding to the next bytecode 170 constitute a simple stack manipulation). The determination of ease of reversibility is based upon the properties of the bytecode 170. Easily reversible bytecodes typically represent operations that take place on stack positions above the top-of-stack just after the CBI 330 translation and that do not modify the state of the system (in particular, outside the VMI 120). The bytecode 170 is fetched in block 420 and decoded in block 430. The SMS is on because the VMI 120 elected to make an assumption (the sequence is being speculatively executed), so if the control value has not yet 25 been returned (block 485) and the decoded properties indicate the fetched bytecode 170 is easily reversible, the native instructions corresponding to the fetched bytecode are dispatched in block 435. Then as long as the fetched bytecode 170 is not another CBI 330 (block 445), the BCC is incremented (block 410) and the next bytecode along the speculative sequence is fetched and decoded (blocks 420 and 430). Thus, the processing of a speculative sequence loops through blocks 410, 420, 430, 432, 485, 486, 460, and 435 as long as each next bytecode 170 is easily reversible, and as long as the branch condition has not been received. If in block 460 a bytecode 170 that is not easily reversible is encountered

during the processing of a speculative sequence, speculation is discontinued in block 461 by switching the SMS off, which causes the VMI 120 to wait for receipt of the control value in

PCT/IB02/03646

WO 03/029961

block 485. The received control value RCV is stored in the control register 130 of the VMI 120. In block 487, the branch condition is evaluated. If the RCV indicates that the branch condition was fulfilled and the SMS history indicates that current sequence was being speculatively processed (the SMS history 190 shows that the SMS has been on at some point during the current sequence) in block 494 the assumed control value ACV stored as the assumption variable 195 is compared to the received control value RCV stored in the control register 130 to determine whether the assumption made by the VMI 120 was correct (i.e., whether the speculative sequence should have been processed). If the assumption was correct (i.e., ACV = RCV) then the speculative execution of the current branch sequence has been confirmed. In other words, the VMI 120 correctly assumed that the branch should be taken. The BCC is incremented in block 410 and fetching resumes. If the assumption was incorrect then the VMI 120 failed to process the branch, and the VMI 120 and the CPU 110 are flushed to reverse the speculatively processed non-branch sequence of bytecodes, the method updates the BCC to reflect the jump in block 498 and then returns to block 410 to increment the BCC and process the next bytecode along the branch sequence.

If the RCV indicates that the branch condition was not fulfilled and the SMS history 190 indicates that current sequence was being speculatively processed, in block 494 the assumed control value ACV is compared to the received control value RCV to determine whether the assumption made by the VMI 120 was correct. If the assumption was correct then the speculative execution of the current non-branch sequence has been confirmed. In other words, the VMI 120 correctly assumed that the branch should not be taken. The BCC is incremented in block 410 and fetching resumes. If the assumption was incorrect then the branch should not have been taken, and all bytecodes along the speculatively processed branch are reversed by resetting the BCC and the stack register pointer in block 495. If necessary, the pipelines of the VMI 120 and the CPU 110 are flushed in block 495.

The SMS history 190 is reset whenever a control value is received because the branch condition has been resolved thus confirming or purging any speculative processes.

If the VMI 120 elects in block 470 not to make an assumption as to the fulfillment of the branch condition, the VMI 120 waits until the actual control value is received by checking in block 485 for receipt of the control value. Because the SMS remains off, block 486 returns to block 485 to continue checking until the control value is received. When the control value is received, the method proceeds to block 487, where the branch condition is evaluated. If the control value indicates that the branch condition was fulfilled, because no speculation has occurred during execution of the bytecode sequence, the method

PCT/IB02/03646

proceeds to block 498 where the BCC is updated to reflect the jump called for by the CBI 330 and then bytecode fetching is resumed in block 410. If the control value indicates that the branch condition was not fulfilled, the method returns to block 410 to resume bytecode fetching. In this manner, if the VMI 120 elects not to make an assumption the VMI 120 processes the CBI 330 normally (taking the branch only if the branch condition is fulfilled).

As discussed above, the decision whether to make an assumption regarding the fulfillment of the branch condition is based upon the branch prediction scheme implemented, as illustrated below.

#### **Branch Prediction Schemes**

10

|                   | Backward Branch            | Forward Branch   |
|-------------------|----------------------------|------------------|
| First embodiment  | Assume taken               | Assume not taken |
| Second embodiment | Assume taken               | No assumption    |
| Third embodiment  | Assume taken               | Assume taken     |
| Fourth embodiment | Depends on prediction sche | eme              |

In a first embodiment of the present invention, the VMI 120 utilizes a speculative execution scheme that assumes that backward branches will be taken, and that forward branches will not be taken. In a second and alternative embodiment, the VMI 120 speculatively executes only backward branches, and makes no assumption regarding forward branches. In a third and alternative embodiment, the VMI 120 utilizes a simpler speculative execution scheme that assumes that all branches will be taken. Furthermore, according to a fourth and alternative embodiment the VMI 120 utilizes a branch prediction scheme to determine whether the branch is to be taken. According to any of the forgoing embodiments, speculative execution only proceeds for bytecodes that are easily reversible.

According to the first embodiment of the present invention, the VMI 120 always makes an assumption regarding the outcome of the branch condition represented by a CBI 330, but bases the speculation upon the type branch called for by the CBI 330. If the CBI 330 calls for a forward branch (BCC offset > 0) the VMI 120 assumes that the branch condition will not be fulfilled and speculatively continues to process a non-branch bytecode sequence as long as it is easily reversible. If the CBI 330 calls for a backward branch (BCC offset < 0) the VMI 120 assumes that the branch condition will be fulfilled and speculatively processes the branch bytecode sequence as long as it is easily reversible.

According to the second embodiment of the present invention, the VMI 120 makes an assumption regarding the outcome of the branch condition represented by a CBI

WO 03/029961 PCT/IB02/03646

330 only if the CBI 330 calls for a backward branch. Where the CBI 330 calls for a forward branch the VMI 120 processes the branch condition normally, i.e., the VMI 120 waits for receipt of the control value and processes the appropriate sequence of bytecodes accordingly.

In a third embodiment of the present invention, a scheme speculates that the branch is always taken when a CBI is encountered. When processing RISC code this speculative execution scheme is accurate approximately 70% of the time because branches usually occur at the bottom of a loop, and loops are typically executed repeatedly. The branch prediction improves the overall RISC code processing performance of VMI by approximately 35%. According to Amdahl's law, when processing Java code this simple prediction will increase bytecode processing speed by 7-20%. Using branch prediction and speculative operation, the overhead of branches as compared to a natively executing CPU can be reduced from 10 to 20 cycles to approximately 2 to 4 cycles. According to an aspect of the third embodiment, when the VMI 120 assumes that a branch condition has been fulfilled. the VMI 120 updates the bytecode counter BCC to reflect the branch offset, starts fetching from the offset address and recovers its pipeline. If the assumption is correct, the time required to process that branch is reduced to about 5 cycles. However, it cannot be concluded that branch prediction according to this embodiment of the present invention would reduce the processing time for every branch by an approximate factor of three (from 14 to 5 cycles) because approximately 10% of all branches results in cache misses.

In a fourth embodiment, any known branch prediction scheme is utilized in combination with the VMI 120 to process each CBI 330.

20

Many of the advantages of the systems and methods of the present invention are described herein, although those skilled in the art will recognize other advantages exist. For example, for optimal bus usage the CPU 110 reads native instructions in bursts (typically consisting of at least 4 cycles). Therefore the CPU 110 must read an entire burst before it will send the control value back to the VMI 120. The VMI 120 must generate some NOPs to fill the burst containing the control value retrieval command so as to ensure that the CPU 110 processes the retrieval command while the VMI 120 processes a speculative branch. An advantage of the present invention is that when a the VMI 120 keeps the CPU 110 and VMI 120 pipelines filled with meaningful instructions by speculatively dispatching the next instructions from the speculative sequence 320 as long as the effects of each instruction can be reversed, rather than having to occupy processor time with NOPs to fill the CPU burst.

In view of the foregoing, it will be appreciated that the present invention provides a system and a method for accurate and efficient processing of conditional branch

15

PCT/IB02/03646

virtual machine instructions. Still, it should be understood that the foregoing relates only to the exemplary embodiments of the present invention, and that numerous changes may be made thereto without departing from the spirit and scope of the invention as defined by the following claims.

PCT/IB02/03646

CLAIMS:

5

15

 $\label{eq:Amethod of processing virtual machine instructions, the method comprising the steps of:$ 

16

identifying a subset of virtual machine instructions the processing of which is conditionally dependent upon the value of a condition control variable;

fetching and processing a range of the virtual machine instructions into native instructions executable by a processor, wherein a virtual machine instruction counter is incremented after processing and dispatching to the processor for execution a virtual machine instruction of said range, and continuing until a member of said subset of the virtual machine instructions is encountered;

initiating a control value retrieval process upon encountering said member, by dispatching native instructions represented by said member to the processor for execution;

processing a speculative sequence of virtual machine instructions when an assumption has been made for an assumed value of a real value of the condition control variable, by:

switching a speculative mode switch on;

updating the virtual machine instruction counter according to the assumed value, so as to process into native instruction each virtual machine instruction of said speculative sequence of virtual machine instructions, incrementing the virtual machine instruction counter and dispatching the native instructions after each virtual machine instruction is processed, until the real value of the condition control variable has been received:

comparing the real value to the assumed value; and
reversing the processing of the speculative sequence of virtual machine
instructions, purging a speculation mode history, and reversing the update to the virtual
machine counter, if the real value is not equal to the assumed value; or
switching said speculation mode switch off and purging said speculation in

switching said speculation mode switch off and purging said speculation mode history, if the real value is equal to the assumed value;

PCT/IB02/03646

delaying further fetching and processing of the range of the virtual machine instructions until the real value of the condition control variable is received and then processing the next virtual machine instruction according to the real control value, if no assumption is made for the assumed value of the real value of the condition control variable.

- 2. The method of Claim 1, wherein fetching and processing of said range of the virtual machine instructions into native instructions executable by a processor is accomplished by a Virtual Machine Interpreter (VMI) virtual machine hardware accelerator.
- 10 3. The method of Claim 1, wherein processing said speculative sequence of virtual machine instructions further comprises:

processing each virtual machine instruction of said speculative sequence only if the virtual machine instruction is easily reversible: and

- suspending processing of said speculative sequence of virtual machine

  instructions until the real value of the condition control variable is received, if the next virtual machine instruction does not represent a stack manipulation.
  - 4. The method of Claim 3, wherein suspending processing of said speculative sequence further comprises dispatching to the processor a series of "no operation" instructions until the real value of the condition control variable is received.
  - 5. The method of Claim 2, wherein determining whether to make an assumption for the assumed value of the real value of the condition control variable further comprises:
     determining a displacement to the virtual machine counter that is called for by said member of said identified subset of virtual machine instructions; and
     setting the assumed value of the condition control variable to indicate that the branch condition is fulfilled, if the member of said identified subset of virtual machine instructions calls for a negative displacement (offset < 0) of the virtual machine counter.</p>
- 30 6. The method of Claim 5 further comprising setting the assumed value of the condition control variable to indicate that the branch condition is not fulfilled, if the member of said identified subset of virtual machine instructions calls for a positive displacement (offset > 0) of the virtual machine counter.

PCT/IB02/03646

7. The method of Claim 5 further comprising making no assumption for the real value of the condition control variable, if the member of said identified subset of virtual machine instructions calls for a positive displacement (offset > 0) of the virtual machine counter.

5

8. The method of Claim 2, wherein determining whether to make an assumption for the assumed value of the real value of the condition control variable further comprises setting the assumed value of the condition control variable to indicate that the branch condition is fulfilled.

ΙU

9. The method of Claim 2, wherein determining whether to make an assumption for the assumed value of the real value of the condition control variable further comprises setting the assumed value of the condition control variable according to a branch prediction scheme.

15

10. The method of Claim 2, wherein determining whether to make an assumption for the assumed value of the real value of the condition control variable further comprises setting the assumed value of the condition control variable according to a speculative execution scheme.

20

- 11. A method of processing virtual machine instructions, the method comprising:
  fetching and processing a range of the virtual machine instructions into native
  instructions executable by a processor, and continuing until a conditional branch instruction
  is encountered:
- 5 initiating a control value retrieval process by dispatching a native instruction represented by the conditional branch instruction to the processor for execution, upon encountering the conditional branch instruction;
  - determining whether to make an assumption as to a value of a condition control variable; and
  - processing a speculative sequence of virtual machine instructions when an assumption is made as to the value of the condition control variable, by:
  - processing a virtual machine instruction of said speculative sequence of virtual machine instructions into a preliminary native instruction, only if the virtual machine instruction is easily reversible; and

20

30

PCT/IB02/03646

suspending processing of said speculative sequence of virtual machine instructions until the value of the condition control variable is received, if the virtual machine instruction does not represent a stack manipulation,

delaying further fetching and processing of the range of the virtual machine instructions until the value of the condition control variable is received and then processing the next virtual machine instruction according to the received value, if no assumption is made as to the value of the condition control variable.

12. The method of Claim 11, wherein processing the speculative sequence of virtual machine instructions further comprises:

comparing the value of the received condition control variable to an assumed value:

reversing the processing of the speculative sequence of virtual machine instructions, purging a speculation mode history, if the value of the condition control variable is not equal to the assumed value; and

switching said speculation mode switch off, and purging said speculation mode history, if the value of the condition control variable is equal to the assumed value.

An apparatus for processing virtual machine instructions, comprising:
 a processor (110) having a native instruction set and configured to execute native instructions;

an instruction memory (150), configured to store virtual machine instructions; a preprocessor (120), configured to fetch virtual machine instructions from the instruction memory and to process the fetched virtual machine instructions into native instructions executable by the processor (110), to identify conditional virtual machine instructions, to determine whether to speculatively process virtual machine instructions while the value of a condition control variable is being sent by the processor, and to confirm or reverse said speculatively processed virtual machine instructions upon receipt of the condition control variable, and further comprising:

a control register (180), configured to store the value of the condition control variable received from the processor;

a virtual machine instruction counter, configured to indicate the next virtual machine instruction to be processed;

PCT/IB02/03646

an assumption variable register, configured to store the value of an assumed control variable:

- a speculation mode bit, configured to indicate whether the preprocessor has made an assumption regarding the value of the condition control variable; and
- a speculation mode history, configured to store speculation mode bits while the value of the control variable is being sent.
- The apparatus of Claim 13, wherein the preprocessor (120) is a Virtual Machine Interpreter (VMI) virtual machine hardware accelerator.
- 15. The apparatus of Claim 13, wherein the preprocessor (120) is further configured to speculatively process only virtual machine instructions that are easily reversible, and to suspend speculative processing of virtual machine instructions until the value of the condition control variable is received when a virtual machine instruction that is not easily reversible is encountered.
  - 16. The apparatus of Claim 15, wherein the preprocessor (120) is further configured to dispatch a series of "no operation" instructions while speculative processing is suspended and until the value of the condition control variable is received.
  - 17. The apparatus of Claim 15, wherein the preprocessor (120) is further configured to speculatively process only virtual machine instructions that represent stack manipulations, and to suspend speculative processing of virtual machine instructions until the value of the condition control variable is received when a virtual machine instruction that is not a stack manipulation is encountered.
  - 18. The apparatus of Claim 17, wherein the preprocessor (120) is further configured to dispatch a series of "no operation" instructions while speculative processing is suspended and until the value of the condition control variable is received.

PCT/IB02/03646

1/3



FIG. 1

PCT/IB02/03646

2/3

| :  |    |          |                            |                                           |                                                          |                                                                               |                                                                                                          |
|----|----|----------|----------------------------|-------------------------------------------|----------------------------------------------------------|-------------------------------------------------------------------------------|----------------------------------------------------------------------------------------------------------|
| _  |    |          |                            |                                           |                                                          |                                                                               |                                                                                                          |
| I1 | 12 | 13       | 14                         | 15                                        | 16                                                       | 17                                                                            | 18                                                                                                       |
|    | I1 | 12       | 13                         | 14                                        | 15                                                       | 16                                                                            | 17                                                                                                       |
| 7  |    | I1       | 12                         | 13                                        | 14                                                       | 15                                                                            | 16                                                                                                       |
| 1  |    |          | I1                         | 12                                        | 13                                                       | 14                                                                            | 15                                                                                                       |
|    |    |          |                            | I1                                        | 12                                                       | 13                                                                            | 14                                                                                                       |
|    |    |          |                            |                                           | I1                                                       | 12                                                                            | 13                                                                                                       |
|    |    |          |                            |                                           |                                                          | I1                                                                            | 12                                                                                                       |
| 1  |    |          |                            |                                           |                                                          |                                                                               | Ι1                                                                                                       |
|    |    |          |                            |                                           |                                                          |                                                                               |                                                                                                          |
|    |    | I1 I2 I1 | I1 I2 I3<br>I1 I2<br>I1 I2 | I1 I2 I3 I4<br>I1 I2 I3<br>I1 I2<br>I1 I2 | I1 I2 I3 I4 I5 I1 I2 I3 I4 I1 I2 I3 I4 I1 I2 I3 I1 I2 I1 | I1 I2 I3 I4 I5 I6 I1 I2 I3 I4 I5 I1 I2 I3 I4 I5 I1 I2 I3 I4 I1 I2 I3 I1 I2 I1 | I1 I2 I3 I4 I5 I6 I7 I1 I2 I3 I4 I5 I6 I1 I2 I3 I4 I5 I1 I2 I3 I4 I5 I1 I2 I3 I4 I1 I2 I3 I1 I2 I3 I1 I2 |

FIG. 2



FIG. 3



FIG. 4

# 【国際調査報告】

|                                                                   |                                                                                                                            |                       | ·                       |                       |  |
|-------------------------------------------------------------------|----------------------------------------------------------------------------------------------------------------------------|-----------------------|-------------------------|-----------------------|--|
|                                                                   | INTERNATIONAL SEARCH REPORT                                                                                                |                       |                         | lication No           |  |
|                                                                   | TO ATION OF OUR IFOT MATTER                                                                                                |                       | PCT/IB 02               | 7 03040               |  |
| IPC 7                                                             | GO6F9/38 GO6F9/318                                                                                                         |                       |                         |                       |  |
|                                                                   | International Patent Classification (IPC) or to both national classifica                                                   | tion and IPC          |                         |                       |  |
| B. FIELDS                                                         | SEARCHED<br>cumentation searched (classification system followed by classification                                         | n symbols)            |                         |                       |  |
| IPC 7                                                             | G06F                                                                                                                       |                       |                         |                       |  |
| Documentati                                                       | ion searched other than minimum documentation to the extent that st                                                        | ich documents are ind | cluded in the fields se | aarched               |  |
| Electronic da                                                     | ata base consulted during the international search (name of data bas                                                       | e and, where practic  | al, search terms used   | )                     |  |
| EPO-Ini                                                           | ternal                                                                                                                     |                       |                         |                       |  |
| C. DOCUME                                                         | ENTS CONSIDERED TO BE RELEVANT                                                                                             |                       |                         |                       |  |
| Category *                                                        | Citation of document, with indication, where appropriate, of the rele                                                      | want passages         |                         | Retevant to claim No. |  |
| А                                                                 | WO 01 27752 A (TRANSMETA CORP)<br>19 April 2001 (2001-04-19)<br>the whole document                                         | 1,11,13               |                         |                       |  |
| A                                                                 | US 6 167 509 A (SITES RICHARD LEE<br>26 December 2000 (2000-12-26)<br>column 16, line 59 - line 65                         | 5-7                   |                         |                       |  |
| A                                                                 | US 5 450 560 A (BRIDGES JEFFREY T<br>12 September 1995 (1995-09-12)<br>column 23, line 58 -column 24, li                   | 3,11,15               |                         |                       |  |
| Furth                                                             | her documents are listed in the continuation of box C.                                                                     | X Patent fami         | Iv members are listed   | 3n annex.             |  |
|                                                                   |                                                                                                                            | _ <u>K</u>            | .,                      |                       |  |
| ° Special ca  *A* docume consid  *E* earlier filing c             | emailonal filing date the application but seemy underlying the claimed invention t be considered to soument is taken alone |                       |                         |                       |  |
| "L" docume<br>which<br>citatio<br>"O" docum<br>other<br>"P" docum | claimed invention<br>wentive step when the<br>lore other such docu-<br>bus to a person skilled                             |                       |                         |                       |  |
|                                                                   | ent published prior to the international filing date but<br>han the priority date claimed                                  |                       | or of the same paten    |                       |  |
|                                                                   | actual completion of the international search 7 December 2002                                                              | 27/12/                | of the international se | шы гериц              |  |
| Name and                                                          | mailing address of the ISA<br>European Patent Office, P.B. 5818 Patentiaan 2                                               | Authorized office     | er                      |                       |  |
| -                                                                 | NL – 2280 HV Rijswijk<br>Tel. (+31–70) 340–2040, Tx. 31 651 epo nl,<br>Fax: (+31–70) 340–3016                              | Morait                | :i, M                   |                       |  |

# Inte onal Application No PCT/IB 02/03646 INTERNATIONAL SEARCH REPORT Publication date Publication date Patent family member(s) Patent document cited in search report 13-11-2002 14-08-2002 19-04-2001 1379875 T 1230594 A1 0127752 A1 CN EP WO WO 0127752 19-04-2001 30-12-1991 03-09-1998 01-04-1999 02-01-1992 20-09-1999 15-04-1994 01-06-1999 2045791 A1 69129881 D1 69129881 T2 0463977 A2 2951064 B2 6103067 A 190252 B1 US 6167509 26-12-2000 CA DE DE EP JP JP KR US 5450560 12-09-1995 NONE

Form PCT/ISA/210 (patent family annex) (July 1992)

# フロントページの続き

(81)指定国 AP(GH,GM,KE,LS,MW,MZ,SD,SL,SZ,TZ,UG,ZM,ZW),EA(AM,AZ,BY,KG,KZ,MD,RU,TJ,TM),EP(AT,BE,BG,CH,CY,CZ,DE,DK,EE,ES,FI,FR,GB,GR,IE,IT,LU,MC,NL,PT,SE,SK,TR),OA(BF,BJ,CF,CG,CI,CM,GA,GN,GQ,GW,ML,MR,NE,SN,TD,TG),AE,AG,AL,AM,AT,AU,AZ,BA,BB,BG,BR,BY,BZ,CA,CH,CN,CO,CR,CU,CZ,DE,DK,DM,DZ,EC,EE,ES,FI,GB,GD,GE,GH,GM,HR,HU,ID,IL,IN,IS,JP,KE,KG,KP,KR,KZ,LC,LK,LR,LS,LT,LU,LV,MA,MD,MG,MK,MN,MW,MX,MZ,NO,NZ,OM,PH,PL,PT,RO,RU,SD,SE,SG,SI,SK,SL,TJ,TM,TN,TR,TT,TZ,UA,UG,UZ,VC,VN,YU,ZA,ZM,ZW

(74)代理人 100122769

弁理士 笛田 秀仙

(72)発明者 リンドワー メンノ エム

オランダ国 5656 アーアー アインドーフェン プロフ ホルストラーン 6

F ターム(参考) 5B013 BB01 BB18 5B081 AA09 DD02

# 【要約の続き】

化される。仮定が無効化された場合は、如何なる投機的に処理されたバイトコードも元に戻される。