JP2013169644A - 手続き記憶学習およびロボット制御 - Google Patents

手続き記憶学習およびロボット制御 Download PDF

Info

Publication number
JP2013169644A
JP2013169644A JP2013018336A JP2013018336A JP2013169644A JP 2013169644 A JP2013169644 A JP 2013169644A JP 2013018336 A JP2013018336 A JP 2013018336A JP 2013018336 A JP2013018336 A JP 2013018336A JP 2013169644 A JP2013169644 A JP 2013169644A
Authority
JP
Japan
Prior art keywords
robot
computer
correlation
similarity matrix
controller
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2013018336A
Other languages
English (en)
Other versions
JP5759495B2 (ja
Inventor
Leandro G Barajas
リアンドロ・ジー・バラジャス
M Sanders Adam
アダム・エム・サンダース
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
GM Global Technology Operations LLC
Original Assignee
GM Global Technology Operations LLC
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by GM Global Technology Operations LLC filed Critical GM Global Technology Operations LLC
Publication of JP2013169644A publication Critical patent/JP2013169644A/ja
Application granted granted Critical
Publication of JP5759495B2 publication Critical patent/JP5759495B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • BPERFORMING OPERATIONS; TRANSPORTING
    • B25HAND TOOLS; PORTABLE POWER-DRIVEN TOOLS; MANIPULATORS
    • B25JMANIPULATORS; CHAMBERS PROVIDED WITH MANIPULATION DEVICES
    • B25J9/00Programme-controlled manipulators
    • B25J9/16Programme controls
    • B25J9/1628Programme controls characterised by the control loop
    • B25J9/163Programme controls characterised by the control loop learning, adaptive, model based, rule based expert control
    • GPHYSICS
    • G05CONTROLLING; REGULATING
    • G05BCONTROL OR REGULATING SYSTEMS IN GENERAL; FUNCTIONAL ELEMENTS OF SUCH SYSTEMS; MONITORING OR TESTING ARRANGEMENTS FOR SUCH SYSTEMS OR ELEMENTS
    • G05B2219/00Program-control systems
    • G05B2219/30Nc systems
    • G05B2219/36Nc in input of data, input key till input tape
    • G05B2219/36422During teaching shut off, disable motor to move arm easy
    • GPHYSICS
    • G05CONTROLLING; REGULATING
    • G05BCONTROL OR REGULATING SYSTEMS IN GENERAL; FUNCTIONAL ELEMENTS OF SUCH SYSTEMS; MONITORING OR TESTING ARRANGEMENTS FOR SUCH SYSTEMS OR ELEMENTS
    • G05B2219/00Program-control systems
    • G05B2219/30Nc systems
    • G05B2219/39Robotics, robotics to robotics hand
    • G05B2219/39296Learn inverse and forward model together
    • GPHYSICS
    • G05CONTROLLING; REGULATING
    • G05BCONTROL OR REGULATING SYSTEMS IN GENERAL; FUNCTIONAL ELEMENTS OF SUCH SYSTEMS; MONITORING OR TESTING ARRANGEMENTS FOR SUCH SYSTEMS OR ELEMENTS
    • G05B2219/00Program-control systems
    • G05B2219/30Nc systems
    • G05B2219/39Robotics, robotics to robotics hand
    • G05B2219/39298Trajectory learning

Landscapes

  • Engineering & Computer Science (AREA)
  • Robotics (AREA)
  • Mechanical Engineering (AREA)
  • Manipulator (AREA)
  • Feedback Control In General (AREA)

Abstract

【課題】作業動作をロボットに対して実演し、ロボットが実演された動作を実行するとロボットから取得された相関値、属性、およびパラメータの類似度マトリクスに従ってロボットに動作を学習させることにより、ロボットを制御する手続き記憶学習のための方法および装置を提供すること。
【解決手段】学習はロボットコントローラに関連する人工神経回路網によって行われ、その結果、ロボットは類似度マトリクスに関連する作業を実行することを学習する。拡張類似度マトリクスは変数の積分値および微分値を含むことができる。手続き記憶学習は、ロボットに作業の実行を教える際のオーバヘッドを削減する。継続学習は成績を向上させ、ロボットの状態および環境因子における変化を自動的に補償する。
【選択図】図1

Description

本発明は、手続き記憶学習およびロボット制御に関する。
[001]ロボット工学、製造業、航空宇宙産業、産業用機械、および他の産業で使用されるマシンコントローラは、通常、既定の運動または動作の特定のセットを実行するようにプログラムされる。
これは時間を浪費し、資源集約的であり得る。例えば、1つの繰返し作業を実行するようにロボットをプログラミングするには、すべてのロボットの構成部品を据え付ける必要があり得る。1度プログラムされると、ロボットは変更に適合したり、変更を補償したり、または新しい動作環境に適応することができない可能性がある。ロボット機能における変更には、通常、適正な動作を保証するために再プログラミング、確認、検証、および他の処理が必要である。
[002]本発明の実施形態は、実演による学習を提供し、すなわち、ロボットコントローラが試行錯誤を通じて実演された動作をまねることによって学習する。作業を習得することにより、ロボットコントローラが、同様の作業だが異なる作業を実行することが可能になる。加えて、学習の結果は永続的であり、ロボットは老朽化、摩耗、および環境条件の変化の影響を補償することができる。ロボットに事前に教えることが不要であるだけでなく、作業の実行に要する低レベルのコマンドを明示的に形式化することも不要である。
[003]手続型メモリコントローラは、ロボットの正常動作中、外乱を観察し、所望の結果と相互に関連付けることによって訓練される。相関、順序および適切な組合せが見出されると、このコントローラは高水準の制御メカニズムに置き換わる。本発明の実施形態は、誤り補償器として動作してロボットのエンドエフェクタのタイミングおよび作動を調節する手続型メモリコントローラと一緒に、既存の宣言型メモリモデルコントローラ(例えば、経路計画、順運動学および逆運動学)を利用する。宣言型メモリコントローラは、作業の順序を実行するようにプログラムすることができる。
[004]本発明の実施形態によれば、複数の入力信号(その限定的でない例には、センサ出力、アクチュエータ入力、属性、位置、および他のロボットの手順に関連した測定可能変数が含まれる)が、半教師付き学習実演の間、モニタされる。ある特定の実施形態では、これらの信号は、また、微分され積分されて再帰的に拡張される。次いで、類似度マトリクスが展開されて、変数がお互いに関してどのように振る舞うかを集約し、これらのマトリクスは学習アルゴリズムへの入力として使用される。具体例は、相関、相互相関、順位相関、積率相関、距離相関、および他の関係の尺度を利用する。線形関係は通常、解析するのが速いが、非線形関係を使用することもある。
[005]センサは、ロボットの内部装置(その限定的でない例には、歪みゲージ、加速度計、位置検出器、RMS電流および電圧メータなどの電力センサ、ならびに振動検出器および整定時間測定器などの構成部品性能エバリュエータが含まれる)、ならびに、ロボットの外部装置(その限定的でない例には、ビデオカメラおよび近接検出器が含まれる)を含む。アクチュエータは、通常、2つの状態をもつ装置であり、その限定的でない例には、オン/オフスイッチおよび開/閉グリッパが含まれる。
[006]本発明の実施形態による半教師付きシーケンス学習では、システムは、マトリクスの中の値を対象手順の目標として使用するように教えられる。ロボットの出力値がマトリクスの値とより近く相関すればするほど、ロボットは対象手順をより良く遂行している。ロボット出力と目標マトリクスの間の相関関係を最適化することを求めることにより、コントローラはいかに最良に手順を遂行するかを学習する。本発明の例では、学習工程が進み、その結果、コントローラは動作環境およびロボットの状態における経時変化を絶え間なく補償する。
[007]本発明と見なされる主題は、明細書の最終部分において具体的に指摘され明確に特許請求される。本発明の実施形態は、実施形態を図示する添付図面とともに読むと、動作の構成と方法の両方に関して、その目的、特徴、および利点とともに、以下の詳細説明を参照することによって最も良く理解することができる。
[008]本発明の実施形態によるシステムを示す図である。 [009]本発明の実施形態による方法の構成要素を示す図である。 [0010]本発明の実施形態による方法の構成要素を示す図である。 [0011]本発明の実施形態による方法の構成要素を示す図である。 [0012]本発明の実施形態による方法の流れ図を示す図である。
[0013]説明を簡単および明確にするために、図において示された構成要素は、必ずしも縮尺通りに描かれていないことが理解されよう。例えば、明確にするために、いくつかの構成要素の大きさは他の構成要素と比べて誇張されている場合がある。さらに、適切と考えられるところでは、対応する、または類似の構成要素を示すために、参照数字は図の間で繰り返される場合がある。
[0014]以下の詳細説明では、本発明を完全に理解するために、多数の特定の詳細が説明される。しかしながら、本発明は特定の詳細がなくても実践できることが当業者によって理解されよう。他の例では、良く知られている方法、手順、および構成部品は、本発明を不明瞭にしないように詳細に説明されていない。
[0015]特に断らない限り、以下の説明から明白なように、明細書の説明全体を通して、「処理」、「算出」、「格納」、「決定」、「評価」、「計算」、「測定」、「提供」、「転送」などの用語の利用は、計算機システムのレジスタ内および/もしくはメモリ内の電子的などの物理的な量として表現されたデータを操作し、かつ/または、計算機システムのメモリ、レジスタもしくは他のそのような情報を格納、伝送もしくは表示する装置の内部の物理的な量として同様に表現された他のデータに変換する、コンピュータすなわち計算機システム、または同様の電子計算装置の動作および/または処理を参照することが理解されよう。
[0016]図1は、本発明の例による学習/制御システム101を示す。システム101は、中央処理装置103、データ格納装置105、および活動状態のデータベース109を含むメモリ装置107を含む。信号インタフェース111は、人工神経回路網を含むコントローラ125を介してロボット123から信号を受信する能力がある。相関器113は、2つ以上の信号を相互に関連付け、相関出力を作成する能力があり、相関出力の限定的でない例には、相互相関、順位相関、積率相関、および距離相関が含まれる。微分器115は、高次微分を含む信号の時間微分を出力する能力があり、積分器117は信号の時間積分を出力する能力がある。微分器115および積分器117の出力は、処理装置103の制御下で相関器113の中に入力することができる。マトリクス装置119は、相関器113によって出力された値を含む類似度マトリクスを生成し、コントローラ125を介して人工神経回路網(ANN)にマトリクスを送信する能力がある。本発明の例では、マトリクス装置119によって生成されたマトリクスは、データ格納装置105の中に格納される。低レベル制御インタフェース121は、コントローラ125を介して直接制御コマンドをロボット123に送信する。これはヒューマンロボットインタフェース127を介して実行することができ、この中で人間のオペレータは、ジョイスティックまたは同様の装置などの手動操作器を使用してコントローラ125を介してロボット123を直接制御する。あるいは、ロボット123への制御コマンドは、コントローラ125へのコマンドインタフェース129を介して、システム101上で走るソフトウェアによって生成することができる。本発明の実施形態では、「コマンド」は低レベルでロボットコントローラによって解釈することができる命令である。コマンドは、「Go to <X,Y,Z>」などの形式言語のコンテキストで表現することができる。ここで、<X,Y,Z>はロボットコントローラが認識するようにプログラムされた座標のポイントを表す。アグリゲータ131は、ロボット123の運動学モデルに従ってANNからのコマンド信号を結合し、結果として生じた被変調制御信号を、制御インタフェース125を介してロボット123に送信する。
[0017]下記で述べるように、(ヒューマンロボットインタフェース127を介するか、またはプログラムに基づいた制御による)ロボット123の直接制御は、学ぶべき動作の実演をロボット123に提供する。プログラムに基づいた制御の利点は、実演された動作を正確に繰り返すことができ、何回も繰り返すことができることである。本発明の実施形態では、動作を繰り返す回数はNと表記される。
[0018]概して、ロボット123に関連する信号およびコマンドは可変量であり、それらは時間および/または周波数、あるいは他のパラメータの関数である。
[0019]本発明の実施形態によれば、複数の信号がロボット123から受信され、類似度の測定値を取得するためにお互いと比較される。図2は実施形態による2つの信号の比較を示す。S1と表記された第1の信号201は、時間軸205に対して振幅軸203によるプロットとして示され、S2と表記された第2の信号207は、時間軸211に対して振幅軸209によるプロットとして示される。S1信号201とS2信号207は、K個の異なる信号毎にN個のサンプルを含むサンプルセット219から取られた例示用の2つの信号である。方向217にスライドするスライドウインドウ215は、両方の信号を採取し、サンプルを類似度解析装置221に供給する。一例では、類似度解析装置221は、S1信号201とS2信号207の類似度を、それらの間の類似度の関数を評価することにより解析する。限定的でない例では、類似度解析装置221は、S1信号201とS2信号207の大きさ−位相の相互相関を実行する。次いで、相互に関連付けられた値は、それによってK×Kの類似度マトリクス223を算出するために適切なエントリの中に置かれる。概して、相関値は複素数であり、大きさと位相の両方における相関関係を表す。ある特定の実施形態では、類似度マトリクス223は、2つの別々のマトリクスとして表され、一方は相関関係の実数部を含み、他方は虚数部を含む。いくつかの実施形態では、類似度マトリクス223の構成要素は、相関関係の関数の値であり、そのような関数の限定的でない例には、正規化関数、計量関数などが含まれる。動作がN回繰り返されてN個のサンプルをもたらすとき、明示的な平均演算を実行する必要はない。相関関係自体が繰返しを考慮に入れている。
[0020]類似度マトリクス223は時間の関数であり、したがって、時間的に変化する関数を近似するためにマトリクス223の多くのインスタンスはメモリの中に格納される。限定的でない例では、0.1秒毎のスナップショットに分解された10秒の動作は、メモリまたはデータベースエントリの中に格納されたマトリクス223の100個のインスタンスを有する。類似度マトリクスM(t)は、単にオフセットを適用することにより、T秒毎に時間移動されてM(t+T)を得ることができる。したがって、特定の動作用の類似度マトリクスをもつことは、遅れた時間の同じ動作用の類似度マトリクスを自動的に提供する。
[0021]図3は上述の図2の構成要素の拡大図を示す。N×K個の入力配列301は、K個の異なる信号毎にN個のサンプルを含む。信号の限定的でない例には、第1のセンサ入力303、第2のセンサ入力305、・・・、第1のアクチュエータ入力307、第2のアクチュエータ入力309、・・・、第1の属性入力311、第2の属性入力313、・・・、第1の位置入力315、第2の位置入力317、・・・が含まれ、K番目の入力319で終わる。
[0022]入力配列301は、L×N×K個の拡張入力配列321のN×K個の構成要素から成る状態入力325として入力される。図3の限定的でない例ではL=4であるが、Lの他の値も実現可能である。
[0023]図3の限定的でない例では、入力配列301の各構成要素は時間積分されて、積分状態入力323用の別のN×K個の構成要素を作成する。入力配列301の各構成要素は時間微分されて、第1の微分状態入力327用の別のN×K個の構成要素を作成する。第1の微分状態入力327の各構成要素は、再び時間微分されて、第2の微分状態入力329用の別のN×K個の構成要素を作成する。他の例では、他の高次モーメントが使用される。図3の例では、位置センサの第2の微分は加速度値をもたらす。別の例(図示せず)では、加速度センサの二重積分は位置オフセットをもたらす。第2の微分、第1の微分、状態、積分、および二重積分が使用されると、L=5である。
[0024]拡張入力配列321の(それぞれが可変量である)構成要素は相互に関連付けられて、(図3の限定的でない例において示されたように、値L=4を使用して)(4×K)×(4×K)=16×K個の平方拡張類似度マトリクス331を作成する。概して、拡張類似度マトリクス331の要素i、jは、信号Siの信号Sjとの相関関係である。
[0025]拡張類似度マトリクス331は、作業実行中のロボットの動作、すなわち、動作の個別の側面だけでなく、各側面が他の側面すべてに関係する方法も特徴付ける。
[0026]上記の例について説明した信号の振幅/時間領域解析に加えて、他の例は、振幅/周波数領域解析(フーリエ変換)、周波数/時間解析(短時間フーリエ変換すなわちSTFT)、および時間/ウェーブレット(「多重解像度」)解析を使用する。
[0027]他の、または異なる一連の演算も使用することができる。
[0028]図4は、以下のような、限定的でない例による方法の構成要素を示す。ロボット123用の運動学モデル400は、連結部品401、405、409、413、417、421、および425、関節403、407、411、415、419、および423、ならびにグリッパ427について、構成要素をモデル化することを含む。位置および方位は座標系429に対して測定される。
[0029]「左に動く」動作用の拡張類似度マトリクス451は、「左に動く」動作用の制御コマンド452とともに、人工神経回路網(「ANN」)457への入力である。こうして、ANN457は、類似度マトリクス451を「左に動く」動作の制御コマンド452と関連付けることを学習する。「5秒で上昇する」動作用の拡張類似度マトリクス453も、「5秒で上昇する」動作用の制御コマンド454とともに、ANN457への入力である。こうして、ANN457は、類似度マトリクス453を「5秒で上昇する」動作の制御コマンド454と関連付けることも学習する。拡張類似度マトリクス451と453が与えられると、ANN457は、ロボット123を制御して「左に動く」と「5秒で上昇する」の結合動作を実行するための制御信号を出力する。
[0030]本発明のある特定の実施形態によれば、各動作グループはそれ自身の類似度マトリクスを有しており、この限定的でない例では、「グリッパを閉める」動作用の拡張類似度マトリクス455も、「グリッパを閉める」動作用の制御コマンド456とともに、人工神経回路網459への入力である。こうして、ANN459は、類似度マトリクス455を「グリッパを閉める」動作の制御コマンド456と関連付けることを学習する。この例では、「グリッパを閉める」動作は、「左に動く」と「5秒で上昇する」とは異なる動作グループに含まれる。何故なら、「動く」動作は位置の検知による連続的な位置決め運動を要するが、「閉める」動作は力の検知による2値状態(開または閉)を要するからである。
[0031]「グリッパを閉め、次いで左に動き、次いで5秒で上昇する」作業の場合、運動学モデル400に従って、上記の出力はアグリゲータ461の中で結合されて、ロボット123への被変調制御信号463を作成する。ANN457および459からの制御信号出力が線形である本発明のある特定の実施形態では、アグリゲータ461は、加算を実行することにより制御信号を集める。本発明の実施形態では、任意の数の異なる動作グループを一緒に集めて、特定の作業を実行することができる。
[0032]「半教師付き学習」では、システムを初期化するとき、および変更、修正を行うとき、および定期的なメンテナンスを行うときだけ、教師付き学習が必要である。本発明の実施形態では、メンテナンスの再訓練は100サイクル毎に実施される。教師付き学習セッションの合間では、システムは、制御ループを修正せずに、教師なしの動作を行うことができる。
[0033]運動学モデルは、通常、ロボット工学において使用されて、エンドエフェクタの位置を関節パラメータに(順方向の運動学モデル)、および関節パラメータをエンドエフェクタの位置に(逆方向の運動学モデル)関係付ける。通常、運動学モデルは関節拘束のセットを要し、そのためアグリゲータ461へ運動学モデル400を入力すると、被変調制御信号463がロボット123の拘束に従うことが保証される。
[0034]結合はロボット400用の制御ループとして機能する。処理が繰り返され、拡張類似度マトリクス451、453、および455を再計算するために必要なパラメータ、属性、および信号を測定する。
[0035]図5は、本発明の実施形態による方法の流れ図を示す。ステップ501において、直接コマンド503で動作がロボットに対して実演される。ステップ505において、類似度マトリクス507が算出され、ステップ509において、直接コマンド503および類似度マトリクス507が人工神経回路網(ANN)に入力されて信号511を取得する。ステップ513において、ロボットの運動学モデル515に従って信号511が集められて、被変調制御信号517を出力して、動作を実行するようにロボットを制御する。
[0036]本発明の実施形態は、本明細書に記載した動作を実行するための装置を含むことができる。そのような装置は、所望の目的のために特別に構成することができるか、または、コンピュータ内に格納されたコンピュータプログラムにより選択的に起動されるかもしくは再構成された、コンピュータもしくはプロセッサを備えることができる。そのようなコンピュータプログラムは、コンピュータ可読もしくはプロセッサ可読の持続性記憶媒体、フロッピディスク、光ディスク、CD−ROM、磁気光ディスクを含む任意のタイプのディスク、リード・オンリ・メモリ(ROM)、ランダム・アクセス・メモリ(RAM)、電子的プログラム可能リード・オンリ・メモリ(EPROM)、電子的消去可能およびプログラム可能リード・オンリ・メモリ(EEPROM)、磁気式もしくは光学式カード、またはその他の任意のタイプの電子命令を格納するのに適切な持続性有形媒体の中に格納することができる。さまざまなプログラミング言語を使用して、本明細書に記載した本発明の教示を実装できることが理解されよう。本発明の実施形態は、プロセッサまたはコントローラによって実行されると、プロセッサまたはコントローラに本明細書で開示された方法を遂行させる命令、例えばコンピュータ実行可能命令を符号化する、含む、または格納する、例えば、メモリ、ディスクドライブ、またはUSBフラッシュメモリなどのコンピュータ可読またはプロセッサ可読の持続性記憶媒体などの物品を含むことができる。命令は、プロセッサまたはコントローラに、本明細書で開示された方法を遂行する処理を実行させることができる。
[0037]さまざまな実施形態が本明細書で開示されている。ある特定の実施形態の特徴は他の実施形態の特徴と結合することができ、したがって、ある特定の実施形態は複数の実施形態の特徴の組合せであり得る。本発明の実施形態の前述の説明は、例示および説明の目的で提示された。それは網羅的なものでも、本発明を開示された厳密な形態に限定するものでもない。上記の教示に照らして、多くの修正形態、変形形態、置換形態、変更形態、および均等形態が実現可能であることは、当業者によって理解されるべきである。したがって、添付の特許請求の範囲は、すべてのそのような修正形態および変更形態を、本発明の本当の精神の範囲に入るものとしてカバーするものであることが理解されよう。

Claims (12)

  1. ロボットを制御して作業を実行する手続き記憶学習のための方法であって、
    低レベルインタフェースを介して直接制御コマンドで前記ロボットを制御して前記作業の動作を実行することにより、前記作業を前記ロボットに対して実演するステップと、
    前記ロボットから前記動作に関連した複数の信号を受信するステップと、
    構成要素が前記複数の信号の類似度の少なくとも1つの関数による値を含む、類似度マトリクスを算出するステップと、
    前記ロボットの人工神経回路網(ANN)コントローラに
    前記直接制御コマンド、および
    前記類似度マトリクス
    を入力するステップと、
    前記ANNコントローラから前記ロボットを制御する制御信号を受信するステップと、
    前記ロボットの運動学モデルに従って、アグリゲータにより前記ANNコントローラから前記制御信号を集めるステップと、
    集められた制御信号を前記アグリゲータから前記ロボットに送信して前記作業を実行するステップと
    を含む方法。
  2. 前記類似度の少なくとも1つの関数が、相関、相互相関、順位相関、積率相関、および距離相関から成るグループから選択される、請求項1に記載の方法。
  3. 前記類似度マトリクスの前記構成要素の前記値が、実数部と虚数部をもつ複素数である、請求項1に記載の方法。
  4. 前記実数部と前記虚数部が、2つの別々のマトリクスによって表現された、請求項3に記載の方法。
  5. 前記類似度マトリクスは、値が積分値および微分値から成るグループから選択された少なくとも1つのモーメントをさらに含む拡張類似度マトリクスである、請求項1に記載の方法。
  6. 人工神経回路網コントローラから別の制御信号を受信するステップと、
    前記アグリゲータにより前記別の制御信号を前記制御信号と集めるステップと
    をさらに含む、請求項1に記載の方法。
  7. ロボットを制御して作業を実行する手続き記憶学習のための装置であって、前記ロボットが人工神経回路網(ANN)を含むロボットコントローラを有し、前記装置が、
    前記ロボットコントローラから複数の信号を受信するための信号インタフェースと、
    前記信号のうちの少なくとも2つの相関関係を生成し、相関関係の出力を作成するための相関器と、
    前記相関関係を含む構成要素を有する類似度マトリクスを生成し、前記ロボットコントローラを介して前記マトリクスを前記ANNに送信するためのマトリクス装置と、
    直接制御コマンドを前記ロボットコントローラに送信するための低レベル制御インタフェースと、
    前記ロボットの運動学モデルに従って前記ANNから制御信号を集めるためのアグリゲータと
    を備える装置。
  8. 微分値を生成して前記類似度マトリクスを拡張するための微分器をさらに備える、請求項7に記載の装置。
  9. 積分値を生成して前記類似度マトリクスを拡張するための積分器をさらに備える、請求項7に記載の装置。
  10. ロボットを制御して作業を実行する手続き記憶学習のためのコンピュータ実行可能命令を含む、コンピュータ可読持続性記憶媒体であって、前記命令がコンピュータによって実行されると前記コンピュータに請求項1に記載の方法を遂行させる、コンピュータ可読持続性記憶媒体。
  11. 前記コンピュータによって実行されると前記コンピュータに請求項2に記載の方法を遂行させる、コンピュータ実行可能命令をさらに含む、請求項10に記載のコンピュータ可読持続性記憶媒体。
  12. 前記コンピュータによって実行されると前記コンピュータに請求項5に記載の方法を遂行させる、コンピュータ実行可能命令をさらに含む、請求項10に記載のコンピュータ可読持続性記憶媒体。
JP2013018336A 2012-02-21 2013-02-01 手続き記憶学習およびロボット制御 Expired - Fee Related JP5759495B2 (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US13/400,969 US8805581B2 (en) 2012-02-21 2012-02-21 Procedural memory learning and robot control
US13/400,969 2012-02-21

Publications (2)

Publication Number Publication Date
JP2013169644A true JP2013169644A (ja) 2013-09-02
JP5759495B2 JP5759495B2 (ja) 2015-08-05

Family

ID=48915394

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2013018336A Expired - Fee Related JP5759495B2 (ja) 2012-02-21 2013-02-01 手続き記憶学習およびロボット制御

Country Status (3)

Country Link
US (1) US8805581B2 (ja)
JP (1) JP5759495B2 (ja)
DE (1) DE102013202378B4 (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106965171A (zh) * 2016-01-14 2017-07-21 发那科株式会社 具备学习功能的机器人装置
JP2017127964A (ja) * 2016-01-14 2017-07-27 ファナック株式会社 学習機能を備えたロボット装置
WO2018016568A1 (ja) * 2016-07-22 2018-01-25 川崎重工業株式会社 ロボットの運転方法、コンピュータプログラム、及びロボットシステム

Families Citing this family (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE102014204475A1 (de) * 2014-03-11 2015-09-17 Kuka Systems Gmbh Verfahren zum Betreiben eines Roboters
US9737990B2 (en) 2014-05-16 2017-08-22 Microsoft Technology Licensing, Llc Program synthesis for robotic tasks
US11370128B2 (en) 2015-09-01 2022-06-28 Berkshire Grey Operating Company, Inc. Systems and methods for providing dynamic robotic control systems
US10647002B2 (en) 2015-09-01 2020-05-12 Berkshire Grey, Inc. Systems and methods for providing dynamic robotic control systems
CN113894826A (zh) 2016-02-08 2022-01-07 伯克希尔格雷股份有限公司 用于提供使用运动规划的各种物体的处理的系统和方法
CN105619408B (zh) * 2016-02-24 2017-10-27 中国科学院自动化研究所 一种类人机器人上肢运动模型的类神经精准控制方法
EP3592510B1 (en) 2017-03-06 2023-09-06 Berkshire Grey Operating Company, Inc. Systems and methods for efficiently moving a variety of objects
JP6669715B2 (ja) * 2017-11-30 2020-03-18 ファナック株式会社 振動抑制装置
WO2020086995A1 (en) 2018-10-25 2020-04-30 Berkshire Grey, Inc. Systems and methods for learning to extrapolate optimal object routing and handling parameters
EP3696733B1 (en) * 2019-02-13 2024-03-27 Siemens Aktiengesellschaft Encoding and transferring scene and task dependent learning information into transferable neural network layers
US11691279B2 (en) 2019-04-25 2023-07-04 Berkshire Grey Operating Company, Inc. Systems and methods for maintaining vacuum hose life in hose routing systems in programmable motion systems
US11556848B2 (en) * 2019-10-21 2023-01-17 International Business Machines Corporation Resolving conflicts between experts' intuition and data-driven artificial intelligence models
DE102020208280A1 (de) 2020-07-02 2022-01-05 Robert Bosch Gesellschaft mit beschränkter Haftung Verfahren zur Herstellung einer Bewegungsvorrichtung
WO2022212916A1 (en) * 2021-04-01 2022-10-06 Giant.Ai, Inc. Hybrid computing architectures with specialized processors to encode/decode latent representations for controlling dynamic mechanical systems
CN113771014B (zh) * 2021-10-09 2022-03-18 北京中海兴达建设有限公司 一种用于建筑施工的scara智能化机械臂控制方法和系统
DE102021212494B4 (de) 2021-11-05 2024-07-04 Robert Bosch Gesellschaft mit beschränkter Haftung Vorrichtung und Verfahren zur Steuerung einer Robotervorrichtung
US11938633B2 (en) * 2021-12-06 2024-03-26 Fanuc Corporation Autonomous robust assembly planning

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH06114768A (ja) * 1992-09-29 1994-04-26 Toyoda Mach Works Ltd ロボット制御装置
JP2002239960A (ja) * 2001-02-21 2002-08-28 Sony Corp ロボット装置の動作制御方法、プログラム、記録媒体及びロボット装置
JP2007276052A (ja) * 2006-04-06 2007-10-25 Sony Corp 制御システム、記録システム、情報処理装置および方法、プログラム、並びに記録媒体
JP2008525907A (ja) * 2004-12-29 2008-07-17 ノキア コーポレイション 改良型ユーザインターフェイスを有する移動体端末および関連方法

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE4111354A1 (de) * 1991-04-09 1992-10-22 Bodenseewerk Geraetetech Einrichtung zur fuehrung des endeffektors eines roboters laengs einer sollbahn
DE4311290A1 (de) * 1992-04-06 1993-10-14 Siemens Ag Modellbasierte neuronale Bahnführung eines Industrieroboters
EP0589394A1 (en) * 1992-09-21 1994-03-30 Toyoda Koki Kabushiki Kaisha Method and apparatus for controlling a robot using a neural network
DE19854011A1 (de) * 1998-11-12 2000-05-25 Knoll Alois Einrichtung und Verfahren zum Vermessen von Mechanismen und ihrer Stellung
US7003509B2 (en) * 2003-07-21 2006-02-21 Leonid Andreev High-dimensional data clustering with the use of hybrid similarity matrices
US20070288453A1 (en) * 2006-06-12 2007-12-13 D&S Consultants, Inc. System and Method for Searching Multimedia using Exemplar Images

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH06114768A (ja) * 1992-09-29 1994-04-26 Toyoda Mach Works Ltd ロボット制御装置
JP2002239960A (ja) * 2001-02-21 2002-08-28 Sony Corp ロボット装置の動作制御方法、プログラム、記録媒体及びロボット装置
JP2008525907A (ja) * 2004-12-29 2008-07-17 ノキア コーポレイション 改良型ユーザインターフェイスを有する移動体端末および関連方法
JP2007276052A (ja) * 2006-04-06 2007-10-25 Sony Corp 制御システム、記録システム、情報処理装置および方法、プログラム、並びに記録媒体

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106965171A (zh) * 2016-01-14 2017-07-21 发那科株式会社 具备学习功能的机器人装置
JP2017127964A (ja) * 2016-01-14 2017-07-27 ファナック株式会社 学習機能を備えたロボット装置
US10254741B2 (en) 2016-01-14 2019-04-09 Fanuc Corporation Robot apparatus having learning function
WO2018016568A1 (ja) * 2016-07-22 2018-01-25 川崎重工業株式会社 ロボットの運転方法、コンピュータプログラム、及びロボットシステム
JP2018012185A (ja) * 2016-07-22 2018-01-25 川崎重工業株式会社 ロボットの運転方法、コンピュータプログラム、及びロボットシステム
CN109414820A (zh) * 2016-07-22 2019-03-01 川崎重工业株式会社 机器人的运转方法、计算机程序、及机器人系统
CN109414820B (zh) * 2016-07-22 2022-06-17 川崎重工业株式会社 机器人的运转方法、储存部、及机器人系统

Also Published As

Publication number Publication date
JP5759495B2 (ja) 2015-08-05
DE102013202378B4 (de) 2015-07-02
US8805581B2 (en) 2014-08-12
US20130218335A1 (en) 2013-08-22
DE102013202378A1 (de) 2013-08-22

Similar Documents

Publication Publication Date Title
JP5759495B2 (ja) 手続き記憶学習およびロボット制御
Li et al. Model-free control for continuum robots based on an adaptive Kalman filter
US11235461B2 (en) Controller and machine learning device
Hsiao et al. Grasping pomdps
CN105082132A (zh) 力-扭矩任务的快速机器人模仿学习
Brown et al. A relational approach to tool-use learning in robots
WO2020016717A1 (en) Perform peg-in-hole task with unknown tilt
JP7291185B2 (ja) 力及びトルク誘導ロボット組立のための技術
Park et al. Utilizing online learning based on echo-state networks for the control of a hydraulic excavator
JP2021142632A (ja) 制御装置、ロボット、学習装置、ロボットシステム、および方法
Jamone et al. Incremental learning of context-dependent dynamic internal models for robot control
KR102139229B1 (ko) 인공신경망을 이용한 로봇 매니퓰레이터의 충돌을 감지하는 방법 및 시스템
KR20210052182A (ko) 인공신경망을 이용한 로봇 매니퓰레이터의 충돌을 감지하는 방법 및 시스템
Hitzler et al. Learning and adaptation of inverse dynamics models: A comparison
CN116276998A (zh) 基于强化学习的免手眼标定的机械臂抓取方法及系统
WO2022044615A1 (ja) 学習装置、学習方法、学習プログラム、制御装置、制御方法、及び制御プログラム
Oikawa et al. Assembly robots with optimized control stiffness through reinforcement learning
Kasaei et al. Data-efficient non-parametric modelling and control of an extensible soft manipulator
De Magistris et al. Teaching a robot pick and place task using recurrent neural network
JP7531733B2 (ja) 異なるドメイン内のタスク間の転送
CN113290554B (zh) 一种基于值迭代的Baxter机械臂智能优化控制方法
Malone et al. Efficient motion-based task learning
Hussain et al. Machine Learning Methods of Industrial Automation System in Manufacturing and Control Sector using Joystick with and Robotic Technology
Pretorius et al. A neural network-based kinematic and light-perception simulator for simple robotic evolution
Ning et al. MT-RSL: A multitasking-oriented robot skill learning framework based on continuous dynamic movement primitives for improving efficiency and quality in robot-based intelligent operation

Legal Events

Date Code Title Description
A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20140206

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20140217

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20140519

A602 Written permission of extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A602

Effective date: 20140522

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20140818

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20141202

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20150227

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20150402

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20150508

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20150605

R150 Certificate of patent or registration of utility model

Ref document number: 5759495

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

LAPS Cancellation because of no payment of annual fees