선형 대수학 및 행렬 이론에서 블록 행렬 의 슈르 보어 는 다음과 같이 정의된다.
p , q 가 음이 아닌 정수라고 가정하고, A , B , C , D 가 각각 p × p , p × q , × q 매트릭스라고 가정한다.내버려두다
M = [ A B C D ] {\displaystyle M=\왼쪽[{\begin{matrix}A& B\\C&D\end{매트릭스}\오른쪽]} 그래서 M은 (p + q ) × (p + q ) 행렬이다.
D 가 변위불능인 경우, M행렬 의 블록 D의 Schur 보어 는 다음과 같이 정의된 p × p행렬 이다.
M / D := A − B D − 1 C . [\displaystyle M/D:=A-BD^{-1}C. } A 가 변위불능인 경우, M행렬 의 블록 A 의 슈르 보어 는 q × q행렬 로 정의된다.
M / A := D − C A − 1 B . {\displaystyle M/A:=D-CA^{-1}B.} A 또는 D 가 단수 인 경우, M/A 와 M/D 의 인버스에 일반화된 역 을 대입하면 일반화된 슈르 보수 가 나온다.
슈르보충은 이전에도 사용되었지만 슈르의 보조정리증 을 증명하기 위해 사용했던 잇사이 슈르의 이름을 따서 붙여졌다.[1] 에밀리 버지니아 해인스워스 는 이것을 슈어 보완제 라고 부른 첫 번째 사람이었다.[2] 슈르 보완은 수치 분석, 통계, 매트릭스 분석 분야의 핵심 도구다.
배경 슈르 보어는 매트릭스 M 에서 블록 가우스 제거 를 수행할 때 발생한다. 블록 대각선 아래의 원소를 제거하기 위해 우측 의 블록 하부 삼각 행렬에 의해 행렬 M을 다음과 같이 곱한다.
M = [ A B C D ] → [ A B C D ] [ I p 0 − D − 1 C I q ] = [ A − B D − 1 C B 0 D ] , {\displaystyle {\begin{aigned}&M={\begin{bmatrix}A& B\\\C&D\end{bmatrix}\quad \to \quad {\begin{bmatrix}A& B\\C&D\end{bmatrix}{\bgin{bmatrix} I_{p}&0\\-D^{-1}C& I_{q}\end{bmatrix}={\begin{bmatrix}A-BD^{-1}C&B\\0&D\end{bmatrix},\end{bmatrix}}} 여기 서p 나는 p×p 아이덴티티 매트릭스 를 나타낸다.그 결과, 슈르 보충제는 M/ D = A - B D - 1 C {\ 디스플레이 스타일 M/D=A-BD^{-1}C} 가 왼쪽 상단 p ×p 블록에 나타난다 .
이 지점 이상으로 제거 프로세스 계속(즉, 블록 가우스-요르단 제거 수행)
[ A − B D − 1 C B 0 D ] → [ I p − B D − 1 0 I q ] [ A − B D − 1 C B 0 D ] = [ A − B D − 1 C 0 0 D ] , {\displaystyle {\begin{aigned}&{\begin{bmatrix}A-BD^{1}C&B\\0&D\end{bmatrix}\quad \to \quad {\begin{bmatrix} I_{p}&-BD^{-1}\\0& I_{q}\end{bmatrix}{\begin{bmatrix}A-BD^{-1}C&B\\0&D\end{bmatrix}}={\begin{bmatrix}A-BD^{-1}C&0\0���&#&#&#&##&#&#&#&#&#&#&#&#&# D\end{bmatrix},\end{aigned}}} M 의 LDU 분해 로 이어지며, M은 다음과 같다.
M = [ A B C D ] = [ I p B D − 1 0 I q ] [ A − B D − 1 C 0 0 D ] [ I p 0 D − 1 C I q ] . {\displaystyle {\reasoned} M&={\begin{bmatrix}A& B\\C&D\end{bmatrix}={\begin{bmatrix} I_{p}&BD^{-1}\\0& I_{q}\end{bmatrix}{\begin{bmatrix}A-BD^{-1}C&0\\0> D\end{bmatrix}{\begin{bmatrix} I_{p}&0\\D^{-1}C& I_{q}\end{bmatrix}. \end{정렬}}} 따라서 M 의 역행은 D 를−1 포함하며, 존재한다고 가정하면 슈르의 보어의 역행은 다음과 같이 표현될 수 있다.
M − 1 = [ A B C D ] − 1 = ( [ I p B D − 1 0 I q ] [ A − B D − 1 C 0 0 D ] [ I p 0 D − 1 C I q ] ) − 1 = [ I p 0 − D − 1 C I q ] [ ( A − B D − 1 C ) − 1 0 0 D − 1 ] [ I p − B D − 1 0 I q ] = [ ( A − B D − 1 C ) − 1 − ( A − B D − 1 C ) − 1 B D − 1 − D − 1 C ( A − B D − 1 C ) − 1 D − 1 + D − 1 C ( A − B D − 1 C ) − 1 B D − 1 ] = [ ( M / D ) − 1 − ( M / D ) − 1 B D − 1 − D − 1 C ( M / D ) − 1 D − 1 + D − 1 C ( M / D ) − 1 B D − 1 ] . {\displaystyle {\begin{aigned}M^{-1}={\begin{bmatrix}A& B\\C&D\end{bmatrix}^{-1}={}&\왼쪽({\begin{bmatrix}) I_{p}&BD^{-1}\\0& I_{q}\end{bmatrix}{\begin{bmatrix}A-BD^{-1}C&0\\0> D\end{bmatrix}{\begin{bmatrix} I_{p}&0\\D^{-1}C& I_{q}\end{bmatrix}\오른쪽)^{-1}\\={}&{\begin{bmatrix} I_{p}&0\\-D^{-1}C& I_{q}\end{bmatrix}{\begin{bmatrix}\왼쪽(A-BD^{-1}C\right)^{-1}&0\D^{-1}\end{bmatrix}}{\gin{bmatrix}} I_{p}&-BD^{-1}\\0& I_{q}\end{bmatrix}}\\[4pt]={}&,{\begin{bmatrix}(A-BD^{-1}C\right)^{)}&, -\left(A-BD^{-1}C\right)^ᆱBD^ᆲ\\-D^ᆳC\left(A-BD^{-1}C\right)^{)}&.D^ᆭ+D^ᆮC\left(A-BD^{-1}C\right)^{)}BD^{)}\end{bmatrix}}\\[4pt]={}&,{\begin{bmatrix}(M/D\right)^{)}&, -\left(M/D\right)^ᆵBD^ᆶ\\-D^ᆷC\left(M/D\right)^{)}&.D^{)}+D^{)}C\left(M/D\rig ht)^{-1}BD^{-1}\end{bmatrix}}. \end{정렬}}} 상기 관계는 D 와−1 M/D 를 수반하는 제거 작업에서 비롯된다. 등가 도출 은 A와 D의 역할을 상호 교환하여 수행할 수 있다.이 두 가지 다른 방법으로 얻은 M 에−1 대한 표현을 동일시함으로써 M : M/D 와 M/A 의 두 가지 Schur 보완과 관련된 매트릭스 반전 보조정리 (Woodbury 매트릭스 아이덴티티 § Alternative proofs의 "LDU 분해로부터의 탈리버전" 참조)를 설정할 수 있다.
특성. p 와 q 가 둘 다 1이면(즉 , A, B , C , D 는 모두 스칼라) 우리는 2x2 행렬의 역행렬에 대한 친숙한 공식을 얻는다. M − 1 = 1 A D − B C [ D − B − C A ] {\displaystyle M^{-1}={\frac {1}{AD-BC}\왼쪽[{\begin{matrix}D&-B\-C&A\end{matrix}\오른쪽]} AD - BC 가 0이 아닌 경우.일반적으로 A 가 변절불능이면 M = [ A B C D ] = [ I p 0 C A − 1 I q ] [ A 0 0 D − C A − 1 B ] [ I p A − 1 B 0 I q ] , M − 1 = [ A − 1 + A − 1 B ( M / A ) − 1 C A − 1 − A − 1 B ( M / A ) − 1 − ( M / A ) − 1 C A − 1 ( M / A ) − 1 ] {\displaystyle {\reasoned} M&={\begin{bmatrix}A& B\\C&D\end{bmatrix}={\begin{bmatrix} I_{p}&0\\ CA^{-1}& I_{q}\end{bmatrix}{\begin{bmatrix} A&0\\\0&D-CA^{-1B\end{bmatrix}{\begin{bmatrix} I_{p}&A^{-1}B\\0& I_{q}\end{bmatrix},\\[4pt] M^{-1}&={\begin{bmatrix}A^{-1}+A^{-1}B(M/A)^{-1}CA^{-1}&-A^{-1}B(M/A)^{-1}\\-(M/A)^{-1}CA^{-1}&(M/A)^{-1}\end{bmatrix}}\end{aligned}}} 이 역이 존재할 때마다 A , 각 D 가 변위불능일 때 M 의 결정인자는 또한 다음과 같이 분명하게 나타난다. det ( M ) = det ( A ) det (D - C A - 1 B ) {\ displaystyle \det(M)=\det(A)\det(D-CA^{-1}B\right )}, 각각. det ( M ) = det ( D ) det (A - B D - 1 C ) {\ displaystyle \det(M)=\det(D)\det (D)\depleft(A-BD^{-1}C\right )},2 × 2 행렬에 대한 결정 공식을 일반화한다. (Guttman rank additivity 공식) D 가 변절불능이면 M 의 랭크 는 다음과 같이 주어진다. 등수를 매기다 ( M ) = 등수를 매기다 ( D ) + 등수를 매기다 ( A − B D − 1 C ) {\displaystyle \operatorname {rank}=\operatorname {rank}(D)+\operatorname {rank} \left(A-BD^{-1}C\right)} (Haynsworth 관성 부가성 공식 ) A 가 변위성이면 블록 매트릭스 M 의 관성 + M /A 의 관성과 동일 하다.
선형 방정식 해결에 적용 슈르 보어는 다음과[3] 같은 선형 방정식의 시스템을 풀 때 자연적으로 발생한다.
[ A B C D ] [ x y ] = [ u v ] {\ displaystyle {\begin{bmatrix}A& B\\\C&D\end{bmatrix}{\bgin{bmatrix}x\\y\end{bmatrix}={\begin{bmatrix}u\v\end{bmatrix }}}}}}.
서브트릭스 A {\displaystyle A} 을 (를) 변환할 수 없다고 가정하면 다음과 같이 방정식에서 x {\displaystyle x} 을(를) 제거할 수 있다.
x = A - 1 ( u - B y ) {\displaystyle x=A^{-1}(u-By)} .
이 식을 두 번째 방정식으로 대체하는 것
( D - C A - 1 B ) y = v - C A - 1 u {\displaystyle \left(D-CA^{-1}B\right)y=v-CA^{-1}u } 이것을 원래 방정식에서 x {\displaystyle x} 을(를) 제거하여 얻은 축소 방정식 이라고 한다. 축소 방정식에 나타나는 행렬을 M {\displaystyle M} 의 첫 번째 블록 A {\displaystyle A} 의 Schur 보완이라고 한다.
S = d e e D - C A - 1 B {\displaystyle S\\\\overset {\underset {\mathrm {def}{}{}}{{=}\ D-CA^{-1B} . 감소된 방정식을 풀어서 우리는 얻는다.
y = S - 1 ( v - C A - 1 u ) {\ displaystyle y=S^{-1}\좌측(v-CA^{-1}u\우측)} . 이것을 첫 번째 방정식으로 대체하는 것
x = ( A - 1 + A - 1 B S - 1 C - 1 ) u - A - 1 B - 1 v {\displaystyle x=\좌측(A^{-1}+ A^{-1}+A^{-1} BS^{-1}BC^{-1 }{-1}\우측 )u-A^{-1}BS ^{-1}{-1}. 위의 두 방정식을 다음과 같이 표현할 수 있다.
[)y])[A− 1+A− 1BS− 1C− 1− − 1BS− 1− S− 1C− 1S− 1][u'v']{\displaystyle{\begin{bmatrix}x\\y\end{bmatrix}}={\begin{bmatrix}A^{)}+A^{)}BS^{)}CA^{)}&, -A^{)}BS^{)}\\-S^{)}CA^{)}&을 말한다.S^{)}\end{bmatrix}}{\begin{bmatrix}u\\v\end{bm atrix}} . 따라서 블럭 행렬의 역행렬에 대한 공식은 다음과 같다.
[ A B C D ] - 1 = [ A - 1 + A - 1 B S - 1 C - 1 - A - 1 B - 1 - S - 1 C - 1 S - 1 S - 1 S - 1 ] {\ displaystyle {\begin{bmatrix}A& gt; B\\C&D\end{bmatrix}}^{-1}={\begin{bmatrix}A^{-1}+A^{-1}BS^{-1}CA^{-1}&-A^{-1}BS^{-1}\\-S^{-1}CA^{-1}&S^{-1}\end{bmatrix}}} . 특히, 우리는 슈어 보수가 M {\displaystyle M} 의 역행의 2 ,2} 블록 엔트리의 역행임을 알 수 있다.
실제로 이 알고리즘이 수치적으로 정확하려면 A {\displaystyle A} 이(가) 잘 갖춰져 있어야 한다.
전기 공학에서 이것은 흔히 노드 제거 또는 크론 감소 라고 불린다.
확률 이론 및 통계에 대한 적용 랜덤 열 벡터 X , Y 가 각각 R 과n R 에m 살고, 벡터 n + m (X , Y )가 다변량 정규 분포 를 가지며 공분산이 대칭 양-확정성 행렬이라고 가정하자.
Σ = [ A B B T C ] , {\displaystyle \Sigma =\왼쪽[{\begin{matrix}A& B\\B^{\mathsf {T}&C\end{matrix}\오른쪽,} where A ∈ R n × n {\textstyle A\in \mathbb {R} ^{n\times n}} is the covariance matrix of X , C ∈ R m × m {\textstyle C\in \mathbb {R} ^{m\times m}} is the covariance matrix of Y and B ∈ R n × m {\textstyle B\in \mathbb {R} ^{n\times m}} is the covariance matrix between X and Y .
그러면 주어진 X 의 조건부 공분산 은 σ {\textstyle \Sigma }: [4]
코브 ( X ∣ Y ) = A − B C − 1 B T E ( X ∣ Y ) = E ( X ) + B C − 1 ( Y − E ( Y ) ) {\displaystyle {\begin}\operatorname {Cov}(X\mid Y)&=A-BC^{-1B^{\mathsf{T}\\\\operatorname {E}(X)&=\operatorname {E}(X)+) BC^{-1}(Y-\operatorname {E}(Y)\end{aigned}}}} 위의 행렬 σ{\displaystyle \Sigma } 을 랜덤 벡터의 공분산이 아닌 표본 공분산으로 본다면 위시아트 분포 가 있을 수 있다. 이 경우 σ{\displaystyle \Sigma } 에 있는 C의 슈르 보충판도 위시아트 분포를 가진다.[citation needed ]
양의 정의 및 반정의 조건 X 가 대칭 행렬이 되도록 한다.
X = [ A B B T C ] . {\displaystyle X=\왼쪽[{\begin{matrix}A& B\\B^{\mathsf{T}&C\end{matrix}\오른쪽] } 그러면
A 가 변위할 수 없는 경우, A 와 그 보완 X/A가 모두 양수인 경우에만 X 가 양수확정이다. X ≻ 0 ⇔ A ≻ 0 , X / A = C − B T A − 1 B ≻ 0. {\displaystyle X\such 0\Leftrightarrow A\such 0,X/A=C-B^{\mathsf{T}A^{-1}B\such 0. } [5] C 가 변위할 수 없는 경우, C 와 그 보완 X/C가 모두 양수일 경우에만 X 가 양수일 경우: X ≻ 0 ⇔ C ≻ 0 , X / C = A − B C − 1 B T ≻ 0. {\displaystyle X\such 0\Leftrightarrow C\such 0,X/C=A-BC^{-1B^{\mathsf{T}\such 0. } A 가 양수인 경우, X 가 양수인 경우 에만 양수인 반수확수 X/A 가 양수인 경우: 만약 A ≻ 0 , 그때 X ⪰ 0 ⇔ X / A = C − B T A − 1 B ⪰ 0. {\displaystyle {\text{ }}A\such 0,{\text{}}}X\succeq 0\왼쪽 오른쪽 화살표 X/A=C-B^{\mathsf{T}A^{-1}B\succeq 0.} [5] C 가 양수인 경우, X가 양수인 경우 에만 X가 양수 반수확이다. 만약 C ≻ 0 , 그때 X ⪰ 0 ⇔ X / C = A − B C − 1 B T ⪰ 0. {\displaystyle {\text{ }}}C\such 0,{\text{}}}X\succeq 0\좌우 이동 X/C=A-BC^{-1}B^{\mathsf{T}\succeq 0.} 첫 번째와 세 번째 문장은 수량의 최소화를 고려하여 도출할[3] 수 있다.
u T A u + 2 v T B T u + v T C v , {\displaystyle u^{\mathsf{T}Au+2v^{\mathsf {T}B^{\mathsf {{T}u+v^{\mathsf {T}Cv,\,} v 의 함수로서 (고정 u 의 경우)
게다가, 그 이후로
[ A B B T C ] ≻ 0 ⟺ [ C B T B A ] ≻ 0 왼쪽[{\begin{matrix}A& B\\\B^{\mathsf{T}&C\end{matrix}\오른쪽]\such 0\Long 왼쪽 오른쪽 화살표 \왼쪽[{\begin{matrix}C> B^{\mathsf{T}\\B& A\end{matrix}\오른쪽]\such 0} 그리고 유사하게 양의 반-반-반-반-반-반-반-반-반-반-반-반-반-반-반-반-반-반-반-반-반-반-반-반-반-반-반
일반화된 슈르 보완의 관점에서 X 의 양의 반정의 충분하고 필요한 조건도 있다.[1] 바로 그거야
X ⪰ 0 ⇔ A ⪰ 0 , C − B T A g B ⪰ 0 , ( I − A A g ) B = 0 {\displaystyle X\succeq 0\Leftrightarrow A\succeq 0,C-B^{\mathsf {T}}A^{g}B\succeq 0,\left(I-AA^{g}\right) B =0\,} 및 X ⪰ 0 ⇔ C ⪰ 0 , A − B C g B T ⪰ 0 , ( I − C C g ) B T = 0 , {\displaystyle X\succeq 0\왼쪽 오른쪽 화살표 C\succeq 0,A-BC^{g}B^{\mathsf{T}\succeq 0,\reft(I-CC^{g}\우) B^{\mathsf{T}=0,} 여기서 a g {\ displaystyle A^{g} 는 A {\displaystyle A} 의 일반화된 역수 를 의미한다.
참고 항목
참조 ^ a b Zhang, Fuzhen (2005). Zhang, Fuzhen (ed.). The Schur Complement and Its Applications . Numerical Methods and Algorithms. Vol. 4. Springer. doi :10.1007/b105056 . ISBN 0-387-24271-6 . ^ Haynsworth, E. V. "On the Schur Compons", Basel Mathemical Notes , #BNB 20, 17페이지, 1968년 6월. ^ a b 보이드, S., 반덴베헤, L. (2004), "콘벡스 최적화", 캠브리지 대학 출판부(부록 A.5.5) ^ von Mises, Richard (1964). "Chapter VIII.9.3". Mathematical theory of probability and statistics . Academic Press. ISBN 978-1483255385 . ^ a b Zhang, Fuzhen (2005). The Schur Complement and Its Applications . Springer. p. 34.