高代课外题2

高代课外题2

1.(华罗庚不等式)Let \(A,B\in \mathbb{C}^{n\times n}\) be such that \(I-AA^{*} \geqslant 0\), \(I-BB^{*} \geqslant 0\). Then \[ (\det(I-AB^*))^2\geqslant \det(I-AA^*) \cdot \det(I-BB^*)\]

proof 1[1]:首先证明一个引理:

Lemma 设Hermite阵 \(A\geqslant 0\)\(B\geqslant 0\).则 \[ \det(A+B) \geqslant \det(A) + \det(B)\] 等号成立 \(\Longleftrightarrow\) \(A=0\)\(B=0\)\(\det(A+B)=0\)

proof 由谱定理,存在酉阵\(P\),使得 \(PBP^*=\Lambda=\text{diag} (\lambda_1,\cdots,\lambda_n), \lambda_1 \geqslant \cdots \geqslant \lambda_n \geqslant 0\)\(B\)的特征值. 因为 \(\det(A+B)=\det(PAP^*+\Lambda)\)\(\det(A)=\det(PAP^*)\)\(\det(B)=\det(\Lambda)\),且 \(PAP^*\geqslant 0\),故不失一般性,可假设 \(B=\Lambda\).

\(\det(A+\Lambda)\)展开,得 \[\det(A+\Lambda)=\det(A)+\sum_{i=1}^n\lambda_i d_i+\cdots+\prod_{i=1}^n\lambda_i\]

其中 \(d_{i_1\cdots i_k}\)表示从 \(A\)中剔除第 \(i_1,\cdots,i_k\)行和列之后剩下方阵的行列式,因为 \(A\geqslant 0\),故所有的 \(d_{i_1\cdots i_k}\geqslant 0\). 又 \(\det(B)=\prod_{i=1}^n\lambda_i\),故 \[\det(A+\Lambda)\geqslant \det(A)+\det(\Lambda)\]

现在证明等号成立的充要条件. 充分性是显然的. 以下证必要性,分两种情况来考虑.

(1)若 \(\det(B)\neq 0\),此时每个 \(\lambda_i\neq 0\). 此时必有对一切可能的指标,\(d_{i_1\cdots i_n}=0\). 特别当\(k=n-1\)时知道\(A\)的所有对角元为零. 但 \(A\geqslant 0\),故\(A=0\).

(2)若 \(\det(B)=0\),但 \(B\neq 0\). 此时至少有一个 \(\lambda_i \neq 0\). 因所有 \(d_{i_1\cdots i_k} \geqslant 0\),但从等号成立知,至少有一个 \(d_{i_1\cdots i_k} = 0\). 故\(A\)不可能是正定的,于是 \(\det(A)=0\). 由等号成立知,\(\det(A+B)=0\),证毕.

回到原题,一个重要的观察是(不妨\(I-AA^*,I-BB^*\)均正定) \[ (I-AB^*)(I-BB^*)^{-1}(I-AB^*)^* =(I-AA^*)+(A-B)(I-B^*B)^{-1}(A-B)^* \]

这个恒等式可以用(不严格的)等比数列展开理解,并用相关的(严格的)恒等式证明。注意 \(\det(I-BB^*)=\det(I-B^*B)\)\(I-AA^* > 0\)\((A-B)(I-BB^*)^{-1}(A-B)^* > 0\). 则 \[ \begin{aligned} &\lvert \det(I-AB^*) \rvert^2[\det(I-BB^*)]^{-1} \\ =&\det[(I-AA^*)+(A-B)(I-B*B)^{-1}(A-B)^*] \\ \geqslant&\det(I-AA^*)+\det(A-B)(I-B^*B)^{-1}(A-B)^* \\ =&\det(I-AA^*)+\lvert\det(A-B)\rvert^2[\det(I-BB^*)]^{-1} \end{aligned} \] 由Lemma知,等号成立当且仅当 \[ (A-B)(I-B^*B)^{-1}(A-B)^*=[(A-B)(I-B^*B)^{-\frac{1}{2}}][(A-B)(I-B^*B)^{-1\frac{1}{2}}]^*=0 \] 当且仅当 \((A-B)(I-B^*B)^{-\frac{1}{2}}=0\) 当且仅当 \(A=B\). 证毕.

注:从Lemma可以得到一个推论

prop. 设Hermite阵\(A\)\(B\)皆为半正定阵,且 \(A\geqslant B\). 且 \(A-B \geqslant 0\),则 \[ \det(A)\geqslant\det(B) \] 这是引理的直接应用.

proof 2:考虑分块矩阵 \[ M= \begin{bmatrix} I & A^* \\ B & I \\ \end{bmatrix} \begin{bmatrix} I & -B^* \\ -A & I \end{bmatrix} \] 和上面的引理.

2. Let \(H_1,H_2\in \mathbb{C^{n\times n}}\) such that \(H_1^*=H_1\), \(H_2^*=H_2\), \(H_1>0\), \(H_2>0\). Then

(1) If \(H_2-H_1>0\), then \(H_1^{-1}-H_2^{-1}>0\).

(2) (Minkowski) \(\lvert H_1 \rvert^{\frac{1}{n}}+\lvert H_2 \rvert^{\frac{1}{n}} \leqslant \lvert H_1+H_2 \rvert^{\frac{1}{n}}\) and the equality holds iff \(H_2=aH_1\), for some \(a\in \mathbb{R}^+\).

:首先证明一个引理:

Lemma 设\(A\)\(B\)为两个\(n\)阶Hermite阵. \(A>0\)\(B\geqslant 0\),则

  1. \(A\geqslant B \Longleftrightarrow \lambda_1(BA^{-1})\leqslant 1\)

  2. \(A > B \Longleftrightarrow \lambda_1(BA^{-1})< 1\).

这里 \(\lambda_1(A)\)表示\(A\)的最大特征值.

proof: (1)我们有 \[ \begin{aligned} A\geqslant B &\Longleftrightarrow A^{-\frac{1}{2}}(A-B)A^{-\frac{1}{2}}\geqslant 0 \\ &\Longleftrightarrow I_n-A^{-\frac{1}{2}}BA^{-\frac{1}{2}}\geqslant 0 \\ &\Longleftrightarrow \lambda_1(I_n-A^{-\frac{1}{2}}BA^{-\frac{1}{2}})\geqslant 0 \\ &\Longleftrightarrow\lambda_1(A^{-\frac{1}{2}}BA^{-\frac{1}{2}})\leqslant 1 \\ &\Longleftrightarrow\lambda_1(BA^{-1})\leqslant 1 \end{aligned} \]

故(1)得证. 同法可证(2),引理证毕.

利用引理,\(H_2> H_1\Longleftrightarrow \lambda_1(H_1H_2^{-1})< 1\Longleftrightarrow \lambda_1(H_2^{-1}H_1)< 1 \Longleftrightarrow H_1^{-1}> H_2^{-1}\)

  1. 不失一般性,可以假设\(H_1=I\),于是问题归结为证明 \[ (\det(I_n+H_2))^{\frac{1}{n}}\geqslant 1+(\det(B))^{\frac{1}{n}} \]

\(\lambda_1\geqslant\cdots\geqslant\lambda_n>0\)\(H_2\)的特征值,则上面的不等式等价于 \[ \prod_{i=1}^n(1+\lambda_i)\geqslant(1+\sqrt[n]{\lambda_1\cdots\lambda_n})^n \] 这是Holder不等式的特殊情况. 等号成立当且仅当\(\lambda_1=\cdots\lambda_n=a\),此即\(H_2=aH_1\).

3. Assume that \(n \leqslant m\), and \(A\in \mathbb{C}^{n\times m}\), \(B\in \mathbb{C^{m\times p}}\), \(r(A)=n\). Show that \[\det[B^*(I_m-A^*(AA^*)^{-1}A)B] \leqslant \det(B^*B)\]

proof1:我们的目标是利用第一题中的Lemma. 注意\(B^*B\)正定,\(B^*A^*(AA^*)^{-1}AB\)正定,故我们只需要证明\(I_m-A^*(AA^*)^{-1}A\)正定即可,不妨设\(AA^*=\text{diag}(\lambda_1,\cdots,\lambda_n)\),其中\(\lambda_i\)均为实数. 我们有 \[ A^*\text{diag}(\frac{1}{\lambda_1},\cdots\frac{1}{\lambda_n})A=\frac{1}{\lambda_1\cdots\lambda_n}A^*A \]\[ (A^*A)^2=A^*AA^*A=A^*\text{diag}(\lambda_1\cdots\lambda_n)A=\lambda_1\cdots\lambda_nA^*A \] 于是\(A^*(AA^*)^{-1}A\)的特征值都不大于1. 故\(I_m-A^*(AA^*)^{-1}A\)正定,证毕.

proof 2:事实上 \(A^*(AA^*)^{-1}A\)\((AA^*)^{-1}AA^*=I_n\)有相同的非零特征值,故事实上\(A^*(AA^*)^{-1}A\)所有非零特征值都为 \(1\).

4. Let \(H\in \mathbb{C}^{n\times n}\) be such that \(H^*=H\) and \(H\geqslant 0\), then there exists a unique semipositive-definite Hermite matrix \(S\) such that \(H=S^2\). Furthermore, \(S\) is a polynomial of \(H\).

proof:首先由\(H\)自伴知存在酉矩阵\(P\),使得\(H=P\text{diag}(\lambda_1,\cdots,\lambda_n)P^*\),其中\(\lambda_i\)均为正实数. 易知\(S=P\text{diag}(\sqrt{\lambda_1},\cdots,\sqrt{\lambda_n})P^*\)满足\(H=S^2\). 唯一性是容易的.

其次,不妨设\(\sqrt{\lambda_1},\cdots,\sqrt{\lambda_n}\)中有且仅有\(t\)个互不相同的值\(\sqrt{\lambda_1},\cdots,\sqrt{\lambda_t}\),构造一个Lagrange插值多项式 \[ f(\lambda)=\sum_{i=1}^t\sqrt{\lambda_i}\prod_{k\neq i}\frac{\lambda-\lambda_k}{\lambda_i-\lambda_k} \] 于是 \[ \text{diag}(\sqrt{\lambda_1},\cdots,\sqrt{\lambda_n})=f(\text{diag}(\lambda_1,\cdots,\lambda_n)) \] 从而 \[ S=P\text{diag}(\sqrt{\lambda_1},\cdots,\sqrt{\lambda_n})P^*=f(H) \]

5. Let \(H \in \mathbb{C}^{2n}\) be such that \(H^*=H\), \(H>0\), and \(HJ=J\bar{H}\), where

\[J=\begin{bmatrix} 0 & I_n \\ -I_n & 0 \\ \end{bmatrix} \]

show that there exists \(Q\in GL_{2n}(\mathbb{C})\) such that \(QJ=J\bar{Q}\), and \(H=Q^*Q\).

:设 \(Q\)\(H\)的唯一的平方根,\(Q^*=Q\). 则 \(Q\)\(H\)的多项式,可设 \(Q=g(H)\),其中 \(g(x)\in \mathbb{C}[x]\). 则 \[ QJ=g(H)J=Jg(\bar{H})=J \overline{g(H)}=J \bar{Q} \]

6. Let V be a n-dimensional inner space, and \(V_1,\cdots,V_s\) are finitely many proper subspaces of \(V\). Then there exists an orthonormal basis \(\{\alpha_1,\cdots,\alpha_n\}\) of \(V\) such that \(\alpha_i\notin \bigcup_{j=1}^sV_j, i=1,2,\cdots,n\).

proof:先取一个\(\alpha_1\),使得\(\alpha_1\in V/\bigcup_{j=1}^sV_j/\bigcup_{j=1}^sV_j^\bot\),这是经典的结果. 于是\(\langle\alpha_1\rangle ^\bot\)与诸\(V_j\)相交得到的线性空间仍然是\(\langle\alpha_1\rangle ^\bot\)中的真子空间. 可以继续取\(\alpha_2,\cdots\)直到取到\(\alpha_n\).

7. Let \(A,B\in O(n)\) i.e. \(A,B\in \mathbb{R}^{n\times n}\), and \(A^{\mathsf{T}} A=I\), \(B^{\mathsf{T}} B=I\). If \(\det(A)+\det(B)=0\), then \(\det(A+B)=0\).

proof:不妨\(\det(A)=-\det(B)=1\),注意到\((A+B)^\top=A^\top(A+B)B^\top\)即可.

这个问题还可以这么理解:将行列式看成是线性变换下的有向体积,那么\(A\)\(B\)是两个定向相反的线性映射,故\(A+B\)自然就将一个单位正方体映成两个体积为\(1\)\(-1\)的平行\(2n\)面体的叠加,自然有\(\det(A+B)=0\).

8. Assume that \(P\in O(n)\), and \(A=\text{diag}(a_1,\cdots,a_n)\), \(a_i\in \mathbb{R}\), then the eigenvalues \(\lambda_j,1\leqslant j \leqslant n\) of \(PA\) satisfies \(m\leqslant\lvert\lambda_j \rvert \leqslant M\), where \(m=\min_{1\leqslant j\leqslant n}\{a_j\}\), \(M=\max_{1\leqslant j\leqslant n}\{a_j\}\).

proof:简单的放缩,具体过程略.

9. Let \(A\in O(n)\), and \(B\) a square submatrix of \(A\). Then any complex eigenvalue \(\lambda\) of \(B\) satisfies that \(\bar{\lambda}\lambda \leqslant 1\).

proof:一个重要的观察是,因为交换正交矩阵的任意两行、任意两列不改变矩阵的正交性质,故可以不妨假设\(B\)\(A\)的左上角的\(k\)阶主子式. 将A写成: \[ A= \begin{bmatrix} B & A_{12} \\ A_{13} & A_{14} \\ \end{bmatrix} \]

那么,由\(A^{\mathsf{T}} A=I\),可以得到 \[ B^{\mathsf{T}} B+A_{13}^{\mathsf{T}} A_{13}=I_k \]

假设\(\lambda\)\(B\)的任意一个(复)特征值,对应的特征向量为\(\alpha\). 在上式两边左乘\(\alpha^*\),右乘\(\alpha\),移项,得: \[ \alpha^*A_{13}^{\mathsf{T}} A_{13}\alpha=(1-\bar{\lambda}\lambda)\alpha^*\alpha \] 显然有\(\bar{\lambda}\lambda\leqslant 1\).

10. Give the maximal \(r\) such that there exist \(\beta_1,\cdots,\beta_r\) satisfying \((\beta_i | \beta_j)<0, 1\leqslant i<j \leqslant r\).

proof: 题目意思应该是求\(n\)维欧氏空间中两两成钝角的向量最多有几个,答案是\(n+1\)个.

考虑\(n+1\)个向量\(v_1=(n+\sqrt{1+n},-1,-1,\cdots,-1)\),\(v_2=(-1,n+\sqrt{1+n},-1,\cdots,-1)\),\(\cdots\),\(v_n=(-1,-1,\cdots,n+\sqrt{1+n})\)\(v_{n+1}=(-1-\sqrt{1+n},\cdots,-1-\sqrt{1+n})\),易见他们之间两两成钝角.

也可以用归纳法:假设对 \(n-1\)维空间满足,考虑由一组标准正交基 \(\alpha_1,\alpha_2,\cdots,\alpha_n\)张成的 \(n\)维空间. 由假设,\(\tilde{\beta}_1,\tilde{\beta}_2,\cdots,\tilde{\beta}_n \in L(\alpha_1,\alpha_2,\cdots,\alpha_{n-1})\) 两两成钝角,令 \[ \begin{cases} \beta_i=\tilde{\beta}_i \quad 1\leqslant i\leqslant n-1\\ \beta_n=\tilde{\beta}_n+\alpha_n \\ \tilde{\beta}_{n+1}=\tilde{\beta}_n-2(\tilde{\beta}_n|\tilde{\beta}_n)\alpha_n \end{cases} \] 则它们两两成钝角.

假设有\(n+2\)个向量\(a_1,\cdots,a_{n+2}\)两两成钝角,因存在不全为零的系数\(k_1,k_2,\cdots,k_{n+1}\)使得 \[ k_1a_1+\cdots+k_{n+1}a_{n+1}=0 \] 上式两端点乘\(a_{n+2}\),假设\(k_1,\cdots,k_i\)为正,\(k_{i+1},\cdots,k_j\)为负,其余为零,则有 \[ k_1a_1+\cdots+k_ia_i=-k_{i+1}a_{i+1}-\cdots-k_ja_j=V \] 那么 \[ V\cdot V=(k_1a_1+\cdots+k_ia_i)(-k_{i+1}a_{i+1}-\cdots-k_ja_j)=-k_1k_{i+1}a_1\cdot a_{i+1}-\cdots<0 \] 矛盾!故最多有\(n+1\)个两两之间成钝角的向量.

其实该结论在Hermite空间中也对,上面的做法用到了实数的序关系,因此不具有推广价值,可以利用下面的归纳法证明:

假设对 \(n-1\)维空间,至多有 \(n\)个两两成钝角的向量. 考虑 \(n\)维空间的情况.

假设存在 \(\beta_1,\beta_2,\cdots,\beta_{n+2}\)使得它们之间两两成钝角,对 \(\beta_1,\beta_2,\cdots,\beta_{n-1}\)找一组子空间的标准正交基 \(\alpha_1,\alpha_2,\cdots,\alpha_{n-1}\),再将其扩充为原空间的一组标准正交基 \(\alpha_1,\alpha_2,\cdots,\alpha_n\),设 \[ \beta_n=\gamma_n+a_n \alpha_n \\ \beta_{n+1}=\gamma_{n+1}+a_{n+1}\alpha_n \\ \beta_{n+2}=\gamma_{n+2}+a_{n+2}\alpha_n \\ \] 那么 \((\gamma_i|\beta_j)<0,n\leqslant i\leqslant n+2,1\leqslant j\leqslant n-1\). 由 \(n-1\)维的归纳假设, \[ (\gamma_i|\gamma_j)\geqslant 0, \quad n\leqslant i,j \leqslant n+2 \] 但是 \((\beta_i|\beta_j)<0,q\leqslant i,j\leqslant n+2\). 故 \(a_n \bar{a}_{n+2}<0,a_{n+1}\bar{a}_{n+2}<0,a_n \bar{a}_{n+1}<0\),从中易得矛盾.

另注:该问题还可以放到\(n+1\)维空间中一个标准的\(n\)维单纯形上看;另一个对偶的问题是\(n\)维欧式空间中大于\(2^n\)个点的集合一定存在钝角.

11. Let \(A\in \mathbb{C}^{n\times n}\), and \(\lambda\) be an eigenvalue of \(A\). Then \(\lvert \lambda \rvert \leqslant \lVert A \rVert\), for any matrix norm of \(A\).

proof:对 \(\varepsilon >0\),令 \[ B=\frac{A}{\left\| A \right\|_{}+\varepsilon } \]\(\left\| B \right\|_{}<1\). 故有 \(B^n \to 0\),即任何 \(B\)的特征值 \(\mu\)都有 \(\left\vert \mu \right\vert <1\). 故对任何 \(A\)的特征值 \(\lambda\),有 \[ \frac{\left\vert \lambda \right\vert }{\left\| A \right\|_{}+\varepsilon }<1 \]\(\varepsilon \to 0\),就有结论成立.

参考

  1. 《矩阵论中不等式》 王松桂 贾忠贞 著 安徽教育出版社 ↩︎

高代课外题2
http://example.com/2022/03/29/高代课外题2/
Author
John Doe
Posted on
March 29, 2022
Licensed under