不少同學在初學線性代數(shù)時感到迷茫、痛苦,體會不到課程的實際意義。這很大程度上是因為,教材為了由淺入深、循序漸進,須從基礎的抽象概念講起,而真正直觀的部分,往往要等到后面的細分領域或具體應用。于是初學者往往知其然,不知其所以然;只見樹木,不見森林。希望本文能讓你換個視角,以輕松有趣的日常眼光,看到一個不一樣的線性代數(shù)。
本文是系列文章《N文粗通線性代數(shù)》的第五篇。在上篇文章中,我們討論了如何處理線性方程組無解、有無窮多解的情形。當A為滿秩方陣時,線性方程
撰文 | 吳進遠
上回書說到,某近視宅男,某日下樓到早點鋪買早餐。眼鏡忘在家里,看不清黑板上寫的價目。于是,宅男就一邊排隊,一邊聽著前邊顧客買早點的品種數(shù)量,和服務員小妹報的總價,據(jù)此計算各種早點品種的單價。
宅男買了早餐,一邊吃,一邊思考。我們知道,只有正方形的矩陣,也就是說,行數(shù)與列數(shù)相同的矩陣,才可能存在逆矩陣。不過,即使是正方形的矩陣,也不一定有逆矩陣。因為一個矩陣存在逆矩陣的條件,除了必須是方的,它還必須是滿秩的。可是,我們在現(xiàn)實世界中,經(jīng)常會遇到不方的矩陣,或者不(列)滿秩的矩陣。對于這種情況,難道我們就只能干瞪眼,一籌莫展嗎?
這個問題本身是一個實實在在的問題。在求解線性方程組的時候,盡管我們可能無法求出方程的唯一解,但我們希望通過這個方程組了解未知數(shù)之間的關系。這就要求我們?nèi)ふ乙粋€任意矩陣的廣義逆矩陣。
(1)假美術老師教的真數(shù)學
一個任意矩陣A,不管這個矩陣是不是方的,也不管它的秩滿不滿,假如有個矩陣G,符合 AGA = A 這樣一個條件,則G就被稱為A的一個廣義逆矩陣。如果同時符合 AGA = A 和 GAG = G 這兩個條件,則G被稱為一個自反的廣義逆矩陣。我們下面討論一個例子。
矩陣的作用可以用坐標變換來解釋,實際上,繪畫攝影都可以看成是坐標變換。當然我這樣說藝術家們會抄起苕帚把我趕出去,所以這里需要限定我們說的是像我這樣的假美術老師。比如有一天,我畫了一個蘋果。
我自己畫技很差,但如果換成一個經(jīng)過訓練的畫家,應該不難畫得像下圖那樣非常像。
這個圖實際是P出來的,用在這里是為了表明有的畫家確實是可以畫到這么像的。
我們可以把攝影看成是一個矩陣:A。它的作用是把實物(x)或者畫作(v)變成照片(u)。
實物變成照片:u = Ax
畫作變成照片:u = Av
同樣,我們可以把繪畫看成一個矩陣:G。它的作用是把實物或者照片變成畫作。
實物變成畫作:v = Gx
照片變成畫作:v = Gu
在現(xiàn)場,我們不難看出畫作和實物是很不相同的,同樣,照片和實物,照片(斜著一定角度拍攝的照片)和畫作也都是不同的。
不過,我們可以進行如下操作:
這個過程中,照片1如果和照片2相同,則繪畫矩陣G可以看成是攝影A的廣義逆矩陣,因為它們符合 AGA = A。
同理,我們可以進行如下操作:
如果畫作1和畫作2相同,則有 GAG = G。
這里強調一下,繪畫顯然不是攝影的逆矩陣,因為我們不可能從照片畫出一個真的蘋果,哪怕是一個三維的模型蘋果也不行。但繪畫卻是攝影的廣義逆矩陣,因為把照片通過繪畫變成畫作之后,再把畫作通過攝影變成照片,這兩張照片是一樣的。
同理,攝影不是繪畫的逆矩陣,但卻是它的廣義逆矩陣。
兩者同時是對方的廣義逆矩陣,并且都是自反的。
(2)尋找靠譜的廣義逆矩陣
現(xiàn)在,我們換數(shù)學老師換一個角度來討論。廣義逆矩陣要滿足什么條件呢?如前所述,對于一個矩陣A,如果有另一個矩陣G,滿足 AGA = A 這個條件,G 就是A的一個廣義逆矩陣。我們?nèi)匀挥媒曊匈I早餐為例,來說明廣義逆矩陣的定義。
比如宅男前面假定只有兩個顧客,如下表所示。
這兩筆買賣構成一個線性方程組,用矩陣乘法寫出來是這樣的:
很顯然,這里我們有三個未知數(shù),卻只有兩個方程,約束條件不夠,不可能有唯一解。從系數(shù)矩陣上看,這個矩陣是矮胖的,顯然不是列滿秩的,因此這個矩陣沒有對應的逆矩陣。但我們可以定義這個矩陣的廣義逆矩陣。
這個定義可以畫成下面這樣一個圖。
早餐店有三種食品,三個單價構成向量x。兩個顧客購買不同品種食品的數(shù)量,構成一個2行3列的矩陣A。而兩位顧客購物總價構成一個有兩個元素的向量y。總價的計算過程是一個矩陣乘法 Ax = y,這個計算如圖中第一行所示。
我們從兩個顧客的購物總價y出發(fā),盡管無法計算出三種食品的準確單價,但完全可能算出一組可能的單價u,如上圖第二行所示。這個算法說到底是把y里的兩個元素拿來做線性組合,這個線性組合可以看成是一個矩陣乘法:u = G y,其中G是A的廣義逆矩陣,它可以從A計算出來,盡管這個計算比較復雜,我們暫時先不討論。注意,這里算出的可能單價u與我們事先知道的單價x完全可能是不相同的,但這組可能單價應該是靠譜的。
可是,“靠譜”又是什么意思呢?我們通過上圖第三行來解釋。簡單說,就是 Au=y。或者說,當我們用這一組新的可能單價去代替我們事先知道的真實單價,以此計算前兩位顧客的購物總價時,得到的結果必須不變。具體在我們這個例子中,我們事先知道的單價:油餅3元,茶葉蛋4元,豆腐腦7元。而使用廣義逆矩陣,我們可能算出另一組可能單價:油餅3元,茶葉蛋5.5元,豆腐腦5.5元。這一組可能單價顯然不是我們事先知道的真實單價,但由這組可能單價算出的兩位顧客的購物總價卻是不變的。實際上,當茶葉蛋單價加豆腐腦單價等于11元時,我們總會得到相同的結果。
(3)廣義逆矩陣可能不止一個
我們要求廣義逆矩陣“靠譜”,或者說 AGA=A,這是一個非常松的條件。因為這個條件很松,因此對于一個矩陣A,完全可能有無窮多個矩陣G滿足條件。因而一個矩陣可能有無窮多個廣義逆矩陣。
當然,如果矩陣A是一個滿秩的方陣,則它的廣義逆矩陣就只有一個,這個廣義逆矩陣就是我們以前學過的逆矩陣。
在 AGA = A 中,確實(GA)這個乘積有點像單位矩陣,因為它與A相乘還會得到A:A(GA) = A,但(GA)通常不是單位矩陣,它通常只能還原A,而不能還原其他矩陣。
(4)在廣義逆矩陣中挑三揀四
雖然滿足 AGA = A 的矩陣G是一個“靠譜”的廣義逆矩陣,但滿足這個條件的矩陣G在一般情況下會有無數(shù)個。像我們前面這個例子中,只要一個矩陣G能算出茶葉蛋單價加豆腐腦單價等于11元,它就可以算一個廣義逆矩陣。
我們自然會想到,能不能讓我們挑選的廣義逆矩陣范圍縮小一點,最好能縮小到只剩下一個?
我們?nèi)祟愐幌蛉绱耍魏问挛餂]有的時候焦慮,多了也焦慮。比如富家小姐挑女婿,先提個條件要個子高,符合條件的多了就又提條件要家里富,然后再提條件要長得帥。
縮小廣義逆矩陣范圍其實也是這個思路,沒有什么萬里挑一的事情不能通過加限制條件來實現(xiàn),如果不行,那就再加幾個條件。
我們最容易想到的條件是 GAG = G,從外觀上看它和 AGA = A 對稱。它表達的意思可以用下圖來說明。
在我們前面買早餐的例子中,根據(jù)兩個顧客的付款額y',我們可以用廣義逆矩陣算出三種食品的單價,盡管這個單價和真實的單價并不一樣,但它多少能提供一點有價值的信息。比如,從道理上說,如果今天兩個顧客的付款額都比昨天低了,我們可以猜出今天有優(yōu)惠,食品單價降低了。
利用我們手里眾多廣義逆矩陣中的一個,近視宅男可以算出今天的食品單價 u = Gy',如上圖第一行所示。當然,這一組單價并不一定正確。使用這一組單價,服務員小妹可以算出兩位顧客的付款額:Au = y,如上圖第二行所示。注意這一組付款額y和近視宅男聽到的y'可能會是不同的。現(xiàn)在如果近視宅男反過來再算食品單價 u = Gy ,如上圖第三行所示,一般情況下不一定會得到相同的結果。不過,由于廣義逆矩陣一般情況下有無數(shù)個,如果一開始我們選擇了一個合適的廣義逆矩陣G,它滿足GAG =G,則上圖第一行與第三行這兩次計算都會算出相同的單價。
我們看到 AGA = A 和 GAG = G 這兩個條件是對稱的,同時符合這兩個條件的一對矩陣A與G互為廣義逆矩陣,它們互相之間是自反的(reflexive)。在有的文獻中,把符合 AGA = A 這個條件的矩陣G,叫做A的內(nèi)逆(inner inverse);把符合 GAG = G 這個條件的矩陣G,叫做A的外逆(outer inverse)。
有了 AGA = A 和 GAG = G 這兩個條件,同時符合這兩個條件的廣義逆矩陣數(shù)目顯然少了,但令人抓狂的是,對于一個一般的矩陣A,我們?nèi)匀豢赡軙袩o數(shù)個G。這就需要我們進一步增加限制條件,我們后面會進一步討論。
(5)挑出唯一的那個廣義逆矩陣
增加限制條件可以讓我們的尋找范圍縮小,可以想象,如果選定的條件合適,我們完全可能在無數(shù)個廣義逆矩陣挑出唯一的一個。當然這里還必須確保我們設定的條件不能太苛刻,因為那樣可能會出現(xiàn)沒有廣義逆矩陣符合全部條件的尷尬情形。好在,我們現(xiàn)在至少有一組條件,可以確保篩選出一個、而且只有一個廣義逆矩陣。
現(xiàn)在,到了彭羅斯閃亮登場的時候了。對于任何一個矩陣A,存在一個而且只存在一個矩陣G,同時滿足下面四個條件。這個矩陣G叫做矩陣A的彭羅斯逆矩陣。
可以看出,這四個條件中,第一個是廣義逆矩陣的定義,第二個是我們剛剛討論的自反廣義逆矩陣的關系式。第三和第四兩個關系式中“*”是共軛轉置的意思,就是把里面所有元素換成共軛復數(shù),同時把元素的行與列對調。如果括號里矩陣所有元素都是實數(shù),則共軛轉置“*”與轉置“T”等價,或者說括號里兩個矩陣的乘積AG或GA對稱。(這里提醒讀者注意,A通常不是正方形的,因而G通常也不是正方形的。但AG以及GA卻是正方形的,這兩個正方形矩陣一般情況下一個大一些另一個小一些。)第三個條件讓廣義逆矩陣提供最小二乘解,同時滿足第一與第三條件的G,在 Ax = y 自相矛盾沒有解的情況下,可以用 Gy 算出最小二乘解。(當原方程組不自相矛盾時,Gy 就是方程組的解)。而第四個條件讓廣義逆矩陣提供最小范數(shù)解。我們知道,如果原方程組約束不夠,則它可能有無窮多解。現(xiàn)在第四個條件的作用是把最小范數(shù)解挑了出來。
在大學教科書上留下名字的人,幾乎沒有活人,但羅杰·彭羅斯(Roger Penrose)還活得好好的,他2020年得到了物理學的諾貝爾獎,成果是黑洞方面的。
羅杰·彭羅斯 | Nobel Prize Outreach. Photo: Fergus Kennedy
彭羅斯發(fā)現(xiàn)彭羅斯逆這個工作發(fā)表于1955年,說起來,這種逆矩陣在30多年前就已經(jīng)被前人發(fā)現(xiàn)了。可是彭羅斯當時壓根不知道這回事,從某種意義上說,可以算是再次發(fā)明輪子(re-inventing wheels)。
當然這個事情并不能怪彭羅斯,因為當時數(shù)學界很多人也不知道這回事。實際上,在彭羅斯之前,1951年,瑞典大地測量學家Arne Bjerhammar已經(jīng)重新發(fā)明過一回輪子了。到彭羅斯投稿的時候,至少可以想象他那篇文章的審稿人也不知道前人的工作,否則這篇文章就可能發(fā)不出來了。你可能覺得哪個編輯敢拒稿諾獎得主的文章?但諾獎得主也有做黃口小兒的時候。彭羅斯得諾獎是60多年后的事情,他當時只是個24歲的博士生。
當初在1920年發(fā)現(xiàn)這個廣義逆矩陣的數(shù)學家是穆爾(Eliakim Hastings Moore),他是用矩陣的行列子空間上的投影來表述他的發(fā)現(xiàn)的,非常抽象難懂,所以沒有很多人繼續(xù)研究下去。我沒有查到他1920年的論文原文,但讀過后人的一個轉述文章。大家形容文章難懂都是說字全認識意思不懂,可這篇文章里我連有的字母都不認識。上網(wǎng)查了希臘、希伯來、西里爾字母表都查不到,最后發(fā)現(xiàn)那個不認識的字母是一種花體的拉丁字母。
穆爾 | wikipedia
若干年后人們知道彭羅斯的逆和穆爾的逆是等價的,但彭羅斯和穆爾的表述非常不同。此外,彭羅斯的四個條件是可以拆開來互相混搭使用的,由此能夠揭示廣義逆矩陣的更多新奇性質。因此數(shù)學界完全認可彭羅斯的新貢獻,人們現(xiàn)在把這種逆叫做穆爾-彭羅斯逆。我們后面會進一步討論。(未完待續(xù))
特 別 提 示
1. 進入『返樸』微信公眾號底部菜單“精品專欄“,可查閱不同主題系列科普文章。
2. 『返樸』提供按月檢索文章功能。關注公眾號,回復四位數(shù)組成的年份+月份,如“1903”,可獲取2019年3月的文章索引,以此類推。
版權說明:歡迎個人轉發(fā),任何形式的媒體或機構未經(jīng)授權,不得轉載和摘編。轉載授權請在「返樸」微信公眾號內(nèi)聯(lián)系后臺。
下一篇:返回列表
【免責聲明】本文轉載自網(wǎng)絡,與科技網(wǎng)無關。科技網(wǎng)站對文中陳述、觀點判斷保持中立,不對所包含內(nèi)容的準確性、可靠性或完整性提供任何明示或暗示的保證。請讀者僅作參考,并請自行承擔全部責任。