今天我想分享一個簡單的 idea,它既不新穎也不花哨。甚至很多人都有過這個想法。但是無論你有沒有這么想過,我都希望你能抽出幾分鐘和我一起重新感受這個想法。 這個想法是這樣的: 想法非常簡單,但非常實(shí)用。 首先嚴(yán)謹(jǐn)?shù)馗爬ㄟ@個想法:每個矩陣對應(yīng)一個加權(quán)二分圖。所謂「圖」是指頂點(diǎn)(點(diǎn))和線的集合;「二分」是指點(diǎn)有兩種不同的類型/顏色;;「加權(quán)」是指每條線都有一個數(shù)字標(biāo)記。 上圖對應(yīng)一個 3×23×2 矩陣 M。右側(cè)我畫了三個綠點(diǎn),分別對應(yīng)矩陣 M 的三行,兩個粉點(diǎn)分別對應(yīng)矩陣 M 的兩列。如果對應(yīng)矩陣 M 中的值非零,就在綠點(diǎn)和粉點(diǎn)間畫一條線連接。 例如,在第二個綠點(diǎn)和第一個粉點(diǎn)間存在一條線,因?yàn)?M_21=4,即矩陣 M 第二行第一列的值不為 0。此外,我用非零數(shù)字標(biāo)記了這條線。而第一個綠點(diǎn)和第二個粉點(diǎn)之間沒有線連接,因?yàn)榫仃嚨牡谝恍械诙兄禐榱恪?/p> 更明確的描述如下: 任何矩陣 M 都是 n×m 個數(shù)的數(shù)組。當(dāng)然這是常識。但是這樣的數(shù)組也可以看作函數(shù) M:X×Y→R,其中 X = {x_1,...,x_n},是一組 n 個元素組成的集合;Y = {y_1,...,y_m},是一組 m 個元素組成的集合。實(shí)際上,如果要描述矩陣 M,那么需要描述第 ij 項(xiàng)的值。換句話說,對于每對 (i,j),都需要給出一個實(shí)數(shù) M_ij。這就是函數(shù)的功能??!函數(shù) M:X×Y→R 關(guān)聯(lián)每對 (x_i,y_j)(如果你愿意,可以去掉字母并將其看作 (i,j)),即實(shí)數(shù) M(x_i,y_j)。所以可以將 M(x_i,y_j) 簡寫為 M_ij。 看,矩陣就是一種函數(shù)。 如前所述,我們進(jìn)一步認(rèn)為 X 的元素是綠點(diǎn),而 Y 的元素是粉點(diǎn)。然后矩陣 M 以下圖方式與加權(quán)二分圖相對應(yīng):圖的頂點(diǎn)有由 X 和 Y 提供的兩種不同顏色,并且每個 x_i 和 y_j 之間存在連線,連線由數(shù)字 M_ij 標(biāo)記。但是如果數(shù)值為零,那就省略這條邊。 每個矩陣對應(yīng)一個圖。 當(dāng)我們以這種方式可視化矩陣時,神奇的事就發(fā)生了。例如... 矩陣乘法即為沿連線向前運(yùn)算。 給定兩個矩陣(圖)M:X×Y→R 和 N:Y×Z→R,我們可以通過將它們的圖拼在一起并沿著連線進(jìn)行乘法運(yùn)算:MN 的第 ij 項(xiàng)的輸入,即連接 x_i 到 z_j 的線的值,是通過將沿 x_i 到 z_j 的各個邊相乘并加和得到的。例如: 對稱矩陣對應(yīng)對稱圖。 如果一個矩陣等于它的轉(zhuǎn)置,即為對稱矩陣。這種對稱性常通過矩陣對角線映射得到。但現(xiàn)在可以從圖中觀察到對稱性。尤其對于任何矩陣 M 來說,下圖直觀地解釋了,為什么 MM^?和 M^?M 始終對稱! 若矩陣所有項(xiàng)都非零,則對應(yīng)完全二分圖。 如果一個矩陣的所有元素都不為零,那么它對應(yīng)的圖就沒有缺失的連線。這意味著 X 中的每個點(diǎn)都與 Y 的每個點(diǎn)相連。這樣的二分圖稱為完全二分圖。 N 分塊矩陣對應(yīng)獨(dú)立的 N 個圖。 具體來說,由直和得到的分塊矩陣對應(yīng)斷開的圖。將兩個矩陣做直和運(yùn)算得到更大的數(shù)組(與向量直和運(yùn)算類似),即一個帶有全零塊的大型分塊矩陣。分塊矩陣的圖通過將原矩陣的圖疊加得到。 關(guān)于矩陣和圖我們能展開更多的討論,但我想通過一個不同的角度來探討。事實(shí)證明,概率非常適合我們矩陣-圖的討論。這是通過另一個有趣的小事實(shí)來實(shí)現(xiàn)的: 例如: 這樣的概率分布圖可以讓我們更好地分析。 聯(lián)合概率 通過架構(gòu)圖中的連線,可以得到聯(lián)合概率:(x_i,y_j) 的概率是連接 x,y 兩點(diǎn)的線的標(biāo)簽。 邊緣概率 邊緣概率是通過沿矩陣的行/列求和得到的(與上圖等效)。例如,x_1 的概率 p(x_1)=p(x_1,y_1)+p(x_1,y_2)=1/8+0,這是第一行的總和。同樣,y_2 的概率是 p(y_2)=p(x_1,y_2)+p(x_2,y_2)+p(x_3,y_2)=0+1/8+1/4,是第二列的和。 圖中,x_i 的邊緣概率是以 x_i 為頂點(diǎn)的所有連線的和。類似地,y_j 的邊緣概率是以 y_j 為頂點(diǎn)的所有連線的和。 條件概率 條件概率是由聯(lián)合概率除以邊緣概率得到的。例如在 y_2 條件下 x_3 的概率 p(x_3|y_2)=p(x_3,y_2)/p(y_2)。從圖中可以看出,這是通過將 x_3 和 y_2 的連線除以所有與 y_2 相連的線之和得到的。同樣,y_i 下 x_j 的條件概率是兩點(diǎn)連線的值除以所有與 x_j 相連的線之和。 這很簡單,對吧? 這里邊的原理并不復(fù)雜,只是有時用新角度看舊想法是很有用的。 關(guān)系矩陣 本文的最后是另一個簡單而有趣的事實(shí),即:矩陣運(yùn)算在交換環(huán)(communicative ring)上是有意義的。不僅僅是像 R 或 C 等。矩陣相乘甚至不需要負(fù)數(shù):矩陣運(yùn)算在交換半環(huán)上是有意義的!(半環(huán)是一個沒有相反數(shù)的環(huán)。) 我認(rèn)為這很好,因?yàn)榘瑑蓚€元素 Z_2 = {0,1} 的集合通過下圖的加法和乘法形成一個半環(huán): 為什么會這么好?因?yàn)橐粋€矩陣 M:X×Y→Z_2 相當(dāng)于一個「關(guān)系」?!戈P(guān)系」是笛卡爾積 X×Y 的子集 R 的名稱。換句話說,每個 Z_2-valued 矩陣定義了一個「關(guān)系」,每個關(guān)系又定義了一個 Z_2-valued 矩陣:當(dāng)且僅當(dāng) (x_i,y_j) 是 R 子集的元素時,M_ij=1,否則 M_ij=0。 Z_2 中的矩陣圖與上面討論的圖完全相同,只是現(xiàn)在所有連線的值都是 0 或 1。如果權(quán)重是 0,那和之前一樣,我們就不畫這條連線了。 (順便說一句,你現(xiàn)在可以問,「既然每個「關(guān)系」對應(yīng)于 Z_2 中的矩陣,那與「等價關(guān)系」相對應(yīng)的矩陣是什么樣的?」我離題了....) 通過將基礎(chǔ)(半)環(huán)從 R 改為 Z_2,我們改變了解釋權(quán)重的方式。例如,在上面的概率場景中,我們可以問,「從 x_1 到 y_1 的概率是多少?」答案由對應(yīng)邊的權(quán)重而來,在本例中為 12.5%?;蛘?,當(dāng)矩陣在 Z_2 中取值時,問題變?yōu)椋骸甘欠窨赡軓?x_1 到 y_1?」如果連線標(biāo)記為 1,則為「是」,如果標(biāo)記為 0 則為「否」。(這個想法已經(jīng)被多次解釋了)。 重要的是,「關(guān)系」的組合恰好是使用了上面的 Z_2 算法的矩陣乘法。換句話說,給定任意兩個關(guān)系 R?X×Y 和 S?Y×Z,存在一個新關(guān)系 SR?X×Z,包括所有 (x,z),至少存在一個 y∈Y,其中 (x,y)∈R,(y,z)∈S。這種新關(guān)系正是表示 R 和 S 的矩陣乘積所指定的。 這個關(guān)于矩陣/關(guān)系的小事實(shí)絕對是我最喜歡的數(shù)學(xué)事實(shí)之一。一個原因是因?yàn)橛邢藜姆懂?,「關(guān)系」很像有限向量空間和線性映射的范疇。實(shí)際上,它更像是有限維希爾伯特空間的范疇。這意味著許多看似不相干的想法突然變得密切。這些聯(lián)系可以更加精準(zhǔn),這是一個在范疇理論界經(jīng)常被分享的故事。 原文鏈接:https://www./blog/matrices-probability-graphs |
|