入門數據可視化的小伙伴往往都會問這樣一個問題:我應該從哪里開始學起,有什么書推薦嗎? 這個問題之所以普遍,是因為數據可視化是一個相當交叉的學科,既涉及數據分析,也涉及設計和編程。而這三大方向之中,每一個又可以延伸出許多子領域(例如設計里面又可以分出靜態(tài)圖表設計、交互圖表設計、圖表動畫設計)。這樣一來,可能的學習路徑就非常多樣。然而,目前市面上的可視化書籍各有側重、缺乏歸類,導致讀者很難高效挑選到最吻合自己學習目標的讀物。再者,在中文世界里,高質量的數據可視化讀物還不多,因此,如果想要深入了解這門學科,就繞不開要閱讀一些英文著作。 基于以上這些原因,倭瓜在回答“我該讀什么書”的時候,總覺得十分棘手。不過幸運的是,最近讀到了一篇文獻綜述,對可視化領域的圖書做了一次系統性梳理。這篇綜述由英國Swansea University的兩位研究人員撰寫,在選書這個問題上給出了很好的指導。我們會首先介紹原版的英文圖書,之后給出相應的中文譯本。 可視化領域有多少書? 兩位研究者總共搜集到了86本與數據可視化強相關的書籍。這86本書,涵蓋了可視化基礎理論、信息設計原理、可視分析、工具教程等多個方面。 其中,最早的可視化書籍發(fā)布于1967年,是來自Jacques Bertin的《圖形符號學》(Semiology of Graphics)。此后十幾年,都未有新的可視化書籍發(fā)表。 1983年,Edward Tufte發(fā)表了他的代表作The visual display of quantitative information,這也是可視化領域一本劃時代的奠基之作。 此后,90年代,又陸續(xù)有幾本新書出現。直到2000年,尤其是2010年以后,可視化相關書籍才迎來井噴。 這86本書的詳細列表可在項目網站查看:http://visbooks./ 如何給這些書歸類? ![]() ![]() 從寫作定位來看,這些書可以被歸為6大類: 1.經典理論 2.通俗讀物 3.學術教材 4.業(yè)界經驗 5.專項知識 6.工具教程 ![]() 下面我們來自己看看每一類具體都包含哪些書! 經典理論 經典理論一般是20年以上的奠基性作品,共6本: 1.Jacques Bertin的《圖形符號學》(Semiology of Graphics)。 Bertin是一名來自法國的制圖師,也是第一個系統地總結如何設計可視化的人。 比如,在這張圖里,Bertin總結了各種各樣的視覺符號,包括:尺寸、飽和度、紋理、顏色、方向、形狀。同時,他指出了數據本身有不同類型,包括關系類數據、順序類數據等等。通過將視覺符號與數據類型匹配,Bertin總結出了一系列可能的設計方案。 例如,下圖展示了16種地圖的畫法,是不是比現在的很多地圖都好看呢: 2.Edward Tufte的3本書:The Visual Display of Quantitative Information,Envisioning Information,Visual Explanation。 Tufte在可視化領域的影響力毋庸置疑。他最為人稱道的著作就是第一本:The Visual Display of Quantitative Information。 這本書提出的一系列理念,可以說奠定了可視化領域的設計準則。從“派系”而言,Tufte的觀點偏實用主義和極簡主義,他強調用理性、客觀的方法,判斷一張圖表是否能夠最高效地傳達數據信息。比如,他提出了數據墨水(Data-Ink Ratio)和圖表垃圾(Chartjunk)的概念,強調應該減少與數據無關的墨水。 同一幅折線圖,左邊裝飾主義,右邊極簡主義 3.William Cleveland的2本書:Visualizing Data,The Elements of Graphing Data。 第一本書比較偏向用可視化進行數據分析,即如何用圖表繪制復雜的數據類型,包括單變量,雙變量,三變量等等。作者提出的這些圖表畫法,在今天的很多統計軟件里已經能常常見到: 用矩陣查看正態(tài)分布 Cleveland的第二本書則主要關注圖表元素的正確使用,比如圖例、數據標簽、坐標軸等是否清晰。 遺憾的是,這六本書目前都還沒有中文譯本。這里推薦一些中文文章供閱讀:Jacques Bertin與圖形符號系統,數據可視化有統一規(guī)范嗎。 通俗讀物 通俗讀物一般是向大眾引介可視化概念、用法,并提供一些圖表案例供翻閱。由于是寫給大眾看的入門類書籍,因此不要求讀者有任何專業(yè)背景。 一些例子 影響比較大的有資深圖表設計師、數據新聞記者Alberto Cairo的三本書: 其中兩本已經被翻譯為中文。通過閱讀這些書籍,你可以了解到可視化是如何在真實數據上應用的,以及在設計可視化時,應該避免哪些誤區(qū)或濫用。 還有一個更加“古早”的項目,Visual Complexity。這個項目從2005年起就開始搜集各種各樣的可視化設計,十幾年中已經搜集了上千個作品,并出版了一部書籍,中文叫“視覺繁美”。 不過,倭瓜最近一次登陸這個網站的時候,項目似乎已經缺乏維護??粗畮啄昵暗脑O計,不禁感嘆技術在進步,而美還是一如往常。 與此同時,市面上還有許多“圖冊”類的書籍,主要以印刷可視化作品為主。這類書的好處在于文字很少,因此看英文原版也不會有太大負擔。同時,豐富的精選案例,也可以幫助你打開設計思路、激發(fā)可視化的想象力。 兩本可愛的可視化畫冊 學術教材 第三類書是學術教材。這類書一般會系統性、分章節(jié)的講解領域知識,受眾為學習該專業(yè)的學生。 一些例子 比如,下面這本書從 What, Why, How三個層面講解了什么是可視化、為什么需要可視化、以及如何可視化。 書中總結的視覺通道,比早期Bertin的總結要更全面一些,還包括斜度、彎曲度、體積、動畫等等。這些通道都可以用來映射數據: 書中也對可視化設計的合理性進行了討論。例如,人眼對哪些視覺通道的感知更加準確: 研究顯示,位置類(Position)的視覺通道在感知上是最準確的,面積類(Area)則最不準確 如果你還想更加深入地了解可視化背后的心理學原理,那么下面這本教材是一個不錯的選擇。這本書基本上逐一介紹了人類對各種視覺元素的感知機制,包括亮度、色彩、空間感等等。 中文教材方面,目前有浙大陳為老師等編寫的《數據可視化》。這本書梳理了可視化領域的學科分類和研究內容,對于想要學習可視化專業(yè)的同學來說是一本必讀入門教材。 還有一些書筆者稱之為“應用型教材”,主要關注如何實現可視化。例如Nathan Yau的兩本書,中文分別譯為“鮮活的數據”和“數據之美”。這兩本書偏系統性的實操教材,包括如何處理數據、分析數據、如何使用工具畫圖等。 業(yè)界經驗 這一類的書籍一般是業(yè)界人士的現身說法,結合業(yè)務和實操經驗進行分享。它的目標讀者一般是特定行業(yè)的從業(yè)者或專業(yè)人士。 一些例子 例如,《用數據講故事》。這本書由谷歌的前人力分析團隊經理撰寫,主要講解在了公司業(yè)務場景里應該怎樣繪制數據圖表,下圖右邊是它的中文版。 左:英文版;右:中文版 整本書不涉及任何復雜理論和技術,但是許多小知識、小技巧能切實提高畫圖的水準。比如,作者總結了一些商務匯報中常用的可視化類型: 抑或是提出一些改進辦法,使得原本簡陋的excel圖表更加美觀得體。下面這張圖其實無形之中實踐了Tufte的數據墨水理論,減少了許多不必要的元素,使圖表整體更清晰、美觀。 左:改良前;右:改良后 總體而言,倭瓜認為這本書很適合有日常作圖需求的辦公室人群,幾乎不需要專業(yè)知識背景,會比學術教材更加通俗易懂。當然,有的時候,所謂的“業(yè)界”、“學界”并不是那么涇渭分明的。學術研究,往往也需要吸納很多業(yè)界的需求,而學術產生的成果也常常會應用于實踐中。 以下面這本書為例,這本書的主題也是“用數據講故事”,但作者們都是資深的可視化研究人員。不過,盡管仍保留著學術的嚴謹性,書籍的整體風格并不晦澀,里面的文章也都不是嚴格意義上的論文,而是夾雜了許多觀點、評論和案例。筆者認為這是一個跨越固有邊界、促進思維碰撞的有益嘗試。 這本書暫時只有英文版 還有不少書專門講解商業(yè)儀表盤的制作經驗: 或者是定位于設計師的經驗分享: 因此,在選書時,最好認準自己本行業(yè)專家撰寫的圖書。 專項知識 專項知識類圖書一般解決一個具體的領域問題,一般是偏技術類的問題,例如如何針對安全類數據進行可視化、如何對多維度數據進行降維展示、如何對城市規(guī)劃數據進行可視分析等等。 這些書往往是眾多學術研究成果的集成品,因而相對專業(yè)艱深,適合領域專家研讀。目前這一類的圖書的中文譯本還很少,因此不做過多介紹了。 一些例子 工具教程 這一類圖書主要講解某個工具的具體用法和操作步驟。而工具的種類也非常繁多,且以編程語言和軟件為主(如Python, D3.js, Processing)。這類圖書中文譯本不少,且中國本土也有很多人撰寫此類書籍。 然而,這類書也存在一些潛在問題,比如,教學的質量不高、光是看書難以學會實操,以及工具本身更新換代速度快等等。尤其是中文的技術類圖書,灌水的比例更大。因此筆者認為,在學技術時,讀書可能會幫助理解技術的構建方式和底層邏輯。但要熟練掌握這門技術,還是要依靠不斷的上手練習和項目實戰(zhàn)。 否則就會這樣 最后打個總結。如下圖所示,總體而言,早期的書籍以經典理論(藍色)為主,而近年來則出現了越來越多工具教程(紫色)以及面向大眾用戶的通俗讀物(綠色)。同時,也出現了一些內容更綜合的書籍,例如在分享案例的同時,提供工具教程(藍黑色)。當然,當我們書架上的選擇越來越豐富的時候,辨別好書也就越來也重要。 可視化書籍數量,按時間排序 ![]() 哪些書最值得讀? ![]() ![]() ![]() 下面這張圖顯示了所有可視化書籍的學術引用量(展現其學術影響力,y軸表示)和亞馬遜銷量(展現其普遍的熱門程度,x軸表示)分布。 可視化書籍的引用量(y軸-越上越高)和亞馬遜銷量(x軸-越左越高) 首先來看高引的書籍,也就是圖上的這幾本: 引用量最高的是Tufte的The Visual Display of Quantitative Information,截止倭瓜發(fā)文時已經被引超過13000次,引用量相比其他書可以說是一騎絕塵。Tufte的另外兩本書,Envisioning Information和Visual Explanation,分別位于被引的第2名、第7名。上文介紹的心理學教材Information Visualization: Perception for Design位列第3名。Bertin和Cleveland的經典理論著作位列第4、第5。位列第6的是Illuminating the Path,這本書由美國國土安全部資助,致力于將數據的可視分析應用于國家安全維護和反恐。位列第8的是另一本可視化教材Information Visualization: An Introduction。 再來看銷量。下圖紅框中是銷量最高的幾本書: 所有書中銷量最好的是業(yè)界實戰(zhàn)書《用數據講故事》。Edward Tufte和Bertin的經典著作分別位于銷量的第2、第3、第4、第7位。同樣高銷量還有通俗讀物如The Functional Art(《不只是美》),以及業(yè)界經驗書如Information Dashboard Design。 可以發(fā)現,在國外,經典理論著作無論是在引用量上,還是銷量上,都處于優(yōu)勢地位。而在銷量上同樣表現突出的,則主要是業(yè)界經驗和通俗讀物。 出于好奇,筆者也去查了查京東上賣得最火的可視化圖書。結果顯示,在中國最為暢銷的基本上都是技術類教程,著重于工程實操。相反,基礎理論和行業(yè)經驗類的書籍則數量較少,且大多譯自英文,鮮有來自本土的作者??梢?,國內的可視化理念普及還需時日,同時,我們也希望看到更多優(yōu)質的本土作品出現。 以“數據可視化“為關鍵詞搜到的圖書,按銷量排名 當然,引用量和銷量并不是評價一本書的唯一標準。一方面,一本書是否被大多數人熟知存在一定的偶然性,并不是所有的好書都是熱門的;另一方面,讀書是人和書交互的過程,能夠解答你疑惑、啟發(fā)你思路的書往往才是最“對胃口”的書。 書山有路勤為徑。挑一本書,開啟你的可視化之旅吧! ———————————————— 參考文獻: Rees, D., & Laramee, R. S. (2019, February). A survey of information visualization books. In Computer Graphics Forum (Vol. 38, No. 1, pp. 610-646). https://www./watch?v=8EMW7io4rSI https:///starlinking/%E7%94%A8%E6%95%B8%E6%93%9A%E8%AC%9B%E6%95%85%E4%BA%8B-d21cb7fc1540. https:///vis-it-%E6%9C%89%E8%A6%96%E6%B2%92%E4%BA%8B/%E5%8F%AF%E8%A6%96%E5%8C%96%E5%9F%BA%E7%A4%8E-jacques-bertin-%E8%88%87%E5%9C%96%E5%BD%A2%E7%AC%A6%E8%99%9F%E7%B3%BB%E7%B5%B1-63c99484da5f. https:///@mslima/visualcomplexity-com-ad9a12fa2c1a https://www./reading/munzner-14-visualization-analysis-and-design https:///visualization-analysis-design-tamara-munzner-department-of-computer/ ![]() - the end - |
|