日韩黑丝制服一区视频播放|日韩欧美人妻丝袜视频在线观看|九九影院一级蜜桃|亚洲中文在线导航|青草草视频在线观看|婷婷五月色伊人网站|日本一区二区在线|国产AV一二三四区毛片|正在播放久草视频|亚洲色图精品一区

分享

我們是如何在一張地圖上表現(xiàn)86萬(wàn)個(gè)數(shù)據(jù)的

 昵稱27299644 2015-09-23

數(shù)盟(dataunion.org)是一個(gè)專注于數(shù)據(jù)應(yīng)用的技術(shù)型社區(qū),致力于成為培養(yǎng)與發(fā)現(xiàn)“數(shù)據(jù)科學(xué)家”的黃埔軍校。數(shù)盟主要關(guān)注大數(shù)據(jù)、數(shù)據(jù)挖掘、數(shù)據(jù)分析、數(shù)據(jù)可視化等領(lǐng)域,倡導(dǎo)“數(shù)據(jù)價(jià)值的發(fā)現(xiàn)與應(yīng)用”,助力企業(yè)、個(gè)人提升價(jià)值。

國(guó)內(nèi)唯一的數(shù)據(jù)可視化在線課程,搜索網(wǎng)易云課堂“數(shù)盟數(shù)據(jù)可視化”,或點(diǎn)擊文末閱讀原文,輕松搞定數(shù)據(jù)可視化~


出處:百度新聞實(shí)驗(yàn)室

作為一名數(shù)據(jù)工作者,我每天會(huì)接觸到很多的數(shù)據(jù)可視化成果,美好的可視化作品簡(jiǎn)潔明快炫酷非常,讓人心情舒暢。

但是不佳的數(shù)據(jù)可視化也越來(lái)越多。比如這張信息圖,通過(guò)大大小小的飛機(jī)圖標(biāo)展示某島空軍部署情況,但讀者能從中迅速獲取所表達(dá)的信息嗎?如果用“數(shù)字+圖標(biāo)”重新設(shè)計(jì)這張圖能否更加清晰?最后,這張圖也是密集恐懼者的一場(chǎng)災(zāi)難。

我認(rèn)為目前可視化正在快速進(jìn)入泡沫期。每天在誕生各類優(yōu)秀作品的同時(shí),會(huì)出現(xiàn)數(shù)倍的劣質(zhì)作品。原因在哪里?

我的答案是——

技術(shù)的發(fā)展激發(fā)了人類過(guò)度表達(dá)的欲望。

2000年前,那時(shí)我們的祖先在竹簡(jiǎn)上刻字,鐫刻每一個(gè)字都非常辛苦,技術(shù)落后使我們的表達(dá)簡(jiǎn)潔,比如說(shuō)《老子》五千言,文辭深邃,流轉(zhuǎn)久遠(yuǎn),陳鼓應(yīng)先生用厚厚一本書(shū)注譯。而現(xiàn)在我們有了電腦輸入法,打字飛快。但是結(jié)果呢(如下圖)?

技術(shù)的發(fā)展在解放生產(chǎn)力的同時(shí),也解放了過(guò)度表達(dá)的欲望,而這個(gè)勢(shì)頭正在數(shù)據(jù)可視化領(lǐng)域重演。

在現(xiàn)代工具的幫助下,我們點(diǎn)兩下鼠標(biāo)就可以做出精美的圖表,而類似的圖表在三五年前還要需要專業(yè)繪圖者花兩三天才能做出來(lái)。傳播就更容易了,輕輕點(diǎn)擊按紐就可以立刻傳到朋友圈讓大家看到。

極簡(jiǎn)主義面前,數(shù)據(jù)可視化需要回答的三個(gè)問(wèn)題

這個(gè)時(shí)代可視化更需要簡(jiǎn)潔表達(dá)。極簡(jiǎn)主義目前很流行,但做到并不容易,一方面是由于技術(shù)局限,另一方面是必須努力控制自身表達(dá)欲望。一年前我們也經(jīng)歷了一場(chǎng)理智與欲望的斗爭(zhēng)。

2013年,中國(guó)政府啟動(dòng)了中國(guó)第三次全國(guó)經(jīng)濟(jì)普查。這是人類歷史上空前的一次壯舉!國(guó)家動(dòng)用了300多萬(wàn)基層調(diào)查員,對(duì)960萬(wàn)平方公里上的1200多萬(wàn)個(gè)經(jīng)濟(jì)單位,進(jìn)行上千個(gè)指標(biāo)的詳細(xì)地毯式普查。

我們的團(tuán)隊(duì)為國(guó)家統(tǒng)計(jì)系統(tǒng)建設(shè)了十多年的統(tǒng)計(jì)地理信息系統(tǒng),所以2014年接受了一個(gè)光榮而艱巨的任務(wù)把全國(guó)33個(gè)?。ú话ㄅ_(tái)灣)328個(gè)地市、2000多個(gè)縣的數(shù)據(jù)展示在一張地圖上,一共3次經(jīng)濟(jì)普查每個(gè)地區(qū)包含90多個(gè)指標(biāo),總數(shù)據(jù)量達(dá)到86萬(wàn)個(gè)。

這個(gè)可視化工作很困難。迫使我們?nèi)ニ伎既齻€(gè)關(guān)鍵的問(wèn)題:

數(shù)據(jù)可視化的目的是什么?

作用對(duì)象是誰(shuí)?

傳遞信息的關(guān)鍵是什么?

我想到了多年前看過(guò)無(wú)印良品的創(chuàng)始人原研哉撰寫(xiě)的《設(shè)計(jì)中的設(shè)計(jì)》,其中提到“Visualogue”的概念,也就是視覺(jué)對(duì)話。可以設(shè)想兩個(gè)語(yǔ)言、文字不通的陌生人,給他們一張紙,一桿筆,他們一定是最簡(jiǎn)潔的方式把自己的想法畫(huà)下來(lái)交流,這就是用視覺(jué)對(duì)話。這其實(shí)就是數(shù)據(jù)可視化的本質(zhì),通過(guò)可視化圖表將對(duì)領(lǐng)域陌生的讀者用比文字快十倍百倍的速度帶進(jìn)門。

這給了我一個(gè)啟示,了解了人類的對(duì)話也許是理解可視化的鑰匙。所以我破解了一次對(duì)話。所有對(duì)話都從信息源開(kāi)始,信息經(jīng)歷通道傳輸給接收者,并形成反饋,此外還需要考慮來(lái)自環(huán)境的噪音以及人為噪音——語(yǔ)言中的無(wú)效信息。所有對(duì)話都是由這樣的基本單元組成。

提升可視化效率的三個(gè)方法

參照對(duì)話模型就可以發(fā)現(xiàn)數(shù)據(jù)可視化的優(yōu)化密碼。提升對(duì)話效率通常有三個(gè)方法:

第一個(gè)是明確,明確的說(shuō)話內(nèi)容,

第二需要邏輯,每句話之間需要有關(guān)系,

第三是剔除噪音,包括自然和認(rèn)為的噪音。

在數(shù)據(jù)可視化領(lǐng)域相對(duì)應(yīng)的三項(xiàng)技術(shù)就是數(shù)據(jù)降維、關(guān)聯(lián)關(guān)系和扁平交互。

1.數(shù)據(jù)降維

數(shù)據(jù)降維被認(rèn)為是大數(shù)據(jù)處理的首要任務(wù)。而迄今為止最有效的降維方法依舊是人類已經(jīng)使用上千年的分類。在沒(méi)有計(jì)算機(jī)的時(shí)代,圖書(shū)館使用分類技術(shù)讓我們?cè)诙虝r(shí)間內(nèi)可以在成千上萬(wàn)本書(shū)中找到需要的信息。

在地理可視化中也充分利用分類技術(shù),分析發(fā)現(xiàn)86萬(wàn)數(shù)據(jù)是可以分為時(shí)間和地區(qū)兩個(gè)分組,而90多個(gè)指標(biāo)可以分為綜合信息,第三產(chǎn)業(yè),第二產(chǎn)業(yè)、能源四大類。這三大維度時(shí)間、地區(qū)和指標(biāo)構(gòu)成數(shù)據(jù)空間,三個(gè)維度值確定就可以獲得唯一的數(shù)據(jù),比如北京市(地區(qū))2013年(時(shí)間)的就業(yè)人口總數(shù)(指標(biāo));

如果確定兩個(gè)維度就可以獲得一個(gè)相關(guān)的數(shù)據(jù)集,例如2013年(時(shí)間)單位總數(shù)(指標(biāo)),其全國(guó)分布圖。


我們?cè)谑欠駠L試去了解分析自己面對(duì)的數(shù)據(jù),良好的數(shù)據(jù)分類整理是實(shí)現(xiàn)優(yōu)質(zhì)的可視化的最好起點(diǎn)。

2.關(guān)聯(lián)關(guān)系

數(shù)據(jù)本身并無(wú)意義,只有相關(guān)才能產(chǎn)生含義與價(jià)值,所以關(guān)聯(lián)關(guān)系時(shí)則從數(shù)據(jù)到知識(shí)躍遷的過(guò)程.此過(guò)程需要將零散數(shù)據(jù)集聚,叫做信息加工。

可視化不同于文字,知識(shí)不是直白的說(shuō)出來(lái),而是用隱喻方式表達(dá),綜合利用顏色、大小、聯(lián)動(dòng)等視覺(jué)習(xí)慣讓讀者在不知不覺(jué)中自然感受到數(shù)據(jù)的差異和關(guān)聯(lián)。

地圖上不同顏色深淺代表數(shù)據(jù)值的大小,圖標(biāo)的大小和內(nèi)容可以代表數(shù)據(jù)總量大小,和不同成分差異。

數(shù)據(jù)聯(lián)動(dòng)主要體現(xiàn)在人機(jī)交互中,隨著鼠標(biāo)移動(dòng)數(shù)據(jù)同步變化,此外關(guān)聯(lián)的欄目頁(yè)隨時(shí)更新當(dāng)前熱點(diǎn)區(qū)域的指標(biāo)排名和三次經(jīng)濟(jì)普查的變化趨勢(shì),整個(gè)過(guò)程基本不依賴文字語(yǔ)言,讀者可以直觀感受到數(shù)據(jù)的變化。

良好的數(shù)據(jù)關(guān)聯(lián)性分析與處理有助于厘清一份數(shù)據(jù)對(duì)于可視化是否有價(jià)值,也可以幫助我們選擇合適的可視化方法。

3.扁平交互

計(jì)算機(jī)與手機(jī)屏幕是有限的,每增加一個(gè)顏色和要素都會(huì)增加進(jìn)入眼睛的信息量,從而干擾對(duì)信息的傳輸,所以要嚴(yán)格控制進(jìn)入用戶眼睛每一個(gè)比特,避免沖淡可視化主題。

地理可視化中采取了兩種方式實(shí)現(xiàn)數(shù)據(jù)隱藏,一種是逐級(jí)鉆取,可以充分利用地域的天然的分級(jí)包含關(guān)系,使得信息不用不一下子全部展開(kāi),而是隨著“省-市-縣”層次逐級(jí)展示;另一種是擴(kuò)展圖示。

將復(fù)雜的信息濃縮為簡(jiǎn)單的圖標(biāo),只有讀者感興趣的時(shí)候才點(diǎn)擊展開(kāi)。

數(shù)據(jù)可視化是一個(gè)“謊言”

從某種意義上說(shuō)可視化是一個(gè)“謊言”,現(xiàn)在不缺乏數(shù)據(jù)展示,缺乏的是數(shù)據(jù)隱藏,只有充分的數(shù)據(jù)隱藏才能有效的數(shù)據(jù)展示。這是可視化的關(guān)鍵。

什么叫隱藏?不是不讓讀者看到這個(gè)數(shù)據(jù),而是分不同的場(chǎng)合、不同的時(shí)間段展示不同的數(shù)據(jù),只有當(dāng)讀者需要了才展示,而不是一下子將所有數(shù)據(jù)鋪開(kāi)來(lái),否則其實(shí)是對(duì)數(shù)據(jù)的濫用,也阻礙了讀者獲取信息。

感謝我們不屈不撓,創(chuàng)意無(wú)限的優(yōu)秀團(tuán)隊(duì),感謝你們?yōu)榇税具^(guò)的多少個(gè)不眠之夜,作為你們的一員,我非常驕傲。

我們也于8月份把作品放在國(guó)家數(shù)據(jù)網(wǎng)站上,讓全國(guó)乃至全球的讀者都可以分享中國(guó)第三次全國(guó)經(jīng)濟(jì)普查這項(xiàng)人類壯舉的喜悅。

這就是我們將86萬(wàn)數(shù)據(jù)放入一張地圖的故事,總結(jié)一句話“可視化的本質(zhì)是簡(jiǎn)潔”,也就是俗話說(shuō)“千言萬(wàn)語(yǔ)不如一張圖”

但是為什么還會(huì)出現(xiàn)過(guò)度表達(dá)現(xiàn)象呢?我想這和更愛(ài)自己還是更愛(ài)世界有關(guān),如果一個(gè)人更希望去炫耀自己的技術(shù)和數(shù)據(jù),那么很有可能選擇復(fù)雜的可視化,如果一個(gè)人更關(guān)注傳遞給讀者有效信息,那么他肯定會(huì)選擇簡(jiǎn)潔的可視化。

所以請(qǐng)行動(dòng)吧,審視自己的每一幅作品,每一段文字,每一張圖片,大膽的剃掉不必要的部分,你會(huì)發(fā)現(xiàn)舍棄的越多,你將獲得的會(huì)更多。


關(guān)于我們 ID:DataScientistUnion

數(shù)盟網(wǎng)站:www.dataunion.org

數(shù)盟微博:@數(shù)盟社區(qū)

數(shù)盟微信:DataScientistUnion

數(shù)盟【大數(shù)據(jù)群】272089418

數(shù)盟【數(shù)據(jù)可視化群】 179287077

數(shù)盟【數(shù)據(jù)分析群】 174306879

(長(zhǎng)按可關(guān)注)



點(diǎn)擊[閱讀原文] 國(guó)內(nèi)唯一數(shù)據(jù)可視化在線課程



    本站是提供個(gè)人知識(shí)管理的網(wǎng)絡(luò)存儲(chǔ)空間,所有內(nèi)容均由用戶發(fā)布,不代表本站觀點(diǎn)。請(qǐng)注意甄別內(nèi)容中的聯(lián)系方式、誘導(dǎo)購(gòu)買等信息,謹(jǐn)防詐騙。如發(fā)現(xiàn)有害或侵權(quán)內(nèi)容,請(qǐng)點(diǎn)擊一鍵舉報(bào)。
    轉(zhuǎn)藏 分享 獻(xiàn)花(0

    0條評(píng)論

    發(fā)表

    請(qǐng)遵守用戶 評(píng)論公約

    類似文章 更多