日韩黑丝制服一区视频播放|日韩欧美人妻丝袜视频在线观看|九九影院一级蜜桃|亚洲中文在线导航|青草草视频在线观看|婷婷五月色伊人网站|日本一区二区在线|国产AV一二三四区毛片|正在播放久草视频|亚洲色图精品一区

分享

【必收】不管什么企業(yè),做數(shù)據(jù)分析,這50張圖足夠了

 廣益堂 2019-09-03

數(shù)據(jù)可視化分析的好處

1

在不歪曲事實(shí)的情況下傳達(dá)正確和必要的信息。

2

設(shè)計(jì)簡(jiǎn)單。



3

美學(xué)支持信息而不是掩蓋信息。

4

沒(méi)有超載信息。



關(guān)聯(lián)

關(guān)聯(lián)圖表用于可視化2個(gè)或更多變量之間的關(guān)系。 也就是說(shuō),一個(gè)變量如何相對(duì)于另一個(gè)變化。

1. 散點(diǎn)圖(Scatter plot)

散點(diǎn)圖是用于研究?jī)蓚€(gè)變量之間關(guān)系的經(jīng)典的和基本的圖表。 如果數(shù)據(jù)中有多個(gè)組,則可能需要以不同顏色可視化每個(gè)組。

2. 帶邊界的氣泡圖(Bubble plot with Encircling)

有時(shí),您希望在邊界內(nèi)顯示一組點(diǎn)以強(qiáng)調(diào)其重要性。

3. 帶線性回歸最佳擬合線的散點(diǎn)圖 (Scatter plot with linear regression line of best fit)

如果你想了解兩個(gè)變量如何相互改變,那么最佳擬合線就是常用的方法。 下圖顯示了數(shù)據(jù)中各組之間最佳擬合線的差異。

針對(duì)每列繪制線性回歸線:

4. 抖動(dòng)圖 (Jittering with stripplot)

通常,多個(gè)數(shù)據(jù)點(diǎn)具有完全相同的 X 和 Y 值。 結(jié)果,多個(gè)點(diǎn)繪制會(huì)重疊并隱藏。 為避免這種情況,請(qǐng)將數(shù)據(jù)點(diǎn)稍微抖動(dòng),以便您可以直觀地看到它們。

5. 計(jì)數(shù)圖 (Counts Plot)

避免點(diǎn)重疊問(wèn)題的另一個(gè)選擇是增加點(diǎn)的大小,這取決于該點(diǎn)中有多少點(diǎn)。 因此,點(diǎn)的大小越大,其周?chē)狞c(diǎn)的集中度越高。

6. 邊緣直方圖 (Marginal Histogram)

邊緣直方圖具有沿 X 和 Y 軸變量的直方圖。 這用于可視化 X 和 Y 之間的關(guān)系以及單獨(dú)的 X 和 Y 的單變量分布。 這種圖經(jīng)常用于探索性數(shù)據(jù)分析(EDA)。

7. 邊緣箱形圖 (Marginal Boxplot)

邊緣箱圖與邊緣直方圖具有相似的用途。 然而,箱線圖有助于精確定位 X 和 Y 的中位數(shù)、第25和第75百分位數(shù)。

8. 相關(guān)圖 (Correllogram)

相關(guān)圖用于直觀地查看給定數(shù)據(jù)框(或二維數(shù)組)中所有可能的數(shù)值變量對(duì)之間的相關(guān)度量。

9. 矩陣圖 (Pairwise Plot)

矩陣圖是探索性分析中的最?lèi)?ài),用于理解所有可能的數(shù)值變量對(duì)之間的關(guān)系。 它是雙變量分析的必備工具。

偏差

10. 發(fā)散型條形圖 (Diverging Bars)

如果您想根據(jù)單個(gè)指標(biāo)查看項(xiàng)目的變化情況,并可視化此差異的順序和數(shù)量,那么散型條形圖 (Diverging Bars) 是一個(gè)很好的工具。它有助于快速區(qū)分?jǐn)?shù)據(jù)中組的性能,并且非常直觀,并且可以立即傳達(dá)這一點(diǎn)。

11. 發(fā)散型文本 (Diverging Texts)

發(fā)散型文本 (Diverging Texts)與發(fā)散型條形圖 (Diverging Bars)相似,如果你想以一種漂亮和可呈現(xiàn)的方式顯示圖表中每個(gè)項(xiàng)目的價(jià)值,就可以使用這種方法。

12. 發(fā)散型包點(diǎn)圖 (Diverging Dot Plot)

發(fā)散型包點(diǎn)圖 (Diverging Dot Plot)也類(lèi)似于發(fā)散型條形圖 (Diverging Bars)。 然而,與發(fā)散型條形圖 (Diverging Bars)相比,條的缺失減少了組之間的對(duì)比度和差異。

13. 帶標(biāo)記的發(fā)散型棒棒糖圖 (Diverging Lollipop Chart with Markers)

帶標(biāo)記的棒棒糖圖通過(guò)強(qiáng)調(diào)您想要引起注意的任何重要數(shù)據(jù)點(diǎn)并在圖表中適當(dāng)?shù)亟o出推理,提供了一種對(duì)差異進(jìn)行可視化的靈活方式。

14. 面積圖 (Area Chart)

通過(guò)對(duì)軸和線之間的區(qū)域進(jìn)行著色,面積圖不僅強(qiáng)調(diào)峰和谷,而且還強(qiáng)調(diào)高點(diǎn)和低點(diǎn)的持續(xù)時(shí)間。 高點(diǎn)持續(xù)時(shí)間越長(zhǎng),線下面積越大。

排序

15. 有序條形圖 (Ordered Bar Chart)

有序條形圖有效地傳達(dá)了項(xiàng)目的排名順序。 但是,在圖表上方添加度量標(biāo)準(zhǔn)的值,用戶可以從圖表本身獲取精確信息。

16. 棒棒糖圖 (Lollipop Chart)

棒棒糖圖表以一種視覺(jué)上令人愉悅的方式提供與有序條形圖類(lèi)似的目的。

17. 包點(diǎn)圖 (Dot Plot)

包點(diǎn)圖表傳達(dá)了項(xiàng)目的排名順序,并且由于它沿水平軸對(duì)齊,因此您可以更容易地看到點(diǎn)彼此之間的距離。

18. 坡度圖 (Slope Chart)

坡度圖最適合比較給定人/項(xiàng)目的“前”和“后”位置。

19. 啞鈴圖 (Dumbbell Plot)

啞鈴圖表傳達(dá)了各種項(xiàng)目的“前”和“后”位置以及項(xiàng)目的等級(jí)排序。如果您想要將特定項(xiàng)目/計(jì)劃對(duì)不同對(duì)象的影響可視化,那么它非常有用。

標(biāo)題分布

20. 連續(xù)變量的直方圖 (Histogram for Continuous Variable)

直方圖顯示給定變量的頻率分布。下面的圖表示基于類(lèi)型變量對(duì)頻率條進(jìn)行分組,從而更好地了解連續(xù)變量和類(lèi)型變量。

21. 類(lèi)型變量的直方圖 (Histogram for Categorical Variable)

類(lèi)型變量的直方圖顯示該變量的頻率分布。 通過(guò)對(duì)條形圖進(jìn)行著色,可以將分布與表示顏色的另一個(gè)類(lèi)型變量相關(guān)聯(lián)。

22. 密度圖 (Density Plot)

密度圖是一種常用工具,用于可視化連續(xù)變量的分布。 通過(guò)“響應(yīng)”變量對(duì)它們進(jìn)行分組,您可以檢查 X 和 Y 之間的關(guān)系。以下情況用于表示目的,以描述城市里程的分布如何隨著汽缸數(shù)的變化而變化。

23. 直方密度線圖 (Density Curves with Histogram)

帶有直方圖的密度曲線匯集了兩個(gè)圖所傳達(dá)的集體信息,因此您可以將它們放在一個(gè)圖中而不是兩個(gè)圖中。

24. Joy Plot

Joy Plot允許不同組的密度曲線重疊,這是一種可視化大量分組數(shù)據(jù)的彼此關(guān)系分布的好方法。 它看起來(lái)很悅目,并清楚地傳達(dá)了正確的信息。

25. 分布式包點(diǎn)圖 (Distributed Dot Plot)

分布式包點(diǎn)圖顯示按組分割的點(diǎn)的單變量分布。 點(diǎn)數(shù)越暗,該區(qū)域的數(shù)據(jù)點(diǎn)集中度越高。 通過(guò)對(duì)中位數(shù)進(jìn)行不同著色,組的真實(shí)定位立即變得明顯。

26. 箱形圖 (Box Plot)

箱形圖是一種可視化分布的好方法,記住中位數(shù)、第25個(gè)第45個(gè)四分位數(shù)和異常值。 但是,您需要注意解釋可能會(huì)扭曲該組中包含的點(diǎn)數(shù)的框的大小。 因此,手動(dòng)提供每個(gè)框中的觀察數(shù)量可以幫助克服這個(gè)缺點(diǎn)。

27. 包點(diǎn)+箱形圖 (Dot + Box Plot)

包點(diǎn)+箱形圖 (Dot + Box Plot)傳達(dá)類(lèi)似于分組的箱形圖信息。 此外,這些點(diǎn)可以了解每組中有多少數(shù)據(jù)點(diǎn)。

28. 小提琴圖 (Violin Plot)

小提琴圖是箱形圖在視覺(jué)上令人愉悅的替代品。 小提琴的形狀或面積取決于它所持有的觀察次數(shù)。 但是,小提琴圖可能更難以閱讀,并且在專(zhuān)業(yè)設(shè)置中不常用。

29. 人口金字塔 (Population Pyramid)

人口金字塔可用于顯示由數(shù)量排序的組的分布。 或者它也可以用于顯示人口的逐級(jí)過(guò)濾,因?yàn)樗谙旅嬗糜陲@示有多少人通過(guò)營(yíng)銷(xiāo)渠道的每個(gè)階段。

30. 分類(lèi)圖 (Categorical Plots)

分類(lèi)圖可用于可視化彼此相關(guān)的2個(gè)或更多分類(lèi)變量的計(jì)數(shù)分布。

組成

31. 華夫餅圖 (Waffle Chart)

用于顯示更大群體中的組的組成。

32. 餅圖 (Pie Chart)

餅圖是顯示組成的經(jīng)典方式。 然而,現(xiàn)在通常不建議使用它,因?yàn)轲W餅部分的面積有時(shí)會(huì)變得誤導(dǎo)。 因此,如果您要使用餅圖,強(qiáng)烈建議明確記下餅圖每個(gè)部分的百分比或數(shù)字。

33. 樹(shù)形圖 (Treemap)

樹(shù)形圖類(lèi)似于餅圖,它可以更好地完成工作而不會(huì)誤導(dǎo)每個(gè)組的貢獻(xiàn)。

34. 條形圖 (Bar Chart)

條形圖是基于計(jì)數(shù)或任何給定指標(biāo)可視化項(xiàng)目的經(jīng)典方式。 在下面的圖表中,我為每個(gè)項(xiàng)目使用了不同的顏色,但您通??赡芟M麨樗许?xiàng)目選擇一種顏色,除非您按組對(duì)其進(jìn)行著色。

變化

35. 時(shí)間序列圖 (Time Series Plot)

時(shí)間序列圖用于顯示給定度量隨時(shí)間變化的方式。 在這里,您可以看到 1949年 至 1969年間航空客運(yùn)量的變化情況。

36. 帶波峰波谷標(biāo)記的時(shí)序圖 (Time Series with Peaks and Troughs Annotated)

下面的時(shí)間序列繪制了所有峰值和低谷,并注釋了所選特殊事件的發(fā)生。

37. 自相關(guān)和部分自相關(guān)圖 (Autocorrelation (ACF) and Partial Autocorrelation (PACF) Plot)

自相關(guān)圖(ACF圖)顯示時(shí)間序列與其自身滯后的相關(guān)性。 每條垂直線(在自相關(guān)圖上)表示系列與滯后0之間的滯后之間的相關(guān)性。圖中的藍(lán)色陰影區(qū)域是顯著性水平。 那些位于藍(lán)線之上的滯后是顯著的滯后。

那么如何解讀呢?

對(duì)于空乘旅客,我們看到多達(dá)14個(gè)滯后跨越藍(lán)線,因此非常重要。這意味著,14年前的航空旅客交通量對(duì)今天的交通狀況有影響。

PACF在另一方面顯示了任何給定滯后(時(shí)間序列)與當(dāng)前序列的自相關(guān),但是刪除了滯后的貢獻(xiàn)。

38. 交叉相關(guān)圖 (Cross Correlation plot)

交叉相關(guān)圖顯示了兩個(gè)時(shí)間序列相互之間的滯后。

39. 時(shí)間序列分解圖 (Time Series Decomposition Plot)

時(shí)間序列分解圖顯示時(shí)間序列分解為趨勢(shì),季節(jié)和殘差分量。

40. 多個(gè)時(shí)間序列 (Multiple Time Series)

您可以繪制多個(gè)時(shí)間序列,在同一圖表上測(cè)量相同的值,如下所示。

41. 使用輔助 Y 軸來(lái)繪制不同范圍的圖形 (Plotting with different scales using secondary Y axis)

如果要顯示在同一時(shí)間點(diǎn)測(cè)量?jī)蓚€(gè)不同數(shù)量的兩個(gè)時(shí)間序列,則可以在右側(cè)的輔助Y軸上再繪制第二個(gè)系列。

42. 帶有誤差帶的時(shí)間序列 (Time Series with Error Bands)

如果您有一個(gè)時(shí)間序列數(shù)據(jù)集,每個(gè)時(shí)間點(diǎn)(日期/時(shí)間戳)有多個(gè)觀測(cè)值,則可以構(gòu)建帶有誤差帶的時(shí)間序列。 您可以在下面看到一些基于每天不同時(shí)間訂單的示例。 另一個(gè)關(guān)于45天持續(xù)到達(dá)的訂單數(shù)量的例子。

在該方法中,訂單數(shù)量的平均值由白線表示。 并且計(jì)算95%置信區(qū)間并圍繞均值繪制。

43. 堆積面積圖 (Stacked Area Chart)

堆積面積圖可以直觀地顯示多個(gè)時(shí)間序列的貢獻(xiàn)程度,因此很容易相互比較。

44. 未堆積的面積圖 (Area Chart UnStacked)

未堆積面積圖用于可視化兩個(gè)或更多個(gè)系列相對(duì)于彼此的進(jìn)度(起伏)。 在下面的圖表中,您可以清楚地看到隨著失業(yè)中位數(shù)持續(xù)時(shí)間的增加,個(gè)人儲(chǔ)蓄率會(huì)下降。 未堆積面積圖表很好地展示了這種現(xiàn)象。

45. 日歷熱力圖 (Calendar Heat Map)

與時(shí)間序列相比,日歷地圖是可視化基于時(shí)間的數(shù)據(jù)的備選和不太優(yōu)選的選項(xiàng)。 雖然可以在視覺(jué)上吸引人,但數(shù)值并不十分明顯。 然而,它可以很好地描繪極端值和假日效果。

46. 季節(jié)圖 (Seasonal Plot)

季節(jié)圖可用于比較上一季中同一天(年/月/周等)的時(shí)間序列。

分組

47. 樹(shù)狀圖 (Dendrogram)

樹(shù)形圖基于給定的距離度量將相似的點(diǎn)組合在一起,并基于點(diǎn)的相似性將它們組織在樹(shù)狀鏈接中。

48. 簇狀圖 (Cluster Plot)

簇狀圖 (Cluster Plot)可用于劃分屬于同一群集的點(diǎn)。 下面是根據(jù)USArrests數(shù)據(jù)集將美國(guó)各州分為5組的代表性示例。 此圖使用“謀殺”和“攻擊”列作為X和Y軸。 或者,您可以將第一個(gè)到主要組件用作X軸和Y軸。

49. 安德魯斯曲線 (Andrews Curve)

安德魯斯曲線有助于可視化是否存在基于給定分組的數(shù)字特征的固有分組。 如果要素(數(shù)據(jù)集中的列)無(wú)法區(qū)分組(cyl),那么這些線將不會(huì)很好地隔離,如下所示。

50. 平行坐標(biāo) (Parallel Coordinates)

平行坐標(biāo)有助于可視化特征是否有助于有效地隔離組。 如果實(shí)現(xiàn)隔離,則該特征可能在預(yù)測(cè)該組時(shí)非常有用。


END

    本站是提供個(gè)人知識(shí)管理的網(wǎng)絡(luò)存儲(chǔ)空間,所有內(nèi)容均由用戶發(fā)布,不代表本站觀點(diǎn)。請(qǐng)注意甄別內(nèi)容中的聯(lián)系方式、誘導(dǎo)購(gòu)買(mǎi)等信息,謹(jǐn)防詐騙。如發(fā)現(xiàn)有害或侵權(quán)內(nèi)容,請(qǐng)點(diǎn)擊一鍵舉報(bào)。
    轉(zhuǎn)藏 分享 獻(xiàn)花(0

    0條評(píng)論

    發(fā)表

    請(qǐng)遵守用戶 評(píng)論公約

    類(lèi)似文章 更多