日韩黑丝制服一区视频播放|日韩欧美人妻丝袜视频在线观看|九九影院一级蜜桃|亚洲中文在线导航|青草草视频在线观看|婷婷五月色伊人网站|日本一区二区在线|国产AV一二三四区毛片|正在播放久草视频|亚洲色图精品一区

分享

數(shù)據(jù)分析入門極簡書單

 東西二王 2019-05-16

如果你找一個熟悉的朋友給你推薦書單,他會傾向于越短越好,因?yàn)?strong>他想把他知道的最好的推薦給你,讓你少花時間在不重要的事情上。

但如果你在網(wǎng)上看到一個書單,往往會發(fā)現(xiàn)都很長長長長長,長到你覺得別人都能日讀40萬字而自己是個天天刷朋友圈的懶癌患者。別擔(dān)心,告訴你個小秘密,列書單的人很可能自己也沒讀完書單里的書哦。

所以我想做的是像你的朋友一樣,推薦一份數(shù)據(jù)分析入門的極簡書單給你,并且?guī)湍闵疃仍u測,告訴你什么是最值得讀的、不得不讀的。

你不是吃個火鍋都要看評測嗎?吃火鍋也就花個兩小時吧,但是讀一本書,很可能要花上一個月時間呀,這么大的時間成本,總應(yīng)該更慎重的做出決定吧。

數(shù)據(jù)分析入門極簡書單

以下評測會從數(shù)據(jù)分析崗位必備的三個技能出發(fā):

  • SQL

  • 統(tǒng)計(jì)學(xué)

  • Python 數(shù)據(jù)分析

最終獲得的結(jié)果是相應(yīng)的3本最推薦的入門書。

數(shù)據(jù)分析入門極簡書單

一提到 SQL 入門,呼聲最高的是這3本書:

《MySQL必知必會》- Ben Forta[1]

《SQL必知必會》- Ben Forta[2]

《SQL基礎(chǔ)教程》- Mick[3]

數(shù)據(jù)分析入門極簡書單

《MySQL必知必會》還是《SQL必知必會》傻傻分不清楚?

首先要搞清楚的一件事,《MySQL必知必會》和《SQL必知必會》是同一個作者 Ben Forta ,《SQL必知必會》的前20章所有內(nèi)容在《MySQL必知必會》里都有,并且多了10章針對 MySQL 的內(nèi)容。

這是作者在前言中的解釋:

數(shù)據(jù)分析入門極簡書單

考慮到在中國 MySQL 還是占主流,評測時選擇了后出版的、內(nèi)容更豐富的《MySQL必知必會》。

(出版社喜歡把這兩本捆綁在一起賣,真的沒必要都買,80%內(nèi)容都雷同的)

知識結(jié)構(gòu) PK

先放上兩張我悉心整理的全書思維導(dǎo)圖,一眼就可以看出《MySQL必知必會》和《SQL基礎(chǔ)教程》的不同:

數(shù)據(jù)分析入門極簡書單

《MySQL必知必會》思維導(dǎo)圖[4]

數(shù)據(jù)分析入門極簡書單

《SQL基礎(chǔ)教程》思維導(dǎo)圖[5]

《MySQL必知必會》這本書講解的非常的全面。

光是最常用的 SELECT語句就花了12章來細(xì)細(xì)講解。并且整本讀下來會感覺到邏輯是非常清晰的,時刻知道自己學(xué)的是知識體系上的哪一個分支。

而《SQL基礎(chǔ)教程》的講述結(jié)構(gòu)并不是按照知識的邏輯,而是按照使用的邏輯。

所以你會看到在思維導(dǎo)圖上會出現(xiàn)同一章的不同節(jié)被拆開放到了不同分支的情況,第三章第一節(jié)還在講聚合函數(shù),到了第二節(jié)就去講 SELECT 語句的 GROUP BY 子句了,因?yàn)樵谧髡呖磥磉@兩節(jié)都是用來解決「聚合與排序」這個使用場景的問題,所以就被歸納到了一起。

和《MySQL必知必會》相比其實(shí)是少了很多知識點(diǎn)的,《MySQL必知必會》用了4章去講解的 WHERE 子句,在《SQL基礎(chǔ)教程》中就只有1小節(jié)帶過。

講述方式 PK

這里對比一下最基本的 SELECT 語句這個知識點(diǎn)的講述方式:

數(shù)據(jù)分析入門極簡書單

《MySQL必知必會》的講述方式幾乎沒什么廢話,直接上案例,需要輸入什么代碼,會輸出什么結(jié)果,都用很清晰的方式呈現(xiàn)出來。對于一些細(xì)枝末節(jié)的細(xì)節(jié)提示和說明,都采用灰框的方式附在案例后面逐一列出。

數(shù)據(jù)分析入門極簡書單

《SQL基礎(chǔ)教程》使用了雙色印刷,配了表格圖片去幫助讀者理解。在案例代碼之前,還會多給一個基本語法的示例,講解同一個知識點(diǎn)的篇幅會更長,甚至?xí)悬c(diǎn)啰嗦。

對比來看,《MySQL必知必會》的簡明的講述方式更適合喜歡簡單直接的理工直男,《SQL基礎(chǔ)教程》更適合喜歡詳盡說明的文科生。

對學(xué)習(xí)過程的考慮 PK

數(shù)據(jù)分析入門極簡書單

《MySQL必知必會》在每章的開始會有一個一句話簡介,每章的末尾會有一小段的小結(jié),和整體的行文風(fēng)格一樣,都是非常簡明扼要的,也方便查閱。

數(shù)據(jù)分析入門極簡書單

《SQL基礎(chǔ)教程》在每章和每節(jié)開始之前會有一個詳盡的說明和學(xué)習(xí)重點(diǎn)清單,在每章結(jié)束時會有幾道練習(xí)題。

SQL 入門推薦書:《MySQL必知必會》

如果你需要在工作中用到 SQL,還是更推薦《MySQL必知必會》,這本書的知識點(diǎn)覆蓋是更全面的,簡明扼要的風(fēng)格也方便隨時查閱。

如果你缺乏理工科背景、抽象思維比較弱、注意力已經(jīng)被碎片化閱讀摧毀,可以先閱讀《SQL基礎(chǔ)教程》,更便于你理解。能上手了之后,再去讀《MySQL必知必會》補(bǔ)全知識體系。

數(shù)據(jù)分析入門極簡書單

作為統(tǒng)計(jì)學(xué)的入門,我們以這兩本書來進(jìn)行深入對比。

《深入淺出統(tǒng)計(jì)學(xué)》- Dawn Griffiths[6]

《商務(wù)與經(jīng)濟(jì)統(tǒng)計(jì)學(xué)》-詹姆斯·麥克拉夫[7]

數(shù)據(jù)分析入門極簡書單

統(tǒng)計(jì)學(xué)的教材可以說是非常多了,并且相似度很高,在這里選取人大出版的這本經(jīng)典之作《商務(wù)與經(jīng)濟(jì)統(tǒng)計(jì)學(xué)》。

有些 900 多頁的教材屬于進(jìn)階學(xué)習(xí),不算是入門書了。

另外一些社科雞湯類的書也沒有放進(jìn)來,在我看來,人是無法以繞開知識本身的方式學(xué)到知識的。

知識結(jié)構(gòu) PK

還是先放兩張全書思維導(dǎo)圖

數(shù)據(jù)分析入門極簡書單

《深入淺出統(tǒng)計(jì)學(xué)》思維導(dǎo)圖[8]

數(shù)據(jù)分析入門極簡書單

《商務(wù)與經(jīng)濟(jì)統(tǒng)計(jì)學(xué)》思維導(dǎo)圖[9]

《深入淺出統(tǒng)計(jì)學(xué)》涵蓋了基本的統(tǒng)計(jì)學(xué)概念,默認(rèn)讀者是零基礎(chǔ)。

甚至連平均數(shù)、中位數(shù)這種小學(xué)六年級教材中的基礎(chǔ)知識都會細(xì)細(xì)講解。一般來說,一本書越是照顧零基礎(chǔ),書的知識點(diǎn)深度就會越低,這本也不例外。包括比較重點(diǎn)的描述統(tǒng)計(jì)、假設(shè)驗(yàn)證都停留在簡單例子的步驟上。

當(dāng)然,這種方式的好處是激發(fā)讀者興趣,如果一本書是用漫畫或者小說去講解統(tǒng)計(jì)學(xué),那知識點(diǎn)深度就更低了。

《商務(wù)與經(jīng)濟(jì)統(tǒng)計(jì)學(xué)》的結(jié)構(gòu)就是按照知識的邏輯來進(jìn)行講述的。

知識難度會循序漸進(jìn)的去遞進(jìn),先讓你理解最簡單的情景,再逐漸去增加情景的復(fù)雜度,比如從單樣本到多樣本,從簡單線性回歸到多元線性回歸。并且所有案例都是基于真實(shí)的數(shù)據(jù)去展開的,這也讓知識點(diǎn)的覆蓋更加全面。

講述方式 PK

這里用統(tǒng)計(jì)學(xué)里一個經(jīng)典的知識點(diǎn)「正態(tài)分布」來對比兩本書講述方式的不同:

數(shù)據(jù)分析入門極簡書單

《深入淺出統(tǒng)計(jì)學(xué)》用生活中的小事作為案例,一個女生找高個男朋友的例子去引出正態(tài)分布的概念,用了很多的插圖去輔助讀者理解,并且每個概念后面會有一個「世上沒有傻問題」的欄目去整理出所有的常見問題和回答,解答初學(xué)者心中的疑問。

我還沒見過看不懂《深入淺出》的人呢,這個難度高一學(xué)生也能看懂的。有些地方甚至?xí)杏X太簡單而讀不下去。

數(shù)據(jù)分析入門極簡書單

《商務(wù)與經(jīng)濟(jì)統(tǒng)計(jì)學(xué)》不像一般的教材會寫大段的概念和定義,而是用了大量的例子幫助讀者真正理解,講正態(tài)分布這一個概念就用了 9 個例子。并且這些例子都是用的真實(shí)的數(shù)據(jù)和貼近實(shí)際工作的場景。

對學(xué)習(xí)過程的考慮 PK

數(shù)據(jù)分析入門極簡書單

《深入淺出統(tǒng)計(jì)學(xué)》的「動動腦」欄目通過問題促使讀者思考。「動動筆」欄目通過幾道練習(xí)題,讓你動手練習(xí),在下一頁有「動動筆解答」?!敢c(diǎn)」欄目概括了這一小節(jié)的重點(diǎn)內(nèi)容。

數(shù)據(jù)分析入門極簡書單

《商務(wù)與經(jīng)濟(jì)統(tǒng)計(jì)學(xué)》每章有一個章末小結(jié),包括這幾點(diǎn):

  • 關(guān)鍵術(shù)語

  • 關(guān)鍵符號

  • 關(guān)鍵知識點(diǎn)

  • 關(guān)鍵公式

所有總結(jié)要點(diǎn)都以要點(diǎn)或表格的方式簡練概括。 另外還有本章相應(yīng)的練習(xí)題。

統(tǒng)計(jì)學(xué)入門推薦書:《商務(wù)與經(jīng)濟(jì)統(tǒng)計(jì)學(xué)》

如果你是理工科背景、或者在本科學(xué)習(xí)過高等數(shù)學(xué),可以選擇《商務(wù)與經(jīng)濟(jì)統(tǒng)計(jì)學(xué)》,其中大量的實(shí)際案例能讓你更容易補(bǔ)全知識體系、上手實(shí)際應(yīng)用。

如果你的數(shù)學(xué)基礎(chǔ)較弱,可以選擇《深入淺出統(tǒng)計(jì)學(xué)》,跟著練一遍,這是人人都能看懂的。

數(shù)據(jù)分析入門極簡書單

數(shù)據(jù)分析入門的經(jīng)典書籍,我們以這兩本口碑最好的來進(jìn)行對比:

《利用Python進(jìn)行數(shù)據(jù)分析第一版》- Wes McKinney[10]

《利用Python進(jìn)行數(shù)據(jù)分析第二版》- Wes McKinney[11]

《Python數(shù)據(jù)科學(xué)手冊》- Jake VanderPlas[12]

數(shù)據(jù)分析入門極簡書單

利用 Python 進(jìn)行數(shù)據(jù)分析第一版還是第二版?

數(shù)據(jù)分析入門極簡書單

很多人在推薦這本書時會放第一版的封面圖,在這里旗幟鮮明的反對!

第一版和第二版隔了整整 6 年時間;第一版用的是 Python2.7,第二版用的是 Python3.6;第一版用的是 pandas 0.1.0 版本,第二版用的是 pandas 0.22.0 版本。技術(shù)變化這么快,當(dāng)然要選第二版。

而且兩個版本很好區(qū)分的,第二版的耗子頭是朝左的,而不是像第一版那樣朝右的。讀者朋友們,請認(rèn)清朝左的耗子頭啊!

知識結(jié)構(gòu) PK

還是先放兩張全書思維導(dǎo)圖

數(shù)據(jù)分析入門極簡書單

《利用Python進(jìn)行數(shù)據(jù)分析 第二版》思維導(dǎo)圖[13]

數(shù)據(jù)分析入門極簡書單

《Python數(shù)據(jù)科學(xué)手冊》思維導(dǎo)圖[14]

《利用Python進(jìn)行數(shù)據(jù)分析》這本書的層級結(jié)構(gòu)設(shè)計(jì)的非常漂亮。

我特地用了不同的顏色去體現(xiàn)了他的層次。

大家都知道,這本書的作者 Wes McKinney 就是 pandas 庫的主要作者,但這本書的結(jié)構(gòu)并不是圍繞著 pandas 庫而展開的——不然就直接去看 pandas 文檔好了。這本書的結(jié)構(gòu)超越了某個庫或者某個語言,最核心的部分是以數(shù)據(jù)分析的工作流展開的,從數(shù)據(jù)載入、數(shù)據(jù)清洗、數(shù)據(jù)規(guī)整到數(shù)據(jù)可視化、數(shù)據(jù)建模。這種結(jié)構(gòu)對于不熟悉數(shù)據(jù)分析工作流的讀者是非常有幫助的。

并且這本書的第 2 章、第 3 章包含了數(shù)據(jù)分析會用到的 Python 基礎(chǔ)語法,對零基礎(chǔ)的讀者挺友好的。

《Python數(shù)據(jù)科學(xué)手冊》這本書的結(jié)構(gòu)非常扁平,就 5 章。

第 1 章著重介紹了作者偏愛的 IPython 的各種用法,然后 NumPy, pandas, matplotlib 各一章,第 5 章是機(jī)器學(xué)習(xí)。整體是以知識邏輯去組織的。

講述方式 PK

這里選取數(shù)據(jù)清洗工作中的一個關(guān)鍵知識點(diǎn)「過濾缺失值」來進(jìn)行兩本書的對比。

數(shù)據(jù)分析入門極簡書單

《利用Python進(jìn)行數(shù)據(jù)分析》在講解「過濾缺失值」時會選取最好用的一種方法進(jìn)行細(xì)致講解,然后說明了如何剔除含有缺失值的行、列。以及個性化的配置。

數(shù)據(jù)分析入門極簡書單

《Python數(shù)據(jù)科學(xué)手冊》在講解「過濾缺失值」時也使用了 dropna() 方法,代碼部分幾乎和《利用Python進(jìn)行數(shù)據(jù)分析》一致,文字?jǐn)⑹錾蠈κ褂脠鼍暗臄⑹鰰远嘁恍?/p>

對學(xué)習(xí)過程的考慮 PK

數(shù)據(jù)分析入門極簡書單

《利用Python進(jìn)行數(shù)據(jù)分析》有比較簡略的每章前言和每章小節(jié),比較有特色的是篇幅中會穿插 3 類提示,分別是:提示或建議、一般性說明、警告。另外會有大量表格整理有用的方法。沒有練習(xí)題。

數(shù)據(jù)分析入門極簡書單

《Python數(shù)據(jù)科學(xué)手冊》把上章小結(jié)和本章前言合并在一起講。另外每章末尾有一個參考資料合集。也沒有練習(xí)題。

數(shù)據(jù)分析入門推薦書:《利用 Python 進(jìn)行數(shù)據(jù)分析第二版》

《利用Python進(jìn)行數(shù)據(jù)分析 第二版》的知識結(jié)構(gòu)更勝一籌。

這本書的作者 Wes McKinney 就是 pandas 庫的主要作者。全書最核心的部分是以數(shù)據(jù)分析的工作流展開的,從數(shù)據(jù)載入、數(shù)據(jù)清洗、數(shù)據(jù)規(guī)整到數(shù)據(jù)可視化、數(shù)據(jù)建模。這種結(jié)構(gòu)對于不熟悉數(shù)據(jù)分析工作流的讀者是非常有幫助的。

數(shù)據(jù)分析入門極簡書單

下次,如果你有朋友問你,學(xué)數(shù)據(jù)分析應(yīng)該看哪本書?就直接把這篇測評發(fā)給他就可以啦。


References

[1] 《MySQL必知必會》- Ben Forta: https://book.douban.com/subject/3354490/

[2] 《SQL必知必會》- Ben Forta: https://book.douban.com/subject/24250054/

[3] 《SQL基礎(chǔ)教程》- Mick: https://book.douban.com/subject/24841239/

[4] 《MySQL必知必會》思維導(dǎo)圖: https://video./MySQLcrash.png

[5] 《SQL基礎(chǔ)教程》思維導(dǎo)圖: https://video./SQLmick.png

[6] 《深入淺出統(tǒng)計(jì)學(xué)》- Dawn Griffiths: https://book.douban.com/subject/7056708/

[7] 《商務(wù)與經(jīng)濟(jì)統(tǒng)計(jì)學(xué)》-詹姆斯·麥克拉夫: https://book.douban.com/subject/26410924/

[8] 《深入淺出統(tǒng)計(jì)學(xué)》思維導(dǎo)圖: https://video./HeadFirstStatistics.png

[9] 《商務(wù)與經(jīng)濟(jì)統(tǒng)計(jì)學(xué)》思維導(dǎo)圖: https://video./StatisticsForBE.png

[10] 《利用Python進(jìn)行數(shù)據(jù)分析第一版》- Wes McKinney: https://book.douban.com/subject/25779298/

[11] 《利用Python進(jìn)行數(shù)據(jù)分析第二版》- Wes McKinney: https://book.douban.com/subject/25779298/

[12] 《Python數(shù)據(jù)科學(xué)手冊》- Jake VanderPlas: https://book.douban.com/subject/27667378/

[13] 《利用Python進(jìn)行數(shù)據(jù)分析 第二版》思維導(dǎo)圖: https://video./PythonForDA2nd.png

[14] 《Python數(shù)據(jù)科學(xué)手冊》思維導(dǎo)圖: https://video./PDS.png

    本站是提供個人知識管理的網(wǎng)絡(luò)存儲空間,所有內(nèi)容均由用戶發(fā)布,不代表本站觀點(diǎn)。請注意甄別內(nèi)容中的聯(lián)系方式、誘導(dǎo)購買等信息,謹(jǐn)防詐騙。如發(fā)現(xiàn)有害或侵權(quán)內(nèi)容,請點(diǎn)擊一鍵舉報(bào)。
    轉(zhuǎn)藏 分享 獻(xiàn)花(0

    0條評論

    發(fā)表

    請遵守用戶 評論公約

    類似文章 更多