日韩黑丝制服一区视频播放|日韩欧美人妻丝袜视频在线观看|九九影院一级蜜桃|亚洲中文在线导航|青草草视频在线观看|婷婷五月色伊人网站|日本一区二区在线|国产AV一二三四区毛片|正在播放久草视频|亚洲色图精品一区

分享

用Python建立自己的數(shù)據(jù)分析平臺(tái)

 powerbaby 2016-02-13

Python,R作為量化領(lǐng)域領(lǐng)域兩門主流的語(yǔ)言,各有千秋,R語(yǔ)法比較“迂回”,加上先開始學(xué)習(xí)python,當(dāng)然會(huì)成為首選的工具語(yǔ)言,python在數(shù)據(jù)分析方面有很多成熟的庫(kù),所以如果在linux環(huán)境下布置自己的分析環(huán)境一定會(huì)有很多便利,很多券商例如華寶證券,萬(wàn)得,IB都有開放的 python api接口,如果需要開發(fā)自己的交易平臺(tái)時(shí)這也會(huì)帶來(lái)很大便利。

前面提到在linux系統(tǒng)下做部署有一些天然優(yōu)勢(shì),但是所依賴的一系列工具都是一樣的,本來(lái)一直在使用ubuntu,在部署環(huán)境開始時(shí)很順利,但是最后在安裝一個(gè)獲取國(guó)內(nèi)數(shù)據(jù)的包時(shí)受挫,可能一直以來(lái)都把Ubuntu做為跟window一樣的平臺(tái)去使用,很多在ubuntu環(huán)境下的設(shè)置操作都不太熟練,兩天找不到解決方案,就轉(zhuǎn)戰(zhàn)到windows環(huán)境下,因?yàn)橹芭渲眠^ipython notebook,所以安裝很順利,下面主要介紹下windows下的設(shè)置步驟。

1當(dāng)然所有的軟件都依賴最基層的python,pip可以使我們?cè)谄脚_(tái)上安裝一些依賴的包像在Linux系統(tǒng)下一樣方便,pip的安裝可以參考這篇文章http:///1dlBFo。

2接下來(lái)需要安裝的軟件:numpy,pandas,tushare,matplotlib,scipy,lxml,xlwt.

其中numpy/scipy可以快速高效的進(jìn)行數(shù)組和矩陣運(yùn)算,python本事也自帶有數(shù)組運(yùn)算的list容器,但是numpy可以省略代碼中很多的循環(huán)語(yǔ)句,這樣大大提高了效率,特別是在處理較大規(guī)模的數(shù)據(jù)時(shí),具體效率高出多少,可以參考numpy指南一書中的例子。

pandas由AQR Capital Management開發(fā),主要用于處理數(shù)據(jù)“沖突”和時(shí)間序列分析,Pandas的名稱來(lái)自于面板數(shù)據(jù)(panel data)和python數(shù)據(jù)分析(data analysis),同時(shí)它也是tushare庫(kù)的基礎(chǔ),在使用tushare之前必須先安裝pandas,兩者操作的語(yǔ)法幾乎一樣,tushare一個(gè)財(cái)經(jīng)數(shù)據(jù)接口包,由國(guó)內(nèi)開發(fā)者在Pypi發(fā)布,使用爬蟲系統(tǒng)從新浪財(cái)經(jīng),雅虎財(cái)經(jīng),以及上交所,深交所提供的數(shù)據(jù),十分強(qiáng)大,誰(shuí)用誰(shuí)知道。。官網(wǎng):http://tushare.,作者微博:http://weibo.com/u/1304687120,你可以在官網(wǎng)看到你可以用tushare獲得的數(shù)據(jù)以及步驟。  安裝tushare之前先安裝lxml,不然在讀取安裝地址時(shí)會(huì)出現(xiàn)錯(cuò)誤。

matplotlib用以數(shù)據(jù)的可視化,比如繪制圖表等等,xlwt是一個(gè)可以把用python抓取的數(shù)據(jù)存入excel的工具,也可以存入csv文件,當(dāng)然所以來(lái)的庫(kù)包含在pandas中,所以不用額外安裝,當(dāng)然如果想從excel中讀取數(shù)據(jù)可以安裝xlrd庫(kù)存。截一張安裝命令及成功截圖

 

介紹完了幾個(gè)主要庫(kù)的功能,他們的安裝全都依靠一個(gè)命令:pip install xx,xx為你要安裝的庫(kù),安裝順序以及必備的庫(kù)上面已經(jīng)介紹過,當(dāng)然這只是對(duì)初學(xué)者,對(duì)于一些數(shù)據(jù)分析高手,比如經(jīng)常參加業(yè)內(nèi)比較出名的比賽kaggle,或者國(guó)內(nèi)由阿里巴巴組織的天池大數(shù)據(jù)比賽,你還需要更強(qiáng)大的工具,比如scikit-learn,可以用于機(jī)器學(xué)習(xí)和人工智能算法,pyspark結(jié)合了大數(shù)據(jù)分析領(lǐng)域火熱的spark,在處理海量數(shù)據(jù)時(shí)可以使用。好了,這篇文章主要講述分析所以來(lái)的軟件和庫(kù),下一篇會(huì)講利用這些庫(kù)進(jìn)行一些入門工作。

當(dāng)前頁(yè)面網(wǎng)址http://www./gongju/1734,轉(zhuǎn)載請(qǐng)保留

    本站是提供個(gè)人知識(shí)管理的網(wǎng)絡(luò)存儲(chǔ)空間,所有內(nèi)容均由用戶發(fā)布,不代表本站觀點(diǎn)。請(qǐng)注意甄別內(nèi)容中的聯(lián)系方式、誘導(dǎo)購(gòu)買等信息,謹(jǐn)防詐騙。如發(fā)現(xiàn)有害或侵權(quán)內(nèi)容,請(qǐng)點(diǎn)擊一鍵舉報(bào)。
    轉(zhuǎn)藏 分享 獻(xiàn)花(0

    0條評(píng)論

    發(fā)表

    請(qǐng)遵守用戶 評(píng)論公約

    類似文章 更多