近日,數(shù)據(jù)科學(xué)網(wǎng)站KDnuggets發(fā)布 2018年數(shù)據(jù)科學(xué)和機(jī)器學(xué)習(xí)工具調(diào)查結(jié)果。下面一起來看看調(diào)查結(jié)果 最受青睞的分析、數(shù)據(jù)科學(xué)、機(jī)器學(xué)習(xí)工具 圖1:2018年的最受青睞的工具及其在2016 - 2017年調(diào)查中的份額 *為了更有效的比較,KDnuggets重新計(jì)算了2016年,2017年問卷調(diào)查結(jié)果,排除了受訪者“單一”的選項(xiàng)。 下表是前11名的工具排行,其中每個(gè)工具至少有20%的份額: 表1:KDnuggets2018年頂級分析/數(shù)據(jù)科學(xué)/ ML軟件調(diào)查 在這里,“2018%share”是指使用該工具的受訪者百分比,“ %change 2018 VS 2017”是表示2017年調(diào)查的變化 ,用綠色表示增長幅度達(dá)到10%以上,紅色表示下降幅度達(dá)到10%以上。 今年,每名受訪者的平均使用工具數(shù)量為7個(gè),略高于2017年投票中的6.75(不包括單一工具回復(fù))。 與2017年軟件投票相比,今年前11名中,出現(xiàn)了一個(gè)新面孔Keras,Keras取代了去年Knime的位置。下面是針對以上數(shù)據(jù)的一些觀察發(fā)現(xiàn): Python消滅了R 到2017年,Python已經(jīng)擁有超過50%的份額,如今已經(jīng)將其份額提高到66%,而在我們此次的調(diào)查中,R份額首次出現(xiàn)下降,而且是一下子降到50%以下。 RapidMiner激增 在過去的幾次調(diào)查中,RapidMiner一直是最大的數(shù)據(jù)科學(xué)平臺之一,它的份額從2017年的33%大幅增加到50%左右。 這樣的增長速度是否是因?yàn)閺S商的推廣帶來的呢?RapidMiner創(chuàng)始人兼總裁Ingo Mierswa的表示:
SQL是穩(wěn)定的 SQL(包括Spark SQL和SQL to Hadoop工具在內(nèi))在最近的3次調(diào)查中仍然占有約40%的份額。所以,如果你是一位有抱負(fù)的數(shù)據(jù)科學(xué)家,學(xué)習(xí)SQL吧,它可能會對你很有用! 趨勢 在調(diào)查中,使用率超過2%的新工具是Spark SQL,擁有11.7%的份額。 下表列出了2018年份額增長20%以上的工具,并在2018年達(dá)到至少3%的份額。 表 2:使用率增幅最大的主要分析/數(shù)據(jù)科學(xué)/機(jī)器學(xué)習(xí)工具 整合 值得一提的是,在2017年擁有2%以上份額的56個(gè)工具中,有19個(gè)(僅約三分之一)工具在2018年份額有所增加,而有37個(gè)的份額下降。結(jié)合Datawatch收購Angoss,Minitab收購Salford等近期的收購案可以表明,數(shù)據(jù)科學(xué)平臺的整合即將展開。 2018年擁有3%以上份額,卻在2018年份額下降25%以上的工具見下表: 表 3:使用率跌幅最大的主要分析/數(shù)據(jù)科學(xué)工具 深度學(xué)習(xí)工具 使用深度學(xué)習(xí)工具的受訪者比例保持穩(wěn)定,2018年有33%的受訪者表示使用深度學(xué)習(xí)工具,2017年為32%,2016年為18%。 谷歌Tensorflow依然是最主要的平臺。 頂級深度學(xué)習(xí)工具排名如下: ● Tensorflow, 29.9% ● Keras, 22.2% ● PyTorch, 6.4% ● Theano, 4.9% ● Other Deep Learning Tools, 4.9% ● DeepLearning4J, 3.4% ● Microsoft Cognitive Toolkit (Prev. CNTK), 3.0% ● Apache MXnet, 1.5% ● Caffe, 1.5% ● Caffe2, 1.2% ● TFLearn, 1.1% ● Torch, 1.0% ● Lasagne, 0.3% 大數(shù)據(jù)工具:Hadoop被拋棄 2018年,約33%的開發(fā)者使用Hadoop或Spark等大數(shù)據(jù)工具 - 與2017年大致相同,但Hadoop使用率顯著下降,下降幅度高達(dá)35%,以下是詳細(xì)信息: 編程語言 Python似乎不僅超過了R,還包括大多數(shù)其他語言,目前Python和SQL,Java和C / C ++幾乎保持在相同水平。自從KDnuggets 進(jìn)行這項(xiàng)調(diào)查以來,R第一次出現(xiàn)了下降。其他語言同樣也有所下降。 以下是按熱門度排序的主要編程語言: ● Python, 65.6% (was 59.0% in 2017), 11% up ● R, 48.5% (was 56.6%), 14% down ● SQL, 39.6% (was 39.2%), 1% up ● Java, 15.1% (was 15.5%), 3% down ● Unix, shell/awk/gawk, 9.2% (was 10.8%), 15% down ● Other programming and data languages, 6.9%, (was 7.6%), -9% down ● C/C++, 6.8%, (was 7.1%), 3% down ● Scala, 5.9%, (was 8.3%), 29% down ● Perl, 1.0% (was 1.9%), 46% down ● Julia, 0.7% (was 1.2%), 45% down ● Lisp, 0.3% (was 0.4%), -25% down ● Clojure, 0.2% (was 0.3%), -38% down ● F, # 0.1% (was 0.5%), -73% down 完整結(jié)果和 3 年來的趨勢 以下表格展示了調(diào)查結(jié)果的細(xì)節(jié)(此處僅列出排名前 20 的工具): ●編號3109,輸入編號直達(dá)本文 ●輸入m獲取文章目錄 |
|