人們說Python很慢,可能會很慢每當出現(xiàn)編程速度競賽時,Python通常都會走到最底層。有人說這是因為Python是一種解釋語言。所有的解釋語言都很慢。但是我們知道Java也是一種語言,它的字節(jié)碼由JVM解釋。 https://benchmarksgame-team.pages.debian.net/benchmarksgame/fastest/python3-java.html 如本基準測試所示,Java比Python快得多。 這是一個可以演示Python慢度的示例。使用傳統(tǒng)的for循環(huán)產(chǎn)生倒數(shù): import numpy as np np.random.seed(0) values = np.random.randint(1, 100, size=1000000) def get_reciprocal(values): output = np.empty(len(values)) for i in range(len(values)): output[i] = 1.0/values[i] %timeit get_reciprocal(values) 結果: 每個循環(huán)3.37 s±582毫秒(平均±標準偏差,共7次運行,每個循環(huán)1次) 神圣的xxx,計算1,000,000個倒數(shù)需要3.37s。C語言中的相同邏輯只需要眨一下就可以了:9ms ; C#需要19毫秒; Nodejs花費26ms ; Java需要5毫秒!而Python則采用了自我懷疑的3.37秒。(我在最后附加了所有測試代碼)。 緩慢的根本原因我們通常將Python稱為動態(tài)類型編程語言。而且Python程序中的所有內(nèi)容都是object,換句話說,每次Python代碼處理數(shù)據(jù)時,都需要將對象包裝拆箱。在 與C之類的傳統(tǒng)語言不同,對數(shù)據(jù)的訪問是直接的,而在Python中,大量的CPU周期用于檢查類型。 即使是簡單的數(shù)字分配也將花費很長時間。 a = 1 步驟1.設置a->PyObject_HEAD->typecode為整數(shù) 步驟2.設置a->val =1 解決方案:NumPy通用函數(shù)與Python列表不同,NumPy數(shù)組是圍繞C數(shù)組構建的對象。NumPy中的訪問項無需任何步驟即可檢查類型。這使我們了解了解決方案,它是NumPy通用函數(shù)(又稱UFunc)。 簡而言之,UFunc是一種我們可以直接對整個數(shù)組進行算術運算的方法。將第一個慢速Python示例轉(zhuǎn)換為UFunc版本,它將像這樣: import numpy as np np.random.seed(0) values = np.random.randint(1, 100, size=1000000) %timeit result = 1.0/values 此代碼不僅可以提高速度,還可以縮短代碼長度。猜猜現(xiàn)在需要多少時間?比我上面提到的任何其他語言快2.7ms: 每個循環(huán)2.71 ms±50.8 μs(平均±標準偏差,共運行7次,每個循環(huán)100個) 1.0/values 。值這里是不是一個數(shù)字,它是一個NumPy的陣列。像除法運算符一樣,還有很多其他運算符。檢查這里的所有Ufunc運營商。 對于那些使用Python的人,您很有可能使用Python處理數(shù)據(jù)和數(shù)字。這些數(shù)據(jù)可以存儲在NumPy或Pandas DataFrame中,因為DataFrame是基于NumPy實現(xiàn)的。因此,Ufunc也可以。 UFunc使我們能夠在Python中以數(shù)量級更快的速度執(zhí)行重復操作。最慢的Python甚至可以比C語言更快。太棒了。 附錄— C,C#,Java和NodeJS的測試代碼C語言: #include <stdio.h> #include <stdlib.h> #include <sys/time.h>
int main(){ struct timeval stop, start; gettimeofday(&start, NULL); int length = 1000000; int rand_array[length]; float output_array[length]; for(int i = 0; i<length; i++){ rand_array[i] = rand(); } for(int i = 0; i<length; i++){ output_array[i] = 1.0/(rand_array[i]*1.0); } gettimeofday(&stop, NULL); printf("took %lu us\n", (stop.tv_sec - start.tv_sec) * 1000000 + stop.tv_usec - start.tv_usec); printf("done\n"); return 0; } C#(dotnet 5.0): using System; namespace speed_test{ class Program{ static void Main(string[] args){ int length = 1000000; double[] rand_array =new double[length]; double[] output = new double[length]; var rand = new Random(); for(int i =0; i<length;i++){ rand_array[i] = rand.Next(); //Console.WriteLine(rand_array[i]); } long start = DateTimeOffset.Now.ToUnixTimeMilliseconds(); for(int i =0;i<length;i++){ output[i] = 1.0/rand_array[i]; } long end = DateTimeOffset.Now.ToUnixTimeMilliseconds(); Console.WriteLine(end - start); } } } Java: import java.util.Random;
public class speed_test { public static void main(String[] args){ int length = 1000000; long[] rand_array = new long[length]; double[] output = new double[length]; Random rand = new Random (); for(int i =0; i<length; i++){ rand_array[i] = rand.nextLong(); } long start = System.currentTimeMillis(); for(int i = 0;i<length; i++){ output[i] = 1.0/rand_array[i]; } long end = System.currentTimeMillis(); System.out.println(end - start); } } NodeJS: let length = 1000000; let rand_array = []; let output = []; for(var i=0;i<length;i++){ rand_array[i] = Math.floor(Math.random()*10000000); } let start = (new Date()).getMilliseconds(); for(var i=0;i<length;i++){ output[i] = 1.0/rand_array[i]; } let end = (new Date()).getMilliseconds(); console.log(end - start); |
|