如果隨機變量X的所有可能取值不可以逐個列舉出來,而是取數(shù)軸上某一區(qū)間內(nèi)的任意點,那么稱之為連續(xù)型隨機變量。例如,一批電子元件的壽命、實際中常遇到的測量誤差等都是連續(xù)型隨機變量。 連續(xù)型隨機變量X無法像離散型隨機變量一樣,給出其取每一個點時的概率,那么換一種思路,來研究隨機變量落入一個區(qū)間 的概率 ,當區(qū)間 接近無窮小時,這時我們使用概率密度來表示概率值。什么是概率密度?假設(shè)有一組零件,由于各種因素的影響,其長度是各不相同的。具體數(shù)值如下。[171.671,172.04,171.67,172.40,172.70,172.164,171.71,172.68,172.13,171.97,172.266,171.81,172.15,172.45,172.20,172.600,172.24,171.39,172.17,171.2] 按前面離散型隨機變量的思路,要將數(shù)據(jù)分組,對應(yīng)每個組計算出其相應(yīng)的概率值,并繪制概率分布直方圖,如下圖所示。圖中的橫坐標是隨機變量值,縱坐標是隨機變量落入該值范圍內(nèi)的概率。直方圖的邊緣看起來有點粗糙,但當我們把樣本數(shù)據(jù)和分組數(shù)同時增加時,輪廓就會越來越細致,接近于如圖所示的曲線,這條曲線對應(yīng)的函數(shù)就稱為概率密度函數(shù)。由此思路,得到概率密度的數(shù)學描述如下。考慮連續(xù)隨機變量 落入?yún)^(qū)間區(qū)間 的概率,由概率分布函數(shù) 的定義可知 ,令 ,則設(shè)概率密度 反映出概率在 點處的密集程度,可以設(shè)想一根的質(zhì)量不均勻的金屬桿,總質(zhì)量為1,概率密度相當于桿上各點處的質(zhì)量密度。從上式中可得結(jié)論:若 在處連續(xù),則概率密度函數(shù) 是分布函數(shù) 的導函數(shù)。設(shè) 為連續(xù)型隨機變量, 在任意區(qū)間(a,b]上的概率可以表示為:下圖形象描繪出概率密度函數(shù) 和概率 之間的關(guān)系。概率 被看成曲線下的面積,用數(shù)學公式描述就是一個積分形式。連續(xù)型隨機變量X的分布函數(shù),也可寫成:概率密度函數(shù)和分布函數(shù)具有以下性質(zhì)。假設(shè)某零件誤差量在區(qū)間(-4,4)均勻分布,計算誤差量為1~3的概率。解:設(shè)隨機抽取一個零件的誤差量為X,隨機變量X在區(qū)間(-4,4)上均勻分布,X落在該區(qū)間任意點的概率相同,即概率密度為一常量。下圖中顯示均勻分布對應(yīng)的概率密度函數(shù)和分布函數(shù)。均勻分布對應(yīng)的概率密度函數(shù)和分布函數(shù)在Python中輸出正態(tài)分布概率密度函數(shù)和對應(yīng)的概率分布函數(shù)。則稱隨機變量X為正態(tài)分布隨機變量,并記為 。下面代碼模擬實現(xiàn)了一個均值 為0和方差σ2為1的正態(tài)分布。import numpy as npimport matplotlib.pyplot as pltimport scipy.stats as statsdef test_norm_pmf():# 正態(tài)分布是一種連續(xù)分布,其函數(shù)可以在實線上的任何地方取值# 正態(tài)分布由兩個參數(shù)描述:分布的平均值μ和方差σ2 mu = 0 # meansigma = 1#standard deviationx = np.arange(-5,5,0.1) #生成隨機數(shù)x#得到對應(yīng)的概率值yy = (1/(np.sqrt(2*np.pi*sigma*sigma)))*np.exp(-(((x-mu)**2)/(2*sigma*sigma)))fig, (ax0, ax1) = plt.subplots(ncols=2, figsize=(10, 5))ax0.plot(x, y)ax1.plot(x,stats.norm.cdf(x,0,1))ax0.set_title('Normal: $\mu$=%.1f, $\sigma^2$=%.1f' % (mu,sigma))ax0.set_xlabel('x')ax0.set_ylabel('Probability density', fontsize=15)ax1.set_title('Normal: $\mu$=%.1f, $\sigma^2$=%.1f' % (mu, sigma))ax1.set_xlabel('x')ax1.set_ylabel('Cumulative density', fontsize=15)fig.subplots_adjust(wspace=0.4)plt.show()test_norm_pmf() 正態(tài)分布對應(yīng)的概率密度函數(shù)和分布函數(shù)自然界中許多隨機指標都服從一種“中間高,兩頭低”的概率特性。例如,一門課程的考試成績,人的身高、體重等。正態(tài)分布這種“鐘形曲線”很好地反映了現(xiàn)實世界中的中間高、兩頭低的隨機現(xiàn)象。
|