概率與統(tǒng)計(jì)
二. 教學(xué)目標(biāo): 概率是高考的重點(diǎn)內(nèi)容之一,尤其是新增的隨機(jī)變量這部分內(nèi)容。要充分注意一些重要概念的實(shí)際意義,理解概率處理問題的基本思想方法。 重難點(diǎn)歸納: 本章內(nèi)容分為概率初步和隨機(jī)變量兩部分。第一部分包括等可能事件的概率、互斥事件有一個發(fā)生的概率、相互獨(dú)立事件同時發(fā)生的概率和獨(dú)立重復(fù)實(shí)驗(yàn) 涉及的思維方法:觀察與試驗(yàn)、分析與綜合、一般化與特殊化。 主要思維形式有:邏輯思維、聚合思維、形象思維和創(chuàng)造性思維。
三. 知識要點(diǎn): (一)統(tǒng)計(jì) 1. 抽樣方法有 簡單隨機(jī)抽樣 ; 系統(tǒng)抽樣 ; 分層抽樣 。 2. 簡單隨機(jī)抽樣 抽簽法 ; 隨機(jī)數(shù)表法 。 用抽簽法從個體個數(shù)為N的總體中抽取一個容量為k的樣本的步驟為: (1)將總體中的所有個體編號(號碼可以從1到N); (2)將1到N這N個號碼寫在形狀、大小相同的號簽上(號簽可以用小球、卡片、紙條等制作); (3)將號簽放在同一箱中,并攪拌均勻; (4)從箱中每次抽出1個號簽,并記錄其編號,連續(xù)抽取k次; (5)從總體中將與抽到的簽的編號相一致的個體取出. 用隨機(jī)數(shù)表法抽取樣本的步驟是: (1)對總體中的個體進(jìn)行編號(每個號碼位數(shù)一致); (2)在隨機(jī)數(shù)表中任選一個數(shù)作為開始; (3)從選定的數(shù)開始按一定的方向讀下去,得到的數(shù)碼若不在編號中,則跳過;若在編號中,則取出;如果得到的號碼前面已經(jīng)取出,也跳過;如此繼續(xù)下去,直到取滿為止; (4)根據(jù)選定的號碼抽取樣本. 3. 將總體平均分成幾個部分,然后按照預(yù)先定出的規(guī)則,從每個部分中抽取一個個體,得到所需的樣本,這樣的抽樣方法稱為系統(tǒng)抽樣(systematicsampling). 系統(tǒng)抽樣, 又叫 等距 抽樣。 4. 系統(tǒng)抽樣的步驟為: (1)采用隨機(jī)的方式將總體中的個體編號; (2)將整個的編號按一定的間隔(設(shè)為k)分段,當(dāng)Nn(N為總體中的個體數(shù),n為樣本容量)是整數(shù)時,k=Nn;當(dāng)Nn不是整數(shù)時,從總體中剔除一些個體,使剩下的總體中個體的個數(shù)N′能被n整除,這時k=N′n,并將剩下的總體重新編號; (3)在第一段中用簡單隨機(jī)抽樣確定起始的個體編號l; (4)將編號為1,1+k,1+2k,…,1+(n-1)k的個體抽出. 5. 當(dāng)總體由 差異明顯 的幾個部分組成時,常常將總體中的 個體 按不同的特點(diǎn)分成 比較分明 的幾部分,然后按各部分在總體中 所占的比例 實(shí)施抽樣,這種抽樣方法叫分層抽樣;其中所分成的各個部分稱為 “層” . 6. 分層抽樣的步驟是: (1)將總體按一定標(biāo)準(zhǔn)分層;若按比例計(jì)算所得的個體數(shù)不是整數(shù),可作適當(dāng)?shù)慕铺幚?/U>。 (2)計(jì)算各層的個體數(shù)與總體的個體數(shù)的比; (3)按各層個體數(shù)占總體的個體數(shù)的比確定各層應(yīng)抽取的樣本容量; (4)在每一層進(jìn)行抽樣(可用簡單隨機(jī)抽樣或系統(tǒng)抽樣)。 7. 三種抽樣的關(guān)系:
8. 反映總體頻率分布的表格稱為頻率分布表 9. 將整個取值區(qū)間的長度稱為 全距,分成的區(qū)間的長度稱為組距。 10. 直觀地體現(xiàn)數(shù)據(jù)的分布規(guī)律的方法———繪制頻數(shù)條形圖或頻率直方圖。 11. 如果將頻率分布直方圖中各相鄰的矩形的上底邊的中點(diǎn)順次連結(jié)起來,就得到一條折線,我們稱這條折線為本組數(shù)據(jù)的頻率折線圖 12. 頻率折線圖的優(yōu)點(diǎn)是它反映了數(shù)據(jù)的變化趨勢. 如果將樣本容量取得足夠大,分組的組距取得足夠小,則這條折線將趨于一條曲線,我們稱這一曲線為總體分布的密度曲線 13. 將這些數(shù)據(jù)有條理地列出來,從中觀察得分的分布情況. 這種方法就是畫出該運(yùn)動員得分的莖葉圖 14. 回歸分析 一元線性回歸分析: 對具有相關(guān)關(guān)系的兩個變量進(jìn)行統(tǒng)計(jì)分析的方法叫做回歸分析。通俗地講,回歸分析是尋找相關(guān)關(guān)系中非確定性關(guān)系的某種確定性。 對于線性回歸分析,我們要注意以下幾個方面: (1)回歸分析是對具有相關(guān)關(guān)系的兩個變量進(jìn)行統(tǒng)計(jì)分析的方法。兩個變量具有相關(guān)關(guān)系是回歸分析的前提。 (2)散點(diǎn)圖是定義在具有相關(guān)關(guān)系的兩個變量基礎(chǔ)上的,對于性質(zhì)不明確的兩組數(shù)據(jù),可先作散點(diǎn)圖,在圖上看它們有無關(guān)系,關(guān)系的密切程度,然后再進(jìn)行相關(guān)回歸分析。 (3)求回歸直線方程,首先應(yīng)注意到,只有在散點(diǎn)圖大致呈線性時,求出的回歸直線方程才有實(shí)際意義,否則,求出的回歸直線方程毫無意義。 15. 散點(diǎn)圖:表示具有相關(guān)關(guān)系的兩個變量的一組數(shù)據(jù)的圖形叫做散點(diǎn)圖.散點(diǎn)圖形象地反映了各對數(shù)據(jù)的密切程度。粗略地看,散點(diǎn)分布具有一定的規(guī)律。 16. 回歸直線 設(shè)所求的直線方程為
相應(yīng)的直線叫做回歸直線,對兩個變量所進(jìn)行的上述統(tǒng)計(jì)分析叫做回歸分析 17. 相關(guān)系數(shù):相關(guān)系數(shù)是因果統(tǒng)計(jì)學(xué)家皮爾遜提出的,對于變量y與x的一組觀測值,把
叫做變量y與x之間的樣本相關(guān)系數(shù),簡稱相關(guān)系數(shù),用它來衡量兩個變量之間的線性相關(guān)程度. 18. 相關(guān)系數(shù)的性質(zhì): 19. 顯著性水平:顯著性水平是統(tǒng)計(jì)假設(shè)檢驗(yàn)中的一個概念,它是公認(rèn)的小概率事件的概率值。它必須在每一次統(tǒng)計(jì)檢驗(yàn)之前確定。 20. 顯著性檢驗(yàn):(相關(guān)系數(shù)檢驗(yàn)的步驟)由顯著性水平和自由度查表得出臨界值,顯著性水平一般取0.01和0.05,自由度為n-2,其中n是數(shù)據(jù)的個數(shù)。在“相關(guān)系數(shù)檢驗(yàn)的臨界值表”查出與顯著性水平0.05或0.01及自由度n-2(n為觀測值組數(shù))相應(yīng)的相關(guān)數(shù)臨界值r0.05或r0.01;例如n=7時,r0.05=0.754,r0.01=0.874。求得的相關(guān)系數(shù)r和臨界值r0.05比較,若r>r0.05,上面y與x是線性相關(guān)的,當(dāng) 討論若干變量是否線性相關(guān),必須先進(jìn)行相關(guān)性檢驗(yàn),在確認(rèn)線性相關(guān)后,再求回歸直線;通過兩個變量是否線性相關(guān)的估計(jì),實(shí)際上就是把非確定性問題轉(zhuǎn)化成確定性問題來研究;我們研究的對象是兩個變量的線性相關(guān)關(guān)系,還可以研究多個變量的相關(guān)問題,這在今后的學(xué)習(xí)中會進(jìn)一步學(xué)到。
(二)概率 1. 一般地,如果隨機(jī)事件A在n次試驗(yàn)中發(fā)生了m次,當(dāng)試驗(yàn)的次數(shù)n很大時,我們可以將事件A發(fā)生的頻率 2. 在一次試驗(yàn)中可能出現(xiàn)的每一個基本結(jié)果稱為基本事件 3. 等可能基本事件的兩個特點(diǎn): (1)所有的基本事件只有有限個; (2)每個基本事件的發(fā)生都是等可能的。 將滿足上述條件的隨機(jī)試驗(yàn)的概率模型稱為古典概型 4. 概率計(jì)算公式:如果一次試驗(yàn)的等可能基本事件共有n個,那么每一個等可能基本事件發(fā)生的概率都是 5. 一年按365天計(jì)算,2名同學(xué)在同一天過生日的概率為 6. 一只口袋裝有形狀、大小都相同的6只小球,其中有2只白球、2只紅球和2只黃球。從中一次隨機(jī)摸出2只球,試求: (1)2只球都是紅球的概率; (2)2只球同色的概率; (3)“恰有1只球是白球的概率”是“2只球都是白球的概率”的多少倍? 解:(1)
(三) 幾何概型 1. 對于一個隨機(jī)試驗(yàn),我們將每個基本事件理解為從某個特定的幾何區(qū)域內(nèi)隨機(jī)地取一點(diǎn),該區(qū)域中每一點(diǎn)被取到的機(jī)會都一樣;而一個隨機(jī)事件的發(fā)生則理解為恰好取到上述區(qū)域內(nèi)的某個指定區(qū)域中的點(diǎn)。這里的區(qū)域可以是線段、平面圖形、立體圖形等。用這種方法處理隨機(jī)試驗(yàn),稱為幾何概型。 一般地,在幾何區(qū)域D中隨機(jī)地取一點(diǎn),記事件“該點(diǎn)落在其內(nèi)部一個區(qū)域d內(nèi)”為事件A,則事件A發(fā)生的概率P(A)= 2. 即事件A與B是不可能同時發(fā)生的。不能同時發(fā)生的兩個事件稱為互斥事件,如果事件A1,A2,…,An中的任何兩個都是互斥事件,就說事件A1,A2,…,An彼此互斥。 3. 設(shè)A,B為互斥事件,當(dāng)事件A,B有一個發(fā)生,我們把這個事件記作A+B。 4. 如果事件A,B互斥,那么事件A+B發(fā)生的概率,等于事件A,B分別發(fā)生的概率的和,即P(A+B)=P(A)+P(B)。 5. 如果事件A1,A2,…,An兩兩互斥,則P(A1+A2+…+An)=P(A1)+P(A2)+…+P(An)。 6. 兩個互斥事件必有一個發(fā)生,則稱這兩個事件為對立事件。事件A的對立事件記為
【典型例題】 例1. 有一容量為50的樣本,數(shù)據(jù)的分組及各組的頻率數(shù)如下:
(1)列出樣本的頻率分布表(含累積頻率); (2)畫出頻率分布直方圖和累積頻率的分布圖。 命題意圖:本題主要考查頻率分布表,頻率分布直方圖和累積頻率的分布圖的畫法。 知識依托:頻率、累積頻率的概念以及頻率分布表、直方圖和累積頻率分布圖的畫法。 錯解分析:解答本題時,計(jì)算容易出現(xiàn)失誤,且要注意頻率分布與累積頻率分布的區(qū)別。 技巧與方法: 本題關(guān)鍵在于掌握三種表格的區(qū)別與聯(lián)系。 解:(1)由所給數(shù)據(jù),計(jì)算得如下頻率分布表:
(2)頻率分布直方圖與累積頻率分布圖如下:
例2. 袋子A和B中裝有若干個均勻的紅球和白球,從A中摸出一個紅球的概率是 (Ⅰ)從A中有放回地摸球,每次摸出一個,有3次摸到紅球即停止。 (i)求恰好摸5次停止的概率; (ii)記5次之內(nèi)(含5次)摸到紅球的次數(shù)為 (Ⅱ) 若A、B兩個袋子中的球數(shù)之比為12,將A、B中的球裝在一起后,從中摸出一個紅球的概率是 命題意圖:本題考查利用概率知識和期望的計(jì)算方法。 知識依托:概率的計(jì)算及期望的概念的有關(guān)知識。 錯解分析:在本題中,隨機(jī)變量的確定,稍有不慎,就將產(chǎn)生失誤。 技巧與方法:可借助n次獨(dú)立重復(fù)試驗(yàn)概率公式計(jì)算概率。 解:(Ⅰ)(i) (ii)隨機(jī)變量 由n次獨(dú)立重復(fù)試驗(yàn)概率公式
(或 隨機(jī)變量
(Ⅱ)設(shè)袋子A中有m個球,則袋子B中有2m個球。 由
例3. 一個口袋里共有2個紅球和8個黃球,從中隨機(jī)地接連取3個球,每次取一個。設(shè){恰有一個紅球}=A,{第三個球是紅球}=B (1)不返回抽樣; (2)返回抽樣。 解:(1)不返回抽樣, P(A)= (2)返回抽樣, P(A)=C
例4. 在袋中裝20個小球,其中彩球有n個紅色、5個藍(lán)色、10個黃色,其余為白球。 求:(1)如果從袋中取出3個都是相同顏色彩球(無白色)的概率是 (2)根據(jù)(1)的結(jié)論,計(jì)算從袋中任取3個小球至少有一個是紅球的概率。 解:(1)取3個球的種數(shù)為C 設(shè)“3個球全為紅色”為事件A,“3個球全為藍(lán)色”為事件B,“3個球全為黃色”為事件C。 P(B)= ∵A、B、C為互斥事件, ∴P(A+B+C)=P(A)+P(B)+P(C), 即
又∵n≥2,故n=2。 (2)記“3個球中至少有一個是紅球”為事件D P(D)=1-P( P(D)=
例5. 甲乙兩船駛向一個不能同時停泊兩艘船的碼頭,它們在一晝夜內(nèi)到達(dá)該碼頭的時刻是等可能的。如果甲船停泊的時間為4小時,乙船停泊的時間為2小時,求它們中的任意一艘船都不需要等待碼頭空出的概率。 解:設(shè)甲乙兩船到達(dá)該碼頭的時刻分別是x,y時刻.則 則x,y滿足的可行域?yàn)槿鐖D所示的陰影部分。 故所求的概率為:
例6. 將長為3的棒隨機(jī)折成3段,(1)求3段能構(gòu)成三角形的概率; (2)求3段不能構(gòu)成三角形的概率。 解:設(shè)被分成的三段為x,y,3-x-y,則 x,y對應(yīng)的區(qū)域是如上圖所示的三角形。 (1)記3段能構(gòu)成三角形為事件A,則P(A)= (2) 記3段不能構(gòu)成三角形為事件B,則P(B)
例7. 已知某地每單位面積菜地年平均使用氮肥量xkg與每單位面積蔬菜年平均產(chǎn)量yt之間的關(guān)系有如下數(shù)據(jù):
(1)求x與y之間的相關(guān)系數(shù),并檢驗(yàn)是否線性相關(guān); (2)若線性相關(guān),求蔬菜產(chǎn)量y與使用氮肥量之間的回歸直線方程,并估計(jì)每單位面積施肥150kg時,每單位面積蔬菜的年平均產(chǎn)量。 分析:(1)使用樣本相關(guān)系數(shù)計(jì)算公式來完成;(2)查表得出顯著性水平0.05與自由度15-2相應(yīng)的相關(guān)系數(shù)臨界 解:(1)列出下表,并用科學(xué)計(jì)算器進(jìn)行有關(guān)計(jì)算:
故蔬菜產(chǎn)量與放用氮肥量的相關(guān)系數(shù) 由于n=15,故自由度15-2=13。 由相關(guān)系數(shù)檢驗(yàn)的臨界值表查出與顯著水平0.05及自由度13相關(guān)系數(shù)臨界值 從而說明蔬菜產(chǎn)量與氮肥量之間存在著線性相關(guān)關(guān)系。 (2)設(shè)所求的回歸直線方程為 ∴回歸直線方程為 點(diǎn)評:求解兩個變量的相關(guān)系數(shù)及它們的回歸直線方程的計(jì)算量較大,需要細(xì)心、謹(jǐn)慎地計(jì)算。如果會使用含統(tǒng)計(jì)的科學(xué)計(jì)算器,能簡單得到
例8. 假設(shè)關(guān)于某設(shè)備的使用年限x和所支出的維修費(fèi)用y(萬元),有如下的統(tǒng)計(jì)資料:
若由資料可知y對x呈線性相關(guān)關(guān)系。試求: (1)線性回歸方程; (2)估計(jì)使用年限為10年時,維修費(fèi)用是多少? 分析:本題為了降低難度,告訴了y與x間呈線性相關(guān)關(guān)系,目的是訓(xùn)練公式的使用。 解:(1)列表如下:
于是 ∴線性回歸方程為: (2)當(dāng)x=10時, 即估計(jì)使用10年時維修費(fèi)用是12.38萬元。 點(diǎn)評:本題若沒有告訴我們y與x間是呈線性相關(guān)的,應(yīng)首先進(jìn)行相關(guān)性檢驗(yàn)。如果本身兩個變量不具備線性相關(guān)關(guān)系,或者說它們之間相關(guān)關(guān)系不顯著時,即使求出回歸方程也是沒有意義的,而且其估計(jì)與預(yù)測也是不可信的。
【模擬試題】 1. 為考慮廣告費(fèi)用x與銷售額y之間的關(guān)系,抽取了5家餐廳,得到如下數(shù)據(jù):
現(xiàn)要使銷售額達(dá)到6萬元,則需廣告費(fèi)用為_____(保留兩位有效數(shù)字) 2. 某校高三年級舉行的一次演講比賽共有10位同學(xué)參加,其中一班有3位,二班有2位,其他班有5位 A. 3. 甲、乙兩人下棋,甲獲勝的概率是40%,甲不輸?shù)母怕蕿?/SPAN>90%,則甲、乙二人下成和棋的概率為 A. 60% B. 30% C. 10% D. 50% 4. 從裝有2個紅球和2個白球的口袋內(nèi)任取2個球,那么互斥而不對立的兩個事件是 A. 至少有1個白球,都是紅球 B. 至少有1個白球,至多有1個紅球 C. 恰有1個白球,恰有2個白球 D. 至多有1個白球,都是紅球 5. 一批產(chǎn)品共10件,其中有兩件次品,現(xiàn)隨機(jī)地抽取5件,則所取5件中至多有一件次品的概率為 A. 6. 在某段時間內(nèi),甲地不下雨的概率為0.3,乙地不下雨的概率為0.4,假設(shè)在這段時間內(nèi)兩地是否下雨相互無影響,則這段時間內(nèi)兩地都下雨的概率是 A. 0.12 B. 0.88 C. 0.28 D. 0.42 7. 一道數(shù)學(xué)競賽試題,甲生解出它的概率為 8. 一出租車司機(jī)從飯店到火車站途中有六個交通崗,假設(shè)他在各交通崗遇到紅燈這一事件是相互獨(dú)立的,并且概率都是 9. 某學(xué)生參加一次選拔考試,有5道題,每題10分。已知他解題的正確率為 10. 某單位訂閱大眾日報的概率為0.6,訂閱齊魯晚報的概率為0.3,則至少訂閱其中一種報紙的概率為________。 11. 在未來3天中,某氣象臺預(yù)報每天天氣的準(zhǔn)確率為0 (1)至少有2天預(yù)報準(zhǔn)確的概率是多少? (2)至少有一個連續(xù)2天預(yù)報都準(zhǔn)確的概率是多少? 12. 一個通訊小組有兩套設(shè)備,只要其中有一套設(shè)備能正常工作,就能進(jìn)行通訊 (1)恰有一套設(shè)備能正常工作的概率; (2)能進(jìn)行通訊的概率。 13. 已知甲袋中有3個白球和4個黑球,乙袋中有5個白球和4個黑球
【試題答案】 1. 解析:先求出回歸方程 答案:1.5萬元 2. 解析:10位同學(xué)總參賽次序A ∴所求概率為 答案:B 3. 甲不輸即為甲獲勝或甲、乙二人下成和棋,90%=40%+p,∴p=50%。 答案:D 4. C 5. 解析:P= 答案:B 6. 解析:P=(1-0.3)(1-0.4)=0.42。 答案:D 7. 解析:P= 答案: 8. 因?yàn)檫@位司機(jī)在第一、二個交通崗未遇到紅燈,在第三個交通崗遇到紅燈,所以P=(1- 答案: 9. 解析:要使該生被選中,則必須他解對5題或4題。 ∴P=( 答案: 答案:0.72。 11. 解:(1)至少有2天預(yù)報準(zhǔn)確的概率即為恰有2天和恰有3天預(yù)報準(zhǔn)確的概率,即 C ∴至少有2天預(yù)報準(zhǔn)確的概率為0.896。 (2)至少有一個連續(xù)2天預(yù)報都準(zhǔn)確,即為恰有一個連續(xù)2天預(yù)報準(zhǔn)確或3天預(yù)報準(zhǔn)確的概率為 2·0.82·0.2+0.83=0.768。 ∴至少有一個連續(xù)2天預(yù)報都準(zhǔn)確的概率為0.768。 12. 解:記“第一套通訊設(shè)備能正常工作”為事件A,“第二套通訊設(shè)備能正常工作”為事件B。 由題意知P(A)=p3,P(B)=p3, P( (1)恰有一套設(shè)備能正常工作的概率為 P(A· =p3(1-p3)+(1-p3)p3=2p3-2p6。 (2)方法一:兩套設(shè)備都能正常工作的概率為 P(A·B)=P(A)·P(B)=p6。 至少有一套設(shè)備能正常工作的概率,即能進(jìn)行通訊的概率為 P(A· 方法二:兩套設(shè)備都不能正常工作的概率為 P( 至少有一套設(shè)備能正常工作的概率, 即能進(jìn)行通訊的概率為 1-P( 答:恰有一套設(shè)備能正常工作的概率為2p3-2p6,能進(jìn)行通訊的概率為2p3-p6。 13. 解:從甲袋中取2個白球,從乙袋中取1個黑球和1個白球的概率為
從甲袋中取1個黑球和1個白球,從乙袋中取2個白球的概率為
所以,取得的4個球中有3個白球和1個黑球的概率為
|
|