本文引用自:深入理解Java虛擬機的第2章內容
Java與C++之間有一堵由內存動態(tài)分配和垃圾收集技術所圍成的高墻,墻外面的人想進去,墻里面的人卻想出來。 概述:對于從事C和C++程序開發(fā)的開發(fā)人員來說,在內存管理領域,他們既是擁有最高權力的皇帝,又是從事最基礎工作的勞動人民—既擁有每 一個對象的“所有權”,又擔負著每一個對象生命開始到終結的維護責任。 對于Java程序員來說,在虛擬機的自動內存管理機制的幫助下,不再需要為每一個new操作去寫配對的delete/free代碼,而且不容易出現(xiàn) 內存泄漏和內存溢出問題,看起來由虛擬機管理內存一切都很美好。不過,也正是因為Java程序員把內存控制的權力交給了Java虛擬機,一旦 出現(xiàn)內存泄漏和溢出方面的問題,如果不了解虛擬機是怎樣使用內存的,那排查錯誤將會成為一項異常艱難的工作。
運行時數(shù)據區(qū)域Java虛擬機在執(zhí)行Java程序的過程中會把它所管理的內存劃分為若干個不同的數(shù)據區(qū)域。這些區(qū)域都有各自的用途,以及創(chuàng)建和銷毀的時 間,有的區(qū)域隨著虛擬機進程的啟動而存在,有些區(qū)域則是依賴用戶線程的啟動和結束而建立和銷毀。根據《Java虛擬機規(guī)范(第2版)》的規(guī) 定,Java虛擬機所管理的內存將會包括以下幾個運行時數(shù)據區(qū)域,如下圖所示: 程序計數(shù)器程序計數(shù)器(Program Counter Register)是一塊較小的內存空間,它的作用可以看做是當前線程所執(zhí)行的字節(jié)碼的行號指示器。在虛擬 機的概念模型里(僅是概念模型,各種虛擬機可能會通過一些更高效的方式去實現(xiàn)),字節(jié)碼解釋器工作時就是通過改變這個計數(shù)器的值來選取 下一條需要執(zhí)行的字節(jié)碼指令,分支、循環(huán)、跳轉、異常處理、線程恢復等基礎功能都需要依賴這個計數(shù)器來完成。 由于Java虛擬機的多線 程是通過線程輪流切換并分配處理器執(zhí)行時間的方式來實現(xiàn)的,在任何一個確定的時刻,一個處理器(對于多核處理器來說是一個內 核)只會執(zhí)行一條線程中的指令。因此,為了線程切換后能恢復到正確的執(zhí)行位置,每條線程都需要有一個獨立的程序計數(shù)器,各條 線程之間的計數(shù)器互不影響,獨立存儲,我們稱這類內存區(qū)域為“線程私有”的內存。 如果線程正在執(zhí)行的是一個Java方法,這個計數(shù)器 記錄的是正在執(zhí)行的虛擬機字節(jié)碼指令的地址;如果正在執(zhí)行的是Natvie方法,這個計數(shù)器值則為空(Undefined)。此內存區(qū)域是唯一一個 在Java虛擬機規(guī)范中沒有規(guī)定任何OutOfMemoryError情況的區(qū)域。
Java虛擬機棧 與程序計數(shù)器一樣,Java虛擬機棧(Java Virtual Machine Stacks)也是線程私有的,它的生命周期與線程相同。虛擬機棧描述的是Java 方法執(zhí)行的內存模型:每個方法被執(zhí)行的時候都會同時創(chuàng)建一個棧幀(Stack Frame)用于存儲局部變量表、操作棧、動態(tài)鏈接、方法出口 等信息。每一個方法被調用直至執(zhí)行完成的過程,就對應著一個棧幀在虛擬機棧中從入棧到出棧的過程。 經常有人把Java內存區(qū)分為堆內存(Heap)和棧內存(Stack),這種分法比較粗糙,Java內存區(qū)域的劃分實際上遠比這復雜。這種劃分 方式的流行只能說明大多數(shù)程序員最關注的、與對象內存分配關系最密切的內存區(qū)域是這兩塊。其中所指的“堆”在后面會專門講述,而所指 的“?!本褪乾F(xiàn)在講的虛擬機棧,或者說是虛擬機棧中的局部變量表部分。 局部變量表存放了編譯期可知的各種基本數(shù)據類型(boolean、byte、char、short、int、float、long、double)、對象引用 (reference類型),它不等同于對象本身,根據不同的虛擬機實現(xiàn),它可能是一個指向對象起始地址的引用指針,也可能指向一個代表對象的 句柄或者其他與此對象相關的位置)和returnAddress類型(指向了一條字節(jié)碼指令的地址)。 其中64位長度的long和double類型的數(shù)據會占用2個局部變量空間(Slot),其余的數(shù)據類型只占用1個。局部變量表所需的內存 空間在編譯期間完成分配,當進入一個方法時,這個方法需要在幀中分配多大的局部變量空間是完全確定的,在方法運行期間不會改 變局部變量表的大小。 在Java虛擬機規(guī)范中,對這個區(qū)域規(guī)定了兩種異常狀況:如果線程請求的棧深度大于虛擬機所允許的深度,將拋出 StackOverflowError異常;如果虛擬機??梢詣討B(tài)擴展(當前大部分的Java虛擬機都可動態(tài)擴展,只不過Java虛擬機規(guī)范中也允許固定長度的 虛擬機棧),當擴展時無法申請到足夠的內存時會拋出OutOfMemoryError異常。
本地方法棧 本地方法棧(Native Method Stacks)與虛擬機棧所發(fā)揮的作用是非常相似的,其區(qū)別不過是虛擬機棧為虛擬機執(zhí)行Java方法(也就是字 節(jié)碼)服務,而本地方法棧則是為虛擬機使用到的Native方法服務。虛擬機規(guī)范中對本地方法棧中的方法使用的語言、使用方式與數(shù)據結構并沒 有強制規(guī)定,因此具體的虛擬機可以自由實現(xiàn)它。甚至有的虛擬機(譬如Sun HotSpot虛擬機)直接就把本地方法棧和虛擬機棧合二為一。與 虛擬機棧一樣,本地方法棧區(qū)域也會拋出StackOverflowError和OutOfMemoryError異常。
Java堆 對于大多數(shù)應用來說,Java堆(Java Heap)是Java虛擬機所管理的內存中最大的一塊。Java堆是被所有線程共享的一塊內存區(qū)域,在虛擬機啟動時創(chuàng)建。此內 存區(qū)域的唯一目的就是存放對象實例,幾乎所有的對象實例都在這里分配內存。這一點在Java虛擬機規(guī)范中的描述是:所有的對象實例以及數(shù)組都要在堆上分配, 但是隨著JIT編譯器的發(fā)展與逃逸分析技術的逐漸成熟,棧上分配、標量替換優(yōu)化技術將會導致一些微妙的變化發(fā)生,所有的對象都分配在堆上也漸漸變得不是那么“絕 對”了。 Java堆是垃圾收集器管理的主要區(qū)域,因此很多時候也被稱做“GC堆”(Garbage Collected Heap,幸好國內沒翻譯成“垃圾堆”)。如果從內存回收的角度看, 由于現(xiàn)在收集器基本都是采用的分代收集算法,所以Java堆中還可以細分為:新生代和老年代;再細致一點的有Eden空間、From Survivor空間、To Survivor空間 等。如果從內存分配的角度看,線程共享的Java堆中可能劃分出多個線程私有的分配緩沖區(qū)(Thread Local Allocation Buffer,TLAB)。不過,無論如何劃 分,都與存放內容無關,無論哪個區(qū)域,存儲的都仍然是對象實例,進一步劃分的目的是為了更好地回收內存,或者更快地分配內存。在本章中,我們僅僅針對內存區(qū) 域的作用進行討論,Java堆中的上述各個區(qū)域的分配和回收等細節(jié)將會是下一章的主題。 根據Java虛擬機規(guī)范的規(guī)定,Java堆可以處于物理上不連續(xù)的內存空間中,只要邏輯上是連續(xù)的即可,就像我們的磁盤空間一樣。在實現(xiàn)時,既可以實現(xiàn)成固定 大小的,也可以是可擴展的,不過當前主流的虛擬機都是按照可擴展來實現(xiàn)的(通過-Xmx和-Xms控制)。如果在堆中沒有內存完成實例分配,并且堆也無法再擴展 時,將會拋出OutOfMemoryError異常。
方法區(qū) 方法區(qū)(Method Area)與Java堆一樣,是各個線程共享的內存區(qū)域,它用于存儲已被虛擬機加載的類信息、常量、靜態(tài)變量、即時編譯器編譯后的代碼等 數(shù)據。雖然Java虛擬機規(guī)范把方法區(qū)描述為堆的一個邏輯部分,但是它卻有一個別名叫做Non-Heap(非堆),目的應該是與Java堆區(qū)分開來。 對于習慣在HotSpot虛擬機上開發(fā)和部署程序的開發(fā)者來說,很多人愿意把方法區(qū)稱為“永久代”(Permanent Generation),本質上兩者并不等價,僅僅是因 為HotSpot虛擬機的設計團隊選擇把GC分代收集擴展至方法區(qū),或者說使用永久代來實現(xiàn)方法區(qū)而已。對于其他虛擬機(如BEA JRockit、IBM J9等)來說是不存在 永久代的概念的。即使是HotSpot虛擬機本身,根據官方發(fā)布的路線圖信息,現(xiàn)在也有放棄永久代并“搬家”至Native Memory來實現(xiàn)方法區(qū)的規(guī)劃了。 Java虛擬機規(guī)范對這個區(qū)域的限制非常寬松,除了和Java堆一樣不需要連續(xù)的內存和可以選擇固定大小或者可擴展外,還可以選擇不實現(xiàn)垃圾收集。相對而言, 垃圾收集行為在這個區(qū)域是比較少出現(xiàn)的,但并非數(shù)據進入了方法區(qū)就如永久代的名字一樣“永久”存在了。這個區(qū)域的內存回收目標主要是針對常量池的回收和對類型 的卸載,一般來說這個區(qū)域的回收“成績”比較難以令人滿意,尤其是類型的卸載,條件相當苛刻,但是這部分區(qū)域的回收確實是有必要的。在Sun公司的BUG列表中, 曾出現(xiàn)過的若干個嚴重的BUG就是由于低版本的HotSpot虛擬機對此區(qū)域未完全回收而導致內存泄漏。 根據Java虛擬機規(guī)范的規(guī)定,當方法區(qū)無法滿足內存分配 需求時,將拋出OutOfMemoryError異常。
運行時常量池 運行時常量池(Runtime Constant Pool)是方法區(qū)的一部分。Class文件中除了有類的版本、字段、方法、接口等描述等信息外,還有一項信息是常量池 (Constant Pool Table),用于存放編譯期生成的各種字面量和符號引用,這部分內容將在類加載后存放到方法區(qū)的運行時常量池中。 Java虛擬機對Class 文件的每一部分(自然也包括常量池)的格式都有嚴格的規(guī)定,每一個字節(jié)用于存儲哪種數(shù)據都必須符合規(guī)范上的要求,這樣才會被虛擬機認可、裝載和執(zhí)行。但對于 運行時常量池,Java虛擬機規(guī)范沒有做任何細節(jié)的要求,不同的提供商實現(xiàn)的虛擬機可以按照自己的需要來實現(xiàn)這個內存區(qū)域。不過,一般來說,除了保存Class 文件中描述的符號引用外,還會把翻譯出來的直接引用也存儲在運行時常量池中。 運行時常量池相對于Class文件常量池的另外一個重要特征是具備動態(tài)性,Java語言 并不要求常量一定只能在編譯期產生,也就是并非預置入Class文件中常量池的內容才能進入方法區(qū)運行時常量池,運行期間也可能將新的常量放入池中,這種特性被 開發(fā)人員利用得比較多的便是String類的intern()方法。 既然運行時常量池是方法區(qū)的一部分,自然會受到方法區(qū)內存的限制,當常量池無法再申請到內存時會拋出 OutOfMemoryError異常。
對象訪問介紹完Java虛擬機的運行時數(shù)據區(qū)之后,我們就可以來探討一個問題:在Java語言中,對象訪問是如何進行的?對象訪問在Java語言中無處不在,是最普通的程 序行為,但即使是最簡單的訪問,也會卻涉及Java棧、Java堆、方法區(qū)這三個最重要內存區(qū)域之間的關聯(lián)關系,如下面的這句代碼: Object obj = new Object(); 假設這句代碼出現(xiàn)在方法體中,那“Object obj”這部分的語義將會反映到Java棧的本地變量表中,作為一個reference類型數(shù)據出現(xiàn)。而“new Object()”這部分的語 義將會反映到Java堆中,形成一塊存儲了Object類型所有實例數(shù)據值(Instance Data,對象中各個實例字段的數(shù)據)的結構化內存,根據具體類型以及虛擬機實現(xiàn) 的對象內存布局(Object Memory Layout)的不同,這塊內存的長度是不固定的。另外,在Java堆中還必須包含能查找到此對象類型數(shù)據(如對象類型、父類、實 現(xiàn)的接口、方法等)的地址信息,這些類型數(shù)據則存儲在方法區(qū)中。 由于reference類型在Java虛擬機規(guī)范里面只規(guī)定了一個指向對象的引用,并沒有定義這個引用應該通過哪種方式去定位,以及訪問到Java堆中的對 象的具體位置,因此不同虛擬機實現(xiàn)的對象訪問方式會有所不同,主流的訪問方式有兩種:使用句柄和直接指針。 如果使用句柄訪問方式,Java堆中將會 劃分出一塊內存來作為句柄池,reference中存儲的就是對象的句柄地址,而句柄中包含了對象實例數(shù)據和類型數(shù)據各自的具體地址信息,如下圖所示:
如果使用的是直接指針訪問方式,Java 堆對象的布局中就必須考慮如何放置訪問類型數(shù)據的相關信息,reference中直接存儲的就是對象地址,如下 圖所示: 這兩種對象的訪問方式各有優(yōu)勢,使用句柄訪問方式的最大好處就是reference中存儲的是穩(wěn)定的句柄地址,在對象被移動(垃圾收集時移動對象是非 常普遍的行為)時只會改變句柄中的實例數(shù)據指針,而reference本身不需要被修改。使用直接指針訪問方式的最大好處就是速度更快,它節(jié)省了一次指針 定位的時間開銷,由于對象的訪問在Java中非常頻繁,因此這類開銷積少成多后也是一項非??捎^的執(zhí)行成本。就本書討論的主要虛擬機Sun HotSpot而 言,它是使用第二種方式進行對象訪問的,但從整個軟件開發(fā)的范圍來看,各種語言和框架使用句柄來訪問的情況也十分常見。 |
|
來自: 昵稱20874412 > 《Java源碼》