【干貨】連肝7個晚上，總結了關于Java基礎的16個問題！

印度阿三17 2020-11-20

展開全文

說說進程和線程的區(qū)別？

進程是程序的一次執(zhí)行，是系統(tǒng)進行資源分配和調度的獨立單位，他的作用是是程序能夠并發(fā)執(zhí)行提高資源利用率和吞吐率。

由于進程是資源分配和調度的基本單位，因為進程的創(chuàng)建、銷毀、切換產生大量的時間和空間的開銷，進程的數量不能太多，而線程是比進程更小的能獨立運行的基本單位，他是進程的一個實體，可以減少程序并發(fā)執(zhí)行時的時間和空間開銷，使得操作系統(tǒng)具有更好的并發(fā)性。

線程基本不擁有系統(tǒng)資源，只有一些運行時必不可少的資源，比如程序計數器、寄存器和棧，進程則占有堆、棧。

知道synchronized原理嗎？

synchronized是java提供的原子性內置鎖，這種內置的并且使用者看不到的鎖也被稱為監(jiān)視器鎖，使用synchronized之后，會在編譯之后在同步的代碼塊前后加上monitorenter和monitorexit字節(jié)碼指令，他依賴操作系統(tǒng)底層互斥鎖實現。他的作用主要就是實現原子性操作和解決共享變量的內存可見性問題。

執(zhí)行monitorenter指令時會嘗試獲取對象鎖，如果對象沒有被鎖定或者已經獲得了鎖，鎖的計數器 1。此時其他競爭鎖的線程則會進入等待隊列中。

執(zhí)行monitorexit指令時則會把計數器-1，當計數器值為0時，則鎖釋放，處于等待隊列中的線程再繼續(xù)競爭鎖。

synchronized是排它鎖，當一個線程獲得鎖之后，其他線程必須等待該線程釋放鎖后才能獲得鎖，而且由于Java中的線程和操作系統(tǒng)原生線程是一一對應的，線程被阻塞或者喚醒時時會從用戶態(tài)切換到內核態(tài)，這種轉換非常消耗性能。

從內存語義來說，加鎖的過程會清除工作內存中的共享變量，再從主內存讀取，而釋放鎖的過程則是將工作內存中的共享變量寫回主內存。

實際上大部分時候我認為說到monitorenter就行了，但是為了更清楚的描述，還是再具體一點。

如果再深入到源碼來說，synchronized實際上有兩個隊列waitSet和entryList。

當多個線程進入同步代碼塊時，首先進入entryList
有一個線程獲取到monitor鎖后，就賦值給當前線程，并且計數器 1
如果線程調用wait方法，將釋放鎖，當前線程置為null，計數器-1，同時進入waitSet等待被喚醒，調用notify或者notifyAll之后又會進入entryList競爭鎖
如果線程執(zhí)行完畢，同樣釋放鎖，計數器-1，當前線程置為null

那鎖的優(yōu)化機制了解嗎？

從JDK1.6版本之后，synchronized本身也在不斷優(yōu)化鎖的機制，有些情況下他并不會是一個很重量級的鎖了。優(yōu)化機制包括自適應鎖、自旋鎖、鎖消除、鎖粗化、輕量級鎖和偏向鎖。

鎖的狀態(tài)從低到高依次為無鎖->偏向鎖->輕量級鎖->重量級鎖，升級的過程就是從低到高，降級在一定條件也是有可能發(fā)生的。

自旋鎖：由于大部分時候，鎖被占用的時間很短，共享變量的鎖定時間也很短，所有沒有必要掛起線程，用戶態(tài)和內核態(tài)的來回上下文切換嚴重影響性能。自旋的概念就是讓線程執(zhí)行一個忙循環(huán)，可以理解為就是啥也不干，防止從用戶態(tài)轉入內核態(tài)，自旋鎖可以通過設置-XX: UseSpining來開啟，自旋的默認次數是10次，可以使用-XX:PreBlockSpin設置。

自適應鎖：自適應鎖就是自適應的自旋鎖，自旋的時間不是固定時間，而是由前一次在同一個鎖上的自旋時間和鎖的持有者狀態(tài)來決定。

鎖消除：鎖消除指的是JVM檢測到一些同步的代碼塊，完全不存在數據競爭的場景，也就是不需要加鎖，就會進行鎖消除。

鎖粗化：鎖粗化指的是有很多操作都是對同一個對象進行加鎖，就會把鎖的同步范圍擴展到整個操作序列之外。

偏向鎖：當線程訪問同步塊獲取鎖時，會在對象頭和棧幀中的鎖記錄里存儲偏向鎖的線程ID，之后這個線程再次進入同步塊時都不需要CAS來加鎖和解鎖了，偏向鎖會永遠偏向第一個獲得鎖的線程，如果后續(xù)沒有其他線程獲得過這個鎖，持有鎖的線程就永遠不需要進行同步，反之，當有其他線程競爭偏向鎖時，持有偏向鎖的線程就會釋放偏向鎖?？梢杂眠^設置-XX: UseBiasedLocking開啟偏向鎖。

輕量級鎖：JVM的對象的對象頭中包含有一些鎖的標志位，代碼進入同步塊的時候，JVM將會使用CAS方式來嘗試獲取鎖，如果更新成功則會把對象頭中的狀態(tài)位標記為輕量級鎖，如果更新失敗，當前線程就嘗試自旋來獲得鎖。

整個鎖升級的過程非常復雜，我盡力去除一些無用的環(huán)節(jié)，簡單來描述整個升級的機制。

簡單點說，偏向鎖就是通過對象頭的偏向線程ID來對比，甚至都不需要CAS了，而輕量級鎖主要就是通過CAS修改對象頭鎖記錄和自旋來實現，重量級鎖則是除了擁有鎖的線程其他全部阻塞。

那對象頭具體都包含哪些內容？

在我們常用的Hotspot虛擬機中，對象在內存中布局實際包含3個部分：

對象頭
實例數據
對齊填充

而對象頭包含兩部分內容，Mark Word中的內容會隨著鎖標志位而發(fā)生變化，所以只說存儲結構就好了。

對象自身運行時所需的數據，也被稱為Mark Word，也就是用于輕量級鎖和偏向鎖的關鍵點。具體的內容包含對象的hashcode、分代年齡、輕量級鎖指針、重量級鎖指針、GC標記、偏向鎖線程ID、偏向鎖時間戳。
存儲類型指針，也就是指向類的元數據的指針，通過這個指針才能確定對象是屬于哪個類的實例。如果是數組的話，則還包含了數組的長度

對于加鎖，那再說下ReentrantLock原理？他和synchronized有什么區(qū)別？

相比于synchronized，ReentrantLock需要顯式的獲取鎖和釋放鎖，相對現在基本都是用JDK7和JDK8的版本，ReentrantLock的效率和synchronized區(qū)別基本可以持平了。他們的主要區(qū)別有以下幾點：

等待可中斷，當持有鎖的線程長時間不釋放鎖的時候，等待中的線程可以選擇放棄等待，轉而處理其他的任務。
公平鎖：synchronized和ReentrantLock默認都是非公平鎖，但是ReentrantLock可以通過構造函數傳參改變。只不過使用公平鎖的話會導致性能急劇下降。
綁定多個條件：ReentrantLock可以同時綁定多個Condition條件對象。

ReentrantLock基于AQS(AbstractQueuedSynchronizer 抽象隊列同步器)實現。別說了，我知道問題了，AQS原理我來講。

AQS內部維護一個state狀態(tài)位，嘗試加鎖的時候通過CAS(CompareAndSwap)修改值，如果成功設置為1，并且把當前線程ID賦值，則代表加鎖成功，一旦獲取到鎖，其他的線程將會被阻塞進入阻塞隊列自旋，獲得鎖的線程釋放鎖的時候將會喚醒阻塞隊列中的線程，釋放鎖的時候則會把state重新置為0，同時當前線程ID置為空。

CAS的原理呢？

CAS叫做CompareAndSwap，比較并交換，主要是通過處理器的指令來保證操作的原子性，它包含三個操作數：

變量內存地址，V表示
舊的預期值，A表示
準備設置的新值，B表示

當執(zhí)行CAS指令時，只有當V等于A時，才會用B去更新V的值，否則就不會執(zhí)行更新操作。

那么CAS有什么缺點嗎？

CAS的缺點主要有3點：

ABA問題：ABA的問題指的是在CAS更新的過程中，當讀取到的值是A，然后準備賦值的時候仍然是A，但是實際上有可能A的值被改成了B，然后又被改回了A，這個CAS更新的漏洞就叫做ABA。只是ABA的問題大部分場景下都不影響并發(fā)的最終效果。

Java中有AtomicStampedReference來解決這個問題，他加入了預期標志和更新后標志兩個字段，更新時不光檢查值，還要檢查當前的標志是否等于預期標志，全部相等的話才會更新。

循環(huán)時間長開銷大：自旋CAS的方式如果長時間不成功，會給CPU帶來很大的開銷。

只能保證一個共享變量的原子操作：只對一個共享變量操作可以保證原子性，但是多個則不行，多個可以通過AtomicReference來處理或者使用鎖synchronized實現。

好，說說HashMap原理吧？

HashMap主要由數組和鏈表組成，他不是線程安全的。核心的點就是put插入數據的過程，get查詢數據以及擴容的方式。JDK1.7和1.8的主要區(qū)別在于頭插和尾插方式的修改，頭插容易導致HashMap鏈表死循環(huán)，并且1.8之后加入紅黑樹對性能有提升。

put插入數據流程

往map插入元素的時候首先通過對key hash然后與數組長度-1進行與運算((n-1)&hash)，都是2的次冪所以等同于取模，但是位運算的效率更高。找到數組中的位置之后，如果數組中沒有元素直接存入，反之則判斷key是否相同，key相同就覆蓋，否則就會插入到鏈表的尾部，如果鏈表的長度超過8，則會轉換成紅黑樹，最后判斷數組長度是否超過默認的長度*負載因子也就是12，超過則進行擴容。

get查詢數據

查詢數據相對來說就比較簡單了，首先計算出hash值，然后去數組查詢，是紅黑樹就去紅黑樹查，鏈表就遍歷鏈表查詢就可以了。

resize擴容過程

擴容的過程就是對key重新計算hash，然后把數據拷貝到新的數組。

那多線程環(huán)境怎么使用Map呢？ConcurrentHashmap了解過嗎？

多線程環(huán)境可以使用Collections.synchronizedMap同步加鎖的方式，還可以使用HashTable，但是同步的方式顯然性能不達標，而ConurrentHashMap更適合高并發(fā)場景使用。

ConcurrentHashmap在JDK1.7和1.8的版本改動比較大，1.7使用Segment HashEntry分段鎖的方式實現，1.8則拋棄了Segment，改為使用CAS synchronized Node實現，同樣也加入了紅黑樹，避免鏈表過長導致性能的問題。

1.7分段鎖

從結構上說，1.7版本的ConcurrentHashMap采用分段鎖機制，里面包含一個Segment數組，Segment繼承與ReentrantLock，Segment則包含HashEntry的數組，HashEntry本身就是一個鏈表的結構，具有保存key、value的能力能指向下一個節(jié)點的指針。

實際上就是相當于每個Segment都是一個HashMap，默認的Segment長度是16，也就是支持16個線程的并發(fā)寫，Segment之間相互不會受到影響。

put流程

其實發(fā)現整個流程和HashMap非常類似，只不過是先定位到具體的Segment，然后通過ReentrantLock去操作而已，后面的流程我就簡化了，因為和HashMap基本上是一樣的。

計算hash，定位到segment，segment如果是空就先初始化
使用ReentrantLock加鎖，如果獲取鎖失敗則嘗試自旋，自旋超過次數就阻塞獲取，保證一定獲取鎖成功
遍歷HashEntry，就是和HashMap一樣，數組中key和hash一樣就直接替換，不存在就再插入鏈表，鏈表同樣

get流程

get也很簡單，key通過hash定位到segment，再遍歷鏈表定位到具體的元素上，需要注意的是value是volatile的，所以get是不需要加鎖的。

1.8CAS synchronized

1.8拋棄分段鎖，轉為用CAS synchronized來實現，同樣HashEntry改為Node，也加入了紅黑樹的實現。主要還是看put的流程。

put流程

首先計算hash，遍歷node數組，如果node是空的話，就通過CAS 自旋的方式初始化
如果當前數組位置是空則直接通過CAS自旋寫入數據
如果hash==MOVED，說明需要擴容，執(zhí)行擴容
如果都不滿足，就使用synchronized寫入數據，寫入數據同樣判斷鏈表、紅黑樹，鏈表寫入和HashMap的方式一樣，key hash一樣就覆蓋，反之就尾插法，鏈表長度超過8就轉換成紅黑樹

get查詢

get很簡單，通過key計算hash，如果key hash相同就返回，如果是紅黑樹按照紅黑樹獲取，都不是就遍歷鏈表獲取。

volatile原理知道嗎？

相比synchronized的加鎖方式來解決共享變量的內存可見性問題，volatile就是更輕量的選擇，他沒有上下文切換的額外開銷成本。使用volatile聲明的變量，可以確保值被更新的時候對其他線程立刻可見。volatile使用內存屏障來保證不會發(fā)生指令重排，解決了內存可見性的問題。

我們知道，線程都是從主內存中讀取共享變量到工作內存來操作，完成之后再把結果寫會主內存，但是這樣就會帶來可見性問題。舉個例子，假設現在我們是兩級緩存的雙核CPU架構，包含L1、L2兩級緩存。

線程A首先獲取變量X的值，由于最初兩級緩存都是空，所以直接從主內存中讀取X，假設X初始值為0，線程A讀取之后把X值都修改為1，同時寫回主內存。這時候緩存和主內存的情況如下圖。
線程B也同樣讀取變量X的值，由于L2緩存已經有緩存X=1，所以直接從L2緩存讀取，之后線程B把X修改為2，同時寫回L2和主內存。這時候的X值入下圖所示。
那么線程A如果再想獲取變量X的值，因為L1緩存已經有x=1了，所以這時候變量內存不可見問題就產生了，B修改為2的值對A來說沒有感知。

那么，如果X變量用volatile修飾的話，當線程A再次讀取變量X的話，CPU就會根據緩存一致性協(xié)議強制線程A重新從主內存加載最新的值到自己的工作內存，而不是直接用緩存中的值。

再來說內存屏障的問題，volatile修飾之后會加入不同的內存屏障來保證可見性的問題能正確執(zhí)行。這里寫的屏障基于書中提供的內容，但是實際上由于CPU架構不同，重排序的策略不同，提供的內存屏障也不一樣，比如x86平臺上，只有StoreLoad一種內存屏障。

StoreStore屏障，保證上面的普通寫不和volatile寫發(fā)生重排序
StoreLoad屏障，保證volatile寫與后面可能的volatile讀寫不發(fā)生重排序
LoadLoad屏障，禁止volatile讀與后面的普通讀重排序
LoadStore屏障，禁止volatile讀和后面的普通寫重排序

那么說說你對JMM內存模型的理解？為什么需要JMM？

本身隨著CPU和內存的發(fā)展速度差異的問題，導致CPU的速度遠快于內存，所以現在的CPU加入了高速緩存，高速緩存一般可以分為L1、L2、L3三級緩存?；谏厦娴睦游覀冎懒诉@導致了緩存一致性的問題，所以加入了緩存一致性協(xié)議，同時導致了內存可見性的問題，而編譯器和CPU的重排序導致了原子性和有序性的問題，JMM內存模型正是對多線程操作下的一系列規(guī)范約束，因為不可能讓陳雇員的代碼去兼容所有的CPU，通過JMM我們才屏蔽了不同硬件和操作系統(tǒng)內存的訪問差異，這樣保證了Java程序在不同的平臺下達到一致的內存訪問效果，同時也是保證在高效并發(fā)的時候程序能夠正確執(zhí)行。

原子性：Java內存模型通過read、load、assign、use、store、write來保證原子性操作，此外還有l(wèi)ock和unlock，直接對應著synchronized關鍵字的monitorenter和monitorexit字節(jié)碼指令。
可見性：可見性的問題在上面的回答已經說過，Java保證可見性可以認為通過volatile、synchronized、final來實現。
有序性：由于處理器和編譯器的重排序導致的有序性問題，Java通過volatile、synchronized來保證。

happen-before規(guī)則

雖然指令重排提高了并發(fā)的性能，但是Java虛擬機會對指令重排做出一些規(guī)則限制，并不能讓所有的指令都隨意的改變執(zhí)行位置，主要有以下幾點：

單線程每個操作，happen-before于該線程中任意后續(xù)操作
volatile寫happen-before與后續(xù)對這個變量的讀
synchronized解鎖happen-before后續(xù)對這個鎖的加鎖
final變量的寫happen-before于final域對象的讀，happen-before后續(xù)對final變量的讀
傳遞性規(guī)則，A先于B，B先于C，那么A一定先于C發(fā)生

說了半天，到底工作內存和主內存是什么？

主內存可以認為就是物理內存，Java內存模型中實際就是虛擬機內存的一部分。而工作內存就是CPU緩存，他有可能是寄存器也有可能是L1\L2\L3緩存，都是有可能的。

說說ThreadLocal原理？

ThreadLocal可以理解為線程本地變量，他會在每個線程都創(chuàng)建一個副本，那么在線程之間訪問內部副本變量就行了，做到了線程之間互相隔離，相比于synchronized的做法是用空間來換時間。

ThreadLocal有一個靜態(tài)內部類ThreadLocalMap，ThreadLocalMap又包含了一個Entry數組，Entry本身是一個弱引用，他的key是指向ThreadLocal的弱引用，Entry具備了保存key value鍵值對的能力。

弱引用的目的是為了防止內存泄露，如果是強引用那么ThreadLocal對象除非線程結束否則始終無法被回收，弱引用則會在下一次GC的時候被回收。

但是這樣還是會存在內存泄露的問題，假如key和ThreadLocal對象被回收之后，entry中就存在key為null，但是value有值的entry對象，但是永遠沒辦法被訪問到，同樣除非線程結束運行。

但是只要ThreadLocal使用恰當，在使用完之后調用remove方法刪除Entry對象，實際上是不會出現這個問題的。

那引用類型有哪些？有什么區(qū)別？

引用類型主要分為強軟弱虛四種：

強引用指的就是代碼中普遍存在的賦值方式，比如A a = new A()這種。強引用關聯的對象，永遠不會被GC回收。
軟引用可以用SoftReference來描述，指的是那些有用但是不是必須要的對象。系統(tǒng)在發(fā)生內存溢出前會對這類引用的對象進行回收。
弱引用可以用WeakReference來描述，他的強度比軟引用更低一點，弱引用的對象下一次GC的時候一定會被回收，而不管內存是否足夠。
虛引用也被稱作幻影引用，是最弱的引用關系，可以用PhantomReference來描述，他必須和ReferenceQueue一起使用，同樣的當發(fā)生GC的時候，虛引用也會被回收。可以用虛引用來管理堆外內存。

線程池原理知道嗎？

首先線程池有幾個核心的參數概念：

最大線程數maximumPoolSize
核心線程數corePoolSize
活躍時間keepAliveTime
阻塞隊列workQueue
拒絕策略RejectedExecutionHandler

當提交一個新任務到線程池時，具體的執(zhí)行流程如下：

當我們提交任務，線程池會根據corePoolSize大小創(chuàng)建若干任務數量線程執(zhí)行任務
當任務的數量超過corePoolSize數量，后續(xù)的任務將會進入阻塞隊列阻塞排隊
當阻塞隊列也滿了之后，那么將會繼續(xù)創(chuàng)建(maximumPoolSize-corePoolSize)個數量的線程來執(zhí)行任務，如果任務處理完成，maximumPoolSize-corePoolSize額外創(chuàng)建的線程等待keepAliveTime之后被自動銷毀
如果達到maximumPoolSize，阻塞隊列還是滿的狀態(tài)，那么將根據不同的拒絕策略對應處理