Java中字符串對象創(chuàng)建有兩種形式,一種為字面量形式,如String str = "droid"; ,另一種就是使用new這種標(biāo)準(zhǔn)的構(gòu)造對象的方法,如String str = new String("droid"); ,這兩種方式我們在代碼編寫時都經(jīng)常使用,尤其是字面量的方式。然而這兩種實(shí)現(xiàn)其實(shí)存在著一些性能和內(nèi)存占用的差別。這一切都是源于JVM為了減少字符串對象的重復(fù)創(chuàng)建,其維護(hù)了一個特殊的內(nèi)存,這段內(nèi)存被成為字符串常量池或者字符串字面量池。
工作原理
當(dāng)代碼中出現(xiàn)字面量形式創(chuàng)建字符串對象時,JVM首先會對這個字面量進(jìn)行檢查,如果字符串常量池中存在相同內(nèi)容的字符串對象的引用,則將這個引用返回,否則新的字符串對象被創(chuàng)建,然后將這個引用放入字符串常量池,并返回該引用。
舉例說明
字面量創(chuàng)建形式
JVM檢測這個字面量,這里我們認(rèn)為沒有內(nèi)容為droid 的對象存在。JVM通過字符串常量池查找不到內(nèi)容為droid 的字符串對象存在,那么會創(chuàng)建這個字符串對象,然后將剛創(chuàng)建的對象的引用放入到字符串常量池中,并且將引用返回給變量str1。
如果接下來有這樣一段代碼
同樣JVM還是要檢測這個字面量,JVM通過查找字符串常量池,發(fā)現(xiàn)內(nèi)容為”droid”字符串對象存在,于是將已經(jīng)存在的字符串對象的引用返回給變量str2。注意這里不會重新創(chuàng)建新的字符串對象。
驗(yàn)證是否為str1和str2是否指向同一對象,我們可以通過這段代碼
1
| System.out.println(str1 == str2);
|
結(jié)果為true 。
使用new創(chuàng)建
1
| String str3 = new String("droid");
|
當(dāng)我們使用了new來構(gòu)造字符串對象的時候,不管字符串常量池中有沒有相同內(nèi)容的對象的引用,新的字符串對象都會創(chuàng)建。因此我們使用下面代碼測試一下,
1
2
| String str3 = new String("droid");
System.out.println(str1 == str3);
|
結(jié)果如我們所想,為false ,表明這兩個變量指向的為不同的對象。
intern
對于上面使用new創(chuàng)建的字符串對象,如果想將這個對象的引用加入到字符串常量池,可以使用intern方法。
調(diào)用intern后,首先檢查字符串常量池中是否有該對象的引用,如果存在,則將這個引用返回給變量,否則將引用加入并返回給變量。
1
2
| String str4 = str3.intern();
System.out.println(str4 == str1);
|
輸出的結(jié)果為true 。
疑難問題
前提條件?
字符串常量池實(shí)現(xiàn)的前提條件就是Java中String對象是不可變的,這樣可以安全保證多個變量共享同一個對象。如果Java中的String對象可變的話,一個引用操作改變了對象的值,那么其他的變量也會受到影響,顯然這樣是不合理的。
引用 or 對象
字符串常量池中存放的時引用還是對象,這個問題是最常見的。字符串常量池存放的是對象引用,不是對象。在Java中,對象都創(chuàng)建在堆內(nèi)存中。
更新驗(yàn)證,收到的很多評論也在討論這個問題,我簡單的進(jìn)行了驗(yàn)證。
驗(yàn)證環(huán)境
1
2
3
4
5
6
7
8
9
10
11
12
13
| 22:18:54-androidyue~/Videos$ cat /etc/os-release
NAME=Fedora
VERSION="17 (Beefy Miracle)"
ID=fedora
VERSION_ID=17
PRETTY_NAME="Fedora 17 (Beefy Miracle)"
ANSI_COLOR="0;34"
CPE_NAME="cpe:/o:fedoraproject:fedora:17"
22:19:04-androidyue~/Videos$ java -version
java version "1.7.0_25"
OpenJDK Runtime Environment (fedora-2.3.12.1.fc17-x86_64)
OpenJDK 64-Bit Server VM (build 23.7-b01, mixed mode)
|
驗(yàn)證思路:以下的Java程序讀取一個大小為82M的視頻文件,以字符串形式進(jìn)行intern操作。
1
2
| 22:01:17-androidyue~/Videos$ ll -lh | grep why_to_learn.mp4
-rw-rw-r--. 1 androidyue androidyue 82M Oct 20 2013 why_to_learn.mp4
|
驗(yàn)證代碼
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
| import java.io.BufferedReader;
import java.io.FileNotFoundException;
import java.io.FileReader;
import java.io.IOException;
public class TestMain {
private static String fileContent;
public static void main(String[] args) {
fileContent = readFileToString(args[0]);
if (null != fileContent) {
fileContent = fileContent.intern();
System.out.println("Not Null");
}
}
private static String readFileToString(String file) {
BufferedReader reader = null;
try {
reader = new BufferedReader(new FileReader(file));
StringBuffer buff = new StringBuffer();
String line;
while ((line = reader.readLine()) != null) {
buff.append(line);
}
return buff.toString();
} catch (FileNotFoundException e) {
e.printStackTrace();
} catch (IOException e) {
e.printStackTrace();
} finally {
if (null != reader) {
try {
reader.close();
} catch (IOException e) {
e.printStackTrace();
}
}
}
return null;
}
}
|
由于字符串常量池存在于堆內(nèi)存中的永久代,適用于Java8之前。我們通過設(shè)置永久代一個很小的值來進(jìn)行驗(yàn)證。如果字符串對象存在字符串常量池中,那么必然拋出java.lang.OutOfMemoryError permgen space 錯誤。
1
| java -XX:PermSize=6m TestMain ~/Videos/why_to_learn.mp4
|
運(yùn)行證明程序沒有拋出OOM,其實(shí)這個不能很好的證明存儲的是對象還是引用。
但是這個至少證明了字符串的實(shí)際內(nèi)容對象char[]不存放在字符串常量池中。既然這樣的話,其實(shí)字符串常量池存儲字符串對象還是字符串對象的引用反而不是那么重要。但個人還是傾向于存儲的為引用。
優(yōu)缺點(diǎn)
字符串常量池的好處就是減少相同內(nèi)容字符串的創(chuàng)建,節(jié)省內(nèi)存空間。
如果硬要說弊端的話,就是犧牲了CPU計算時間來換空間。CPU計算時間主要用于在字符串常量池中查找是否有內(nèi)容相同對象的引用。不過其內(nèi)部實(shí)現(xiàn)為HashTable,所以計算成本較低。
GC回收?
因?yàn)樽址A砍刂谐钟辛斯蚕淼淖址畬ο蟮囊?,這就是說是不是會導(dǎo)致這些對象無法回收?
首先問題中共享的對象一般情況下都比較小。據(jù)我查證了解,在早期的版本中確實(shí)存在這樣的問題,但是隨著弱引用的引入,目前這個問題應(yīng)該沒有了。
關(guān)于這個問題,可以具體了解這片文章interned Strings : Java Glossary
intern使用?
關(guān)于使用intern的前提就是你清楚自己確實(shí)需要使用。比如,我們這里有一份上百萬的記錄,其中記錄的某個值多次為美國加利福尼亞州,我們不想創(chuàng)建上百萬條這樣的字符串對象,我們可以使用intern只在內(nèi)存中保留一份即可。關(guān)于intern更深入的了解請參考深入解析String#intern。
總有例外?
你知道下面的代碼,會創(chuàng)建幾個字符串對象,在字符串常量池中保存幾個引用么?
1
| String test = "a" + "b" + "c";
|
答案是只創(chuàng)建了一個對象,在常量池中也只保存一個引用。我們使用javap反編譯看一下即可得知。
1
2
3
4
5
6
7
8
9
10
11
12
13
14
| 17:02 $ javap -c TestInternedPoolGC
Compiled from "TestInternedPoolGC.java"
public class TestInternedPoolGC extends java.lang.Object{
public TestInternedPoolGC();
Code:
0: aload_0
1: invokespecial #1; //Method java/lang/Object."<init>":()V
4: return
public static void main(java.lang.String[]) throws java.lang.Exception;
Code:
0: ldc #2; //String abc
2: astore_1
3: return
|
看到了么,實(shí)際上在編譯期間,已經(jīng)將這三個字面量合成了一個。這樣做實(shí)際上是一種優(yōu)化,避免了創(chuàng)建多余的字符串對象,也沒有發(fā)生字符串拼接問題。關(guān)于字符串拼接,可以查看Java細(xì)節(jié):字符串的拼接。
參考文章
|