引用(reference)和指針(pointer)是學(xué)C++過(guò)程中最令人頭疼的問(wèn)題,常常不知道什么時(shí)候用哪個(gè)合適,又常常弄混。找到Dan Saks的這篇文章,講的很清楚,強(qiáng)烈推薦,所以翻譯一下供大家參考。
———————————————————————————
以下譯自Dan Saks的文章 References vs. Pointers 英文原文
———————————————————————————
了解引用reference與指針pointer到底有什么不同可以幫助你決定什么時(shí)候該用reference,什么時(shí)候該用pointer。
在C++ 中,reference在很多方面與指針(pointer)具有同樣的能力。雖然多數(shù)C++程序員對(duì)于何時(shí)使用reference何時(shí)使用pointer 都會(huì)有一些直覺(jué),但總還是會(huì)有些時(shí)候搞不清楚。如果你想要建立一個(gè)關(guān)于使用reference使用的清晰有理的概念,又有必要了解到底reference和pointer有什么不同。
深層含義
與pointer 類似,一個(gè)reference是一個(gè)對(duì)象(object),可以用來(lái)間接指向另一個(gè)對(duì)象。一個(gè)reference的聲明與pointer的聲明的實(shí)質(zhì)語(yǔ)法結(jié)構(gòu)是相同的。不同的是,聲明pointer的時(shí)候使用星號(hào)操作符 * , 而聲明reference的時(shí)候使用地址操作符 & 。 例如,我們有:
int i = 3;
則有:
int *pi = &i;
聲明 pi 為一個(gè)指針類型的對(duì)象,并且是一個(gè)”指向int整型的指針”,它的初始值為對(duì)象i的地址。而另一方面:
int &ri = i;
聲明 ri為一個(gè)reference類型的對(duì)象,并且也是一個(gè)指向整型的reference,它指向的是i。我們可以看到pointer和reference的聲明有顯著的不同,但這并不是決定何時(shí)使用哪一個(gè)的根據(jù)。決定的真正依據(jù)是當(dāng)它們被用在表達(dá)式中時(shí)其顯示的不同決定了使用哪一個(gè)合適
Pointer 和reference的最大不同是:pointer必須使用一個(gè)星號(hào)操作符 * 來(lái)去掉reference (英文叫做dereference,我不知道這里怎樣翻譯這個(gè)詞合適,姑且就叫“去參考”吧)而reference不需要任何操作符來(lái)去參考。例如,有了上面例子中的定義, 間接表達(dá)式 *pi 將 pi 去參考為指向i。相反,表達(dá)式ri-不需要任何操作符-自動(dòng)將ri去參考為指向i。因此, 使用指針p,我們需要用賦值語(yǔ)句:
*p = 4;
將i的值變?yōu)?; 而使用reference ri,我們只需要直接寫:
ri = 4;
就可以同樣將i的值變?yōu)? 。
這個(gè)顯示的不同在當(dāng)你為函數(shù)的參數(shù)類型和返回值類型選擇是使用pointer還是reference的時(shí)候就會(huì)顯著起來(lái),尤其是對(duì)于重載操作符的函數(shù)。
下面使用一個(gè)針對(duì)列舉類型(enumeration)的++操作符例子來(lái)說(shuō)明上面這點(diǎn)。在C++中,內(nèi)置的++操作符對(duì)列舉類型無(wú)效,例如,對(duì)下面定義:
enum day{
Sunday, Monday, …
};
day x;
表達(dá)式 ++x 不能編譯。如果想讓它通過(guò)編譯,必須要定義一個(gè)名為operator++的函數(shù),接受day為參數(shù),并且調(diào)用 ++x 必須改變x的值。因此, 僅聲明一個(gè)函數(shù) operator++ , 以類型day為參數(shù), 如下:
day operator++(day d);
并不能夠得到想要得效果。 這個(gè)函數(shù)通過(guò)值傳遞參數(shù)(pass by value),這就意味著函數(shù)內(nèi)看到的是參數(shù)的一個(gè)拷貝,而不是參數(shù)本身。為了使函數(shù)能夠改變其操作數(shù)(operand)的值,它必須通過(guò)指針或reference來(lái)傳遞其操作數(shù)。
通過(guò)指針傳遞參數(shù)(passing by pointer),函數(shù)定義如下:
day *operator++(day *d);
它通過(guò)將增加后的值存儲(chǔ)到*d里面來(lái)使函數(shù)改變?nèi)掌?day)的值。但是,這樣你就必須使用像表達(dá)式++&x這樣來(lái)調(diào)用這個(gè)操作符,這看起來(lái)不太對(duì)勁兒。
正確的方法是定義operator++以reference為參數(shù)類型,如下:
day &operator++(day &d)
{
d = (day)(d + 1);
return d;
}
使用這個(gè)函數(shù), 表達(dá)式 ++x 才有正確的顯示以及正確的操作。
Passing by reference不僅僅是寫operator++較好的方法,而是唯一的方法。 C++在這里并沒(méi)有給我們選擇的余地。 像下面的聲明:
day *operator++(day *d);
是不能 通過(guò)編譯的。每個(gè)重載的操作符函數(shù)必須或者是一個(gè)類的成員, 或者使用類型T、 T & 或 T const & 為參數(shù)類型,這里T是一個(gè)類(class)或列舉(enumeration)類型。也就是說(shuō),每一個(gè)重載操作符必須以類或列舉類型為參數(shù)類型。指針,即使是指向一個(gè)類或列舉類型對(duì)象的指針,也不可以用。C++ 不允許在重載操作符時(shí)重新定義內(nèi)置操作符的含義,包括指針類型。因此,我們不可以定義:
int operator++(int i); // 錯(cuò)誤
因?yàn)樗噲D對(duì)int重新定義操作符 ++ 的含義。 我們也不可以定義:
int *operator++(int *i); // 錯(cuò)誤
因?yàn)樗噲D對(duì) int * 重新定義操作符 ++ 的含義。
References vs. const pointers
C++ 中不允許定義”const reference”,因?yàn)橐粋€(gè)reference天生就是const。也就是說(shuō),一旦將一個(gè)reference綁定到一個(gè)對(duì)象,就無(wú)法再將它重新綁定到另一個(gè)不同的對(duì)象。在聲明一個(gè)reference之后沒(méi)有寫法可以將它重新綁定到另外一個(gè)對(duì)象。例如:
int &ri = i;
將 ri 綁定到 i 。然后下面的賦值:
ri = j;
并不是把 ri 綁定到 j ,而是將 j 中的值賦給 ri 指向的對(duì)象,也就是賦給 i 。
簡(jiǎn)而言之,一個(gè)pointer在它的有生之年可以指向許多不同的對(duì)象,而一個(gè)reference只能夠指向一個(gè)對(duì)象。有些人認(rèn)為這才是 reference和 pointer最大的不同。我并不贊成。也許這是reference與pointer的一點(diǎn)不同,但并不是reference和const pointer的不同。在強(qiáng)調(diào)一遍,一旦一個(gè)reference與一個(gè)對(duì)象綁定,就不能再將它改指向另外的東西。既然不能再綁定reference之后再改變,一個(gè)reference就必須在一出生就被綁定。否則這個(gè)reference就永遠(yuǎn)不能被綁定到任何東西,也就毫無(wú)用處了。
上一段的討論也同樣完全適用于常量指針(const pointer)。(注意,我這里說(shuō)的是常量指針(const pointer),而不是指向常量的指針 “pointers to const”。) 例如,一個(gè)reference聲明必須同時(shí)帶有一個(gè)初始化賦值,如下所示:
void f()
{
int &r = i;
…
}
省略這個(gè)初始化賦值將產(chǎn)生一個(gè)編譯錯(cuò)誤:
void f()
{
int &r; //錯(cuò)誤
…
}
一個(gè)常量指針的聲明也同樣必須帶有一個(gè)初始化賦值,如下所示:
void f()
{
int *const p = &i;
…
}
省略這個(gè)初始化賦值同樣會(huì)出錯(cuò):
void f(){
int *const p; // 錯(cuò)誤
…
}
在我看來(lái),不能夠?qū)eference二次綁定作為reference與pointer的不同。并不比常量指針和非常量指針的不同更為顯著。
Null references
除了顯示的不同,常量指針與reference還有一點(diǎn)非常不同,那就是,一個(gè)有效的reference必須指向一個(gè)對(duì)象;而一個(gè)指針不需要。一個(gè)指針,即使是一個(gè)常量指針,都可以有空值。一個(gè)空指針不指向任何東西。
這點(diǎn)不同就暗示當(dāng)你想要確信一個(gè)參數(shù)必須指向一個(gè)對(duì)象的時(shí)候,應(yīng)該使用reference作為參數(shù)類型。 例如,交換函數(shù)(swap function),它接受兩個(gè)int參數(shù),并將兩個(gè)參數(shù)的數(shù)值對(duì)調(diào),如下所示:
int i, j;
swap(i, j);
將原本在 i 中的值放到 j 中, 并將原本在 j 中的值放到 i 中。我們可以這樣寫這個(gè)函數(shù):
void swap(int *v1, int *v2)
{
int temp = *v1;
*v1 = *v2;
*v2 = temp;
}
這種定義下,函數(shù)要像這樣被調(diào)用: swap(&i, &j);
這個(gè)接口暗示其中一個(gè)或兩個(gè)參數(shù)都有可能為空(null)。而這個(gè)暗示是誤導(dǎo)的。例如,調(diào)用
swap(&i, NULL);
的后果很可能是不愉快的。
而像下面這樣定義reference為參數(shù):
void swap(int &v1, int &v2)
{
int temp = v1;
v1 = v2;
v2 = temp;
}
清晰的表明了調(diào)用swap應(yīng)該提供兩個(gè)對(duì)象,它們的值將被交換。并且這樣定義的另一個(gè)好處是,在調(diào)用這個(gè)函數(shù)的時(shí)候,不需要使用那些&符號(hào),看起來(lái)更順眼:
swap(i, j);
更安全?
有些人認(rèn)為既然reference不能夠?yàn)榭眨敲此鼞?yīng)該比指針更安全。我認(rèn)為reference可能要安全一點(diǎn),但不會(huì)安全很多。雖然一個(gè)有效的reference不能為空,但是無(wú)效的可以呀。實(shí)際上,在很多情況下程序有可能產(chǎn)生無(wú)效的reference,而不只是空的reference。例如,你可以定義一個(gè)reference,使它綁定到一個(gè)指針指向的對(duì)象,如下所示:
int *p;
…
int &r = *p;
如果指針*p在reference定義時(shí)剛好為空,則這個(gè)reference為空。從技術(shù)上來(lái)說(shuō),這個(gè)錯(cuò)誤并不在于將reference綁定到一個(gè)空值,而是在于對(duì)一個(gè)空指針去參考。對(duì)一個(gè)空指針去參考產(chǎn)生了一個(gè)不確定的操作,也就意味著很多事都可能發(fā)生,而且大部分都不是什么好事。很有可能當(dāng)程序?qū)eference r 綁定到*p (p所指向的對(duì)象)的時(shí)候,p實(shí)際上沒(méi)有被去參考,甚至程序只是將p的值拷貝給實(shí)現(xiàn)r的指針。而程序?qū)?huì)繼續(xù)執(zhí)行下去直到錯(cuò)誤在后面的運(yùn)行中更為明顯的表現(xiàn)出來(lái),產(chǎn)生不可預(yù)知的危害。
下面的函數(shù)展示了另外一種產(chǎn)生無(wú)效reference的方法:
int &f()
{
int i;
…
return i;
}
這個(gè)函數(shù)返回一個(gè)指向本地變量 i 的reference。然而當(dāng)函數(shù)返回時(shí),本地變量 i 的存儲(chǔ)空間也就消失了。因此這個(gè)函數(shù)實(shí)際返回了一個(gè)指向被回收了的空間的reference。這個(gè)操作與返回一個(gè)指向本地變量的指針的后果相同。有些編譯器可以在編譯時(shí)發(fā)現(xiàn)這個(gè)錯(cuò)誤,但也很有可能不會(huì)發(fā)現(xiàn)。
我喜歡reference,也有很好的理由使用它們代替pointer。但如果你期望使用reference來(lái)使你的程序健壯性顯著增強(qiáng),那么你多半會(huì)失望的。
以指針或reference為參數(shù)的C++函數(shù)定義與調(diào)用對(duì)照表
初學(xué)者不易建立清晰的指針和reference概念,總結(jié)這個(gè)表以供快速參考:
假設(shè)有對(duì)象定義:
MyObjectType obj1;
1. 值傳遞:
如果函數(shù)定義為:
void myFunction( MyObjectType obj);
函數(shù)調(diào)用:
myFunction(obj); //函數(shù)以外對(duì)象obj的值不會(huì) 改變
2. reference傳遞:
如果函數(shù)定義為:
void myFunction( MyObjectType &obj);
函數(shù)調(diào)用:
myFunction(obj); //函數(shù)以外對(duì)象obj的值會(huì) 改變
3. 指針傳遞:
如果函數(shù)定義為:
void myFunction( MyObjectType *obj);
函數(shù)調(diào)用:
myFunction(&obj); //需要dereference(&), 函數(shù)以外對(duì)象obj的值會(huì) 改變
參考資料:
- Saks, Dan. “Introduction to References,” Embedded Systems Programming, January 2001, p. 81.
- Saks, Dan. “References and const“, Embedded Systems Programming February 2001, p. 73.