Windows字符串類型 CHAR* WCHAR* LPSTR LPCSTR

tianht 2015-04-22

展開全文

基于windows編程開發(fā)，字符類型肯定是少不了的，收集整理一下關(guān)于 windows下的基本類型，以便遺忘查看.

C++主要使用的是C-Style字符串，而M$在Windows中又增加了很多C-Style字符串的變體。這個一多嘛，就容易亂~

所謂字符串，就是由字符組合而成，所以我們先來查看一下字符類型。

首先，存在兩種最基本的字符類型：char和wchar_t。char大家都很熟悉了，我就跳過。至于wchar_t，是應(yīng)用于UNICODE的寬字符，即一個字符2Bytes，16Bits。事實上，Windows中利用

typedef unsigned short wchar_t

定義wchar_t

然后為了書寫方便（MS我也沒覺得有多大差別），M$又把那兩個基本字符類型重新的給他typedef了一遍，即：

typedef char CHAR
typedef wchar_t WCHAR

為了使得兼容性更加，M$又定義了TCHAR數(shù)據(jù)類型：

#ifdef UNIOCDE
typedef WCHAR TCHAR
#else
typedef CHAR TCHAR
#end if

這樣，你不用關(guān)心是要使用ANSI字符串還是Unicode，編譯器會自動根據(jù)你的OS來選擇。

說明：
1、UNICODE宏在C/C++中分別是 _UNICODE宏（有下劃線）/ UNICODE宏（無下劃線）。

2、在使用字符串常量的時候需要使用_TEXT(“TStr”)或者_T("TStr")來支持系統(tǒng)的自動轉(zhuǎn)換。

然后，M$又利用上面的幾種基本數(shù)據(jù)類型，定義了一些字符串指針類型。
LPSTR和LPCSTR：LPSTR是指向以0結(jié)尾的ANSI字符串的指針，后者是const指針

typedef CHAR* LPSTR
typedef const CHAR* LPCSTR

LPWSTR和LPCWSTR：LPWSTR是指向以0結(jié)尾的UNICODE字符串的指針，后者是const指針

typedef WCHAR* LPWSTR
typedef const WCHAR* LPCWSTR

同樣，為了擺脫對ANSI還是UNICODE的選擇麻煩，M$也增加了LPTSTR和LPCTSTR兩個字符串指針類型。他們被如下定義：

typedef TCHAR* LPTSTR

#ifdef UNICODE
  typedef LPSTR LPTSTR
#else
  typedef LPWSTR LPTSTR
#endif
/////////////////////////////////////
typedef const TCHAR* LPCTSTR

#ifdef UNICODE
  typedef LPCSTR LPCTSTR
#else
  typedef LPCWSTR LPCTSTR
#endif

ps：你會在某些地方看到存在PSTR/PWSTR/PTSTR等等，與上面的只卻一個L的字符串指針類型。實際上，這個是長指針和短指針問題。LPXX是長指針，PXX是短指針。不過在32Bit的系統(tǒng)上，二者已經(jīng)沒有區(qū)別。

BSTR：

BSTR是為了與原先的basic字符兼容。主要用來和VB打交道的(VB里的string就是指它)。一個 BSTR 由頭部和字符串組成，頭部4字節(jié)包含串長信息，串中可以包含嵌入的 null 值。這種帶長度前綴的字符串,主要由操作系統(tǒng)來管理的,所以要用api.操作它的API函數(shù)很多，如SysAllocString,SysFreeString等.
vc里封裝它的類如_bstr_t,及ATL中的CComBSTR等.
BSTR 是以指針的形式進行傳遞的。
BSTR 是 Unicode 的，即每個字符需要兩個字節(jié)。
BSTR 通常以兩字節(jié)的 null 字符結(jié)束。

然后說說兩個比較成熟好用的字符串類型：String和CString
String是C++的標(biāo)準(zhǔn)字符串，需要string（不帶.h）頭文件和std名字空間支持。
CString是M$為MFC設(shè)計的字符串，功能更加強大，而且這玩意兒是安全的。需要atlstr.h文件和MFC DLL的支持。不過目前已經(jīng)有人將此類型從MFC中分離~

為了增強程序的通用性，還必須注意以下幾點：

cLPTSTR、LPCSTR、LPCTSTR、LPSTR的意義：
LPSTR：32bit指針指向一個字符串，每個字符占1字節(jié)
LPCSTR:32-bit指針指向一個常字符串，每個字符占1字節(jié)
LPCTSTR:32-bit指針指向一個常字符串,每字符可能占1字節(jié)或2字節(jié)，取決于Unicode宏是否定義
LPTSTR:32-bit指針每字符可能占1字節(jié)或2字節(jié)，取決于Unicode宏是否定義

1、既然程序里不能出現(xiàn)char，那表示字符串時，就不能再習(xí)慣性的用char*了。應(yīng)該改為TCHAR*，或者是PTSTR。后一種是 windows的變量，類似的有：PSTR、PTSTR、LPTSTR、LPSTR、PCTSTR等等等等。這也是讓人一開始接觸會頭大的地方。其實并非如此恐怖，我以PCTSTR為例做個解釋：P代表指針(和LP是一個東西，LP的本意是Long Pointer，16位windows時代的遺留物。)，C代表const，T代表TCHAR，STR代表字符串。所以PCTSTR其實就是const TCHAR* 的意思。而PSTR也就是char* 的意思。所以我們在表示字符串時也不能使用PSTR等不帶T的變量類型名。

2、表示字符串常量時，不能簡單的用雙引號括起來，因為那代表ascii字符串。同樣也不能在前面加L，因為那代表unicode。我們的程序要做到的是通用性，即不是ascii也不是unicode。所以我們在字符串前應(yīng)該加的是TEXT，比如MessageBox(NULL,TEXT("Fypher"),TEXT("FF"),MB_OK)。TEXT還可用于字符。比如TCHAR m=TEXT('A');

3、TCHAR FF[50]。FF能裝多少字符？哈！不要習(xí)慣性的sizeof(FF)了，應(yīng)該_countof(FF)或者sizeof(FF)/sizeof(TCHAR)。因為我們不確定TCHAR到底是char 還是 wchar_t。

4、該和一堆老朋友說再見了……我們不能再使用以前的字符串處理函數(shù)或者字符處理函數(shù)了。比如strlen、strcat、strcmp等等等等……因為這些是ascii專用的，通通改成使用T家族的吧。前綴都換成_tcs。比如_tcslen、_tcscat、_tcscmp等等……順便補充一下wcs前綴是wchar_t使用的。恩，還有大家用得超爽的sprintf，今后就改成_stprintf了吧~呵呵。補充：swprintf是 wchar_t它家的。對了，windows認(rèn)為_tcscpy、_tcscat等不安全，所以使用這些函數(shù)編譯器會報警?？梢愿挠脀indows推出的 _tcscpy_s、_tcscat_s等“安全”函數(shù)，其實就是多了個參數(shù)用來指明緩沖區(qū)大?。ㄓ浀糜胈countof哦~！^_^）。windows 還推出了形如StringCchCat的一套字符串處理函數(shù)，我沒怎么用過。windows也有一個字符串比較函數(shù)CompareString。功能比 _tcscmp強大多了。比如可以設(shè)置忽略大小寫等。

5、IsTextUnicode函數(shù)可以用過一系列統(tǒng)計學(xué)的方法判斷某個字符串是不是unicode字符串。 MultiByteToWideChar和WideCharToMultiByte函數(shù)可實現(xiàn)Ascii和Unicode字符串的相互轉(zhuǎn)化。這些的使用場合都不大。因為我們的程序應(yīng)該做到“沒有”ascii和unicode。

6、恩，雖然絕大多數(shù)情況下應(yīng)該使用TCHAR，但是記住GetProcAdress這個特殊的函數(shù)吧，它的參數(shù)只能是char*。因為在導(dǎo)出函數(shù)表里函數(shù)名是用ascii碼寫的……

7、最后一點，記得要#include <tchar.h>哦！呵呵~ 由于windows內(nèi)核采用的是UNICODE，UNICODE版的程序必然比ASCII版的程序效率高（比如不用在調(diào)用函數(shù)時在堆里分配空間把參數(shù)轉(zhuǎn)成 UNICODE，然后再調(diào)用UNICODE版的函數(shù)），所以我們最好是在程序的開頭加上#define UNICODE和#define _UNICODE，把程序轉(zhuǎn)換成UNICODE版的。如果程序的字符串處理完全按照上面的通用性要求做了是不會出錯的。

8、注意：str前綴與wcs前綴都是標(biāo)準(zhǔn)C函數(shù)，需要有標(biāo)準(zhǔn)C運行庫才能夠使用。而lstr前綴的是window提供的原生函數(shù)，不需標(biāo)準(zhǔn)C運行庫。