2.4 表達式求值和類型轉換
MySQL 允許編寫包括常量、函數(shù)調(diào)用和表列引用的表達式。這些值可利用不同類型的運算符進行組合,諸如算術運算符或比較運算符。表達式的項可用圓括號來分組。表達式在SELECT 語句的列選擇列表和WHERE 子句中出現(xiàn)得最為頻繁,如下所示:

所選擇的每列給出了一個表達式,如WHERE 子句中所示的那樣。表達式也出現(xiàn)在DELETE 和U P D ATE 語句的WHERE 子句中,以及出現(xiàn)在I N S E RT 語句的VALUES( ) 子句中。
在MySQL 遇到一個表達式時,它對其求值得出結果。例如, (4 * 3)/(4 - 2) 求值得6。表達式求值可能涉及類型轉換。例如, MySQL 在數(shù)960821 用于需要日期值的環(huán)境時,將其轉換為日期“ 1 9 9 6 - 0 8 - 2 1”。本節(jié)討論怎樣編寫MySQL 的表達式,以及在表達式求值中MySQL 所使用的類型轉換規(guī)則。每個MySQL 的運算符都介紹過了,但MySQL 有那么多的函數(shù),我們只接觸過幾個。每個運算符和函數(shù)的進一步介紹可參閱附錄C。
2.4.1 撰寫表達式
表達式可以只是一個簡單的常量,如:
0 數(shù)值常量
“a b c” 串常量
表達式可以進行函數(shù)調(diào)用。有的函數(shù)需要參數(shù)(圓括號中有值),而有的不需要。多個參數(shù)應該用逗號分隔。在調(diào)用一個函數(shù)時,參數(shù)旁邊可以有空格,但在函數(shù)名與圓括號間不能有空格。下面是一些函數(shù)例子:
NOW( ) 無參數(shù)函數(shù)
STRCMP (“a b c”, “d e f”) 有兩個參數(shù)的函數(shù)
STRCMP( “a b c”, “d e f”) 參數(shù)旁邊有空格是合法的
STRCMP (“a b c”, “d e f”) 函數(shù)名后跟空格是不合法的
如果函數(shù)名后有一個空格, MySQL 的分析程序可能會將函數(shù)名解釋為一個列名(函數(shù)名不是保留字,如果需要的話,可將它們用作列名)。其結果是出現(xiàn)一個語法錯誤。表達式中可使用表列。最簡單的情形是,當某個列所屬的表在上下文中是明確的,則可簡單地給出列名對該列進行引用。下面的每個SELECT 語句中惟一地出了一個表名,因此,列的引用無歧義:

如果使用哪個表的列不明確,可在列名前加上表名。如果使用哪個數(shù)據(jù)庫中的表也不明確的話,可在表名前加上數(shù)據(jù)庫名。如果只是希望意思更明顯,也可以在無歧義的上下文中利用這種更為具體的表示形式,如:

總之,可以組合所有這些值以得到更為復雜的表達式。
1. 運算符的類型
MySQL 有幾種類型的運算符,可用來連接表達式的項。算術運算符,如表2-15 所示,一般包括加、減、乘、除以及模運算符。在兩個操作數(shù)都是整數(shù)時,“+”、“-”和“ *”算術運算用BIGINT(64 位)整數(shù)值來完成。而在結果預期為一個整數(shù)時,“/”和“%”也是用BIGINT(64 位)整數(shù)值來完成的。應該認識到,如果某個運算涉及更大的值,如結果超過64 位,其結果不可預料。

邏輯運算符如表2 - 1 6所示,對表達式進行估計以確定其為真(非零)或假(零)。M y S Q L包含有C 風格的“& &”、“| |”和“!”運算符,可替換A N D、OR 和N O T。要特別注意“| |”運算符,ANSI SQL 指定“| |”作為串連接符,但在MySQL 中,它表示一個邏輯或運算。如果執(zhí)行下面的查詢,則返回數(shù)0:

MySQL 為進行運算,將“ a b c”和“d e f”轉換為整數(shù),且兩者都轉換為0, 0與0進行或運算,結果為0。在MySQL 中,必須用CONCAT (“a b c”, “d e f”) 來完成串的連接。

位運算符如表2-17 所示,完成按位“與”和“或”,其中結果的每一位按兩個操作數(shù)的對應位的邏輯AND 或OR 求值。還可以進行位的左移或右移。位運算用BIGINT(64 位)整數(shù)值進行。

比較運算符如表2-18 所示,其中包括測試相對大小或數(shù)和串的順序的運算符,以及完成模式匹配和測試NULL 值的運算符。“< = >”運算符是MySQL 特有的,在MySQL 3.23版本中引入。


自MySQL 3.23版本起,可使用B I N A RY 運行符,此運算符可用來將一個串轉換為一個二進制串,這個串在比較中是區(qū)分大小寫的。下列的第一個比較是不區(qū)分大小寫的,但第二個和第三個比較是區(qū)分大小寫的:

沒有相應的NOT BINARY 計算。如果希望使一個列既能在區(qū)分大小寫又能在不區(qū)分大小寫的環(huán)境中使用,則應該利用不區(qū)分大小寫的列并對希望區(qū)分大小寫的比較使用BINARY。對于利用二進制串類型(CHAR BINARY、VARCHAR BINARY 和BLOB 類型)定義的列,其比較總是區(qū)分大小寫的。為了對這樣的列類型實現(xiàn)不區(qū)分大小寫的比較,可利用UPPER( ) 或LOWER( ) 來轉換成相同的大小寫:

對于不區(qū)分大小寫的串比較,有可能把多個字符認為是相等的,這取決于所用的字符集。例如“e”和“é”對于比較和排序操作可能是相同的。二進制(區(qū)分大小寫)比較利用字符的ASCII 值來完成。
模式匹配允許查找值而不必給出精確的直接值。MySQL 利用LIKE 運算符和通配符“%”(匹配任意的字符序列)和“ _”(匹配任意單個字符),提供SQL 的模式匹配。MySQL 還基于類似于諸如g r e p、sed 和vi 等UNIX 程序中所用的REGEXP 運算符和擴展正規(guī)表達式,提供模式匹配。為了完成模式匹配,必須使用這些模式匹配運算符中的某一個;不能使用“ =”。為了進行相反的模式匹配,可使用NOT LIKE 或NOT REGEXP。
除了使用的模式運算符和模式字符不同外,這兩種模式匹配還在以下重要的方面存在差異:
■ 除非至少有一個操作數(shù)為二進制串,否則LIKE 是不區(qū)分大小寫的。REGEXP 是區(qū)分大小寫的。(在MySQL 3.23.4 以后的版本中,除非至少有一個操作數(shù)是二進制串,否則REGEXP 是不區(qū)分大小寫的。)
■ 僅當整個串匹配,SQL 才是模式匹配的。僅當相應的模式在串中某一處出現(xiàn),正規(guī)表達式才匹配。用于LIKE 運算符的模式可以包括“%”和“_”通配符。例如,模式“ F r a n k %”與任何以“F r a n k”起頭的串匹配:

通配符“%”與任何串匹配,其中包括與空字符序列匹配,因此“ Frank %”與“ Frank”匹配:

這也表示模式“%”與任何串匹配,其中包括與空串匹配。但是,“%”不與NULL 匹配。事實上,具有NULL 操作數(shù)的任何模式匹配都將失?。?br>
MySQL 的LIKE 運算符是不區(qū)分大小寫的,除非它至少有一個操作數(shù)是二進制串。因此,缺省時“ Frank %”與串“ Frankly”和“frankly”匹配,但在二進制比較中,它只與其中之一匹配:

這不同于ANSI SQL 的LIKE 運算符,它是區(qū)分大小寫的。通配符可在模式中任何地方給出。“% bert”與“ Englebert”、“Bert”和“Albert”匹配。“% bert %”也與所有這些串匹配,而且還與如像“ Berthold”、“Bertram”、和“Alberta”這樣
的串匹配。LIKE 所允許的另一個通配符是“ _”,它與單個字符匹配。“_ _”與三個字符的串匹配。“c _ t”與“c a t”、“c u t”甚至“c _ t”匹配(因為“_”與自身匹配)。為了關掉“%”或“ _”的特殊含義,與這些字符的直接實例相匹配,需要在它們前面放置一個斜杠(“\ %”或“\ _”),如:

MySQL 的另一種形式的模式匹配使用了正規(guī)表達式。運算符為REGEXP 而不是L I K E(RLIKE 為REGEXP 的同義詞)。最常用的正規(guī)表達式模式字符如下:‘.’與任意單個字符匹配:

‘[ . . . ]’與方括號中任意字符匹配??闪谐鲇啥虅澗€‘ -’分隔的范圍端點指定一個字符范圍。為了否定這種區(qū)間的意義(即與未列出的任何字符匹配),指定‘ ^’作為該區(qū)間的第一個字符即可:

‘*’表示“與其前面字符的任意數(shù)目的字符匹配”,因此,如‘ x *’與任意數(shù)目的‘ x’字符匹配,例如:

“任意數(shù)目”包括0個實例,這也就是為什么第二個表達式匹配成功的原因。‘^pat’和‘pat$’固定了一種模式匹配,從而模式pat 只在它出現(xiàn)在串的前頭時匹配,而‘ ^pat$’只在pat 匹配整個串時匹配,例如:

REGEXP 模式可從某個表列中取出,雖然如果該列包含幾個不同的值時,這樣做比常量模式慢。每當列值更改時,必須對模式進行檢查并轉換成內(nèi)部形式。MySQL 的正規(guī)表達式匹配還有一些特殊的模式字符。要了解更詳細信息請參閱附錄C。
2. 運算符的優(yōu)先級
當求一個表達式的值時,首先查看運算符以決定運算的先后次序。有的運算符具有較高的優(yōu)先級;例如,乘和除比加和減的優(yōu)先級更高。下面的兩個表達式是等價的,因為“ *”和“/”先于“+”和“-”計算:

下面列出了運算符的優(yōu)先級,從高到低。列在同一行中的運算符具有相同的優(yōu)先級。優(yōu)先級較高的運算符在優(yōu)先級較低的運算符之前求值。

可用圓括號來忽略運算符的優(yōu)先級并改變表達式的求值順序,如:

3. 表達式中的NULL 值
請注意,在表達式中使用NULL 值時,其結果有可能出現(xiàn)意外。下列準則將有助于避免出問題。如果將NULL 作為算術運算或位運算符的一個操作數(shù),其結果為N U L L:

如果將NULL 用于邏輯運算符,NULL 被認為是假:

NULL 作為任意比較運算符的操作數(shù),除< = >、IS NULL 和IS NOT NULL 運算符(它們是專門擴展來處理NULL 值的)外,將產(chǎn)生一個NULL 結果。如:


如果給函數(shù)一個NULL 參數(shù),除了那些處理NULL 參數(shù)的函數(shù)外,一般返回一個N U L L結果。例如,IFNULL( ) 能夠處理NULL 參數(shù)并適當?shù)胤祷卣婊蚣佟TRCMP( ) 期望一個非NULL 的參數(shù);如果它發(fā)現(xiàn)傳給它的是一個NULL 參數(shù),則返回NULL 而不是真或假。在排序操作中,NULL 值被歸到一起。在升序排序中, NULL 將排在所有非NULL 值之前(包括空串),而在降序排序中,NULL 將排在所有非NULL 值之后。
2.4.2 類型轉換
MySQL 根據(jù)所執(zhí)行的操作類型,自動地進行大量的類型轉換,任何時候,只要將一個類型的值用于需要另一類型值的場合,就會進行這種轉換。下面是需要進行類型轉換的原因:
■ 操作數(shù)轉換為適合于某種運算符求值的類型。
■ 函數(shù)參數(shù)轉換為函數(shù)所需的類型。
■ 轉換某個值以便賦給一個具有不同類型的表列。下列表達式涉及類型轉換。它由加運算符“ +”和兩個操作數(shù)1 和“2” 組成:
1+"2"
其中操作數(shù)的類型不同,一個是數(shù),另一個是串,因此, MySQL 對其中之一進行轉換以便使它們兩個具有相同的類型。但是應該轉換哪一個呢?因為,“+”是一個數(shù)值運算符,所以MySQL 希望操作數(shù)為數(shù),因此,將串“ 2”轉換為數(shù)2。然后求此表達式的值得出3。再舉一例。C O N C AT( ) 函數(shù)連接串產(chǎn)生一個更長的串作為結果。為了完成此工作,它將參數(shù)解釋為串,而不管參數(shù)實際是何類型。如果傳遞給C O N C AT( ) 幾個數(shù),則它將把它們轉換成串,然后返回這些串的連接,如:

如果作為表達式的組成部分調(diào)用C O N C AT( ),可能會進行進一步的類型轉換??疾煜铝斜磉_式及其結果:

CONCAT(1, 2, 3) 產(chǎn)生串“1 2 3”。表達式“1 2 3”/10 轉換為1 2 3 / 1 0,因為除是一個算術運算符。這個表達式的結果的浮點形式為1 2 . 3,但REPEAT( ) 需要整數(shù)的重復計數(shù)值,所以進行整除得1 2。然后,REPEAT (‘X’, 12) 產(chǎn)生一個含有1 2個‘X’ 字符的結果串。一般原則是,MySQL 盡量將值轉換為表達式所需要的類型,盡量避免由于值的類型不對而導致錯誤。根據(jù)上下文, MySQL 將在三種通用類型(數(shù)、串或日期與時間)之間進行值的轉換。但是,值不能總是可以從一種類型轉為另一種類型。如果被轉換值不是給定類型的合法值,則此轉換失敗。將如“a b c” 這樣不像數(shù)的東西轉換為數(shù),則結果為0。將不像日期或時間的東西轉換為日期或時間類型結果為該類型的“零”值。例如,將串“a b c” 轉換為日期結果為“零”日期“ 0 0 0 0 - 0 0 - 0 0”。而任何值都可以處理為串,因此,一般將某個值轉換為串不會產(chǎn)生問題。
MySQL 也進行一些微小的類型轉換。如果在整型環(huán)境中使用一個浮點值,此值將被轉換,轉換時進行四舍五入。也可以進行相反的工作;一個整數(shù)用作浮點數(shù)也不會有問題。除非其內(nèi)容顯示表示一個數(shù),否則十六進制常數(shù)一般作為串處理。在串上下文中,每對十六進制數(shù)字轉換為一個字符,其結果作為串。下面是一些轉換的樣例:

相同的解釋原理也應用到比較上;除非與其比較的是一個數(shù),否則十六進制常量按串對待,例如:

某些運算符可將操作數(shù)強制轉換為它們所要的類型,而不管操作數(shù)是什么類型。例如,算術運算符需要數(shù),并按此對操作數(shù)進行轉換,參考如下運算:

MySQL 不對整個串進行尋找一個數(shù)的查找;它只查看串的起始處。如果一個串不以數(shù)作為前導部分,其轉換結果為0。

請注意,MySQL 的串到數(shù)的轉換規(guī)則自3 . 2 3版以后已經(jīng)改變了。在該版本以前,類似于數(shù)的串被轉換為四舍五入的整數(shù)值。自3.23 版后,它們轉換為浮點值,例如:

邏輯和位運算符比算術運算符要求更為嚴格。它們不僅希望操作數(shù)為數(shù),而且還要求是整數(shù)。這表示一個浮點數(shù),如. 3,不被視為真,雖然它是非零的;這是因為在轉換為整數(shù)時,. 3已經(jīng)轉換為0了。在下面的表達式中,除非各操作數(shù)有一個至少為1 的值,否則各操作數(shù)不被認為是真。

這種轉換也出現(xiàn)在IF( ) 函數(shù)中,此函數(shù)要求第一個參數(shù)為整數(shù)。為了恰當?shù)貙Ω↑c值進行測試,最好是利用明確的比較。否則,小于1 的值將被認為是假,例如:

模式匹配運算符要求對串進行處理。這表示可將MySQL 的模式匹配運算符用于數(shù),因為MySQL 會在試圖進行的匹配中將它們轉換成串。例如:

大小比較運算符(“<”、“< =”、“=”等等)是上下文相關的;即,它們根據(jù)操作數(shù)的類型求值。下面的表達式從數(shù)值上對操作數(shù)進行比較,因為操作符兩邊都是數(shù)。
下面的表達式涉及串比較,因為其兩邊的操作數(shù)都是串:
在下面的比較中,類型是混合的,因此,MySQL 按數(shù)比較它們。結果是兩個表達式都為真:

在各個比較中,MySQL 根據(jù)下列規(guī)則對操作數(shù)進行轉換:
■ 除了“< = >”運算符外,涉及NULL 值的比較其值為N U L L(除NULL <=> NULL 為真外,“< = >”與“=”相同)。
■ 如果兩個操作數(shù)都是串,則按串進行字典順序的比較。串比較利用服務器上有效的字符集進行。
■ 如果兩個操作數(shù)都為整數(shù),則按整數(shù)進行數(shù)的比較。
■ 不與數(shù)進行比較的十六進制常量按二進制串進行比較。
■ 如果其中有一個操作數(shù)為TIMES TAMP 或DATETIME 值而另一個為常量,則按TIMES TAMP 值進行比較。這樣做將使比較對ODBC 應用更好。
■ 否則,兩個操作數(shù)將按浮點值進行數(shù)的比較。注意,這包括一個串與一個數(shù)進行比較的情況。其中串被轉換為數(shù),如果該串轉換后不是一個數(shù),則結果為0。例如,”1 4 . 3”轉換為1 4 . 3,但“L 4 . 3” 轉換為0。
1. 日期與時間的解釋規(guī)則
MySQL 按表達式的環(huán)境將串和數(shù)自由地轉換為日期和時間值,反之亦然。日期和時間值在數(shù)值上下文中轉換為數(shù);數(shù)在日期或時間上下文中轉換為日期或時間。在將一個值賦予一個日期或時間列時,或在函數(shù)需要一個日期或時間值時,進行轉換為日期或時間值的轉換。如果表my_table 含有一個D ATE 列date _ col,下列語句是等價的:

TO _ DAYS( ) 函數(shù)的參數(shù)在下面三個表達中為相同的值:

2. 測試并強制進行類型轉換
為了了解表達式中類型轉換是怎樣進行的,用mysql 程序發(fā)布一條對表達式求值的SELECT 語句如下:

正如您所想像的那樣,筆者在撰寫本章時,做了不少這種比較。測試表達式的求值對于諸如DELETE 或U P D ATE 這種修改記錄的語句極為重要,因為需要保證只涉及所需涉及的行。檢查表達式的一個辦法是,預先執(zhí)行一條具有準備用于DELETE 或U P D ATE 語句的相同WHERE 子句,以驗證該子句選擇的行是正確的。假如表my_table 具有一個含有下列值的CHAR 列char _ col:

原來的打算大概是想刪除包含值“0 0” 的那兩行。但實際作用是刪除了所有的行。之所以這樣是由于MySQL 的比較規(guī)則在起作用。char_col 為一個串列,但00 沒有用引號括起來,因此,它被作為數(shù)對待了。按MySQL 的比較規(guī)則,涉及一個串與一個數(shù)的比較按兩個數(shù)的比較來求值。隨著DELETE 查詢的執(zhí)行,char_col 的每個值被轉換為0,”0 0”也被轉換為0,因此,所有不類似數(shù)的串都轉換成0。從而,對于每一行, WHERE 子句都為真,因此,DELETE 語句清空了該表。顯然,這是一種在執(zhí)行DELETE 前,應該用SELECT 語句對WHERE 子句進行測試的情況,這樣將會示出表達式所選擇的行太多了。如下所示:

如果不能肯定某個值的使用方式,可以利用MySQL 的表達式求值機制將該值強制轉換為特定的類型:
■ 增加+ 0 或+ 0.0 到某項上以強制轉換到一個數(shù)值:


3. 超范圍值或非法值的轉換
超范圍值或非法值的轉換的基本原則為:無用輸入,無用輸出。如果不在存儲日期前對其進行驗證,那么可能會得到不喜歡的東西。下面給出一些MySQL 處理超范圍值或不合適值的一般原則,這些內(nèi)容曾經(jīng)在前面介紹過:
■ 對于數(shù)值或T I M E列,超出合法范圍的值被剪裁為相應取值范圍的最接近的數(shù)值并作為結果值存儲。
■ 對于非ENUM 或SET 的串列,太長的串被截為適合該列存儲的最大長度的串。ENUM 或SET 列的賦值依賴于定義列時給出的合法值。如果賦予ENUM 列一個未作為枚舉成員給出的值,將會賦予一個錯誤成員(即,對應于零值成員的空串)。如果賦予SET 列一個包含未作為集合成員給出的子串的值,那么,那些未作為集合成員給出的子串將被刪除,并將剩余成員構成的值賦給該列。
■ 對于日期或時間列,非法值被轉換為該類型適當?shù)?#8220;零”值(參閱表2 - 11)。對于非TIME 的日期和時間列,超出取值范圍的值可轉換為“零”值、N U L L或某種其他的值(換句話說,結果是不可預料的)。
這些轉換都將作為A LTER TA B L E、LOAD DATA%