一、Update Statistics的作用 為了提高數(shù)據(jù)庫的效率,INFORMIX提供了一個基于成本的查詢優(yōu)化器,執(zhí)行update statistics語句的作用就是將您創(chuàng)建的數(shù)據(jù)庫表的有關(guān)統(tǒng)計信息更新到系統(tǒng)sysmaster的相關(guān)表中(如systables、syscolumns、sysindexes、sysdistrib、sysprocplan等),以便查詢優(yōu)化器選擇最佳的執(zhí)行路徑。當(dāng)sysmaster庫中沒有相應(yīng)的統(tǒng)計信息,或者統(tǒng)計信息不十分準(zhǔn)確時,優(yōu)化器便無法制定一個行之有效的查詢策略,其結(jié)果必然是進(jìn)行大量極其可怕的順序掃描,產(chǎn)生嚴(yán)重的性能問題。 因此,當(dāng)您重新裝載數(shù)據(jù)或者對數(shù)據(jù)庫表進(jìn)行了大量的更新操作后,應(yīng)該及時執(zhí)行update statistics。也許您會發(fā)現(xiàn),數(shù)據(jù)庫一些參數(shù)配置的不合理可能使數(shù)據(jù)庫效率降低百分之幾,但如果您沒有定期執(zhí)行update statistics的話。數(shù)據(jù)庫的性能則可能降低幾到十幾倍。 二、Update Statistics的語法 執(zhí)行update statistics共有三個級別,即:update statistics low、updates tatistics medium、update statistics high。 1 update statistics[low]for table[{table-name|synonym-name}[(column-list)]]][drop distributions] update statistics low只更新表、字段、記錄數(shù)、頁數(shù)及索引等的最基本信息,對字段的分布情況不做統(tǒng)計。其語法說明如下: (1)update statistics或update statistics low,對當(dāng)前數(shù)據(jù)庫中所有表(包括系統(tǒng)表)及過程進(jìn)行更新統(tǒng)計。 (2)update statistics low for table,對當(dāng)前數(shù)據(jù)庫中所有表(包括臨時表,但不包括系統(tǒng)表)進(jìn)行更新統(tǒng)計。 (3)update statistics low for table tablename,對指定的表所有字段進(jìn)行更新統(tǒng)計。 (4)update statistics low for table tablename(column-list),對指定表的指定字段進(jìn)行更新統(tǒng)計。 (5)如果不帶drop distributions,原有字段分布情況依然保留;否則,原有字段分布情況將被刪除。 2 update statistics medium[for table[{table-name|synonym-name}[(column-list)]]][resolution percent[conf]][distributions only] update statistics medium除了更新表、字段、記錄數(shù)、頁數(shù)及索引等的最基本信息外,對字段的分布情況會采取抽樣的辦法來統(tǒng)計,因此與update statistics low相比需要花費更多的時間。其語法說明如下: (1)resolution percent是指分布統(tǒng)計的詳細(xì)程序,percent定義的是一個百分?jǐn)?shù),如resolution2意思是指按照字段的值分布統(tǒng)計成50段,如果不指定resolution percent,缺省值為2.5。 (2)conf是指分布統(tǒng)計時取樣的比例,conf參數(shù)的取值范圍為0.80—0.99,缺省值為0.95。 (3)如果指定了distributions only,則對索引的信息不做更新統(tǒng)計。 3 update statistics high[for table[{table-name|synonym-name}[(column-list]]][resolutionpercent][distributions only] update statistics high與update statistics medium的區(qū)別是在統(tǒng)計字段的分布情況時,后者采用了取樣的辦法,而前者進(jìn)行全部統(tǒng)計,因此update statistics high更新統(tǒng)計最全面,執(zhí)行時間也最長。其語法說明如下: (1)如果不指定resolution percent,缺省值為0.5。 (2)如果指定了distributions only,則對索引的信息不做更新統(tǒng)計。 4 update statistics for procedure[procedure-name],只對指定的過程進(jìn)行更新統(tǒng)計,對表不做更新統(tǒng)計 三、如何執(zhí)行Update Statistics 通常執(zhí)行update statistics的方法是: 1 對表中不帶索引的字段執(zhí)行update statistics medium,每個表執(zhí)行一次。一般情況下,缺省參數(shù)就足夠了。對于特別大的表(執(zhí)行update statistics時,通常把超過26570條記錄的表定義為特別大的表),可以帶參數(shù)resolution1.00.99。 2 對表中帶有索引的字段執(zhí)行update statistics high,每個字段執(zhí)行一次。 3 對表中帶有復(fù)合索引的字段執(zhí)行update statistics low,每個表執(zhí)行一次。 4 對每一個小表執(zhí)行update statistics high。 四、注意事項 1 數(shù)據(jù)庫本身不會自動更新sysmaster庫中有關(guān)statistics統(tǒng)計信息,只有執(zhí)行update statistics語句后,才能得到更新。 2 執(zhí)行update statistics語句時,必須具有DBA權(quán)限或者為表的屬主。 3 由于update statistics通常為單線程運行,不能利用PDQ等并發(fā)功能,對于一個較大的數(shù)據(jù)庫,執(zhí)行update statistics語句一般需要幾個小時。為提高效率,可以將update statistics分為多個shell程序同時執(zhí)行,并充分考慮數(shù)據(jù)空間分布情況,在并發(fā)執(zhí)行時減少磁盤讀寫的沖突。 4 執(zhí)行update statistics語句會占用一些臨時空間,當(dāng)臨時空間不夠時,數(shù)據(jù)庫將提示錯誤。您可以通過設(shè)置DBUPSPACE環(huán)境變量,使update statistics在遇到臨時空間不夠時分步來執(zhí)行排序統(tǒng)計。 |
|
來自: 昵稱15242507 > 《Java》