Hive 提供了基本數(shù)據(jù)類型和復(fù)雜數(shù)據(jù)類型
1.1 原始數(shù)據(jù)類型#整型 TINYINT — 微整型,只占用1個字節(jié),只能存儲0-255的整數(shù)。 SMALLINT– 小整型,占用2個字節(jié),存儲范圍–32768 到 32767。 INT– 整型,占用4個字節(jié),存儲范圍-2147483648到2147483647。 BIGINT– 長整型,占用8個字節(jié),存儲范圍-2^63到2^63-1。 #布爾型 BOOLEAN — TRUE/FALSE #浮點型 FLOAT– 單精度浮點數(shù)。 DOUBLE– 雙精度浮點數(shù)。 #字符串型 STRING– 不設(shè)定長度。 1.2 復(fù)合數(shù)據(jù)類型Structs:一組由任意數(shù)據(jù)類型組成的結(jié)構(gòu)。比如,定義一個字段C的類型為STRUCT {a INT; b STRING},則可以使用a和C.b來獲取其中的元素值; Maps:和Java中的Map相同,即存儲K-V對的; Arrays:數(shù)組; 復(fù)雜數(shù)據(jù)類型的聲明必須使用尖括號指明其中數(shù)據(jù)字段的類型。定義三列,每列對應(yīng)一種復(fù)雜的數(shù)據(jù)類型,如下所示。 CREATE TABLE complex( col1 ARRAY< INT>, col2 MAP< STRING,INT>, col3 STRUCT< a:STRING,b:INT,c:DOUBLE> )
1.3 hive的文件格式TEXTFILE //文本,默認值 SEQUENCEFILE // 二進制序列文件 RCFILE //列式存儲格式文件 Hive0.6以后開始支持 ORC //列式存儲格式文件,比RCFILE有更高的壓縮比和讀寫效率,Hive0.11以后開始支持 PARQUET //列出存儲格式文件,Hive0.13以后開始支持 #參考博客: http:///archives/2015/06/238.htm http://www.cnblogs.com/zlslch/p/5659714.html https://cwiki./confluence/display/Hive/LanguageManual+Types #
|