【技術(shù)】Hadoop技術(shù)在銀行業(yè)的創(chuàng)新應(yīng)用

yujunnujuy 2016-06-14

展開全文

記得前天小編給大家share的那篇軟文嗎？

《在這個浮躁的年代，讓我們一起完成一件不那么簡單的事情?！?/strong>

今天小編又挖到了他的一篇技術(shù)稿

《Hadoop技術(shù)在銀行業(yè)的創(chuàng)新應(yīng)用》

在2016 Hadoop技術(shù)峰會的大數(shù)據(jù)銀行業(yè)專題論壇上，星環(huán)科技資深架構(gòu)師呂品分享了星環(huán)幫助銀行客戶構(gòu)建大數(shù)據(jù)應(yīng)用的經(jīng)驗(yàn)。創(chuàng)新的技術(shù)架構(gòu)打破舊有模式，全面提升生產(chǎn)效率。

大數(shù)據(jù)的挑戰(zhàn)

大數(shù)據(jù)有四個特征可以概括為4個V：數(shù)據(jù)量大、數(shù)據(jù)生產(chǎn)的速率快、數(shù)據(jù)多樣化、價值總體密度低但價值總量大。正是這四個特點(diǎn)，對銀行業(yè)現(xiàn)有技術(shù)架構(gòu)提出了巨大的挑戰(zhàn)。

圖1. 大數(shù)據(jù)的挑戰(zhàn)

首先，數(shù)據(jù)量大導(dǎo)致原有系統(tǒng)的存儲能力不足，有限的計(jì)算能力無法處理海量數(shù)據(jù)。其次，數(shù)據(jù)產(chǎn)生的速度非?？?，數(shù)據(jù)錄入可能成為瓶頸。再者，數(shù)據(jù)格式變得多樣化，除了高價值密度的結(jié)構(gòu)化數(shù)據(jù)，還有更多的非結(jié)構(gòu)化、半結(jié)構(gòu)化數(shù)據(jù)，這部分?jǐn)?shù)據(jù)價值密度低但總量大，存儲和提取價值都是棘手的問題。最后，復(fù)雜多樣的數(shù)據(jù)怎樣通過關(guān)聯(lián)分析出更多價值，也亟待解決。

Hadoop的能力及應(yīng)用

圖2. Hadoop數(shù)倉的整體邏輯架構(gòu)

圖2是一個使用hadoop構(gòu)建的完整現(xiàn)代數(shù)倉，展現(xiàn)了從數(shù)據(jù)接入、數(shù)據(jù)處理到數(shù)據(jù)展示的整體邏輯架構(gòu)。

左邊表示數(shù)據(jù)的ETL過程：實(shí)時數(shù)據(jù)一般通過Kafka等MQ進(jìn)入平臺；現(xiàn)有系統(tǒng)的存量數(shù)據(jù)、第三方數(shù)據(jù)及非/半結(jié)構(gòu)化數(shù)據(jù)通過文件傳輸方式進(jìn)入平臺；增量數(shù)據(jù)通過Sqoop、Kettle等ETL工具T+1進(jìn)入平臺，此外星環(huán)開發(fā)的TDA組件能夠幫助這部分?jǐn)?shù)據(jù)做到T+0的準(zhǔn)實(shí)時同步。所有數(shù)據(jù)最后匯總到右邊的數(shù)據(jù)倉庫。

關(guān)于數(shù)據(jù)倉庫內(nèi)部的數(shù)據(jù)處理我們有專題分享，這里不再贅述。

數(shù)據(jù)倉庫之上有五種類型的平臺分別支撐不同類型的應(yīng)用。

1. 實(shí)時決策平臺：現(xiàn)在落地較多的案例有實(shí)時推薦、實(shí)時風(fēng)控、實(shí)時運(yùn)維預(yù)警等；

2. 離線批處理平臺：主要處理一些數(shù)據(jù)量巨大的固定報(bào)表業(yè)務(wù)，如審計(jì)業(yè)務(wù)等；

3. 自助分析平臺：提供交互式自助分析服務(wù)，包含傳統(tǒng)數(shù)倉的數(shù)據(jù)集市部分；

4. 數(shù)據(jù)探索平臺：提供模型實(shí)驗(yàn)室，幫助分析師迭代式快速建模，實(shí)現(xiàn)客戶流失預(yù)測、擔(dān)保鏈分析等業(yè)務(wù)場景；

5. 檢索業(yè)務(wù)平臺：提供對數(shù)據(jù)的檢索服務(wù)，包括精確查詢和模糊查詢等；

6. 其中有些應(yīng)用場景綜合使用多種技術(shù)，如實(shí)時推薦?？蛻舢嬒竦墓ぷ髟陔x線批處理平臺完成，而實(shí)時推薦部分在實(shí)時決策平臺完成。

大數(shù)據(jù)平臺處理的數(shù)據(jù)量非常大，典型客戶的單表數(shù)據(jù)量在百億以上，這樣的數(shù)據(jù)量在傳統(tǒng)的Oracle或者DB2方案中處理起來非常困難。而應(yīng)用Hadoop技術(shù)的整體解決方案，能夠處理上文提出的各項(xiàng)挑戰(zhàn)。

下面簡單介紹銀行業(yè)需求比較迫切的幾個應(yīng)用。

自助分析平臺

3.1 數(shù)據(jù)請求邏輯

3.1.1. 現(xiàn)有邏輯

銀行系統(tǒng)一直面臨一個問題，隨著業(yè)務(wù)類型增多數(shù)據(jù)量變大，這個問題愈發(fā)突出，就是數(shù)據(jù)層和系統(tǒng)層的界限模糊不夠清晰，導(dǎo)致數(shù)據(jù)難以管理和獲取。

圖3展示了銀行系統(tǒng)當(dāng)前的數(shù)據(jù)請求邏輯。

圖3. 銀行系統(tǒng)當(dāng)前的數(shù)據(jù)請求邏輯

1. 業(yè)務(wù)人員發(fā)起數(shù)據(jù)需求；

2. 需要確認(rèn)是否已經(jīng)有對應(yīng)的供數(shù)系統(tǒng)；

3. 如果沒有，則需要跟科技部門協(xié)商，通過提數(shù)到本地、新建報(bào)表、新建系統(tǒng)等方式滿足供數(shù)需求，幾種處理方式所花費(fèi)的時間從幾天到幾個月；

4. 如果已經(jīng)有供數(shù)系統(tǒng)，則需要業(yè)務(wù)部門的領(lǐng)導(dǎo)在系統(tǒng)內(nèi)進(jìn)行權(quán)限審批，審批通過才能獲得數(shù)據(jù)。

在整個數(shù)據(jù)請求過程中，業(yè)務(wù)部門和科技部門權(quán)力多有交叉，數(shù)據(jù)層和系統(tǒng)層界限模糊不清，簡單的數(shù)據(jù)請求卻需要復(fù)雜的處理邏輯。

這種處理邏輯還帶來其他問題：

1）時間延遲：如上所述，簡單的數(shù)據(jù)請求需要幾天到幾個月的延遲；

2）數(shù)據(jù)安全：通過提數(shù)，數(shù)據(jù)下發(fā)到業(yè)務(wù)人員，難以管理，極易泄露；

3）一致性：多人提數(shù)，則一份數(shù)據(jù)有多份副本，一方面帶來一致性問題，另一方面是對存儲資源的浪費(fèi)；

4. 分析性能：把數(shù)據(jù)提到本地，用本地的Oracle或者DB2，實(shí)際是單機(jī)在處理整個數(shù)據(jù)集，分析性能得不到保證。

3.1.2. 改進(jìn)后邏輯

使用Hadoop技術(shù)，對整個業(yè)務(wù)流程改進(jìn)，得到如圖4的處理邏輯。

圖4. 改進(jìn)后的數(shù)據(jù)請求邏輯

1. 業(yè)務(wù)人員發(fā)起數(shù)據(jù)需求；

2. 信息管理部門根據(jù)相關(guān)規(guī)則制度，審批權(quán)限；

3. 通過則業(yè)務(wù)人員可以自助查詢數(shù)據(jù)。

整套流程都在統(tǒng)一建設(shè)的自助分析平臺之上，不再涉及科技部門和系統(tǒng)層面。業(yè)務(wù)部門只需要提數(shù)據(jù)需求，權(quán)限審批由專門的信息管理部門統(tǒng)一管理。信息管理部門根據(jù)平臺是否有這份數(shù)據(jù)、業(yè)務(wù)人員是否有權(quán)限獲取這份數(shù)據(jù)進(jìn)行審批。如果審批通過了，業(yè)務(wù)人員就可以自助查詢；如果拒絕，則直接結(jié)束。

這種處理邏輯解決了上文提的四個問題。

1）時間延遲：這套邏輯非常簡單，可能是線上或者線下帶紙質(zhì)備份的審批，時間延遲非常短，減少了流通環(huán)節(jié)無需科技部門參與；

2）數(shù)據(jù)安全：數(shù)據(jù)在統(tǒng)一平臺上，不涉及數(shù)據(jù)下發(fā)，減少泄露可能；

3）一致性：所有的數(shù)據(jù)統(tǒng)一存放，只有一個副本，保證全局一致；

4）分析性能：自助分析平臺底層是物理集群，集群的分析能力比單機(jī)要強(qiáng)很多，所以能夠增強(qiáng)分析能力，減少計(jì)算時間。

整體上看，通過Hadoop技術(shù)，數(shù)據(jù)都錄入到這個平臺的存儲層，在上面進(jìn)行一系列的加工，變成一個個的主題模型，最后提供統(tǒng)一的數(shù)據(jù)接口服務(wù)，供上層的應(yīng)用層訪問這些數(shù)據(jù)。所有操作都在安全管控之下，所有的分析人員只能遠(yuǎn)程連到跳轉(zhuǎn)機(jī)進(jìn)行訪問。數(shù)據(jù)不會泄露，也不會導(dǎo)致多個副本。

下文討論需要實(shí)現(xiàn)以上數(shù)據(jù)請求邏輯的幾點(diǎn)技術(shù)需求。

3.2. 權(quán)限控制

3.2.1. 4A統(tǒng)一安全管理

首先，平臺需要4A認(rèn)證。所謂的4A就是Account、Authentication、Authorization和Audit。

1. Account（賬戶管理）：為平臺提供統(tǒng)一集中的賬戶管理，能夠?qū)崿F(xiàn)賬號的創(chuàng)建、刪除及同步等賬號管理生命周期所包含的功能。

2. Authentication（用戶認(rèn)證）：認(rèn)證部分提供了對用戶身份的認(rèn)證，通常采用輸入用戶名和密碼來進(jìn)行審核。TDH使用Kerberos進(jìn)行認(rèn)證，可以采用密碼和keytab兩種方式，Kerberos支持HA。

3. Authorization（權(quán)限管理）：通過認(rèn)證后的用戶可以使用Inceptor等服務(wù)，但用戶能訪問哪些數(shù)據(jù)、能夠使用哪些資源、能夠?qū)Ρ磉M(jìn)行怎樣的操作還需要進(jìn)一步的權(quán)限管控。RBAC（Role based access control，基于角色的訪問控制）在3.2.2中詳細(xì)介紹，資源隔離在3.3中詳細(xì)介紹。

4. Audit（審計(jì)）：用戶對各個組件的操作日志集中記錄管理和分析，不僅可以對用戶行為進(jìn)行監(jiān)控，還可以對審計(jì)數(shù)據(jù)進(jìn)行挖掘，進(jìn)行一系列預(yù)警。

圖5.權(quán)限控制

3.2.2. RBAC權(quán)限控制

如同傳統(tǒng)的關(guān)系型數(shù)據(jù)庫，Inceptor有基于角色的訪問控制（RBAC）。數(shù)據(jù)庫的建表查表權(quán)限、數(shù)據(jù)表的增刪改查權(quán)限都可以賦權(quán)給角色或個人。角色是一類特殊的權(quán)限集合，每種權(quán)限可以先賦予角色，再將角色賦予個人用戶，形成類似分組的權(quán)限管控。

除了庫級表級權(quán)限，針對大數(shù)據(jù)場景，Inceptor還開發(fā)了行級權(quán)限和列級權(quán)限。行級權(quán)限指的是同一張表中，不同的行可以控制不同的用戶訪問。列級權(quán)限指的是同一張表中，不同的字段可以控制不同的用戶訪問。

通過以上幾種權(quán)限的綜合使用，實(shí)際項(xiàng)目中可以形成三級權(quán)限控制：

1. 庫級表級權(quán)限：主題級控制；

2. 列級權(quán)限：敏感字段控制；

3. 行級權(quán)限：分機(jī)構(gòu)訪問控制。

典型的應(yīng)用場景如下：

平臺中有多種類型的數(shù)據(jù)，有些是客戶關(guān)系，有些是交易明細(xì)。這些表放在不同的庫的不同表中，從主題級別將不同的訪問權(quán)限賦予不同的用戶，如CRM信息賦予營銷人員、交易數(shù)據(jù)賦予財(cái)務(wù)人員。

在大數(shù)據(jù)場景下，有非常多的寬表，一張表中的信息量非常大，可能有幾十甚至上百個字段。如交易信息中，既有客戶身份證、手機(jī)號等敏感信息，也有交易額、數(shù)據(jù)源等非敏感信息。數(shù)據(jù)分析師只允許訪問非敏感信息，而管理員允許訪問敏感信息。該場景下需要讓不同用戶訪問同一張表的不同字段。在傳統(tǒng)的關(guān)系型數(shù)據(jù)庫中，往往通過建視圖的方式控制列級權(quán)限，但是如果權(quán)限分類一多，就會生成非常多的視圖難以管理。針對該場景，星環(huán)開發(fā)了列級權(quán)限，可以在原表上賦予不同用戶不同字段的訪問權(quán)限，方便管理。

最后是行級權(quán)限。銀行的大數(shù)據(jù)平臺一般建立在總行，會把數(shù)據(jù)從下面的分支行抽上來統(tǒng)一存儲。因此一張關(guān)于交易的大表可能糅合了北京、上海、天津的數(shù)據(jù)。不同地方的分析師需要訪問不同的數(shù)據(jù)，傳統(tǒng)的做法是建立多張數(shù)據(jù)表，從應(yīng)用層面進(jìn)行管理。星環(huán)開發(fā)的行級權(quán)限，能夠讓不同的用戶訪問同一張表，但是只能讀到用戶允許訪問的數(shù)據(jù)。

3.3. 資源隔離

除了權(quán)限管控，還需要計(jì)算和存儲資源隔離。

3.3.1. 計(jì)算資源隔離

如果沒有計(jì)算資源隔離，一個用戶在分析平臺上提交了一個SQL任務(wù)，把計(jì)算資源占光，會影響其他用戶的正常使用。

因此需要限定每個用戶的計(jì)算資源。用戶提交任務(wù)時可以申請專有的資源池供自己使用。物理集群根據(jù)當(dāng)前是否有空閑的CPU和內(nèi)存等計(jì)算資源、當(dāng)前用戶是否有獨(dú)享資源的權(quán)限決定是否為其分配專有資源。如果沒有分配，當(dāng)前用戶只能使用共享資源進(jìn)行作業(yè)，根據(jù)作業(yè)優(yōu)先級分配到隊(duì)列里，進(jìn)行作業(yè)調(diào)度。一個虛擬集群里可以有多個隊(duì)列。

如果當(dāng)前用戶申請到專有資源，集群可以為其創(chuàng)建單獨(dú)的虛擬集群，如圖6里的Inceptor2-InceptorN。分析完成或超時以后，該虛擬集群被動態(tài)銷毀，資源被回收。這個需要依靠星環(huán)的容器技術(shù)TOS完成。

圖6. 多任務(wù)隊(duì)列支持計(jì)算資源隔離

3.3.2. 存儲資源隔離

一個平臺的存儲空間是有限的，如果用戶無限放入文件，平臺很快就不堪重負(fù)。所以這里涉及到存儲資源的隔離。

假如有A、B、C三個用戶：

A用戶沒有限制平臺的使用空間，可以無限上傳數(shù)據(jù)；

B用戶被限制了存儲空間，但還沒有達(dá)到上限，可以繼續(xù)上傳數(shù)據(jù)；

C用戶分配的空間比較小，達(dá)到上限了，這時候就不允許上傳數(shù)據(jù)了。

平臺有些文件是靜態(tài)的，還有一些文件是在計(jì)算過程中動態(tài)生成的。平臺通過限制用戶的臨時計(jì)算空間，來限制用戶提交的job的大小。當(dāng)用戶提交的job非常大時，會生成非常多的中間數(shù)據(jù)，達(dá)到上限，整個job會被kill掉。通過這種手段可以限制用戶提交的任務(wù)大小。如果用戶沒有限制就可以提交非常大的任務(wù)，直到整個集群的資源被用完為止。

圖7. HDFS Quota支持存儲資源隔離

3.4. 數(shù)據(jù)聯(lián)邦

一般的Hadoop解決方案中，大數(shù)據(jù)平臺只能調(diào)用存儲于HDFS和HBase之上的數(shù)據(jù)。然而有一些數(shù)據(jù)不適合從外部轉(zhuǎn)存到HDFS或HBase中，如頻繁改動的維度表，每次關(guān)聯(lián)之前都要從生產(chǎn)庫中將維度表完整的抽取過來再做關(guān)聯(lián)。

為了統(tǒng)一訪問平臺內(nèi)外的多種數(shù)據(jù)源，星環(huán)開發(fā)了StarGate組件。StarGate就像星際之門，將各種數(shù)據(jù)源通過各自的Driver匯聚在一起，供Inceptor統(tǒng)一訪問。數(shù)據(jù)源既可以是Text、ORC、Parquet等各種存儲格式的HDFS文件；也可以是Hyperbase；或是星環(huán)開發(fā)的高速列式存儲Holodesk；還可以是外部的關(guān)系型數(shù)據(jù)庫Oracle、DB2。不管是何種數(shù)據(jù)源，Inceptor用戶都可以用統(tǒng)一的SQL語句訪問這些數(shù)據(jù)。

圖8. 數(shù)據(jù)聯(lián)邦

在訪問外部關(guān)系型數(shù)據(jù)庫時，在Inceptor中先通過DBLink的語法，將外部數(shù)據(jù)表映射到Inceptor中，訪問該表就像訪問Inceptor的一張內(nèi)表一般。當(dāng)真正訪問該數(shù)據(jù)表時，數(shù)據(jù)再從外部數(shù)據(jù)庫傳輸?shù)紿adoop平臺上。這個過程中，過濾條件會下沉到外部數(shù)據(jù)庫，所以每次訪問，只會傳輸參與計(jì)算的數(shù)據(jù)，而不是全表，大大減少傳輸數(shù)據(jù)量，提升效率。

日志處理

日志處理是另一類常見的大數(shù)據(jù)應(yīng)用。

4.1. 整體邏輯架構(gòu)

圖9. 日志處理整體邏輯架構(gòu)圖

圖9是星環(huán)常用的日志處理技術(shù)的完整邏輯框架。

數(shù)據(jù)源可以是各種應(yīng)用系統(tǒng)的日志，或網(wǎng)站的訪問信息。

1. 首先，通過Flume agent從各個數(shù)據(jù)源采集數(shù)據(jù)；

2. 然后發(fā)送到消息隊(duì)列Kafka，根據(jù)主題進(jìn)入不同的topic；

3. 接著實(shí)時流處理引擎Transwarp Stream從Kafka把不同job的數(shù)據(jù)拉過來實(shí)時處理；

4. 各種實(shí)時機(jī)器學(xué)習(xí)、預(yù)警、儀表盤等應(yīng)用可以通過SQL的方式寫進(jìn)Stream引擎，進(jìn)行實(shí)時處理；

5. 處理完的信息可以直接錄入持久化存儲層，如Inceptor、Hyperbase、ElasticSearch等。

以往，客戶處理預(yù)警信息都是T+1，當(dāng)發(fā)現(xiàn)一些不正常狀態(tài)時，機(jī)器可能已經(jīng)出現(xiàn)故障了?，F(xiàn)在可以做到實(shí)時預(yù)警，基本上一秒內(nèi)就能定位問題設(shè)備，快速停機(jī)檢修。

4.2. 日志結(jié)構(gòu)化處理

日志數(shù)據(jù)往往是非結(jié)構(gòu)化或半結(jié)構(gòu)化的，半結(jié)構(gòu)化會比較多。如何結(jié)構(gòu)化日志數(shù)據(jù)？這里涉及到兩類數(shù)據(jù)：一類是系統(tǒng)日志，每條之間沒有依賴關(guān)系，我們把它稱為孤立的系統(tǒng)日志。這種日志可以直接采集。還有一些應(yīng)用日志，每一次訪問都會生成多條記錄，比如建立一次連接會有一個begin、一定的input和output，最后是end。但這幾條信息可能散落在多個文件中，因?yàn)閺腷egin到end可以持續(xù)較長時間。

圖10. 孤立日志和關(guān)聯(lián)日志的區(qū)別

在以前沒有update功能的Hadoop系統(tǒng)中，把分散在多個文件的應(yīng)用日志收集在一起是非常困難的。如果有了merge into語法，情況就會截然不同。比如第一個文件中有begin和input信息，第二個文件中有output和end信息。那么在處理第一個文件時，先把begin和input的信息寫入結(jié)構(gòu)化表中；處理第二個文件時，再把output和end信息update進(jìn)該行的后2個字段。通過這種方式，可以快速處理應(yīng)用日志。

4.3. 動態(tài)閾值告警

在傳統(tǒng)的預(yù)警方案中，某個系統(tǒng)的預(yù)警線一般是一條水平線，但實(shí)際上機(jī)器的性能是會波動的，有忙時性能和閑時性能的區(qū)別。如果以固定的閾值作為監(jiān)控指標(biāo)缺少指導(dǎo)意義，因?yàn)槊r指標(biāo)總是偏高，閑時指標(biāo)總是偏低，無法判斷出性能異常。

因此，有效的監(jiān)控告警需要基于機(jī)器性能數(shù)據(jù)，根據(jù)變化規(guī)律進(jìn)行動態(tài)調(diào)整。通過學(xué)習(xí)周期性性能數(shù)據(jù)，挖掘出性能變化曲線，動態(tài)閾值警告能夠有效發(fā)現(xiàn)異常情況，提升告警有效性。

圖11. 動態(tài)閾值告警

4.4. 容量性能預(yù)警

硬件規(guī)劃是另一類日志分析的應(yīng)用場景。對于傳統(tǒng)的應(yīng)用，硬件大多是需要時增加即可，早一點(diǎn)晚一點(diǎn)成本區(qū)別不大。但是在大數(shù)據(jù)場景下，數(shù)據(jù)快速增長，硬件規(guī)模也很大，早采購可能導(dǎo)致硬件限制成本上升，晚采購可能導(dǎo)致存儲空間不足數(shù)據(jù)溢出，或是計(jì)算性能不足無法及時處理數(shù)據(jù)。

因此，通過分析日志信息，可以學(xué)習(xí)網(wǎng)絡(luò)設(shè)備、線路、端口等歷史性能指標(biāo)，估算增長趨勢，預(yù)測指標(biāo)瓶頸，提前提示生產(chǎn)風(fēng)險。這樣在實(shí)際線碰觸預(yù)警線之前，提前畫出預(yù)測線，做好擴(kuò)容準(zhǔn)備。

圖12. 容量性能預(yù)警

T+0 ODS

數(shù)據(jù)同步方面，在關(guān)系型數(shù)據(jù)庫中，常用的是Oracle的OGG和IBM的CDC等數(shù)據(jù)庫同步工具，通過抓取主庫的日志文件，在從庫重演一遍以達(dá)到同步效果。

目前，關(guān)系型數(shù)據(jù)庫和Hadoop之間一般通過Sqoop增量抽取或數(shù)據(jù)文件傳輸?shù)确绞酵?。但是這種方案有一些問題。首先，調(diào)度比較復(fù)雜。其次，時間延遲比較大，現(xiàn)在一般只能做到T+1。

星環(huán)開發(fā)了一個準(zhǔn)實(shí)時的同步工具TDA（Transwarp Data Alive）：

1. 通過CDC獲取關(guān)系型數(shù)據(jù)庫的日志信息；

2. 將日志信息放在臨時層；或者通過命令將需要快速同步的日志直接拖到批次層；或者每天任務(wù)結(jié)束時，臨時層的日志會最終進(jìn)入落地層；

3. 不同的同步頻率作用于臨時層、批次層、落地層，將同步信息傳輸?shù)紿DFS；

4. HDFS上有調(diào)度監(jiān)控程序，將日志信息在Inceptor上重演一遍，完成從關(guān)系型數(shù)據(jù)庫到Hadoop的同步。

這個方案的好處是不同的規(guī)則作用于不同的調(diào)度層：臨時層暫時不會同步，批次層會立馬同步，落地層則是每天晚上同步一次。TDA可以做到不同延遲程度的同步策略，并且傳輸?shù)臄?shù)據(jù)量非常小，傳輸?shù)闹皇侨罩疚募皇峭暾臄?shù)據(jù)文件，所以整個傳輸過程對關(guān)系型數(shù)據(jù)庫的壓力非常小，不影響生產(chǎn)庫的正常業(yè)務(wù)。

圖13. 準(zhǔn)實(shí)時同步技術(shù)實(shí)現(xiàn)T+0 ODS

最后附上大神的皂片供大家膜拜~

本站是提供個人知識管理的網(wǎng)絡(luò)存儲空間，所有內(nèi)容均由用戶發(fā)布，不代表本站觀點(diǎn)。請注意甄別內(nèi)容中的聯(lián)系方式、誘導(dǎo)購買等信息，謹(jǐn)防詐騙。如發(fā)現(xiàn)有害或侵權(quán)內(nèi)容，請點(diǎn)擊一鍵舉報(bào)。

轉(zhuǎn)藏 分享

QQ空間 QQ好友新浪微博微信

獻(xiàn)花（0） +1

來自： yujunnujuy > 《銀行》

舉報(bào)/認(rèn)領(lǐng)