日韩黑丝制服一区视频播放|日韩欧美人妻丝袜视频在线观看|九九影院一级蜜桃|亚洲中文在线导航|青草草视频在线观看|婷婷五月色伊人网站|日本一区二区在线|国产AV一二三四区毛片|正在播放久草视频|亚洲色图精品一区

分享

【技術(shù)】Hadoop技術(shù)在銀行業(yè)的創(chuàng)新應(yīng)用

 yujunnujuy 2016-06-14
記得前天小編給大家share的那篇軟文嗎?
《在這個浮躁的年代,讓我們一起完成一件不那么簡單的事情?!?/strong>

今天小編又挖到了他的一篇技術(shù)稿


《Hadoop技術(shù)在銀行業(yè)的創(chuàng)新應(yīng)用》

在2016 Hadoop技術(shù)峰會的大數(shù)據(jù)銀行業(yè)專題論壇上,星環(huán)科技資深架構(gòu)師呂品分享了星環(huán)幫助銀行客戶構(gòu)建大數(shù)據(jù)應(yīng)用的經(jīng)驗(yàn)。創(chuàng)新的技術(shù)架構(gòu)打破舊有模式,全面提升生產(chǎn)效率。
1
大數(shù)據(jù)的挑戰(zhàn)

大數(shù)據(jù)有四個特征可以概括為4個V:數(shù)據(jù)量大、數(shù)據(jù)生產(chǎn)的速率快、數(shù)據(jù)多樣化、價值總體密度低但價值總量大。正是這四個特點(diǎn),對銀行業(yè)現(xiàn)有技術(shù)架構(gòu)提出了巨大的挑戰(zhàn)。
圖1. 大數(shù)據(jù)的挑戰(zhàn)

首先,數(shù)據(jù)量大導(dǎo)致原有系統(tǒng)的存儲能力不足,有限的計(jì)算能力無法處理海量數(shù)據(jù)。其次,數(shù)據(jù)產(chǎn)生的速度非???,數(shù)據(jù)錄入可能成為瓶頸。再者,數(shù)據(jù)格式變得多樣化,除了高價值密度的結(jié)構(gòu)化數(shù)據(jù),還有更多的非結(jié)構(gòu)化、半結(jié)構(gòu)化數(shù)據(jù),這部分?jǐn)?shù)據(jù)價值密度低但總量大,存儲和提取價值都是棘手的問題。最后,復(fù)雜多樣的數(shù)據(jù)怎樣通過關(guān)聯(lián)分析出更多價值,也亟待解決。

2
Hadoop的能力及應(yīng)用

圖2. Hadoop數(shù)倉的整體邏輯架構(gòu)

圖2是一個使用hadoop構(gòu)建的完整現(xiàn)代數(shù)倉,展現(xiàn)了從數(shù)據(jù)接入、數(shù)據(jù)處理到數(shù)據(jù)展示的整體邏輯架構(gòu)。


左邊表示數(shù)據(jù)的ETL過程:實(shí)時數(shù)據(jù)一般通過Kafka等MQ進(jìn)入平臺;現(xiàn)有系統(tǒng)的存量數(shù)據(jù)、第三方數(shù)據(jù)及非/半結(jié)構(gòu)化數(shù)據(jù)通過文件傳輸方式進(jìn)入平臺;增量數(shù)據(jù)通過Sqoop、Kettle等ETL工具T+1進(jìn)入平臺,此外星環(huán)開發(fā)的TDA組件能夠幫助這部分?jǐn)?shù)據(jù)做到T+0的準(zhǔn)實(shí)時同步。所有數(shù)據(jù)最后匯總到右邊的數(shù)據(jù)倉庫。


關(guān)于數(shù)據(jù)倉庫內(nèi)部的數(shù)據(jù)處理我們有專題分享,這里不再贅述。


數(shù)據(jù)倉庫之上有五種類型的平臺分別支撐不同類型的應(yīng)用。


1.      實(shí)時決策平臺:現(xiàn)在落地較多的案例有實(shí)時推薦、實(shí)時風(fēng)控、實(shí)時運(yùn)維預(yù)警等;
2.      離線批處理平臺:主要處理一些數(shù)據(jù)量巨大的固定報(bào)表業(yè)務(wù),如審計(jì)業(yè)務(wù)等;
3.      自助分析平臺:提供交互式自助分析服務(wù),包含傳統(tǒng)數(shù)倉的數(shù)據(jù)集市部分;
4.      數(shù)據(jù)探索平臺:提供模型實(shí)驗(yàn)室,幫助分析師迭代式快速建模,實(shí)現(xiàn)客戶流失預(yù)測、擔(dān)保鏈分析等業(yè)務(wù)場景;
5.      檢索業(yè)務(wù)平臺:提供對數(shù)據(jù)的檢索服務(wù),包括精確查詢和模糊查詢等;
6.      其中有些應(yīng)用場景綜合使用多種技術(shù),如實(shí)時推薦??蛻舢嬒竦墓ぷ髟陔x線批處理平臺完成,而實(shí)時推薦部分在實(shí)時決策平臺完成。
大數(shù)據(jù)平臺處理的數(shù)據(jù)量非常大,典型客戶的單表數(shù)據(jù)量在百億以上,這樣的數(shù)據(jù)量在傳統(tǒng)的Oracle或者DB2方案中處理起來非常困難。而應(yīng)用Hadoop技術(shù)的整體解決方案,能夠處理上文提出的各項(xiàng)挑戰(zhàn)。
下面簡單介紹銀行業(yè)需求比較迫切的幾個應(yīng)用。

3
自助分析平臺

3.1 數(shù)據(jù)請求邏輯


3.1.1.   現(xiàn)有邏輯

銀行系統(tǒng)一直面臨一個問題,隨著業(yè)務(wù)類型增多數(shù)據(jù)量變大,這個問題愈發(fā)突出,就是數(shù)據(jù)層和系統(tǒng)層的界限模糊不夠清晰,導(dǎo)致數(shù)據(jù)難以管理和獲取。
圖3展示了銀行系統(tǒng)當(dāng)前的數(shù)據(jù)請求邏輯。

圖3. 銀行系統(tǒng)當(dāng)前的數(shù)據(jù)請求邏輯

1.      業(yè)務(wù)人員發(fā)起數(shù)據(jù)需求;
2.      需要確認(rèn)是否已經(jīng)有對應(yīng)的供數(shù)系統(tǒng);
3.      如果沒有,則需要跟科技部門協(xié)商,通過提數(shù)到本地、新建報(bào)表、新建系統(tǒng)等方式滿足供數(shù)需求,幾種處理方式所花費(fèi)的時間從幾天到幾個月;

4.      如果已經(jīng)有供數(shù)系統(tǒng),則需要業(yè)務(wù)部門的領(lǐng)導(dǎo)在系統(tǒng)內(nèi)進(jìn)行權(quán)限審批,審批通過才能獲得數(shù)據(jù)。


在整個數(shù)據(jù)請求過程中,業(yè)務(wù)部門和科技部門權(quán)力多有交叉,數(shù)據(jù)層和系統(tǒng)層界限模糊不清,簡單的數(shù)據(jù)請求卻需要復(fù)雜的處理邏輯。


這種處理邏輯還帶來其他問題:
1)時間延遲:如上所述,簡單的數(shù)據(jù)請求需要幾天到幾個月的延遲;
2)數(shù)據(jù)安全:通過提數(shù),數(shù)據(jù)下發(fā)到業(yè)務(wù)人員,難以管理,極易泄露;
3)一致性:多人提數(shù),則一份數(shù)據(jù)有多份副本,一方面帶來一致性問題,另一方面是對存儲資源的浪費(fèi);
4. 分析性能:把數(shù)據(jù)提到本地,用本地的Oracle或者DB2,實(shí)際是單機(jī)在處理整個數(shù)據(jù)集,分析性能得不到保證。

3.1.2.   改進(jìn)后邏輯


使用Hadoop技術(shù),對整個業(yè)務(wù)流程改進(jìn),得到如圖4的處理邏輯。

圖4. 改進(jìn)后的數(shù)據(jù)請求邏輯

1.      業(yè)務(wù)人員發(fā)起數(shù)據(jù)需求;
2.      信息管理部門根據(jù)相關(guān)規(guī)則制度,審批權(quán)限;

3.      通過則業(yè)務(wù)人員可以自助查詢數(shù)據(jù)。


整套流程都在統(tǒng)一建設(shè)的自助分析平臺之上,不再涉及科技部門和系統(tǒng)層面。業(yè)務(wù)部門只需要提數(shù)據(jù)需求,權(quán)限審批由專門的信息管理部門統(tǒng)一管理。信息管理部門根據(jù)平臺是否有這份數(shù)據(jù)、業(yè)務(wù)人員是否有權(quán)限獲取這份數(shù)據(jù)進(jìn)行審批。如果審批通過了,業(yè)務(wù)人員就可以自助查詢;如果拒絕,則直接結(jié)束。


這種處理邏輯解決了上文提的四個問題。

1)時間延遲:這套邏輯非常簡單,可能是線上或者線下帶紙質(zhì)備份的審批,時間延遲非常短,減少了流通環(huán)節(jié)無需科技部門參與;
2)數(shù)據(jù)安全:數(shù)據(jù)在統(tǒng)一平臺上,不涉及數(shù)據(jù)下發(fā),減少泄露可能;
3)一致性:所有的數(shù)據(jù)統(tǒng)一存放,只有一個副本,保證全局一致;
4)分析性能:自助分析平臺底層是物理集群,集群的分析能力比單機(jī)要強(qiáng)很多,所以能夠增強(qiáng)分析能力,減少計(jì)算時間。
整體上看,通過Hadoop技術(shù),數(shù)據(jù)都錄入到這個平臺的存儲層,在上面進(jìn)行一系列的加工,變成一個個的主題模型,最后提供統(tǒng)一的數(shù)據(jù)接口服務(wù),供上層的應(yīng)用層訪問這些數(shù)據(jù)。所有操作都在安全管控之下,所有的分析人員只能遠(yuǎn)程連到跳轉(zhuǎn)機(jī)進(jìn)行訪問。數(shù)據(jù)不會泄露,也不會導(dǎo)致多個副本。
下文討論需要實(shí)現(xiàn)以上數(shù)據(jù)請求邏輯的幾點(diǎn)技術(shù)需求。

3.2.       權(quán)限控制


3.2.1.   4A統(tǒng)一安全管理

首先,平臺需要4A認(rèn)證。所謂的4A就是Account、Authentication、Authorization和Audit。


1.      Account(賬戶管理):為平臺提供統(tǒng)一集中的賬戶管理,能夠?qū)崿F(xiàn)賬號的創(chuàng)建、刪除及同步等賬號管理生命周期所包含的功能。
2.      Authentication(用戶認(rèn)證):認(rèn)證部分提供了對用戶身份的認(rèn)證,通常采用輸入用戶名和密碼來進(jìn)行審核。TDH使用Kerberos進(jìn)行認(rèn)證,可以采用密碼和keytab兩種方式,Kerberos支持HA。
3.      Authorization(權(quán)限管理):通過認(rèn)證后的用戶可以使用Inceptor等服務(wù),但用戶能訪問哪些數(shù)據(jù)、能夠使用哪些資源、能夠?qū)Ρ磉M(jìn)行怎樣的操作還需要進(jìn)一步的權(quán)限管控。RBAC(Role based access control,基于角色的訪問控制)在3.2.2中詳細(xì)介紹,資源隔離在3.3中詳細(xì)介紹。
4.      Audit(審計(jì)):用戶對各個組件的操作日志集中記錄管理和分析,不僅可以對用戶行為進(jìn)行監(jiān)控,還可以對審計(jì)數(shù)據(jù)進(jìn)行挖掘,進(jìn)行一系列預(yù)警。

圖5.權(quán)限控制

3.2.2.   RBAC權(quán)限控制

如同傳統(tǒng)的關(guān)系型數(shù)據(jù)庫,Inceptor有基于角色的訪問控制(RBAC)。數(shù)據(jù)庫的建表查表權(quán)限、數(shù)據(jù)表的增刪改查權(quán)限都可以賦權(quán)給角色或個人。角色是一類特殊的權(quán)限集合,每種權(quán)限可以先賦予角色,再將角色賦予個人用戶,形成類似分組的權(quán)限管控。


除了庫級表級權(quán)限,針對大數(shù)據(jù)場景,Inceptor還開發(fā)了行級權(quán)限和列級權(quán)限。行級權(quán)限指的是同一張表中,不同的行可以控制不同的用戶訪問。列級權(quán)限指的是同一張表中,不同的字段可以控制不同的用戶訪問。

通過以上幾種權(quán)限的綜合使用,實(shí)際項(xiàng)目中可以形成三級權(quán)限控制:
1.      庫級表級權(quán)限:主題級控制;
2.      列級權(quán)限:敏感字段控制;
3.      行級權(quán)限:分機(jī)構(gòu)訪問控制。

典型的應(yīng)用場景如下:

平臺中有多種類型的數(shù)據(jù),有些是客戶關(guān)系,有些是交易明細(xì)。這些表放在不同的庫的不同表中,從主題級別將不同的訪問權(quán)限賦予不同的用戶,如CRM信息賦予營銷人員、交易數(shù)據(jù)賦予財(cái)務(wù)人員。


在大數(shù)據(jù)場景下,有非常多的寬表,一張表中的信息量非常大,可能有幾十甚至上百個字段。如交易信息中,既有客戶身份證、手機(jī)號等敏感信息,也有交易額、數(shù)據(jù)源等非敏感信息。數(shù)據(jù)分析師只允許訪問非敏感信息,而管理員允許訪問敏感信息。該場景下需要讓不同用戶訪問同一張表的不同字段。在傳統(tǒng)的關(guān)系型數(shù)據(jù)庫中,往往通過建視圖的方式控制列級權(quán)限,但是如果權(quán)限分類一多,就會生成非常多的視圖難以管理。針對該場景,星環(huán)開發(fā)了列級權(quán)限,可以在原表上賦予不同用戶不同字段的訪問權(quán)限,方便管理。


最后是行級權(quán)限。銀行的大數(shù)據(jù)平臺一般建立在總行,會把數(shù)據(jù)從下面的分支行抽上來統(tǒng)一存儲。因此一張關(guān)于交易的大表可能糅合了北京、上海、天津的數(shù)據(jù)。不同地方的分析師需要訪問不同的數(shù)據(jù),傳統(tǒng)的做法是建立多張數(shù)據(jù)表,從應(yīng)用層面進(jìn)行管理。星環(huán)開發(fā)的行級權(quán)限,能夠讓不同的用戶訪問同一張表,但是只能讀到用戶允許訪問的數(shù)據(jù)。

3.3.       資源隔離


除了權(quán)限管控,還需要計(jì)算和存儲資源隔離。

3.3.1.   計(jì)算資源隔離

如果沒有計(jì)算資源隔離,一個用戶在分析平臺上提交了一個SQL任務(wù),把計(jì)算資源占光,會影響其他用戶的正常使用。


因此需要限定每個用戶的計(jì)算資源。用戶提交任務(wù)時可以申請專有的資源池供自己使用。物理集群根據(jù)當(dāng)前是否有空閑的CPU和內(nèi)存等計(jì)算資源、當(dāng)前用戶是否有獨(dú)享資源的權(quán)限決定是否為其分配專有資源。如果沒有分配,當(dāng)前用戶只能使用共享資源進(jìn)行作業(yè),根據(jù)作業(yè)優(yōu)先級分配到隊(duì)列里,進(jìn)行作業(yè)調(diào)度。一個虛擬集群里可以有多個隊(duì)列。


如果當(dāng)前用戶申請到專有資源,集群可以為其創(chuàng)建單獨(dú)的虛擬集群,如圖6里的Inceptor2-InceptorN。分析完成或超時以后,該虛擬集群被動態(tài)銷毀,資源被回收。這個需要依靠星環(huán)的容器技術(shù)TOS完成。

圖6. 多任務(wù)隊(duì)列支持計(jì)算資源隔離

3.3.2.   存儲資源隔離


一個平臺的存儲空間是有限的,如果用戶無限放入文件,平臺很快就不堪重負(fù)。所以這里涉及到存儲資源的隔離。


假如有A、B、C三個用戶:
A用戶沒有限制平臺的使用空間,可以無限上傳數(shù)據(jù);
B用戶被限制了存儲空間,但還沒有達(dá)到上限,可以繼續(xù)上傳數(shù)據(jù);

C用戶分配的空間比較小,達(dá)到上限了,這時候就不允許上傳數(shù)據(jù)了。


平臺有些文件是靜態(tài)的,還有一些文件是在計(jì)算過程中動態(tài)生成的。平臺通過限制用戶的臨時計(jì)算空間,來限制用戶提交的job的大小。當(dāng)用戶提交的job非常大時,會生成非常多的中間數(shù)據(jù),達(dá)到上限,整個job會被kill掉。通過這種手段可以限制用戶提交的任務(wù)大小。如果用戶沒有限制就可以提交非常大的任務(wù),直到整個集群的資源被用完為止。

圖7. HDFS Quota支持存儲資源隔離

3.4.       數(shù)據(jù)聯(lián)邦

一般的Hadoop解決方案中,大數(shù)據(jù)平臺只能調(diào)用存儲于HDFS和HBase之上的數(shù)據(jù)。然而有一些數(shù)據(jù)不適合從外部轉(zhuǎn)存到HDFS或HBase中,如頻繁改動的維度表,每次關(guān)聯(lián)之前都要從生產(chǎn)庫中將維度表完整的抽取過來再做關(guān)聯(lián)。


為了統(tǒng)一訪問平臺內(nèi)外的多種數(shù)據(jù)源,星環(huán)開發(fā)了StarGate組件。StarGate就像星際之門,將各種數(shù)據(jù)源通過各自的Driver匯聚在一起,供Inceptor統(tǒng)一訪問。數(shù)據(jù)源既可以是Text、ORC、Parquet等各種存儲格式的HDFS文件;也可以是Hyperbase;或是星環(huán)開發(fā)的高速列式存儲Holodesk;還可以是外部的關(guān)系型數(shù)據(jù)庫Oracle、DB2。不管是何種數(shù)據(jù)源,Inceptor用戶都可以用統(tǒng)一的SQL語句訪問這些數(shù)據(jù)。

圖8. 數(shù)據(jù)聯(lián)邦

在訪問外部關(guān)系型數(shù)據(jù)庫時,在Inceptor中先通過DBLink的語法,將外部數(shù)據(jù)表映射到Inceptor中,訪問該表就像訪問Inceptor的一張內(nèi)表一般。當(dāng)真正訪問該數(shù)據(jù)表時,數(shù)據(jù)再從外部數(shù)據(jù)庫傳輸?shù)紿adoop平臺上。這個過程中,過濾條件會下沉到外部數(shù)據(jù)庫,所以每次訪問,只會傳輸參與計(jì)算的數(shù)據(jù),而不是全表,大大減少傳輸數(shù)據(jù)量,提升效率。

4
日志處理

日志處理是另一類常見的大數(shù)據(jù)應(yīng)用。

4.1.       整體邏輯架構(gòu)


圖9. 日志處理整體邏輯架構(gòu)圖

圖9是星環(huán)常用的日志處理技術(shù)的完整邏輯框架。


數(shù)據(jù)源可以是各種應(yīng)用系統(tǒng)的日志,或網(wǎng)站的訪問信息。


1.      首先,通過Flume agent從各個數(shù)據(jù)源采集數(shù)據(jù);
2.      然后發(fā)送到消息隊(duì)列Kafka,根據(jù)主題進(jìn)入不同的topic;
3.      接著實(shí)時流處理引擎Transwarp Stream從Kafka把不同job的數(shù)據(jù)拉過來實(shí)時處理;
4.      各種實(shí)時機(jī)器學(xué)習(xí)、預(yù)警、儀表盤等應(yīng)用可以通過SQL的方式寫進(jìn)Stream引擎,進(jìn)行實(shí)時處理;

5.      處理完的信息可以直接錄入持久化存儲層,如Inceptor、Hyperbase、ElasticSearch等。


以往,客戶處理預(yù)警信息都是T+1,當(dāng)發(fā)現(xiàn)一些不正常狀態(tài)時,機(jī)器可能已經(jīng)出現(xiàn)故障了?,F(xiàn)在可以做到實(shí)時預(yù)警,基本上一秒內(nèi)就能定位問題設(shè)備,快速停機(jī)檢修。

4.2.       日志結(jié)構(gòu)化處理

日志數(shù)據(jù)往往是非結(jié)構(gòu)化或半結(jié)構(gòu)化的,半結(jié)構(gòu)化會比較多。如何結(jié)構(gòu)化日志數(shù)據(jù)?這里涉及到兩類數(shù)據(jù):一類是系統(tǒng)日志,每條之間沒有依賴關(guān)系,我們把它稱為孤立的系統(tǒng)日志。這種日志可以直接采集。還有一些應(yīng)用日志,每一次訪問都會生成多條記錄,比如建立一次連接會有一個begin、一定的input和output,最后是end。但這幾條信息可能散落在多個文件中,因?yàn)閺腷egin到end可以持續(xù)較長時間。

圖10. 孤立日志和關(guān)聯(lián)日志的區(qū)別

在以前沒有update功能的Hadoop系統(tǒng)中,把分散在多個文件的應(yīng)用日志收集在一起是非常困難的。如果有了merge into語法,情況就會截然不同。比如第一個文件中有begin和input信息,第二個文件中有output和end信息。那么在處理第一個文件時,先把begin和input的信息寫入結(jié)構(gòu)化表中;處理第二個文件時,再把output和end信息update進(jìn)該行的后2個字段。通過這種方式,可以快速處理應(yīng)用日志。

4.3.       動態(tài)閾值告警

在傳統(tǒng)的預(yù)警方案中,某個系統(tǒng)的預(yù)警線一般是一條水平線,但實(shí)際上機(jī)器的性能是會波動的,有忙時性能和閑時性能的區(qū)別。如果以固定的閾值作為監(jiān)控指標(biāo)缺少指導(dǎo)意義,因?yàn)槊r指標(biāo)總是偏高,閑時指標(biāo)總是偏低,無法判斷出性能異常。


因此,有效的監(jiān)控告警需要基于機(jī)器性能數(shù)據(jù),根據(jù)變化規(guī)律進(jìn)行動態(tài)調(diào)整。通過學(xué)習(xí)周期性性能數(shù)據(jù),挖掘出性能變化曲線,動態(tài)閾值警告能夠有效發(fā)現(xiàn)異常情況,提升告警有效性。

圖11. 動態(tài)閾值告警

4.4.       容量性能預(yù)警

硬件規(guī)劃是另一類日志分析的應(yīng)用場景。對于傳統(tǒng)的應(yīng)用,硬件大多是需要時增加即可,早一點(diǎn)晚一點(diǎn)成本區(qū)別不大。但是在大數(shù)據(jù)場景下,數(shù)據(jù)快速增長,硬件規(guī)模也很大,早采購可能導(dǎo)致硬件限制成本上升,晚采購可能導(dǎo)致存儲空間不足數(shù)據(jù)溢出,或是計(jì)算性能不足無法及時處理數(shù)據(jù)。


因此,通過分析日志信息,可以學(xué)習(xí)網(wǎng)絡(luò)設(shè)備、線路、端口等歷史性能指標(biāo),估算增長趨勢,預(yù)測指標(biāo)瓶頸,提前提示生產(chǎn)風(fēng)險。這樣在實(shí)際線碰觸預(yù)警線之前,提前畫出預(yù)測線,做好擴(kuò)容準(zhǔn)備。

圖12. 容量性能預(yù)警
5
T+0 ODS

數(shù)據(jù)同步方面,在關(guān)系型數(shù)據(jù)庫中,常用的是Oracle的OGG和IBM的CDC等數(shù)據(jù)庫同步工具,通過抓取主庫的日志文件,在從庫重演一遍以達(dá)到同步效果。

目前,關(guān)系型數(shù)據(jù)庫和Hadoop之間一般通過Sqoop增量抽取或數(shù)據(jù)文件傳輸?shù)确绞酵?。但是這種方案有一些問題。首先,調(diào)度比較復(fù)雜。其次,時間延遲比較大,現(xiàn)在一般只能做到T+1。


星環(huán)開發(fā)了一個準(zhǔn)實(shí)時的同步工具TDA(Transwarp Data Alive):


1.      通過CDC獲取關(guān)系型數(shù)據(jù)庫的日志信息;
2.      將日志信息放在臨時層;或者通過命令將需要快速同步的日志直接拖到批次層;或者每天任務(wù)結(jié)束時,臨時層的日志會最終進(jìn)入落地層;
3.      不同的同步頻率作用于臨時層、批次層、落地層,將同步信息傳輸?shù)紿DFS;

4.      HDFS上有調(diào)度監(jiān)控程序,將日志信息在Inceptor上重演一遍,完成從關(guān)系型數(shù)據(jù)庫到Hadoop的同步。


這個方案的好處是不同的規(guī)則作用于不同的調(diào)度層:臨時層暫時不會同步,批次層會立馬同步,落地層則是每天晚上同步一次。TDA可以做到不同延遲程度的同步策略,并且傳輸?shù)臄?shù)據(jù)量非常小,傳輸?shù)闹皇侨罩疚募皇峭暾臄?shù)據(jù)文件,所以整個傳輸過程對關(guān)系型數(shù)據(jù)庫的壓力非常小,不影響生產(chǎn)庫的正常業(yè)務(wù)。

圖13. 準(zhǔn)實(shí)時同步技術(shù)實(shí)現(xiàn)T+0 ODS


最后附上大神的皂片供大家膜拜~



    本站是提供個人知識管理的網(wǎng)絡(luò)存儲空間,所有內(nèi)容均由用戶發(fā)布,不代表本站觀點(diǎn)。請注意甄別內(nèi)容中的聯(lián)系方式、誘導(dǎo)購買等信息,謹(jǐn)防詐騙。如發(fā)現(xiàn)有害或侵權(quán)內(nèi)容,請點(diǎn)擊一鍵舉報(bào)。
    轉(zhuǎn)藏 分享 獻(xiàn)花(0

    0條評論

    發(fā)表

    請遵守用戶 評論公約

    類似文章 更多