日韩黑丝制服一区视频播放|日韩欧美人妻丝袜视频在线观看|九九影院一级蜜桃|亚洲中文在线导航|青草草视频在线观看|婷婷五月色伊人网站|日本一区二区在线|国产AV一二三四区毛片|正在播放久草视频|亚洲色图精品一区

分享

包銀消費(fèi)CTO湯向軍:消費(fèi)金融大數(shù)據(jù)風(fēng)控架構(gòu)與實(shí)踐

 xujin3 2019-05-13

01

風(fēng)險(xiǎn)在哪里

_____

1.1 信用風(fēng)險(xiǎn)

根據(jù)銀行業(yè)的風(fēng)險(xiǎn)理論,信用風(fēng)險(xiǎn)是指借款人因各種原因未能及時(shí)、足額償還債權(quán)人或銀行貸款而違約的可能性。

信用風(fēng)險(xiǎn)的風(fēng)控重點(diǎn)在于,甄別客戶違約的原因究竟是還款能力,還是還款意愿問題。如果客戶真的由于各方面的原因,暫時(shí)不具備還款能力,這是概率問題。即使發(fā)生了,處置起來也不會(huì)有什么損失。而如果是還款意愿問題,存在較大的資金損失概率。

1.2 欺詐風(fēng)險(xiǎn)

在風(fēng)控中,欺詐風(fēng)險(xiǎn)比信用風(fēng)險(xiǎn)要大得多,所以反欺詐是重中之重。一般來說正常的客戶,如果不是刻意騙貸的,只是因?yàn)榧依锍霈F(xiàn)突發(fā)事故、生意出現(xiàn)問題、暫時(shí)失業(yè)等等原因而導(dǎo)致資金周轉(zhuǎn)不過來而逾期的,這畢竟是少數(shù),而且借款只是逾期,能夠還款的概率還是比較高。

消費(fèi)金融行業(yè)絕大多數(shù)不良是因?yàn)槠墼p引起的,如果反欺詐能夠比較有效的情況下,信用風(fēng)險(xiǎn)控制在5%以內(nèi)沒有太大問題。

02

主要挑戰(zhàn)

_____

消費(fèi)金融發(fā)放的借款都就小額分散的,沒有任何抵押和擔(dān)保的情況。隨著消費(fèi)金融行業(yè)的崛起和規(guī)模擴(kuò)大,整個(gè)行業(yè)面臨的欺詐問題越來越嚴(yán)重,一批批的羊毛黨和欺詐等黑產(chǎn)團(tuán)體接踵而來。黑產(chǎn)團(tuán)隊(duì)的規(guī)模越大,意味著消費(fèi)金融機(jī)構(gòu)的損失越大。

欺詐風(fēng)險(xiǎn)目前是整體消費(fèi)金融風(fēng)控的重點(diǎn),目前整個(gè)行業(yè)75%甚至以上的風(fēng)險(xiǎn)都是來自欺詐風(fēng)險(xiǎn)。形式有很多種,如常見的身份偽冒、中介黑產(chǎn)、偽造材料、惡意套現(xiàn)等。欺詐主體一是申請(qǐng)本人或親戚朋友,二是借用或盜用別人的身份信息進(jìn)行欺詐。欺詐主體的不同,防范風(fēng)險(xiǎn)的手段和形式也不同。

03

全生命周期管理

_____

一個(gè)完整的風(fēng)控平臺(tái)需要包括對(duì)借款申請(qǐng)全生命周期進(jìn)行管理 ,是一個(gè)極為復(fù)雜的過程,每一個(gè)流程都會(huì)影響整體的風(fēng)控質(zhì)量。

04

架構(gòu)實(shí)踐

_____

4.1 業(yè)務(wù)架構(gòu)

風(fēng)控平臺(tái)是相對(duì)獨(dú)立的系統(tǒng),信審的案件可以從借款端平臺(tái)推過來,也可以從第三方平臺(tái)推過來。信審案件到達(dá)風(fēng)控平臺(tái)后,自動(dòng)創(chuàng)建工作流,根據(jù)風(fēng)控流程處理各流程環(huán)節(jié)任務(wù)。

· 自動(dòng)決策

風(fēng)控流程自動(dòng)處理案件,訪問第三方合作伙伴的接口,獲取用戶黑名單、欺詐數(shù)據(jù)和多頭借貸等數(shù)據(jù),查詢名單數(shù)據(jù),決策引擎輸出各環(huán)節(jié)處理結(jié)果。自動(dòng)決策后出三個(gè)結(jié)果,自動(dòng)通過、轉(zhuǎn)人工、拒絕。

· 人工信審

根據(jù)決策引擎輸出的結(jié)果進(jìn)行轉(zhuǎn)人工處理,人工通過初審和復(fù)核崗,給出具體信審結(jié)果,信審?fù)ㄟ^的案件給出風(fēng)險(xiǎn)等級(jí)和具體額度。

· 拒絕

被自動(dòng)或者人工拒絕的案件通知到用戶,建議補(bǔ)充資料、過段時(shí)間重新申請(qǐng)或者推薦到第三方機(jī)構(gòu)。

4.2 技術(shù)架構(gòu)

4.2.1 分布式、微服務(wù)架構(gòu)

分布式架構(gòu)目前是互聯(lián)網(wǎng)行業(yè)成熟應(yīng)用的架構(gòu),這里不詳細(xì)討論。

微服務(wù)架構(gòu)下,比較成熟的使用Spring Framework,使用MyBatis、Hibernate等數(shù)據(jù)映射框架。

4.2.2 RPC架構(gòu)

RPC是分布式架構(gòu)的核心,解決服務(wù)分布和服務(wù)解耦問題,目前我們使用的是Dubbo, RPC框架解決序列化、反序列化、網(wǎng)絡(luò)框架、連接池、收發(fā)線程、超時(shí)處理、狀態(tài)機(jī)等“業(yè)務(wù)之外”的重復(fù)技術(shù)勞動(dòng)。

4.2.3 分布式消息

分布式系統(tǒng)中重要的組件,解決應(yīng)用耦合,異步消息,流量削鋒等問題,是分布式系統(tǒng)不可缺少的中間件。目前在生產(chǎn)環(huán)境,使用較多的消息隊(duì)列有ActiveMQ,RabbitMQ,ZeroMQ,Kafka,MetaMQ,RocketMQ等。

4.2.4 分布式緩存

高并發(fā)環(huán)境下,大量的讀寫請(qǐng)求涌向數(shù)據(jù)庫(kù),磁盤的處理速度與內(nèi)存顯然不在一個(gè)量級(jí),從減輕數(shù)據(jù)庫(kù)的壓力和提高系統(tǒng)響應(yīng)速度兩個(gè)角度來考慮,一般都會(huì)在數(shù)據(jù)庫(kù)之前加一層緩存。由于單臺(tái)機(jī)器的內(nèi)存資源以及承載能力有限,并且,如果大量使用本地緩存,也會(huì)使相同的數(shù)據(jù)被不同的節(jié)點(diǎn)存儲(chǔ)多份,對(duì)內(nèi)存資源造成較大的浪費(fèi),因此,才催生出了分布式緩存。常用的分布式緩存是Redis。

4.2.5 分布式日志

分布式情況下,每個(gè)日志分散到各自服務(wù)所在機(jī)器,日志的收集和分析需要統(tǒng)一處理。日志框架主要這幾塊內(nèi)容:

· 業(yè)務(wù)日志埋點(diǎn)

· 日志收集處理系統(tǒng)

· 日志處理系統(tǒng)

· 日志分析系統(tǒng)

ELK(ElasticSearch, Logstash, Kibana)平臺(tái)可以實(shí)現(xiàn)日志收集、日志搜索和日志分析的功能。

4.3 反欺詐平臺(tái)

目前的欺詐團(tuán)伙已經(jīng)形成完整的地下產(chǎn)業(yè)鏈,反欺詐平臺(tái)需要根據(jù)平臺(tái)沉淀的用戶數(shù)據(jù)、環(huán)境數(shù)據(jù)、第三方數(shù)據(jù)結(jié)合生物探針技術(shù)采集的本次用戶行為數(shù)據(jù),建立用戶、環(huán)境、行為畫像以及基于用戶、環(huán)境、行為的關(guān)系網(wǎng)絡(luò),通過對(duì)業(yè)務(wù)數(shù)據(jù)建立多重模型來甄別對(duì)異常用戶的識(shí)別能力和反欺詐能力。

4.3.1 數(shù)據(jù)來源

數(shù)據(jù)源主要是三個(gè)方向:

1. 用戶申請(qǐng)過程的填寫的數(shù)據(jù)和埋點(diǎn)時(shí)采集的行為數(shù)據(jù)和日志數(shù)據(jù)。

2. 第三方合作數(shù)據(jù),如人行征信數(shù)據(jù)、學(xué)歷、多頭借貸等數(shù)據(jù)。

3. 互聯(lián)網(wǎng)上的數(shù)據(jù),需要靠開發(fā)的爬蟲平臺(tái)去抓取。

數(shù)據(jù)分類主要以下幾類:

1. 身份信息:姓名、身份證、手機(jī)號(hào)、卡號(hào)、居住地址、學(xué)歷等。

2. 信用信息:收入信息、借款信息、帳戶信息、還款和逾期信息。

3. 社交信息:通迅錄信息、通話記錄、QQ和其它平臺(tái)交互信息。

4. 消費(fèi)信息:銀行卡詳單、電商網(wǎng)站購(gòu)買信息等其它信息。

5. 行為信息:申請(qǐng)和填寫信息、GPS、時(shí)間點(diǎn)、地點(diǎn)等信息。

6. 第三方:多頭信息、黑灰名單、授信信息。

4.3.2 反欺詐模型

以上的多方面數(shù)據(jù),可以根據(jù)對(duì)用戶行為、語義、關(guān)聯(lián)網(wǎng)絡(luò)等組成一個(gè)巨大的數(shù)據(jù)關(guān)系圖譜。利用這些數(shù)據(jù)建立的模型風(fēng)控體系對(duì)用戶的欺詐概率、還款風(fēng)險(xiǎn)等進(jìn)行強(qiáng)有力的預(yù)測(cè)和判斷。

4.3.2.1 社交圖譜模型

利用“手機(jī)-設(shè)備”及“手機(jī)-手機(jī)(通話)”關(guān)系,進(jìn)行圖建模,所有用戶及外部已知風(fēng)險(xiǎn)手機(jī)號(hào)容納在一張圖中,通過圖中的風(fēng)險(xiǎn)標(biāo)記以及圖中的異常關(guān)系結(jié)構(gòu)。

用戶數(shù)據(jù)量上來的時(shí)候,社交關(guān)系很容易破億,這時(shí)候就要使用圖數(shù)據(jù)庫(kù),相對(duì)成熟就是Neo4j,比易用性和穩(wěn)定性來講Neo4j比orientdb和arangodb要好很多。

NEO4J數(shù)據(jù)庫(kù),其可提供35億節(jié)點(diǎn),當(dāng)前2.5億多點(diǎn),其中付費(fèi)版支持無限節(jié)點(diǎn),費(fèi)用是6.8萬美元/年。

4.3.2.2 黑產(chǎn)攻擊模型

通過分析收集的高風(fēng)險(xiǎn)人群及中介通話數(shù)據(jù),挖掘出一張高風(fēng)險(xiǎn)人群聯(lián)系密切的關(guān)系網(wǎng),有效識(shí)別申請(qǐng)動(dòng)機(jī)不良的客戶,發(fā)現(xiàn)黑產(chǎn)攻擊苗頭。

4.3.2.3 多頭授信模型

通過對(duì)客戶與各類機(jī)構(gòu)的通信關(guān)系,發(fā)現(xiàn)一些體現(xiàn)多頭風(fēng)險(xiǎn)異常結(jié)構(gòu),如客戶總被一些催收機(jī)構(gòu)聯(lián)系,同時(shí)又在主動(dòng)撥打其他一些機(jī)構(gòu)的營(yíng)銷電話。

4.3.2.4 頻次異常分析

欺詐團(tuán)伙在發(fā)現(xiàn)系統(tǒng)規(guī)則漏洞時(shí),往往會(huì)在短時(shí)間內(nèi)發(fā)起大量欺詐交易,以便在受害者反應(yīng)過來前盡快變現(xiàn),例如醫(yī)美欺詐案,短時(shí)間內(nèi)大量發(fā)起虛假的美容貸款請(qǐng)求。

這種交易的頻次常常會(huì)在時(shí)間分布上形成異常的波形,通過ARIMA模型可以很好的預(yù)測(cè)事件的時(shí)間分部特征,貝葉斯框架的生成式模型能夠解決不同空間分布維度下細(xì)顆粒都的時(shí)間分布問題。

通過這兩種手段可以將時(shí)間和空間分布上存在異常的交易行為與正常的交易行為區(qū)分開來。

4.3.2.5 欺詐團(tuán)伙發(fā)現(xiàn)

在互聯(lián)網(wǎng)金融行業(yè),欺詐團(tuán)伙日益嚴(yán)重并且難以防范。從特點(diǎn)上來看,團(tuán)伙欺詐有如下幾個(gè)特點(diǎn):

· 專業(yè)性。欺詐團(tuán)伙通常會(huì)根據(jù)各平臺(tái)的風(fēng)控規(guī)則,制定相應(yīng)的欺詐手段;

· 多變性。欺詐團(tuán)伙的欺詐手法經(jīng)常變化,讓各平臺(tái)防不勝防;

· 爆發(fā)性。欺詐團(tuán)伙一旦發(fā)現(xiàn)欺詐的可能性,會(huì)在短時(shí)間內(nèi),利用地下渠道獲得的身份信息,大量反復(fù)地欺詐;

團(tuán)伙欺詐的發(fā)現(xiàn)是業(yè)務(wù)反欺詐領(lǐng)域面臨的一個(gè)重要挑戰(zhàn)。目前反團(tuán)伙欺詐技術(shù)思路如下:

· 構(gòu)成網(wǎng)絡(luò):將交易,交易信息項(xiàng)(地址,電話,設(shè)備id),用戶等定義為節(jié)點(diǎn);同屬一個(gè)交易的節(jié)點(diǎn)間形成邊;對(duì)邊根據(jù)業(yè)務(wù)經(jīng)驗(yàn)或其他規(guī)則賦予權(quán)重;

· 特征提取和信息挖掘:提取網(wǎng)絡(luò)飽和度,網(wǎng)絡(luò)直徑,關(guān)聯(lián)度,中心度,群聚系數(shù)等特征;基于已有的黑名單,利用社區(qū)發(fā)現(xiàn)等算法得到節(jié)點(diǎn)的欺詐相關(guān)程度預(yù)測(cè);

· 加入模型:提取的特征可以作為模型或規(guī)則的輸入;

· 欺詐預(yù)警:在無標(biāo)注數(shù)據(jù)的情況下,及時(shí)發(fā)現(xiàn)異常的網(wǎng)絡(luò)拓?fù)浣Y(jié)構(gòu),作為欺詐的早期預(yù)警;

4.3.2.6 評(píng)分模型

在消費(fèi)金融反欺詐領(lǐng)域,各種欺詐特征常以規(guī)則形式出現(xiàn),通過一系列的規(guī)則的邏輯組合,排除有欺詐嫌疑的進(jìn)件:

· 規(guī)則系統(tǒng)優(yōu)點(diǎn):可解釋性強(qiáng),可以迅速調(diào)整,應(yīng)對(duì)欺詐手段變化;

· 規(guī)則系統(tǒng)缺點(diǎn):復(fù)雜的規(guī)則體系難于維護(hù),難以利用弱特征,對(duì)強(qiáng)特征依賴,容易被攻破;

評(píng)分模型:評(píng)分模型在金融領(lǐng)域應(yīng)用相當(dāng)成熟,信用評(píng)分模型是最常見的應(yīng)用。但公司將評(píng)分模型應(yīng)用到反欺詐場(chǎng)景時(shí)常常與信用評(píng)分混淆,但本質(zhì)上,二者的預(yù)測(cè)目標(biāo)是不同的,反欺詐模型預(yù)測(cè)的是欺詐的可能性,信用模型預(yù)測(cè)的是還款的可能性。因此建立獨(dú)立的反欺詐評(píng)分模型很有必要。

反欺詐評(píng)分模型有如下優(yōu)點(diǎn):

· 可以充分利用弱特征;

· 對(duì)抗性好,模型結(jié)構(gòu)由一系列弱特征決定,提高欺詐者偽裝成本;

反欺詐評(píng)分模型和反欺詐規(guī)則系統(tǒng)有很好的互補(bǔ)性,在風(fēng)控平臺(tái)中,同時(shí)建立起反欺詐規(guī)則系統(tǒng)和評(píng)分模型很有必要。

4.4 變量平臺(tái)

反欺詐模型和信用模型兩個(gè)模型體系里,最基礎(chǔ)的需要先加工出風(fēng)控變量,根據(jù)基礎(chǔ)信息、關(guān)聯(lián)關(guān)系、信用歷史、設(shè)備信息、社交數(shù)據(jù)以及消費(fèi)和交易數(shù)據(jù)等六大緯度加工出數(shù)百、數(shù)千或者數(shù)萬個(gè)變量。輸出給模型進(jìn)行計(jì)算和決策。

基于實(shí)時(shí)決策的風(fēng)控流程需要對(duì)數(shù)據(jù)和大部分變量加工有實(shí)時(shí)性要求。隨著數(shù)據(jù)量越來越大,傳統(tǒng)關(guān)系數(shù)據(jù)無法解決實(shí)時(shí)和效率的問題,基于Hadoop平臺(tái)的解決方案成為變量平臺(tái)的方案。

4.4.1 數(shù)據(jù)來源

· 實(shí)時(shí)日志采集:

業(yè)務(wù)埋點(diǎn)在流程處理中把風(fēng)控需要的數(shù)據(jù)打印到日志中。

Flume從日志采集的數(shù)據(jù)放入kafka消息隊(duì)列中。

· 實(shí)時(shí)日志采集:

通過Canal分析mysql的bilog日志,放到kafka中。

4.4.2 數(shù)據(jù)加工

Spark streaming處理時(shí)效只能達(dá)到準(zhǔn)實(shí)時(shí),所以變量加工采用Storm方案。Storm可以達(dá)到低延遲的響應(yīng),在秒級(jí)或者毫秒級(jí)完成分析、并得到響應(yīng),而且體系能夠隨著數(shù)據(jù)量的增大而拓展。

05

總結(jié)

_____

消費(fèi)金融行業(yè)這兩年規(guī)模增長(zhǎng)比較快,主要是基于在線的小額分散的借款。一定程度上無法有效和及時(shí)的識(shí)別真正的客戶,某些消費(fèi)場(chǎng)景內(nèi)面對(duì)欺詐團(tuán)伙和黑產(chǎn)需要建立有效和多種風(fēng)控手段和模型。

基于大數(shù)據(jù)的風(fēng)控和反欺詐模型起步也沒有幾年,大部分公司都在逐步完善和成熟的過程,基于機(jī)器學(xué)習(xí)的風(fēng)險(xiǎn)模型也都在大量的投入和嘗試。需要從大數(shù)據(jù)上進(jìn)行挖掘、分析和建模,利用用戶身份數(shù)據(jù)、行為數(shù)據(jù)、外部數(shù)據(jù)和黑產(chǎn)數(shù)據(jù)建立反欺詐平臺(tái)、規(guī)則和欺詐關(guān)聯(lián)網(wǎng)絡(luò)來提高反欺詐能力和風(fēng)險(xiǎn)

識(shí)別能力。(全文完)

    本站是提供個(gè)人知識(shí)管理的網(wǎng)絡(luò)存儲(chǔ)空間,所有內(nèi)容均由用戶發(fā)布,不代表本站觀點(diǎn)。請(qǐng)注意甄別內(nèi)容中的聯(lián)系方式、誘導(dǎo)購(gòu)買等信息,謹(jǐn)防詐騙。如發(fā)現(xiàn)有害或侵權(quán)內(nèi)容,請(qǐng)點(diǎn)擊一鍵舉報(bào)。
    轉(zhuǎn)藏 分享 獻(xiàn)花(0

    0條評(píng)論

    發(fā)表

    請(qǐng)遵守用戶 評(píng)論公約

    類似文章 更多