日韩黑丝制服一区视频播放|日韩欧美人妻丝袜视频在线观看|九九影院一级蜜桃|亚洲中文在线导航|青草草视频在线观看|婷婷五月色伊人网站|日本一区二区在线|国产AV一二三四区毛片|正在播放久草视频|亚洲色图精品一区

分享

如何構(gòu)建 FinTech 科學(xué)反欺詐體系

 千江uta9ytkw0t 2017-11-21


一、FinTech金融科技企業(yè)面臨的欺詐風(fēng)險(xiǎn)

圖 1


如圖 1 是個(gè)人對(duì)個(gè)人的信用貸款,它其實(shí)是服務(wù)于兩端的,理財(cái)人群和借款人群。投資人會(huì)把錢投資到平臺(tái)的一個(gè)公有賬戶上,然后通過平臺(tái)的撮合服務(wù)快速對(duì)接到借款人的需求,而且為了分散風(fēng)險(xiǎn),一個(gè)投資人的資金會(huì)對(duì)接給多個(gè)借款人,一個(gè)借款人的資金也來自于多個(gè)投資人。在這些場景下需要非常多機(jī)器學(xué)習(xí)和數(shù)據(jù)挖掘的技術(shù)來幫助提升運(yùn)營效率和進(jìn)行風(fēng)險(xiǎn)控制,比如做轉(zhuǎn)化率的預(yù)測分析、如何給用戶推薦更優(yōu)質(zhì)的產(chǎn)品。而在這其中對(duì)于金融最重要的就是反欺詐體系,由于整個(gè)信用貸款流程用戶都可以直接在手機(jī)上操作,不需要提供紙質(zhì)的資料,為了用戶的體驗(yàn)不僅在判別速度上要夠快,另外對(duì)客戶的了解也從面對(duì)面交談轉(zhuǎn)移到移動(dòng)數(shù)據(jù),加大了反欺詐識(shí)別的挑戰(zhàn)。


圖 2


從線下到線上的借款流程和評(píng)估的機(jī)制都是不一樣的。線下模式客戶會(huì)到門店柜臺(tái),需要提供各種各樣的紙質(zhì)資料,比如工資流水、房產(chǎn)證明等等,周期會(huì)比較長。宜人貸在線上申請(qǐng)?jiān)u估時(shí),用戶可以通過提供一些移動(dòng)端的授權(quán)數(shù)據(jù),在 10 分鐘之內(nèi)就可以評(píng)估完這個(gè)用戶的信用,信用好的客戶可立即通過申請(qǐng),獲得相應(yīng)的借款額度和費(fèi)率。


整個(gè)線上申請(qǐng)過程(圖 2),無法像原先線下的銷售人員一樣,能夠通過和客戶面對(duì)面交流來判斷資料是否屬實(shí)以及客戶的還款意愿。由此可見,欺詐風(fēng)險(xiǎn)是互聯(lián)網(wǎng)金融線上信貸工廠模式最大的挑戰(zhàn)。


|信用風(fēng)險(xiǎn)和欺詐風(fēng)險(xiǎn)的區(qū)別


圖 3


簡單說一下信用風(fēng)險(xiǎn)和欺詐風(fēng)險(xiǎn)的區(qū)別(圖 3),信用風(fēng)險(xiǎn)更多是來描述一個(gè)用戶是否有還款能力,比如說通過月收入多少,負(fù)債情況怎么樣,就可以判斷用戶適合借多少額度。對(duì)于欺詐風(fēng)險(xiǎn)的判斷其實(shí)會(huì)困難一些,因?yàn)橛泻芏嘀薪闀?huì)幫助客戶偽造資料,有些中介買一全套某個(gè)村里的身份證信息,辦手機(jī)號(hào)、銀行卡、注冊(cè)淘寶賬號(hào)養(yǎng) 6 個(gè)月之后,這一套資料就可以在各家網(wǎng)貸平臺(tái)上申請(qǐng),造成假資料一人多貸的情況。所以對(duì)于國內(nèi)的互聯(lián)網(wǎng)金融公司來說,其實(shí)很希望做到信息共享,因?yàn)橛幸蝗硕噘J情況的話,對(duì)于每一家平臺(tái)風(fēng)險(xiǎn)都是很高的。


業(yè)界通常解決欺詐風(fēng)險(xiǎn)的方法,就是利用人工審查,信用黑名單或者部署反欺詐規(guī)則的方法。這些方法其實(shí)效率比較低,人工成本會(huì)很高。因?yàn)楝F(xiàn)在欺詐手段更新非???,比如說刷注冊(cè)的行為,詐騙者可能都不是去辦一張手機(jī)號(hào),或者找身邊朋友拿手機(jī)號(hào)去注冊(cè),黑產(chǎn)中有“貓池”,會(huì)插幾百張卡,這些卡都可以用來收驗(yàn)證碼在網(wǎng)站上刷注冊(cè),刷完注冊(cè)之后,黑產(chǎn)還可以刷電話的正常通信行為。黑產(chǎn)手段不斷更新,我們也只能不斷的更新技術(shù)、更新模型,找到數(shù)據(jù)中不容易偽造的點(diǎn),識(shí)別出虛假、騙貸用戶。


二、在線反欺詐中的數(shù)據(jù)科學(xué)實(shí)踐


圖 4


對(duì)于反欺詐而言其實(shí)也是一種機(jī)器學(xué)習(xí)的過程。在業(yè)界 Y 目標(biāo)變量的定義非常重要,也就是對(duì)樣本的選擇,在做監(jiān)督學(xué)習(xí)的時(shí)候是必須要做的事情,就是標(biāo)注哪些用戶是好用戶,哪些用戶是壞用戶。選定在一段時(shí)間窗口內(nèi)的樣本后,就可以對(duì)這些樣本提取多維特征,利用監(jiān)督學(xué)習(xí)的算法去做訓(xùn)練,最后再在跨時(shí)間的驗(yàn)證集上驗(yàn)證模型的穩(wěn)定性。


為什么在互聯(lián)網(wǎng)金融做反欺詐這么難?和普通互聯(lián)網(wǎng)中做機(jī)器學(xué)習(xí)有什么不一樣的地方?主要在于樣本的標(biāo)注上。比如在做廣告點(diǎn)擊預(yù)測的時(shí)候,反饋是非常實(shí)時(shí)的,平臺(tái)可以實(shí)時(shí)標(biāo)注這個(gè)用戶到底喜不喜歡展示的商品,但是在互聯(lián)網(wǎng)金融的借貸產(chǎn)品中用戶到底還不還錢可能要等好幾個(gè)月才能判斷。所以對(duì)于互聯(lián)網(wǎng)金融做機(jī)器學(xué)習(xí)的過程中,難度就在于壞用戶會(huì)非常少,也就造成了樣本極度不平衡現(xiàn)狀,這就需要提前做樣本的平衡處理。


如圖 4 中的風(fēng)險(xiǎn)控制數(shù)據(jù)金字塔,越上層的數(shù)據(jù)金融屬性越強(qiáng),越下層的數(shù)據(jù)覆蓋到的用戶越廣。這些數(shù)據(jù)中金融屬性最強(qiáng)的是用戶的信用數(shù)據(jù),比如人行的征信報(bào)告上面會(huì)有用戶過往的貸款記錄及違約記錄,還有信用卡的額度和使用情況,可以直接反應(yīng)用戶的信用。再者就是消費(fèi)記錄,如果說一個(gè)用戶的信用卡使用額度每個(gè)月都基本刷光,那這個(gè)用戶的還款能力需要進(jìn)一步考量。還有通訊行為,比如用新手機(jī)號(hào)來申請(qǐng)貸款會(huì)比長期使用的號(hào)碼的風(fēng)險(xiǎn)高。社交行為方面,比如說用戶的常用聯(lián)系人是否真實(shí)、是否是中介或者在社交網(wǎng)絡(luò)上的一些數(shù)據(jù)。最后是行為數(shù)據(jù),可以覆蓋到每一個(gè)來申請(qǐng)的用戶,例如在填寫個(gè)人信息時(shí),如果輸入的時(shí)長過長有可能不是本人申請(qǐng),有可能是中介代辦。


在做特征工程的時(shí)候,金融場景下做人工特征工程的比較多,而且特征需要有解釋性。比如這個(gè)用戶愛好賭博、經(jīng)常半夜去娛樂場所,那么他的信用表現(xiàn)一般很差。還可以使用知識(shí)圖譜的特征挖掘技術(shù),來挖掘更多的關(guān)聯(lián)性特征?;凇拔镆灶惥郏艘匀悍帧钡募僭O(shè),如果你的朋友都是信用好的人,那么你大概率也是一個(gè)優(yōu)質(zhì)用戶。如果你的朋友都是借了錢不還的人,那么也會(huì)懷疑你是一個(gè)借錢不還的人。


圖 5


我們構(gòu)建的知識(shí)圖譜,把用戶提供授權(quán)的消費(fèi)數(shù)據(jù)、行為數(shù)據(jù)包括第三方的數(shù)據(jù)都整合在一個(gè)知識(shí)圖譜中,通過數(shù)據(jù)的處理后提取特征,做模型訓(xùn)練和模型預(yù)測,最終反映在上層的反欺詐應(yīng)用中。圖譜中的實(shí)體目前包括用戶的電話、身份證、信用卡、地理位置、設(shè)備號(hào)等等。設(shè)備號(hào)其實(shí)在圖譜的關(guān)聯(lián)關(guān)系中可以提供很多信息,比如有些用戶會(huì)發(fā)現(xiàn)他一個(gè)人關(guān)聯(lián)到上萬個(gè)設(shè)備,這種情況需要及時(shí)預(yù)警,另外要看某些設(shè)備是不是虛擬設(shè)備,或者地理位置是不是經(jīng)過偽造的,通過這些蛛絲馬跡都可以幫助欺詐識(shí)別。


圖 6


整個(gè)風(fēng)控決策從數(shù)據(jù)獲取到清洗,再到特征提取,再通過 GBDT、RF 等算法生成高級(jí)特征后,將同一個(gè)數(shù)據(jù)類別的特征輸出為一類風(fēng)險(xiǎn)評(píng)級(jí),在建模時(shí)對(duì)各個(gè)數(shù)據(jù)源進(jìn)行交叉建模,幫助提升預(yù)測能力。如圖 6 就是風(fēng)控決策的模型搭建流程。


 三、用戶全流程欺詐風(fēng)險(xiǎn)評(píng)分體系


1、為什么反欺詐需要體系化?


為什么反欺詐需要體系化呢?對(duì)于這個(gè)問題,其實(shí)很多欺詐機(jī)制在申請(qǐng)初期就可以發(fā)現(xiàn),目前后端反欺詐決策不能滿足實(shí)時(shí)發(fā)現(xiàn)欺詐的需求,而且欺詐行為的技術(shù)含量日益升級(jí),面對(duì)這些現(xiàn)狀需要我們不斷的提升對(duì)欺詐的響應(yīng)能力。


接下來介紹一下在實(shí)踐的過程中做的一套用戶全流程欺詐風(fēng)險(xiǎn)的評(píng)估體系,傳統(tǒng)的做法是判斷欺詐的時(shí)刻是用戶在申請(qǐng)的時(shí)刻,資料已經(jīng)提交完了。例如在銀行申請(qǐng)時(shí)把所有信用資料交給銀行之后,銀行會(huì)統(tǒng)一進(jìn)行評(píng)審,也就是在資料齊全的時(shí)刻去判斷用戶的信用風(fēng)險(xiǎn)和欺詐風(fēng)險(xiǎn)。在移動(dòng)端會(huì)有一個(gè)優(yōu)勢(shì),在用戶一來到平臺(tái)上就可以開始對(duì)用戶進(jìn)行評(píng)估。如果可以在更早的情況下發(fā)現(xiàn)這個(gè)用戶是一個(gè)欺詐用戶的話,就會(huì)引導(dǎo)用戶走不同的流程。比如評(píng)估用戶大概率不是本人,平臺(tái)就讓用戶做人臉識(shí)別?;蛘咂脚_(tái)通過欺詐評(píng)分發(fā)現(xiàn)沒有欺詐的風(fēng)險(xiǎn),就有可能直接放款,這樣對(duì)用戶的體驗(yàn)會(huì)有很大的提升。


圖 7


如圖 7 比如用戶在激活設(shè)備的時(shí)候,平臺(tái)就可以給用戶一個(gè)評(píng)分,用戶在注冊(cè)賬號(hào)的時(shí)候有了更多的用戶信息,就可能給用戶一個(gè)更高的評(píng)分。再比如用戶在做其他的一些操作的時(shí)候,平臺(tái)發(fā)現(xiàn)用戶操作的速度過于頻繁了,就又會(huì)降低用戶的分?jǐn)?shù)。所以說在不同的流程都可能給用戶打不同的評(píng)分,然后根據(jù)這些節(jié)點(diǎn)的不同評(píng)分,平臺(tái)可以引導(dǎo)用戶走不同的流程,最終根據(jù)用戶的信用評(píng)估給用戶相應(yīng)的貸款額度。


2、用戶 SDK 數(shù)據(jù)全流程反欺詐


圖 8


為了提升用戶的使用體驗(yàn),引入了用戶的行為數(shù)據(jù),并利用用戶的設(shè)備數(shù)據(jù)、行為數(shù)據(jù)和位置數(shù)據(jù)(如圖 8)來對(duì)用戶進(jìn)行信用和欺詐評(píng)估。行為數(shù)據(jù)的數(shù)據(jù)質(zhì)量的保障在業(yè)內(nèi)一直是一個(gè)難題,我們也趟了很多坑,做了很多數(shù)據(jù)質(zhì)量的修復(fù),也對(duì) SDK 做了很多定制化的改進(jìn),包括埋點(diǎn)的方式。不過這些工作都是有價(jià)值的,我們也確確實(shí)實(shí)的看到了行為數(shù)據(jù)對(duì)于反欺詐的業(yè)務(wù)價(jià)值所在,還在此基礎(chǔ)上申請(qǐng)了 2 項(xiàng)反欺詐技術(shù)專利。


3、反欺詐平臺(tái)工作流程

圖 9


圖 9 是目前反欺詐平臺(tái)的工作流程,平臺(tái)申請(qǐng)的數(shù)據(jù),會(huì)存儲(chǔ)在 Neo4j 數(shù)據(jù)庫中,通過規(guī)則和反欺詐模型兩種策略對(duì)用戶申請(qǐng)進(jìn)行評(píng)估,反欺詐模型不僅會(huì)給出用戶欺詐的概率,而且將此概率通過 FICO 分?jǐn)?shù)校準(zhǔn)到 300-900 分,并通過分析找出欺詐閾值對(duì)用戶進(jìn)行實(shí)時(shí)提報(bào)預(yù)警。本平臺(tái)的亮點(diǎn)在于引入了反欺詐調(diào)查組,以機(jī)器學(xué)習(xí)加人工的方式,確認(rèn)用戶是否是欺詐用戶,并將實(shí)時(shí)的標(biāo)注信息反饋回模型的訓(xùn)練中,不僅補(bǔ)充了壞樣本,而且使得模型迭代更迅速。


4、引入反欺詐調(diào)查員提升反饋效率


圖 10


引入反欺詐調(diào)查員在國外的金融行業(yè)也是常有的做法,例如 PayPal 公司,而引入人工調(diào)查后,對(duì)于模型的迭代會(huì)有巨大的好處。在欺詐標(biāo)注方面,對(duì)于現(xiàn)金貸類的產(chǎn)品,通常需要 6 個(gè)月甚至 1 年的時(shí)間觀察用戶的還款情況來進(jìn)行數(shù)據(jù)上的標(biāo)注,現(xiàn)在有了人工調(diào)查機(jī)制后,如果預(yù)警了一批用戶,經(jīng)過調(diào)查一天之內(nèi)就可以得到新的標(biāo)注,那么在當(dāng)天晚上就可以重新進(jìn)行一次模型訓(xùn)練讓模型更準(zhǔn)確。另外在過去的情況下,如果通過模型預(yù)測一個(gè)用戶是一個(gè)欺詐用戶的話,用戶是沒有反駁機(jī)會(huì)的,有可能直接被拒或者進(jìn)入黑名單。但是引入反欺詐調(diào)查人工機(jī)制后,通過算法篩選和人工調(diào)查的結(jié)合,可以真實(shí)的確定某一個(gè)用戶是不是真的是一個(gè)中介或者是欺詐用戶。


再有另一個(gè)巨大用處就是結(jié)合人工標(biāo)注再加上圖譜的挖掘,可以快速發(fā)現(xiàn)短時(shí)間內(nèi)的欺詐團(tuán)伙。類似于像圖 10 里展示的,我們找到一些用戶和兩個(gè)以上欺詐用戶聯(lián)絡(luò)過的一個(gè)網(wǎng)絡(luò)。有一些用戶打給了兩個(gè)欺詐用戶,但有些時(shí)候這個(gè)用戶經(jīng)過調(diào)查并不是欺詐用戶。但像右上角這個(gè)結(jié)構(gòu)比較緊密的網(wǎng)絡(luò),其中有兩個(gè)用戶是我們認(rèn)定的欺詐用戶,會(huì)發(fā)現(xiàn)這兩個(gè)用戶和其他兩個(gè)聯(lián)系人構(gòu)成了一個(gè)緊密團(tuán)體,通過這樣結(jié)構(gòu)的發(fā)現(xiàn),再往深挖就發(fā)現(xiàn)這是一個(gè) 13 人的小團(tuán)伙,這個(gè)團(tuán)伙里面有 11 人是申請(qǐng)了貸款的,其中 5 人是沒有通過貸款的流程,另外 6 人通過了之后,其中有 2 人曾有逾期行為,所以通過這種方式是可以找到這樣的欺詐團(tuán)伙,或是中介團(tuán)伙。如果在以前的話,可能挖到這兩個(gè)人標(biāo)記了就完了,會(huì)忽略他關(guān)聯(lián)到的用戶,現(xiàn)在有了知識(shí)圖譜我們能挖到的信息就更深。


平臺(tái)現(xiàn)在正在做的事情就是用一手的行為數(shù)據(jù)再加上圖譜信息去搭建一個(gè)反欺詐的平臺(tái),通過模型與人工調(diào)查的結(jié)合快速的實(shí)現(xiàn)欺詐的識(shí)別,可以使平臺(tái)不受任何的欺詐的損失。

   

能夠預(yù)見的是,F(xiàn)inTech 在未來金融業(yè)將逐步成為常態(tài),可能會(huì)變成一種主流。FinTech 也在驅(qū)動(dòng)生活往更便捷更美好的方向走去,這也正是技術(shù)創(chuàng)新最大的價(jià)值所在。


Q&A

    

現(xiàn)場提問:剛才發(fā)現(xiàn)欺詐團(tuán)伙的例子里面,通話記錄是怎么獲得的?

    

王婷:這是用戶在我們的 App 中授權(quán)抓取獲得的,不用像以前一樣需要用戶去營業(yè)廳打印詳單給到銷售人員。

    

現(xiàn)場提問:用戶授權(quán)之后抓取的?

    

王婷:對(duì),這也是行業(yè)的標(biāo)準(zhǔn)做法。

    

現(xiàn)場提問:我對(duì)您剛剛講到的設(shè)備號(hào)做用戶欺詐行為早期鑒定很感興趣,是不是用蘋果7在望京注冊(cè)走的流程和在村里走的流程不一樣?

    

王婷:按照假設(shè)地理位置在一定程度上可以看出來一些欺詐風(fēng)險(xiǎn),比如一個(gè)風(fēng)險(xiǎn)很高的區(qū)域的申請(qǐng)會(huì)引起系統(tǒng)的預(yù)警。

    

現(xiàn)場提問:在識(shí)別用戶風(fēng)險(xiǎn)進(jìn)行評(píng)分的時(shí)候是怎么樣的邏輯?

    

王婷:比如說在注冊(cè)的時(shí)候,會(huì)通過設(shè)備信息和地理位置信息打一個(gè)評(píng)分,這個(gè)評(píng)分也是通過歷史上模型的訓(xùn)練,如果用戶的欺詐風(fēng)險(xiǎn)評(píng)分低于某一個(gè)閾值的話,會(huì)設(shè)置必須要經(jīng)過的流程去驗(yàn)證這個(gè)用戶有沒有虛假的行為,如果他通過的話,下一個(gè) check point 會(huì)繼續(xù)判斷,引導(dǎo)用戶接下來的流程。

    

現(xiàn)場提問:其實(shí)我想問一下,你們會(huì)獲取哪些社交信息,這個(gè)社交信息你們有跟騰訊方面合作嗎?

    

王婷:其實(shí)我們會(huì)有跟第三方數(shù)據(jù)做一些合作,另外也會(huì)嘗試著抓取一些公網(wǎng)上的信息,通過這些信息,假設(shè)我們認(rèn)定了的欺詐用戶是一個(gè)中介,通過關(guān)聯(lián)信息的數(shù)據(jù),很有可能他聯(lián)系緊密的人也是中介。

    

現(xiàn)場提問:我現(xiàn)在在京東廣告部做數(shù)據(jù)的,我們遇到一個(gè)投訴就是有一個(gè)用戶說,我們給他推薦了他曾經(jīng)看過的商品,他認(rèn)為我們侵犯他隱私,這種行為應(yīng)該很正常,我不知道你們獲取用戶的手機(jī)信息,因?yàn)槲覀儼惭b的時(shí)候會(huì)出現(xiàn)一大串權(quán)限,我們都不會(huì)仔細(xì)看的。其實(shí)有些用戶并不知道你們獲取他們很多信息,比如說系統(tǒng)版本手機(jī)型號(hào),你們有沒有出現(xiàn)過相關(guān)的問題?

    

王婷:其實(shí)我們?cè)谧龅臅r(shí)候,比如你說的提前獲取授權(quán)權(quán)限,或者有一些合同條款說明來保障用戶的知曉。其實(shí)大部分的誤解來自于不了解,現(xiàn)在推薦引擎比較成熟,相信大眾也在逐漸接受網(wǎng)站用自己的歷史數(shù)據(jù)去推測未來。

    

現(xiàn)場提問:我想了解一下,你們?cè)谄墼p標(biāo)注那一塊,欺詐行為是基于以前歷史認(rèn)定嗎?當(dāng)欺詐發(fā)生了,你們才發(fā)現(xiàn)有問題,有沒有一些新的解決方法?

    

王婷:我覺得你問的問題挺有深度的,比如說從舊的方式方法來說,都是我們?cè)馐艿搅藫p失之后,吸取了這個(gè)標(biāo)注就把它轉(zhuǎn)化成數(shù)據(jù)訓(xùn)練,但其實(shí)對(duì)公司來說是一個(gè)蠻大的損失之后才能夠吸取的教訓(xùn)。我們現(xiàn)在做的工作,其實(shí)是希望快速發(fā)現(xiàn)新的欺詐手段,比如說用舊的方法,舊的訓(xùn)練模型發(fā)現(xiàn)了認(rèn)定欺詐用戶,用拓展的方式發(fā)現(xiàn)他周圍的用戶是什么樣的情況,通過這種方式我們就可以發(fā)現(xiàn)新的欺詐團(tuán)伙或者欺詐手段,能夠避免損失,這是我們希望做到的欺詐團(tuán)伙預(yù)警,這也是業(yè)界一直在攻克的問題。


嘉賓簡介:


王婷:宜人貸數(shù)據(jù)科學(xué)家。計(jì)算機(jī)專業(yè)博士,現(xiàn)任宜人貸數(shù)據(jù)科學(xué)家,在數(shù)據(jù)挖掘、大規(guī)模社交網(wǎng)絡(luò)分析、機(jī)器學(xué)習(xí)、知識(shí)圖譜等領(lǐng)域有豐富的研究和實(shí)踐經(jīng)驗(yàn),致力于金融反欺詐模型建模工作,搭建自動(dòng)化個(gè)人信用風(fēng)險(xiǎn)分析系統(tǒng),利用整合多種數(shù)據(jù)源和知識(shí)圖譜技術(shù)幫助線上金融服務(wù)進(jìn)行實(shí)時(shí)、快速、準(zhǔn)確的風(fēng)險(xiǎn)識(shí)別與響應(yīng)。

    本站是提供個(gè)人知識(shí)管理的網(wǎng)絡(luò)存儲(chǔ)空間,所有內(nèi)容均由用戶發(fā)布,不代表本站觀點(diǎn)。請(qǐng)注意甄別內(nèi)容中的聯(lián)系方式、誘導(dǎo)購買等信息,謹(jǐn)防詐騙。如發(fā)現(xiàn)有害或侵權(quán)內(nèi)容,請(qǐng)點(diǎn)擊一鍵舉報(bào)。
    轉(zhuǎn)藏 分享 獻(xiàn)花(0

    0條評(píng)論

    發(fā)表

    請(qǐng)遵守用戶 評(píng)論公約

    類似文章 更多