近日,香港人工智能與機(jī)器人學(xué)會(huì)(HKSAIR)創(chuàng)會(huì)理事長(zhǎng)、微眾銀行首席AI官、香港科技大學(xué)講席教授楊強(qiáng)老師,領(lǐng)銜HKSAIR《AI金融》系列線上講座第一課,主講聯(lián)邦學(xué)習(xí)及其四大應(yīng)用場(chǎng)景。 以下為楊強(qiáng)教授演講全文,雷鋒網(wǎng)做了不改變?cè)獾恼恚?/strong> 我們這次的課程系列,與當(dāng)前大家在工業(yè)界和學(xué)術(shù)界非常重視的一個(gè)議題相關(guān),就是如何利用數(shù)據(jù)做人工智能的模型,同時(shí)又能夠保護(hù)用戶的隱私,保護(hù)數(shù)據(jù)的安全。 很多同學(xué)聽(tīng)說(shuō)過(guò)深度學(xué)習(xí),聽(tīng)說(shuō)過(guò)監(jiān)督學(xué)習(xí),可能沒(méi)有聽(tīng)說(shuō)過(guò)聯(lián)邦學(xué)習(xí)。這個(gè)也是要給大家交代一下聯(lián)邦學(xué)習(xí)的由來(lái)。 為什么我在微眾銀行建立AI團(tuán)隊(duì)?我在觀察金融的各個(gè)方面能不能用AI的模型給包裝起來(lái)。因此我們?cè)O(shè)計(jì)了以下四大版塊,產(chǎn)品和業(yè)務(wù)已經(jīng)出爐,可以說(shuō)是“AI落地急先鋒”。 詳細(xì)說(shuō)一下AI+服務(wù),比如開(kāi)戶驗(yàn)證身份要進(jìn)行人臉/語(yǔ)音/指紋識(shí)別,又比如小微企業(yè)的企業(yè)主申請(qǐng)企業(yè)貸款上傳執(zhí)照要通過(guò)OCR圖像識(shí)別、文字識(shí)別獲取,自動(dòng)產(chǎn)生信用評(píng)估?,F(xiàn)在AI+服務(wù)大概每天能處理百萬(wàn)以上的這種需求。 以語(yǔ)音識(shí)別為例,我們做到了自主自研,與眾多業(yè)界領(lǐng)先的語(yǔ)音識(shí)別的提供者相比具有明顯優(yōu)勢(shì),一是因?yàn)槲覀兘鹑陬I(lǐng)域的知識(shí),有大量特定話術(shù)和專業(yè)詞匯的儲(chǔ)備,在各種具體的特殊環(huán)境下都能處理。二是我們有非常先進(jìn)的聯(lián)邦學(xué)習(xí)技術(shù),這就是今天的主題。還有遷移學(xué)習(xí),可以很快把通用模型適配到特殊的場(chǎng)景。 AI+營(yíng)銷,有了產(chǎn)品也要有能力傳播出去,找到對(duì)的人和企業(yè),去提供金融服務(wù)。 怎么找到正確的需求?比如微信朋友圈,大家有時(shí)候會(huì)看到小微企業(yè)貸款廣告,說(shuō)明系統(tǒng)“認(rèn)出”你是一個(gè)小微企業(yè)主。我們通過(guò)很多的特征來(lái)識(shí)別,很快賦予額度給小微企業(yè)的企業(yè)主,秒級(jí)批準(zhǔn)。另外,推薦系統(tǒng)是非常有用的一個(gè)技術(shù),我們把推薦系統(tǒng)和遷移學(xué)習(xí)、聯(lián)邦學(xué)習(xí)結(jié)合起來(lái),形成了新的技術(shù)優(yōu)勢(shì),后面會(huì)細(xì)說(shuō)。 在金融行業(yè)一個(gè)很大的優(yōu)勢(shì),就是風(fēng)控非常嚴(yán)格,要高效做信用評(píng)估,那就需要很多數(shù)據(jù),360°來(lái)觀察企業(yè)或者申請(qǐng)貸款的用戶。但同時(shí)又不希望這些數(shù)據(jù)的隱私被暴露,如何能夠做到這一點(diǎn)?這,就是聯(lián)邦學(xué)習(xí)要做的事情。 舉例:金融保險(xiǎn)定價(jià),我們把違約概率大幅縮減,個(gè)性化的保險(xiǎn)定價(jià)提升8倍。小微企業(yè)風(fēng)控模型準(zhǔn)確率提高,相應(yīng)地,壞賬率降低。 我們有一個(gè)叫做攬?jiān)碌漠a(chǎn)品,是從衛(wèi)星視角往下看,能看到企業(yè)的經(jīng)營(yíng)狀況,比方說(shuō)左下角可以通過(guò)卡車個(gè)數(shù)和活躍度看到礦業(yè)的經(jīng)營(yíng)狀況。右上角是農(nóng)業(yè)種植區(qū)域,可以通過(guò)衛(wèi)星評(píng)估產(chǎn)量。左上角是洪水泛濫受災(zāi)地區(qū),通過(guò)衛(wèi)星對(duì)地區(qū)受災(zāi)的程度進(jìn)行定價(jià)。右下角是煙囪污染,環(huán)境在投資里是社會(huì)價(jià)值的體現(xiàn),對(duì)環(huán)境的保護(hù)體現(xiàn)了公司治理水平,相應(yīng)產(chǎn)生的ESG指數(shù),很多也來(lái)自于于衛(wèi)星圖像觀察。 綜上所述,這4個(gè)版塊,2個(gè)是前端的(服務(wù)、營(yíng)銷),2個(gè)是后端的(風(fēng)控、資管)。 金融小數(shù)據(jù)與隱私保護(hù)的雙重挑戰(zhàn)在這個(gè)過(guò)程中,數(shù)據(jù)是非常缺乏的。要保護(hù)我們的隱私,同時(shí)也想要服務(wù),怎么做到?下面這句話叫做“數(shù)據(jù)不動(dòng),模型動(dòng)”,希望大家就記住這7個(gè)字。這個(gè)就是聯(lián)邦學(xué)習(xí)的精髓。 AlphaGo出現(xiàn)以后,人工智能井噴式發(fā)展。但我們周圍日常的生活,有的卻是小數(shù)據(jù),不要以為大公司就一定有大數(shù)據(jù)。像在金融里面有很多的數(shù)據(jù),其實(shí)是黑天鵝現(xiàn)象。比方說(shuō)在反洗錢應(yīng)用中用于模型訓(xùn)練的洗錢案例,其實(shí)數(shù)量并沒(méi)有想象中那么多,還是屬于少數(shù)現(xiàn)象。這種數(shù)據(jù)拿它來(lái)訓(xùn)練,效果不是很好。在醫(yī)療也是這樣,每天都有那么多的病人,一定是大數(shù)據(jù)嗎? 有一家公司叫做第四范式,用人工智能賦能金融場(chǎng)景。有很多頭部銀行都在使用它的產(chǎn)品,其中一個(gè)案例很有意思:豪車這種大額貸款,如果要建一個(gè)模型來(lái)做這種大額貸款的信用度的評(píng)估,數(shù)據(jù)往往是在上百例以內(nèi),這點(diǎn)樣本是沒(méi)有辦法訓(xùn)練一個(gè)好的深度模型的,或許可以來(lái)訓(xùn)練 support vector machine(支持向量機(jī))或decision tree(決策樹(shù)),但往往不精確。 又比如,大家都很憧憬無(wú)人車的到來(lái),但遲遲不來(lái),其中一個(gè)重要的原因,就是因?yàn)闊o(wú)人車還不靠譜。我們不知道它見(jiàn)到一個(gè)它沒(méi)見(jiàn)過(guò)的情況會(huì)發(fā)生什么,為了應(yīng)付這種情況,可不可以把所有汽車上面的傳感器、攝像頭的數(shù)據(jù)全部聚合在一起,飛快地訓(xùn)練一個(gè)無(wú)人車的視覺(jué)模型?不行,因?yàn)槊恳粋€(gè)在路上的車輛,雖然它可以收集自己前面的影像數(shù)據(jù),但是它不肯把這個(gè)數(shù)據(jù)和別人去共享,因?yàn)樗泻芏喑鲂须[私在里面。即使這些無(wú)人車都是跟云端在連接的,模型卻沒(méi)有辦法及時(shí)更新。 很多類似的端計(jì)算場(chǎng)景,就沒(méi)有辦法真正的實(shí)現(xiàn),因?yàn)閿?shù)據(jù)的割裂和短缺。 能不能把這些眾多的小數(shù)據(jù)集給聚合起來(lái),成為大數(shù)據(jù)?過(guò)去,確實(shí)是這樣做的?,F(xiàn)在,這樣做的結(jié)果就是違規(guī)。 比方說(shuō),歐洲在18年就推出了一個(gè)非常嚴(yán)格的個(gè)人隱私法規(guī),說(shuō)數(shù)據(jù)的擁有權(quán)是絕對(duì)在終端用戶那里。如果服務(wù)器端的公司,要用戶的數(shù)據(jù)來(lái)訓(xùn)練某個(gè)模型,比方說(shuō)搜索引擎的模型,它就一定要得到用戶的許可。假設(shè)明天它要用同樣的數(shù)據(jù)去訓(xùn)練推薦引擎的模型,那又得到用戶那去,得到新的許可。用戶如果哪天說(shuō)不希望你用我的數(shù)據(jù)在你的模型里了,那么從此以后,這個(gè)公司就沒(méi)有辦法用用戶的新的數(shù)據(jù),這個(gè)叫“被遺忘權(quán)”。 很多巨頭因此被罰,Google就被罰了5000多萬(wàn)歐元, Facebook也遭受了滑鐵盧。 在國(guó)內(nèi),數(shù)據(jù)的隱私保護(hù)已經(jīng)是處于一個(gè)非常嚴(yán)格的態(tài)勢(shì),很多大數(shù)據(jù)公司,在過(guò)去都是新貴,但是現(xiàn)在都變成了階下囚。我們現(xiàn)在在國(guó)內(nèi)的銀行里面工作,深知數(shù)據(jù)是紅線,萬(wàn)萬(wàn)碰不得的。 應(yīng)該說(shuō),聯(lián)邦學(xué)習(xí)現(xiàn)在已經(jīng)變成了國(guó)內(nèi)外的技術(shù)上的一個(gè)重大趨勢(shì),并且它已經(jīng)是一個(gè)跨領(lǐng)域的概念,它不僅僅是技術(shù),而且是商業(yè),它有自己的商業(yè)模式。 何為聯(lián)邦學(xué)習(xí)?在過(guò)去,數(shù)據(jù)動(dòng)模型不動(dòng),也就是說(shuō)我們從各地來(lái)購(gòu)買數(shù)據(jù),或移動(dòng)數(shù)據(jù)到一個(gè)中心點(diǎn),在中心點(diǎn)建立模型。 用一個(gè)簡(jiǎn)單的例子來(lái)給大家進(jìn)行解釋:假設(shè)用一只羊來(lái)類比機(jī)器學(xué)習(xí)模型,草就是數(shù)據(jù),我們希望羊吃了草以后能夠長(zhǎng)大。過(guò)去的做法是,把草買到一起來(lái)建立模型。比方說(shuō)左邊的模型,左邊的箭頭是指向羊的。羊不動(dòng),但是草被購(gòu)買到中心。相當(dāng)于用簡(jiǎn)單粗暴的辦法來(lái)獲取數(shù)據(jù),形成大數(shù)據(jù),來(lái)建立模型。 但我們希望能夠保護(hù)各自的隱私,所以讓草不動(dòng),讓羊動(dòng)。這樣羊既能吃那個(gè)地方的草,主人又不知道到底吃了哪些草,久而久之羊就長(zhǎng)大了——這個(gè)就是聯(lián)邦學(xué)習(xí)的新思路,就是讓草不出草場(chǎng),本地主人無(wú)法知道羊吃了哪些草,但是羊還是長(zhǎng)大了。 比如每一個(gè)手機(jī)都是我們個(gè)人在使用,形成了一堆樣本。有不同的手機(jī),每個(gè)手機(jī)基本上取的這些特征都一樣,但樣本卻不同。我們希望在數(shù)據(jù)不動(dòng)的情況下,能夠聚合這些手機(jī)上的數(shù)據(jù)的這些能力,建立大數(shù)據(jù)模型。 左邊所示的數(shù)據(jù)集們,依次對(duì)應(yīng)右邊各終端上面的數(shù)據(jù)。它們的特征是縱向的,X1、X2、X3是類似的,但樣本U1、U2…U10卻是不同的。所以這個(gè)叫橫向切割,按樣本切割,簡(jiǎn)稱“橫向聯(lián)邦學(xué)習(xí)”。 我們可以在本地建一個(gè)粗糙的模型,用w來(lái)表達(dá)它的參數(shù),同時(shí)對(duì)參數(shù)加密。有密鑰的人才可以看到內(nèi)涵,別人和服務(wù)器也看不到加密后數(shù)據(jù)包里的內(nèi)容。服務(wù)器得了加密后的參數(shù),就可以通過(guò)某種形式,把這些加密后的參數(shù)加以更新、聚合、處理,形成一個(gè)更大的模型。 這里大家可能會(huì)有疑問(wèn),你得到的是一個(gè)加密的包,是一堆亂碼,怎么可以把兩堆亂碼加到一起?還成為一個(gè)有意義的模型?這個(gè)問(wèn)題,我留在下一頁(yè)來(lái)解決。 每一個(gè)地方的數(shù)據(jù),就對(duì)應(yīng)這里有一個(gè)顏色的小表格,行是每一個(gè)用戶的數(shù)據(jù),列是每一維的特征。可以看到這個(gè)特征在不同終端上的特征是類似的,但是用戶不一樣。按照用戶來(lái)切割,并沒(méi)有按照特征來(lái)切割。 有了這樣的一個(gè)形態(tài)以后,我們就可以把剛才給大家講的故事,寫成一個(gè)算法。這個(gè)算法里最關(guān)鍵的第4步是把運(yùn)到服務(wù)器端的加密模型,這些包用一個(gè)f函數(shù)來(lái)處理,它是一個(gè)機(jī)器學(xué)習(xí)算法,作用在參數(shù)上。 我們?cè)瓉?lái)有這么一種新型的加密算法,他可以讓機(jī)器學(xué)習(xí)的算法可以穿透加密層進(jìn)到內(nèi)涵,也就是說(shuō)我們對(duì)一堆加密包的某種數(shù)學(xué)運(yùn)算,相當(dāng)于對(duì)于某種數(shù)學(xué)運(yùn)算的加密。這其實(shí)是一個(gè)小學(xué)的概念,叫做distribution law(分配律)。 同態(tài)加密,可以把多項(xiàng)式的加密,分解成每項(xiàng)加密的多項(xiàng)式,A+B的加密,變成A的加密加B的加密,這是非常偉大的貢獻(xiàn)。因?yàn)檫@樣就使得我們可以拿一個(gè)算法,在外面把算法給全部加密,加密的一層可以滲透到里面的每個(gè)單元。 安卓系統(tǒng)利用剛才所說(shuō)的橫向切割,即橫向聯(lián)邦學(xué)習(xí)的方法,不斷更新一個(gè)總的模型,并且把總的模型分配到本地。在這個(gè)過(guò)程當(dāng)中沒(méi)有數(shù)據(jù)移出本地,并且即使在云端在進(jìn)行運(yùn)算的過(guò)程當(dāng)中,也不會(huì)偷窺到任何的這個(gè)參數(shù)和任何的數(shù)據(jù)本身。所以,谷歌的安卓系統(tǒng)現(xiàn)在已經(jīng)在使用,通過(guò)基博爾系統(tǒng)對(duì)輸入法進(jìn)行更新。 如果是某互聯(lián)網(wǎng)公司和某家銀行合作,并不按照樣本切分,這兩家可能具有同樣的樣本,用戶群類似,但卻有不同的特征。這種情況下,數(shù)據(jù)其實(shí)是按照特征縱向來(lái)切割的,所以我們管這個(gè)模式叫做縱向聯(lián)邦學(xué)習(xí)。 比方說(shuō)兩家數(shù)據(jù)擁有方各自建立一部分的模型,但是在建立的過(guò)程當(dāng)中,它需要知道那一部分模型所計(jì)算的結(jié)果和梯度,計(jì)算的梯度來(lái)告訴最后的結(jié)果是在往哪個(gè)方向發(fā)展,這需要一個(gè)gradient和一個(gè)era。在交換過(guò)程中,又引入剛才所說(shuō)的同態(tài)加密的算法,使得兩邊可以在不看對(duì)方數(shù)據(jù)內(nèi)容的情況下,不斷更新自己這一部分的模型。 這是訓(xùn)練的過(guò)程,我們還有使用的過(guò)程。使用的過(guò)程叫inference,也需要兩方來(lái)進(jìn)行。也就是說(shuō),如果有一方到一半的時(shí)候說(shuō)不合作了,那么聯(lián)邦模型就應(yīng)該停止,這個(gè)效果也是可以實(shí)現(xiàn)的。 我們現(xiàn)在講了兩種模式,一種是橫向聯(lián)邦,那么橫向聯(lián)邦更多的是to c。to b 是幾家公司有意愿合作,可能數(shù)目不多,但每一個(gè)地方的數(shù)據(jù)都是客觀的。在這種情況下,他們要做出1+1>2的效果,就可以用縱向聯(lián)邦來(lái)進(jìn)行。 問(wèn):聯(lián)邦學(xué)習(xí)和分布式機(jī)器學(xué)習(xí)最能區(qū)分的點(diǎn)是什么? 可能以前做機(jī)器學(xué)習(xí)的同學(xué)做過(guò)分布式機(jī)器學(xué)習(xí),比方說(shuō)有參數(shù)服務(wù)器這樣的概念。分布式機(jī)器學(xué)習(xí),目的是加速,加速的辦法是通過(guò)網(wǎng)絡(luò)、多個(gè)服務(wù)器的平行并行計(jì)算。它就要考慮把這個(gè)數(shù)據(jù)給切分成不同的塊,使得每一塊的計(jì)算是在不同的服務(wù)器上進(jìn)行的,但是每一塊它的分布又是差不多的。 但在聯(lián)邦學(xué)習(xí)中,我們不能保證所有的數(shù)據(jù)擁有方,它的數(shù)據(jù)分布是一樣的。分布式機(jī)器學(xué)習(xí)的目標(biāo)是加速,聯(lián)邦學(xué)習(xí)的目的是合作,同時(shí)保護(hù)隱私,所以最終目的還是不一樣。 問(wèn):聯(lián)邦學(xué)習(xí)和安全計(jì)算是什么關(guān)系?國(guó)外是不是有類似的這種經(jīng)驗(yàn)? 安全計(jì)算應(yīng)該說(shuō)是聯(lián)邦學(xué)習(xí)的重要組成部分,聯(lián)邦學(xué)習(xí)不是一個(gè)孤立的算法,它是一個(gè)綜合性的學(xué)科,安全計(jì)算是為它提供工具的。前面說(shuō)到安全是用同態(tài)加密來(lái)進(jìn)行,也可以用其它的方法,比方說(shuō)姚期智院士發(fā)明的Garbled Circuit(混淆電路)。 問(wèn):區(qū)塊鏈聽(tīng)起來(lái)和聯(lián)邦學(xué)習(xí)有點(diǎn)像,都是在多方進(jìn)行的,它們是不是有些異同? 它的做法可能有些相同,但是也有巨大的不同。相同的地方是它可以用區(qū)塊鏈的分布式記賬功能來(lái)進(jìn)行有效的激勵(lì)措施。激勵(lì)措施是我剛才所沒(méi)有講的,就是說(shuō)怎么鼓勵(lì)參與方持續(xù)地投入,參與到聯(lián)邦里面來(lái)。同時(shí)去中心化的概念,也是我們尤其是縱向聯(lián)邦里面的一個(gè)概念。 但一個(gè)很大的不同是,區(qū)塊鏈為了保證 transparency,還有保證數(shù)據(jù)的不可篡改性,那么它要把同樣一份數(shù)據(jù)多次copy到不同的場(chǎng)景,最后大家要有一個(gè)vote的機(jī)制,但是聯(lián)邦學(xué)習(xí)卻不然,聯(lián)邦學(xué)習(xí)是一個(gè)數(shù)據(jù),只有一個(gè)copy,它不能夠出本地,所以它的目的就是通過(guò)這種uniqueness的方法來(lái)保證用戶的數(shù)據(jù)的隱私和安全。 還有我們新提出來(lái)的虎符性概念,就是多方參與,才能夠計(jì)算。缺了一方,這個(gè)就無(wú)效,就像戰(zhàn)國(guó)時(shí)代,你要把虎符兩個(gè)印要對(duì)上才能夠用兵,這個(gè)是聯(lián)邦學(xué)習(xí)的一個(gè)優(yōu)點(diǎn)。 問(wèn):如果有一方數(shù)據(jù)是壞人怎么辦? 比如橫向聯(lián)邦,如果有一個(gè)手機(jī),它其實(shí)是壞人,它參與了計(jì)算,那么它每次貢獻(xiàn)的模型都是在下毒,也就是說(shuō)它在把最后的結(jié)果在朝著他對(duì)它自己有利的方向發(fā)展,或者在縱向聯(lián)邦的時(shí)候,兩方當(dāng)中,其中有一方,它的目的就是為了窺探對(duì)方的隱私, 怎么辦? 在場(chǎng)景下,我們有各種各樣的做法。比方說(shuō)做OCR,written text是0,這個(gè)是原始數(shù)據(jù),我們讓計(jì)算機(jī)識(shí)別0。如果不做加密,我們沒(méi)有一個(gè)機(jī)制,這種所謂的對(duì)抗是可以做到的,壞人是可以通過(guò)參數(shù)或者一系列梯度的泄露可以反猜原始數(shù)據(jù)。 在建立模型訓(xùn)練的過(guò)程當(dāng)中,如果這個(gè)模型的 gradient不斷被引向到一個(gè)第三方,第三方獲取 gradient,最后reconstruct我們就用data,通過(guò)這樣的辦法可以去做竊聽(tīng)。題目也是在去年NIPS得到最佳paper的一個(gè)題目,是MIT韓松教授做的。 應(yīng)付它的方法,也是聯(lián)邦學(xué)習(xí)的一個(gè)拿手好戲。比方說(shuō)假設(shè)一個(gè)player,半誠(chéng)實(shí)(Honest-but-curious)就是好奇,但本身不壞。還有人是惡意的,想搞破壞,想得到用戶隱私,然后獲利。對(duì)于不同的假設(shè),可以設(shè)計(jì)不同的聯(lián)邦學(xué)習(xí)算法和多方計(jì)算算法來(lái)防止下毒,還可以做零知識(shí)(Zero knowledge)和一些知識(shí)(Some knowledge)分類。服務(wù)器端也可以區(qū)分是不是惡意中心、惡意的數(shù)據(jù)節(jié)點(diǎn)和非惡意的數(shù)據(jù)節(jié)點(diǎn)。 問(wèn):金融場(chǎng)景有沒(méi)有遇到過(guò)壞人? 在聯(lián)邦學(xué)習(xí)里面,如果有同學(xué)現(xiàn)在在找題目,說(shuō)我能不能在聯(lián)邦學(xué)習(xí)找一個(gè)碩士題目或者找一個(gè)PHD的topic?完全有的,但是要聚焦,因?yàn)槁?lián)邦學(xué)習(xí)涉及的方面實(shí)在是太多了,所以如果你要找一個(gè)題目,你往往會(huì)找一個(gè)子題目,比方說(shuō)如何能夠做到安全合規(guī),如何能夠設(shè)計(jì)一種機(jī)制防御攻擊,提高算法效率。 比方說(shuō)我們科大的陳凱老師,他帶領(lǐng)的團(tuán)隊(duì)就在設(shè)計(jì)全世界領(lǐng)先的算法,網(wǎng)絡(luò)效率可以通過(guò)網(wǎng)絡(luò)的設(shè)計(jì),包括網(wǎng)絡(luò)protocol、芯片的設(shè)計(jì)來(lái)提高。還有王威老師、宋陽(yáng)秋老師,都在設(shè)計(jì)算法,他們的算法都是非常精確的。 問(wèn):你講模型我還是云里霧里的,模型到底是做什么的? 打個(gè)比方,現(xiàn)在每個(gè)人都用手機(jī),有時(shí)候也看抖音,一看就很長(zhǎng)時(shí)間過(guò)去了。為什么抖音能做到這一點(diǎn)?精準(zhǔn)的推薦和個(gè)性化,利用數(shù)據(jù)來(lái)做推薦系統(tǒng)。 如圖所示,比方說(shuō)我們有很多的手機(jī),每個(gè)手機(jī)上都有數(shù)據(jù)。抖音的做法,是把每個(gè)手機(jī)上的數(shù)據(jù)上傳到云端,再利用所聚集的大數(shù)據(jù)訓(xùn)練模型,再適配到每一個(gè)人的個(gè)人數(shù)據(jù)上,就變成個(gè)性化推薦模型,再給推到手機(jī)端,就是循環(huán)往復(fù)這樣一個(gè)過(guò)程。 這過(guò)程有個(gè)缺點(diǎn),就是它侵犯了用戶隱私,每個(gè)人的數(shù)據(jù),云端就會(huì)看到。怎么防止?這里我就要說(shuō)聯(lián)邦學(xué)習(xí)+推薦系統(tǒng),就是聯(lián)邦推薦,這個(gè)也是我們第一次提出federated recommendation的一個(gè)算法。 它的算法宗旨,就是對(duì)每一個(gè)手機(jī)上的 transaction,用戶以前看過(guò)的視頻或者書(shū),進(jìn)行矩陣分解,得到用戶空間和產(chǎn)品空間。如果你們喜歡數(shù)學(xué),你們可能知道本征值、本征向量,線性代數(shù)里面的概念,實(shí)際上就是求這個(gè)值,但基于本地?cái)?shù)據(jù)求值是非常不準(zhǔn)的。所以通過(guò)聯(lián)邦學(xué)習(xí),能夠讓他們既能夠利用所有的數(shù)據(jù)來(lái)求 ,同時(shí)不把本地的數(shù)據(jù)暴露給其他任何人。這就是聯(lián)邦推薦的概念,可以在toB的形勢(shì)下實(shí)現(xiàn),就是縱向聯(lián)邦。 縱向聯(lián)邦現(xiàn)在應(yīng)用在哪里呢?又有一個(gè)新的名詞,叫做聯(lián)邦廣告。 現(xiàn)在互聯(lián)網(wǎng)的一大經(jīng)濟(jì)支柱就是廣告,在現(xiàn)有的廣告架構(gòu)下,廣告是不可避免地侵犯用戶隱私。聯(lián)邦廣告可以讓廣告方、投放的媒體方、用戶方各自保留自己的數(shù)據(jù),同時(shí)提高投放準(zhǔn)確率。 問(wèn):聯(lián)邦學(xué)習(xí)訓(xùn)練后的模型是一個(gè)公共的模型,而各個(gè)客戶端的數(shù)據(jù)經(jīng)常是non-iid的,怎么辦? 聯(lián)邦學(xué)習(xí)訓(xùn)練后的模型,是一個(gè)公共的模型,而各個(gè)客戶端的數(shù)據(jù)經(jīng)常是分布都不一樣,比方說(shuō)我們有一個(gè)手機(jī)是女生用的,她看的短視頻和一個(gè)男生用的手機(jī)的看的短視頻,可能是完全不一樣的短視頻,因此我們拿他們兩個(gè)的數(shù)據(jù)粗暴地做數(shù)據(jù)聯(lián)邦,這個(gè)效果是肯定不好的,這是機(jī)器學(xué)習(xí)的一個(gè)常識(shí)。 怎么辦?我們還有元學(xué)習(xí),和多任務(wù)學(xué)習(xí)、遷移學(xué)習(xí)是可以解決non-iid問(wèn)題的。 又要給大家提一個(gè)新名詞,叫做聯(lián)邦遷移學(xué)習(xí),在之前每一端都先要做一個(gè)聯(lián)邦遷移學(xué)習(xí),找到自己的一個(gè)子空間,在這個(gè)數(shù)據(jù)子空間的比對(duì)下,大家可以認(rèn)識(shí)到自己找到的子空間,各自找到子空間是屬于同分布的就可以。那么找到子空間,可以用聯(lián)邦學(xué)習(xí)來(lái)實(shí)現(xiàn)。這個(gè)領(lǐng)域論文非常的少,所以如果有同學(xué)在找題目,我鼓勵(lì)大家在這個(gè)方面發(fā)力,一定是明年各個(gè)頂會(huì)的文章,best paper一定是屬于你們的。 聯(lián)邦學(xué)習(xí)應(yīng)用案例
假設(shè)我們要給一些小微企業(yè)貸款,又不知道小微企業(yè)的情況,第一個(gè)可以問(wèn)詢的是央行征信,比方說(shuō)他過(guò)去在某個(gè)銀行貸過(guò)款,信用度如何,但這種數(shù)據(jù),它的樣本往往是非常少的,所以只是去找央行的數(shù)據(jù)遠(yuǎn)遠(yuǎn)不夠。 我們希望用到的數(shù)據(jù)是多方面的,比如工商、稅務(wù)、輿情,還有各種資產(chǎn)的數(shù)據(jù)。但是這些數(shù)據(jù)擁有方,往往都是政府的不同部門、不同的企業(yè)。有專門的公司去幫助這些小微企業(yè)建立電子化的發(fā)票,有從專門的業(yè)務(wù)角度觀察,我們只有用聯(lián)邦學(xué)習(xí)才能說(shuō)服他們來(lái)參與,否則他們擔(dān)心核心資產(chǎn)會(huì)被泄露。 這里的例子,是我們?cè)谄髽I(yè)貸款里面基于聯(lián)邦學(xué)習(xí)的風(fēng)險(xiǎn)控制模型。某個(gè)銀行和某個(gè)發(fā)票企業(yè)最后形成聯(lián)邦,大為提升準(zhǔn)確率,降低壞賬率。
保險(xiǎn)其實(shí)就是風(fēng)險(xiǎn),風(fēng)險(xiǎn)和數(shù)據(jù)是分不開(kāi)的,數(shù)據(jù)越多,風(fēng)險(xiǎn)越低,因此保險(xiǎn)公司在某些程度上也想合作,因?yàn)椴煌谋kU(xiǎn)公司有不同的數(shù)據(jù)。有的保險(xiǎn)公司是專門為保險(xiǎn)公司保險(xiǎn)的,叫做再保險(xiǎn)公司,比方說(shuō)瑞士再保險(xiǎn)公司,是世界上最大的再保險(xiǎn)公司,有100多年的歷史,這些公司在過(guò)去因?yàn)閿?shù)據(jù)割裂,沒(méi)有辦法合作的。現(xiàn)在就在用聯(lián)邦學(xué)習(xí),而且取得了非常好的效果。
比方說(shuō)我們有不同的攝像頭,每個(gè)攝像頭都覆蓋一個(gè)區(qū)域,這個(gè)地方的數(shù)據(jù)是公司的核心資產(chǎn),不愿意和別的公司去share,但是他又希望利用到別的公司的數(shù)據(jù),來(lái)增高自己的準(zhǔn)確度,這個(gè)時(shí)候就可以用到聯(lián)邦學(xué)習(xí),我們叫視覺(jué)聯(lián)邦,已經(jīng)落地實(shí)施。每天深圳的建筑工地用來(lái)探測(cè)危險(xiǎn),影響施工的一些現(xiàn)象,比方說(shuō)明火抽煙和不戴安全帽的現(xiàn)象。 另外,語(yǔ)音識(shí)別、IOT在倉(cāng)儲(chǔ)管理的場(chǎng)景,聯(lián)邦學(xué)習(xí)也有所應(yīng)用。不同的倉(cāng)庫(kù)可以形成線性聯(lián)邦,監(jiān)測(cè)地方倉(cāng)儲(chǔ)狀況,這些狀況就為風(fēng)控模型和為物流業(yè)的決策提供了保障。
我們最近和騰訊的天眼實(shí)驗(yàn)室合作,成功構(gòu)建了一個(gè)“腦卒中發(fā)病風(fēng)險(xiǎn)預(yù)測(cè)模型”,通過(guò)使用來(lái)自就診記錄數(shù)量TOP5的醫(yī)院真實(shí)就診數(shù)據(jù)驗(yàn)證,聯(lián)邦學(xué)習(xí)模型和集中訓(xùn)練模型表現(xiàn)幾乎一致,在腦卒中預(yù)測(cè)模型中的準(zhǔn)確率達(dá)到80%,僅比集中訓(xùn)練模型準(zhǔn)確率降低1%。 同時(shí),聯(lián)邦學(xué)習(xí)技術(shù)顯著提升了不同醫(yī)院的獨(dú)立模型效果,特別是,對(duì)于兩家腦卒中確診病例數(shù)量較少的醫(yī)院而言,聯(lián)邦學(xué)習(xí)分別提升其準(zhǔn)確率10%和20%以上。 聯(lián)邦學(xué)習(xí)不僅僅是一個(gè)算法,而是一個(gè)操作系統(tǒng)。因?yàn)橛屑?lì)機(jī)制在里面,可以把不同的行業(yè)給凝聚在一起,使得大家有動(dòng)力,不斷用聯(lián)邦學(xué)習(xí)來(lái)做聯(lián)盟。除了剛才提到的場(chǎng)景,還有銀行和監(jiān)管聯(lián)合跨境反洗錢,互聯(lián)網(wǎng)+保險(xiǎn),互聯(lián)網(wǎng)+銀行風(fēng)控,互聯(lián)網(wǎng)+零售,這些問(wèn)題都可以通過(guò)聯(lián)邦學(xué)習(xí)更好解決。 我們建立生態(tài),建立平臺(tái),建立標(biāo)準(zhǔn)。也希望這個(gè)不僅僅是一個(gè)算法,而是新的paradise。我有的時(shí)候跟媒體講,AlphaGo代表了AI 1.0,它就是說(shuō)在一個(gè)地方有數(shù)據(jù),在一個(gè)地方有算法,在一個(gè)地方可以有一個(gè)很好的模型,就是AlphaGo。 現(xiàn)在我們進(jìn)入了AI 2.0,我們?cè)诓煌牡胤接袛?shù)據(jù)、算法、業(yè)務(wù),我們還可以做AI,這個(gè)是谷歌所沒(méi)有做到的,中國(guó)現(xiàn)在在這個(gè)方向是領(lǐng)頭的。 怎么做到這一點(diǎn)?首先要建立標(biāo)準(zhǔn)。我們特別自豪的一點(diǎn)是,世界上第一個(gè)聯(lián)邦學(xué)習(xí)的產(chǎn)業(yè)聯(lián)盟,建立的IEEE的標(biāo)準(zhǔn),已經(jīng)到了最后一步,馬上就要正式發(fā)布了,敬請(qǐng)關(guān)注。同時(shí)在國(guó)內(nèi),有聯(lián)邦學(xué)習(xí)的團(tuán)體標(biāo)準(zhǔn),這個(gè)也是微眾銀行領(lǐng)銜發(fā)布。我們有一個(gè)聯(lián)邦學(xué)習(xí)的開(kāi)源平臺(tái),就在Linux Foundation上,是金牌的開(kāi)源平臺(tái),短短兩個(gè)月就收集到貢獻(xiàn)者打的上千星,到現(xiàn)在已經(jīng)2000以上。在短時(shí)間得到這樣的認(rèn)可,也是非常難得。 教育方面,我們先后出版了英文和中文版,是聯(lián)邦學(xué)習(xí)第一本書(shū)。另外還在做一個(gè)專題網(wǎng)頁(yè),提供教學(xué)PPT、習(xí)題、考試題,為師生提供方便,希望大家都能夠很快了解這個(gè)領(lǐng)域,并且參與到里面來(lái)。 |
|