知識圖譜(Knowledge Graph/Vault)技術(shù)作為人工智能技術(shù)重要的分支之一,能以可視化的方式展示實體之間的關(guān)聯(lián),能更快、更簡單地發(fā)現(xiàn)新的信息、新的非結(jié)構(gòu)數(shù)據(jù)模態(tài)和新的知識,達到洞察客戶、降低商務(wù)交易風險的目的。 一、知識圖譜技術(shù)基本情況 (一)定義 知識圖譜(Knowledge Graph/Vault)又稱為科學(xué)知識圖譜,本質(zhì)上是語義網(wǎng)絡(luò),是一種基于圖的數(shù)據(jù)結(jié)構(gòu),由節(jié)點(Point)和邊(Edge)組成(如下圖)。節(jié)點是現(xiàn)實世界中存在的“實體”;邊是實體與實體之間的“關(guān)系”。知識圖譜是關(guān)系網(wǎng)絡(luò)最有效的表達方式,可以用來更好地查詢復(fù)雜的關(guān)聯(lián)信息,從語義層面理解用戶意圖。通俗地講,知識圖譜就是把所有不同種類的信息連接在一起而得到的一個關(guān)系網(wǎng)絡(luò)。它提供了從“關(guān)系”的角度去分析問題的能力。 
(二)技術(shù)優(yōu)勢 一是能快速明白真正含義和指向,規(guī)避一詞多義現(xiàn)象。比如“蘋果”可能是某個公司名稱,也可能是一種水果。如果僅通過關(guān)鍵詞匹配,常常會產(chǎn)生歧義。而知識圖譜可以通過上下文實體關(guān)聯(lián)關(guān)系,縮小搜索范圍,借助優(yōu)先級算法,快速找到用戶真正關(guān)心的東西。 二是能提供智能的知識網(wǎng)絡(luò)。知識圖譜能更智能、更精準的理解字符串的含義,更簡潔高效的提供信息服務(wù)。比如,Google搜索引擎在頁面右側(cè)推出了以知識圖譜為背景的知識面板Knowledge Panel。當用戶搜索某個事物時,左側(cè)是傳統(tǒng)谷歌搜索返回的一列按相關(guān)度排列的網(wǎng)站鏈接,右側(cè)則將一條條與搜索內(nèi)容有關(guān)的知識作為結(jié)果直接呈現(xiàn),省去了逐個網(wǎng)頁點擊閱讀的“痛點”。 三是具備可擴展性。在企業(yè)的數(shù)據(jù)庫、文檔、傳感器、訪問日志、圖像、音視頻等數(shù)據(jù)中包含了大量反映企業(yè)業(yè)務(wù)的數(shù)據(jù)事實和業(yè)務(wù)知識。知識圖譜不同于以往的關(guān)系型數(shù)據(jù)庫存儲,將所有數(shù)據(jù)以“實體-關(guān)系-實體”的形式進行存儲,最直觀的展示了數(shù)據(jù)及數(shù)據(jù)背后的關(guān)聯(lián),基于動態(tài)可擴展的本體模型支持存儲結(jié)構(gòu)化、半結(jié)構(gòu)化、非結(jié)構(gòu)化數(shù)據(jù)。 四是具備強大的推理挖掘和不一致性檢測功能。知識圖譜不僅限于滿足數(shù)據(jù)存儲和調(diào)用的功能,通過知識圖譜,我們可能會了解到之前不知道的東西,以及這些不同東西之間的關(guān)聯(lián)關(guān)系。通過知識推理的方式把隱含的信息表達出來,甚至可以利用知識圖譜里面的不一致性去檢測發(fā)現(xiàn)已存矛盾或有沖突的知識。 二、知識圖譜技術(shù)在保險業(yè)內(nèi)的應(yīng)用實踐 (一)風控反欺詐 近年來,金融欺詐形式花樣繁多,團伙欺詐、內(nèi)外勾結(jié)等手法推陳出新,不少欺詐案件會涉及到復(fù)雜的關(guān)系網(wǎng)絡(luò)。在這種嚴峻形勢下,原來通過單點突破進行反欺詐或者偵查的方法已經(jīng)遠遠落后于時代需要。我們要建立起一個積極有效的知識圖譜,融合不同的數(shù)據(jù)源,發(fā)現(xiàn)更多更深層次的風險模式,找出欺詐者的蛛絲馬跡,挖掘其數(shù)據(jù)的矛盾點和可疑點,識別和預(yù)防欺詐事件的發(fā)生。反欺詐的核心是人,知識圖譜技術(shù)將把與投保人和受益人相關(guān)的所有數(shù)據(jù)源打通,整合投保人和收益人的基本信息,如消費記錄、行為記錄、關(guān)系信息、線上日志信息等,進而進行深度分析和預(yù)測。 (二)風險預(yù)測 基于多維度的數(shù)據(jù),建立起客戶、企業(yè)和行業(yè)間的知識圖譜,從行業(yè)關(guān)聯(lián)的角度預(yù)測行業(yè)或企業(yè)面臨的風險。例如,通過對行業(yè)進行細分,根據(jù)貸款信息、行業(yè)信息建立行業(yè)間的關(guān)系模型;通過機器學(xué)習(xí),可發(fā)現(xiàn)各個行業(yè)間的關(guān)聯(lián)度,如果某一行業(yè)發(fā)生了行業(yè)風險或高風險事件,根據(jù)關(guān)聯(lián)關(guān)系可以及時預(yù)測有潛在風險的其他行業(yè),從而可以幫助金融機構(gòu)做出預(yù)判,盡早地規(guī)避風險。 除此以外,通過知識圖譜,也可以將行業(yè)和企業(yè)之間數(shù)據(jù)進行連接,借助對行業(yè)的潛在風險的預(yù)測,能夠及時發(fā)現(xiàn)與該行業(yè)風險或系統(tǒng)性風險相關(guān)聯(lián)的企業(yè)客戶。例如,某地區(qū)某行業(yè)連續(xù)出現(xiàn)了多筆逾期貸款,通過對行業(yè)和客戶的知識圖譜進行分析,可以及時發(fā)現(xiàn)該地區(qū)相關(guān)行業(yè)存在潛在風險的客戶。 (三)客戶精準畫像 面對愈發(fā)激烈的市場競爭,準確的理解客戶意圖、有效匹配客戶需求和自身產(chǎn)品及服務(wù),是金融機構(gòu)在競爭中的軟實力。相較于傳統(tǒng)的渠道獲客方式,新興的智能數(shù)據(jù)挖掘方法,如客戶畫像體系和精準營銷模型,在營銷場景中具備明顯優(yōu)勢??蛻舢嬒裼泻芏喾N做法,除了傳統(tǒng)的客戶標簽之外,知識圖譜能更好的反應(yīng)與用戶相關(guān)的關(guān)系、事件、行為等因子,使畫像更具有結(jié)構(gòu)化、動態(tài)化的過程。結(jié)合這些實時、動態(tài)、結(jié)構(gòu)化的基礎(chǔ)畫像服務(wù),為客戶分類、精準營銷等上層應(yīng)用提供基礎(chǔ)。 (四)信息多維化可視化展示 基于知識圖譜,我們也可以實現(xiàn)信息多維化可視化展示的功能。比如,通過一個借款人的身份證號,知識圖譜中就會出現(xiàn)與之相關(guān)的借款記錄、聯(lián)系人信息、行為特征、職業(yè)、同業(yè)等關(guān)聯(lián)標簽信息。通過知識圖譜的可視化展,示把復(fù)雜的關(guān)聯(lián)非常直觀的呈現(xiàn)出來,使得各類信息的整體關(guān)聯(lián)情況可以一目了然。 除上述應(yīng)用場景外,知識圖譜還能在個性化營銷、獲客、失聯(lián)找回、風險預(yù)測等方面大有可為。利用圖譜技術(shù)勾勒客戶關(guān)系網(wǎng)絡(luò),可以幫助保險業(yè)務(wù)員展業(yè),非結(jié)構(gòu)化數(shù)據(jù)的加入便于發(fā)現(xiàn)客群特征,設(shè)計定制化的營銷方案。 三、知識圖譜技術(shù)在陽光保險的落地應(yīng)用情況 (一)陽光產(chǎn)險信保事業(yè)部應(yīng)用知識圖譜技術(shù)大大提升反欺詐水平 長期以來,陽光產(chǎn)險信保是業(yè)務(wù)業(yè)務(wù)人員需要根據(jù)貸款申請人信息及關(guān)聯(lián)的歷史貸款人信息進行風險評估,而當申請人涉及復(fù)雜社交網(wǎng)絡(luò)時,業(yè)務(wù)人員難以理清關(guān)系,這是一個很大的“痛點”。2017年11月,知識圖譜技術(shù)正式應(yīng)用于產(chǎn)險信保反欺詐環(huán)節(jié)。截至2017年12月底,共發(fā)現(xiàn)18起重大案件(涉及人數(shù)大于5人的案件),較上線前僅憑人工發(fā)現(xiàn)的案件量提升了8.5倍。知識圖譜反欺詐系統(tǒng)能以可視化的方式勾勒出貸款人個人信息及社會關(guān)系,為反欺詐工作提供了更多線索,增強了反欺詐工作人員的風險識別能力,也提升了他們的工作效率。 
陽光產(chǎn)險信保事業(yè)部知識圖譜項目示意圖 (二)惠金所應(yīng)用知識圖譜技術(shù)開展精準行銷 陽光保險旗下惠金所業(yè)務(wù)當中,邀請好友功能建立了客戶與客戶之間的聯(lián)系。注冊會員和邀請關(guān)系,構(gòu)成了知識圖譜的兩大元素,即實體和關(guān)系。利用知識圖譜的特性,以邀請與被邀請關(guān)系作為基礎(chǔ),建立用戶間的關(guān)系圖譜,實現(xiàn)以更清晰及便捷的方式查詢客戶之間的關(guān)系,評估路徑傳播能力,鎖定優(yōu)質(zhì)客戶群及潛在價值客戶?;萁鹚R圖譜項目一期已上線應(yīng)用。基于“有錢人的朋友也是有錢人”等規(guī)則,利用領(lǐng)軍人物及圖譜結(jié)構(gòu)推測整個圈子的價值,從而支持客戶運營管理,提升業(yè)務(wù)價值目標。 
陽關(guān)保險旗下惠金所知識圖譜項目示意圖 四、工作建議 (一)要加快知識圖譜等人工智能技術(shù)的應(yīng)用研究。要將人工智能技術(shù)(包括深度學(xué)習(xí)、人臉識別、知識圖譜等技術(shù))列入保險業(yè)發(fā)展戰(zhàn)略,追求人工智能與保險業(yè)的深度融合,開展基礎(chǔ)理論、重點領(lǐng)域、交融模式和關(guān)鍵技術(shù)系統(tǒng)研究,推動知識圖譜等人工智能技術(shù)成為行業(yè)轉(zhuǎn)型升級和提升保險服務(wù)實體經(jīng)濟能力的強有力支撐。 (二)要積極借助大數(shù)據(jù)信息平臺和區(qū)塊鏈平臺擴充數(shù)據(jù)信息量。目前,知識圖譜技術(shù)在各家保險公司的運用主要是基于內(nèi)部交易數(shù)據(jù),但這些數(shù)據(jù)資源相當有限。各保險公司可與部分大數(shù)據(jù)信息平臺合作,或者接入?yún)^(qū)塊鏈聯(lián)盟,以合法方式獲取更多有效數(shù)據(jù),構(gòu)建基于個體更多維度的信息連接,從而提高信息識別能力和關(guān)系推理能力。 (三)要大力提高保險數(shù)據(jù)真實性水平,建構(gòu)完善可靠的知識圖譜網(wǎng)絡(luò)。從目前看,保險行業(yè)投保環(huán)節(jié)信息不真實的現(xiàn)象在某種程度上較為普遍??蛻粼谕侗r,不少信息是虛假的,也可能是業(yè)務(wù)人員代為填寫。數(shù)據(jù)不真實,需要大量的人力物力進行數(shù)據(jù)清洗,且極容易造成個別關(guān)系鏈條缺失,影響了關(guān)系網(wǎng)絡(luò)的構(gòu)建,進而影響知識圖譜的全面多維信息判斷功能的發(fā)揮。各保險公司要嚴格按照中國保監(jiān)會《關(guān)于強化保險監(jiān)管 打擊違法違規(guī)行為 整治市場亂象的通知》,切實做好客戶信息真實性管理,為知識圖譜技術(shù)的運用奠定堅實基礎(chǔ),以更好地提高客戶服務(wù)質(zhì)量,保護消費者合法權(quán)益。
|