地址: https://www./paper/90d0d696560bc88ea93f629b478a2128 為了解決各種在線應(yīng)用中的信息爆炸問(wèn)題,提高用戶體驗(yàn),推薦系統(tǒng)被提出來(lái)進(jìn)行用戶偏好建模。盡管人們已經(jīng)做出了許多努力來(lái)實(shí)現(xiàn)更加個(gè)性化的推薦,但是推薦系統(tǒng)仍然面臨著一些挑戰(zhàn),比如數(shù)據(jù)稀疏性和冷啟動(dòng)。近年來(lái),以知識(shí)圖譜作為邊信息生成推薦引起了人們的極大興趣。這種方法不僅可以緩解上述問(wèn)題,提供更準(zhǔn)確的推薦,而且可以對(duì)推薦的項(xiàng)目進(jìn)行解釋。本文對(duì)基于知識(shí)圖譜的推薦系統(tǒng)進(jìn)行了系統(tǒng)的研究。我們收集了這一領(lǐng)域最近發(fā)表的論文,并從兩個(gè)角度進(jìn)行了總結(jié)。一方面,我們通過(guò)研究論文如何利用知識(shí)圖譜進(jìn)行準(zhǔn)確和可解釋的推薦來(lái)研究所提出的算法。另一方面,我們介紹了這些工作中使用的數(shù)據(jù)集。最后,我們提出了幾個(gè)可能的研究方向。 概述 近年來(lái),將知識(shí)圖譜(KG)作為邊信息引入推薦系統(tǒng)引起了研究者的關(guān)注。KG是一個(gè)異構(gòu)圖,其中節(jié)點(diǎn)作為實(shí)體,邊表示實(shí)體之間的關(guān)系??梢詫㈨?xiàng)目及其屬性映射到KG中,以了解項(xiàng)目[2]之間的相互關(guān)系。此外,還可以將用戶和用戶端信息集成到KG中,從而更準(zhǔn)確地捕捉用戶與物品之間的關(guān)系以及用戶偏好。圖1是一個(gè)基于KG的推薦示例,其中電影“Avatar”和“Blood Diamond”被推薦給Bob。此KG包含用戶、電影、演員、導(dǎo)演和類型作為實(shí)體,而交互、歸屬、表演、導(dǎo)演和友誼是實(shí)體之間的關(guān)系。利用KG,電影與用戶之間存在不同的潛關(guān)系,有助于提高推薦的精度。基于知識(shí)的推薦系統(tǒng)的另一個(gè)優(yōu)點(diǎn)是推薦結(jié)果[14]的可解釋性。在同一個(gè)示例中,根據(jù)user-item圖中的關(guān)系序列可以知道向Bob推薦這兩部電影的原因。例如,推薦《阿凡達(dá)》的一個(gè)原因是,《阿凡達(dá)》與鮑勃之前看過(guò)的《星際穿越》屬于同一類型。最近提出了多種KGs,如Freebase[15]、DBpedia[16]、YAGO[17]、谷歌的知識(shí)圖譜[18],方便了KGs的推薦構(gòu)建。 本次綜述的目的是提供一個(gè)全面的文獻(xiàn)綜述利用KGs作為側(cè)信息的推薦系統(tǒng)。在我們的研究過(guò)程中,我們發(fā)現(xiàn)現(xiàn)有的基于KG的推薦系統(tǒng)以三種方式應(yīng)用KGs: 基于嵌入的方法、基于路徑的方法和統(tǒng)一的方法。我們?cè)敿?xì)說(shuō)明了這些方法的異同。除了更準(zhǔn)確的推薦之外,基于KG的推薦的另一個(gè)好處是可解釋性。我們討論了不同的作品如何使用KG來(lái)進(jìn)行可解釋的推薦。此外,根據(jù)我們的綜述,我們發(fā)現(xiàn)KGs在多個(gè)場(chǎng)景中充當(dāng)了輔助信息,包括電影、書(shū)籍、新聞、產(chǎn)品、興趣點(diǎn)(POIs)、音樂(lè)和社交平臺(tái)的推薦。我們收集最近的作品,根據(jù)應(yīng)用程序?qū)λ鼈冞M(jìn)行分類,并收集在這些作品中評(píng)估的數(shù)據(jù)集。 本次綜述的組織如下: 在第二部分,我們介紹了KGs和推薦系統(tǒng)的基礎(chǔ);在第3節(jié)中,我們介紹了本文中使用的符號(hào)和概念;在第4節(jié)和第5節(jié)中,我們分別從方法和評(píng)價(jià)數(shù)據(jù)集的角度對(duì)基于知識(shí)的推薦系統(tǒng)進(jìn)行了綜述;第六部分提出了該領(lǐng)域的一些潛在研究方向;最后,我們?cè)诘?節(jié)總結(jié)了這次調(diào)查。 術(shù)語(yǔ)概念 圖2 常用知識(shí)圖譜集合 圖3 符號(hào) 知識(shí)圖譜推薦系統(tǒng)方法 Embedding-based方法 基于嵌入的方法通常直接使用來(lái)自KG的信息來(lái)豐富項(xiàng)目或用戶的表示。為了利用KG信息,需要使用知識(shí)圖嵌入(KGE)算法將KG編碼為低秩嵌入。KGE算法可分為兩類[98]:翻譯距離模型,如TransE[99]、TransH[100]、TransR[101]、TransD[102]等;語(yǔ)義匹配模型,如DistMult[103]等。 根據(jù)KG中是否包含用戶,可以將基于嵌入的方法分為兩個(gè)類。在第一種方法中,KGs由項(xiàng)目及其相關(guān)屬性構(gòu)成,這些屬性是從數(shù)據(jù)集或外部知識(shí)庫(kù)中提取的。我們將這樣的圖命名為項(xiàng)目圖。注意,用戶不包括在這樣的項(xiàng)目圖中。遵循這一策略的論文利用知識(shí)圖嵌入(KGE)算法對(duì)圖進(jìn)行編碼,以更全面地表示項(xiàng)目,然后將項(xiàng)目側(cè)信息集成到推薦框架中。其大意可以如下所示。 另一種embedding-based方法直接建立user-item圖,用戶,項(xiàng)目,以及相關(guān)屬性函數(shù)作為節(jié)點(diǎn)。在用戶-項(xiàng)目圖中,屬性級(jí)關(guān)系(品牌、類別等)和用戶級(jí)關(guān)系(共同購(gòu)買、共同查看等)都是邊。 Path-based Methods 基于路徑的方法構(gòu)建一個(gè)用戶-項(xiàng)目圖,并利用圖中實(shí)體的連接模式進(jìn)行推薦?;诼窂降姆椒ㄔ?013年就已經(jīng)開(kāi)發(fā)出來(lái)了,傳統(tǒng)的論文將這種方法稱為HIN中的推薦方法。通常,這些模型利用用戶和/或項(xiàng)的連接性相似性來(lái)增強(qiáng)推薦。 統(tǒng)一方法 基于嵌入的方法利用KG中用戶/項(xiàng)的語(yǔ)義表示進(jìn)行推薦,而基于路徑的方法使用語(yǔ)義連接信息,并且兩種方法都只利用圖中信息的一個(gè)方面。為了更好地利用KG中的信息,提出了將實(shí)體和關(guān)系的語(yǔ)義表示和連通性信息結(jié)合起來(lái)的統(tǒng)一方法。統(tǒng)一的方法是基于嵌入傳播的思想。這些方法以KG中的連接結(jié)構(gòu)為指導(dǎo),對(duì)實(shí)體表示進(jìn)行細(xì)化。 總結(jié): 基于嵌入的方法使用KGE方法對(duì)KG(項(xiàng)目圖或用戶-項(xiàng)目圖)進(jìn)行預(yù)處理,以獲得實(shí)體和關(guān)系的嵌入,并將其進(jìn)一步集成到推薦框架中。然而,這種方法忽略了圖中信息的連通性模式,很少有文獻(xiàn)能夠給出有原因的推薦結(jié)果?;诼窂降姆椒ɡ糜脩?項(xiàng)圖,通過(guò)預(yù)先定義元路徑或自動(dòng)挖掘連接模式來(lái)發(fā)現(xiàn)項(xiàng)的路徑級(jí)相似性?;诼窂降姆椒ㄟ€可以為用戶提供對(duì)結(jié)果的解釋。將基于嵌入的方法與基于路徑的方法相結(jié)合,充分利用雙方的信息是當(dāng)前的研究趨勢(shì)。此外,統(tǒng)一的方法還具有解釋推薦過(guò)程的能力。 圖4 收集論文表。在表格中,Emb代表基于嵌入的方法,Uni代表統(tǒng)一方法,Att’代表注意力機(jī)制,’RL’代表強(qiáng)化學(xué)習(xí),’AE’代表自動(dòng)編碼器,’MF’代表矩陣分解。 代表數(shù)據(jù)集 圖5 不同應(yīng)用場(chǎng)景和相應(yīng)論文的數(shù)據(jù)集集合 未來(lái)方向 在以上幾節(jié)中,我們從更準(zhǔn)確的推薦和可解釋性方面展示了基于知識(shí)的推薦系統(tǒng)的優(yōu)勢(shì)。雖然已經(jīng)提出了許多利用KG作為側(cè)信息進(jìn)行推薦的新模型,但仍然存在一些改進(jìn)的機(jī)會(huì)。在這一部分中,我們概述并討論了一些未來(lái)的研究方向。
專知便捷查看 |
|