一文章提綱
最近,人工智能(AI)和機(jī)器學(xué)習(xí)(ML)模型在各個(gè)領(lǐng)域的應(yīng)用都取得了顯著的進(jìn)展,相關(guān)討論也在不斷增多。學(xué)界認(rèn)為,AI和ML模型應(yīng)當(dāng)是透明的,可解釋的和可信的。 在此背景下,可解釋AI(XAI)領(lǐng)域在迅速擴(kuò)張。通過(guò)解釋一些復(fù)雜模型,比如深度神經(jīng)網(wǎng)絡(luò)(DNN)結(jié)果如何生成,可解釋AI在提高人工智能系統(tǒng)可信度和透明度方面前景廣闊。此外,許多研究員和業(yè)內(nèi)人士認(rèn)為,使用數(shù)據(jù)起源去解釋這些復(fù)雜的模型有助于提高基于人工智能系統(tǒng)的透明度。 本文對(duì)數(shù)據(jù)起源、可解釋AI(XAI)和可信賴AI(TAI)進(jìn)行系統(tǒng)的文獻(xiàn)綜述,以解釋基本概念,說(shuō)明數(shù)據(jù)起源文件可以用來(lái)提升基于人工智能系統(tǒng)實(shí)現(xiàn)可解釋性。此外,文中還討論了這個(gè)領(lǐng)域近期的發(fā)展模式,并對(duì)未來(lái)的研究進(jìn)行展望。 對(duì)于有意了解關(guān)于數(shù)據(jù)起源,XAI和TAI的實(shí)質(zhì)的諸多學(xué)者和業(yè)界人士,希望本文能成為助力研究的一個(gè)起點(diǎn)。 ![]() 一文章提綱 1. 引言 2. XAI和TAI的基本概念 3. 數(shù)據(jù)起源, XAI, TAI的文獻(xiàn)計(jì)量分析 4. 數(shù)據(jù)起源, XAI, TAI的關(guān)系的思考 5. 數(shù)據(jù)起源, XAI, TAI未來(lái)十年發(fā)展趨勢(shì) 6. 結(jié)論 二內(nèi)容總結(jié) 引言 人工智能的應(yīng)用廣泛,且對(duì)人類影響深遠(yuǎn)。但現(xiàn)有的模型只有結(jié)果而不涉及過(guò)程,因此,很多人擔(dān)心這些模型不透明,不公平。比如“機(jī)器學(xué)習(xí)和深度學(xué)習(xí)是怎么工作,怎么產(chǎn)生結(jié)果”是一個(gè)黑箱問(wèn)題。對(duì)此,有一個(gè)解決辦法是通過(guò)XAI,也就是建設(shè)TAI去解釋復(fù)雜模型。 作者引用文獻(xiàn)闡述XAI和TAI的技術(shù)方法——數(shù)據(jù)起源的重要性和有效性。本文對(duì)這三者進(jìn)行文獻(xiàn)綜述并關(guān)注他們?cè)跀?shù)據(jù)科學(xué)中的應(yīng)用?;陉P(guān)鍵詞在Scopus文獻(xiàn)庫(kù)中進(jìn)行文獻(xiàn)搜索,采用滾雪球的策略研究2010年到2020年的論文。 XAI和TAI的基本概念
作者先列舉了多例AI和機(jī)器學(xué)習(xí)的漏洞證明了提高可解釋性的重要。又說(shuō)明TAl的基本原則是建立合法透明的AI系統(tǒng)。然后列舉各個(gè)國(guó)家在數(shù)據(jù)科學(xué)領(lǐng)域到XAI方法和戰(zhàn)略計(jì)劃,學(xué)者Wing擴(kuò)充了計(jì)算機(jī)系統(tǒng)的維度,并認(rèn)為需要權(quán)衡多種維度。 ![]() ![]()
![]() 這些方法可以生成結(jié)果,但是為了增加AI系統(tǒng)的透明度,需要應(yīng)用數(shù)據(jù)起源作為XAI的補(bǔ)充技術(shù)。 多方面的文獻(xiàn)計(jì)量分析
文中進(jìn)行文獻(xiàn)計(jì)量分析去搜集這三者之間在論文中相互關(guān)聯(lián)的證據(jù)。作者說(shuō)明選擇數(shù)據(jù)庫(kù)的原因和查詢的關(guān)鍵字以及分析工具是Bibliometrix和VOS Viewer。 ![]() ![]() 三者關(guān)系思考
作者進(jìn)行文獻(xiàn)綜述,整理研究主題后得出: ![]() 文中也介紹了一些能夠使得Provenance文檔化的工具,比如W3C PROV本體,OpenML等。
對(duì)于現(xiàn)實(shí)世界的實(shí)踐,作者進(jìn)行文獻(xiàn)綜述,講述數(shù)據(jù)起源模型類別,W3C PROV的六個(gè)組件,然后作者簡(jiǎn)單介紹Renku等應(yīng)用工具軟件。 未來(lái)十年展望
本部分討論了在AI/ML模型中造成偏差的原因,數(shù)據(jù)不可追蹤,沒(méi)有數(shù)據(jù)起源支持的決定是不可信的。 這項(xiàng)工作是社會(huì)-技術(shù)交叉領(lǐng)域問(wèn)題,需要從兩方面解決問(wèn)題。 開發(fā)數(shù)據(jù)起源功能應(yīng)用前應(yīng)掌握用戶需求 應(yīng)開發(fā)更多的自動(dòng)化工具記錄數(shù)據(jù)起源,并將其標(biāo)準(zhǔn)化、使數(shù)據(jù)起源記錄可查詢可訪問(wèn)。 結(jié)論
用事后解釋的方法來(lái)解釋AI或機(jī)器學(xué)習(xí)模型是不夠的,需要數(shù)據(jù)起源加入增加系統(tǒng)可信度和透明度。作者總結(jié)了文章行文順序,強(qiáng)調(diào)數(shù)據(jù)起源對(duì)于XAI和TAI的重要性。 |
|
來(lái)自: 小飛俠cawdbof0 > 《智能》