最新研究顯示，ChatGP在創(chuàng)造性思維任務(wù)中或超越大部分人類(lèi)

子孫滿(mǎn)堂康復(fù)師 2023-09-21

展開(kāi)全文

來(lái)源：生物世界 2023-09-21 11:44

該研究指出，ChatGPT等基于大語(yǔ)言模型（LLM）的AI對(duì)話機(jī)器人在創(chuàng)造性思維任務(wù)上或能超越一般人類(lèi)，該任務(wù)要求受試者想出日常用品的替代用途（發(fā)散性思維的一個(gè)例子）。

挪威卑爾根大學(xué)、斯塔萬(wàn)格大學(xué)的研究人員在 Scientific Reports 期刊發(fā)表了題為：Best humans still outperform artificial intelligence in a creative divergent thinking task 的研究論文。

該研究指出，ChatGPT等基于大語(yǔ)言模型（LLM）的AI對(duì)話機(jī)器人在創(chuàng)造性思維任務(wù)上或能超越一般人類(lèi)，該任務(wù)要求受試者想出日常用品的替代用途（發(fā)散性思維的一個(gè)例子）。不過(guò)，得分最高的人類(lèi)受試者依然能超過(guò)對(duì)話機(jī)器人的最佳答案。

發(fā)散性思維通常是指與創(chuàng)造性相關(guān)的一類(lèi)思維過(guò)程，需要為特定任務(wù)想出各種不同創(chuàng)意或?qū)Σ摺０l(fā)散性思維一般通過(guò)替代用途任務(wù)（Alternate Uses Task，AUT）進(jìn)行評(píng)估，受試者被要求在短時(shí)間內(nèi)想出某個(gè)日常用品的其他用途，越多越好。受試者的回答從四個(gè)類(lèi)別進(jìn)行打分：流利度、靈活性、原創(chuàng)性和精細(xì)度。

在這項(xiàng)研究中，研究團(tuán)隊(duì)讓ChatGPT3、ChatGPT4和Copy.Ai以及人類(lèi)受試者完成四個(gè)物品（繩子、盒子、鉛筆、蠟燭）的替代用途任務(wù)（AUT），并比較了AI和人類(lèi)的答案。研究團(tuán)隊(duì)通過(guò)語(yǔ)義距離（回答與物品原始用途的相關(guān)度）和創(chuàng)造性給回答的原創(chuàng)性打分，他們用一個(gè)計(jì)算方法在0-2的范圍里量化語(yǔ)義距離，同時(shí)讓不知道作答者身份的人類(lèi)打分者在1-5的范圍里客觀評(píng)價(jià)創(chuàng)造性。

平均而言，AI的回答在語(yǔ)義距離（0.95 vs 0.91）和創(chuàng)造性（2.91 vs 2.47）的得分上顯著高于人類(lèi)的回答。人類(lèi)回答在這兩項(xiàng)的得分差距更大——最低分遠(yuǎn)低于AI的回答，但最高分普遍比AI高。最佳人類(lèi)回答在 8個(gè)評(píng)分項(xiàng)中的7項(xiàng)都超過(guò)了所有對(duì)話機(jī)器人的最佳回答。

這些結(jié)果表明，當(dāng)前的AI對(duì)話機(jī)器人想創(chuàng)意的能力至少已與一般人類(lèi)相當(dāng)。但論文作者也指出，他們只評(píng)價(jià)了涉及創(chuàng)造性評(píng)估的單項(xiàng)任務(wù)的表現(xiàn)。作者認(rèn)為，今后的研究或能探索如何將AI融入創(chuàng)造性過(guò)程來(lái)提升人類(lèi)表現(xiàn)。

本站是提供個(gè)人知識(shí)管理的網(wǎng)絡(luò)存儲(chǔ)空間，所有內(nèi)容均由用戶(hù)發(fā)布，不代表本站觀點(diǎn)。請(qǐng)注意甄別內(nèi)容中的聯(lián)系方式、誘導(dǎo)購(gòu)買(mǎi)等信息，謹(jǐn)防詐騙。如發(fā)現(xiàn)有害或侵權(quán)內(nèi)容，請(qǐng)點(diǎn)擊一鍵舉報(bào)。

轉(zhuǎn)藏 分享

QQ空間 QQ好友新浪微博微信

獻(xiàn)花（0） +1

來(lái)自：子孫滿(mǎn)堂康復(fù)師 > 《藥學(xué)科醫(yī)藥研究》

舉報(bào)/認(rèn)領(lǐng)