今年6月,烏鴉君曾寫過(guò),反AI平臺(tái)Cara在短短一周時(shí)間里,用戶量就從4萬(wàn)增至80萬(wàn),一躍成為美國(guó)社交應(yīng)用榜Top5,甚至超過(guò)了X、Reddit、Discord等。(詳見《9天用戶暴漲80萬(wàn),躋身美國(guó)社交APPTop5!這款反AI產(chǎn)品火了》) 今天,烏鴉君給大家講下另一個(gè)成功的反AI產(chǎn)品,GPTZero。 與Cara主打防止AI偷圖不同,GPTZero能夠準(zhǔn)確識(shí)別AI創(chuàng)作的內(nèi)容,進(jìn)而有效防止AI生成內(nèi)容的濫用。 隨著AI技術(shù)的滲透,GPTZero的客戶群體正在快速增長(zhǎng),用戶畫像已經(jīng)從單一的教師群體擴(kuò)展為,政府采購(gòu)機(jī)構(gòu)、慈善機(jī)構(gòu)、招聘經(jīng)理、數(shù)據(jù)標(biāo)注員等。在過(guò)去6個(gè)月里,GPTZero的用戶規(guī)模從100萬(wàn)增長(zhǎng)到400萬(wàn),增長(zhǎng)300%。 不僅用戶量越來(lái)越多,收入還蹭蹭漲。隨著用戶量的快速上漲,GPTZero的ARR(經(jīng)常性年收入)增長(zhǎng)了500%,并已經(jīng)實(shí)現(xiàn)盈利。 / 01 / 越好懂越是AI GPTZero有打假絕招 這兩年,最先開始打假AI的是美國(guó)中學(xué)老師,他們從去年4月就開始了。 老師為什么要打擊AI呢?經(jīng)常寫家庭作業(yè)的朋友們就知道了,有軟件幫忙寫作業(yè)是多么爽。而無(wú)論是中國(guó)還是美國(guó)的孩子,都非常依賴借助AI來(lái)寫作業(yè),所以我國(guó)AI搜題工具(作業(yè)幫旗下Quetion.AI和字節(jié)旗下Gauth)出海成績(jī)優(yōu)異。這個(gè)現(xiàn)象在ChatGPT發(fā)布后變得更猖狂。 道高一尺魔高一丈,從去年開始就有一些聰明的老師想到,用AI來(lái)打敗AI。他們廣泛地使用一個(gè)叫做GPTZero的AI文本檢測(cè)工具。GPTZero公司也迅速與美國(guó)教師聯(lián)合會(huì)達(dá)成了協(xié)議。 有了這個(gè)工具,媽媽再也不用擔(dān)心AI幫孩子寫作業(yè)了。 AI最懂AI,作為一個(gè)反AI產(chǎn)品,GPTZero主打的是識(shí)別文本中的AI成分。老師們只需要在網(wǎng)頁(yè)上放上GPTZero,那么你在作業(yè)里放了任意GPT-4、Claude等大模型生成的文本內(nèi)容,都逃不過(guò)它的眼睛。 它還有相對(duì)精確的數(shù)據(jù),能算出小孩抄了多少,情節(jié)嚴(yán)重者當(dāng)然會(huì)引起老師的重視。 這樣的AI工具,對(duì)于慣用AI搜索的人群也有意義。AI搜索有時(shí)會(huì)引用純AI生成的文章,普通人有時(shí)很難辨別出AI生成的內(nèi)容,從而錯(cuò)誤地引用。 比如用Perplexity搜索“谷歌前CEO Eric Schmidt的AI無(wú)人戰(zhàn)斗機(jī)”,谷歌引用一條信息來(lái)源(網(wǎng)頁(yè)中文章名為《谷歌前CEO Eric Schmidt正在研發(fā)軍用人工智能無(wú)人機(jī)》),其文章被檢測(cè)出AI成分達(dá)到了98%。 ▲用Perplexity搜索“谷歌前CEO Eric Schmidt的AI無(wú)人戰(zhàn)斗機(jī)”,Perplexity的回答出現(xiàn)了問題,P2為Perplexity引用的網(wǎng)址,該網(wǎng)頁(yè)刊登AI生成文章的網(wǎng)頁(yè) 為了更好地了解GPTZero打假AI的能力,烏鴉君將不同類型的內(nèi)容交給GPTZero識(shí)別。從結(jié)果來(lái)看,GPTZero基本能夠準(zhǔn)確分辨人或者AI創(chuàng)作的內(nèi)容。 比如,在我的提示下,GPT-4創(chuàng)作了小故事《西游記新編(一)》,GPTZero準(zhǔn)確地檢測(cè)出AI內(nèi)容(AI生成內(nèi)容占比100%)。另外,對(duì)于Claude和文心一言創(chuàng)作的內(nèi)容,GPTZero也能夠得出較準(zhǔn)確的結(jié)論。 而面對(duì)AI和人類共同創(chuàng)作的內(nèi)容,比如我和GPT-4共同撰寫的小故事《西游記新編(二)》,GPTZero識(shí)別的結(jié)果會(huì)相對(duì)偏離真實(shí)情況。 說(shuō)起來(lái),GPTZero的工作原理其實(shí)并不復(fù)雜,就是通過(guò)AI算法分析文本的復(fù)雜度和模式,從而判斷其可能的來(lái)源。 烏鴉君將其翻譯成下面這個(gè)秘訣,記住它,你也能變成一眼識(shí)AI: 越簡(jiǎn)單的文字越可能是AI寫的,越難懂的文字越可能是人類寫的。 對(duì)比AI來(lái)說(shuō),人類寫出的東西的不難被理解,而且還會(huì)不自然。這有些逆反普通人的認(rèn)知了。當(dāng)GPTZero對(duì)一段文字的困惑越多,說(shuō)明這篇文章越接近人類寫作的特征。 原因在于,AI生成的文本內(nèi)容,文字會(huì)更可能通順而自然,也更容易預(yù)測(cè),不會(huì)給GPTZero造成理解障礙。而人類的寫作則不同,它往往會(huì)包含更具創(chuàng)意的詞語(yǔ)選擇,甚至偶爾還會(huì)出現(xiàn)拼寫錯(cuò)誤等問題,會(huì)讓GPTZero萌生出多個(gè)問號(hào)。 還有一個(gè)識(shí)別AI的訣竅,就是人類寫作的節(jié)奏感,AI學(xué)不來(lái)。 文字的節(jié)奏感,指的是人們文字在表達(dá)過(guò)程中通過(guò)聲調(diào)、節(jié)奏、押韻等方式所形成的音樂感和流暢感。這東西AI根本學(xué)不會(huì),AI比人類偏好書寫句子長(zhǎng)度平均、結(jié)構(gòu)常規(guī)、風(fēng)格單調(diào)的東西。 說(shuō)完了訣竅,我們看看GTPZero還有哪些功能。除了最核心的AI文本內(nèi)容檢測(cè)外,GTPZero還內(nèi)置了“人類寫作認(rèn)證”,這是他們基于專有寫作模式分析器推出的功能(認(rèn)證文檔確實(shí)由人類寫作,而非AI生成)。 GPTzero在去年1月走紅,最初的客戶是教師群體,宣稱自己可以幫忙檢測(cè)AI生成的學(xué)生作業(yè),到如今,GPTZero的客戶群體已經(jīng)從單一的教師群體擴(kuò)展為,政府采購(gòu)機(jī)構(gòu)、慈善機(jī)構(gòu)、招聘經(jīng)理、數(shù)據(jù)標(biāo)注員等。 GPTZero將遠(yuǎn)期目標(biāo)定位于AI幻覺檢測(cè)。由于幻覺是生成式AI行業(yè)的難以根除的問題,這家公司預(yù)備推出基于LLM訓(xùn)練數(shù)據(jù)集的免費(fèi)AI文本版權(quán)檢查,幫助他們生成更廣泛的幻覺檢測(cè)訓(xùn)練數(shù)據(jù)。 / 02 / AI打假方興未艾 盤點(diǎn)五大AI打假工具 隨著AI生成創(chuàng)新工具集中爆發(fā),AI假圖假視頻盛行。 從去年開始,AI打假應(yīng)用發(fā)展迅猛,可檢測(cè)的類型涵蓋文字、圖片、視頻、音頻等內(nèi)容形態(tài),技術(shù)涉及分類器、水印和元數(shù)據(jù)等。 除了剛剛提過(guò)的文字檢測(cè)工具,在圖像檢測(cè)領(lǐng)域,也出現(xiàn)了許多檢測(cè)圖像的真實(shí)性、來(lái)源以及是否經(jīng)過(guò)篡改的反AI工具。比如通過(guò)分析圖像的像素特征、元數(shù)據(jù)、與已知數(shù)據(jù)庫(kù)的對(duì)比等方式來(lái)進(jìn)行判斷,例如AI or Not和Nuanced。 在聲音、音頻內(nèi)容檢測(cè)工具方面,有以下一些技術(shù)可以實(shí)現(xiàn),如基于音頻特征分析(細(xì)分為韻律特征、頻譜特征分析),還有利用機(jī)器學(xué)習(xí)和深度學(xué)習(xí)模型(細(xì)分為訓(xùn)練分類器、異常檢測(cè))等。例如Project Mockingbird(聲音檢測(cè))、AI-generated Detector(音樂檢測(cè)) 以下是一些烏鴉君認(rèn)為值得關(guān)注的AI檢測(cè)型工具: 1、多媒體內(nèi)容審核工具Hive AI,打擊電商虛假宣傳 AI生成時(shí)代,可能會(huì)讓虛假宣傳更加猖獗。就拿網(wǎng)購(gòu)來(lái)說(shuō),如果大量商家使用AI生成式圖片,普通人可能會(huì)相信虛假的效果而去購(gòu)買商品。商家有必要去克制AI假圖、假視頻在購(gòu)物平臺(tái)上的含量。 Hive AI就是當(dāng)下較為全能的AI檢測(cè)工具,無(wú)論是文本、圖像還是視頻,都能幫助客戶識(shí)別AI內(nèi)容。通過(guò)將上傳的照片與在線文本材料、圖片、視頻庫(kù)進(jìn)行對(duì)比,找出AI生成的內(nèi)容。 Hive AI如今已經(jīng)有各種各樣的使用案例,主要應(yīng)用于社交和電子商務(wù)平臺(tái),比如支付平臺(tái)Visa、網(wǎng)劇平臺(tái)Netflix、社交平臺(tái)Reddit。憑借在多個(gè)平臺(tái)進(jìn)行識(shí)別的優(yōu)勢(shì),Hive AI在去年完成新一輪2億美元融資(但信息未公開)。 2、高端多媒體檢測(cè)工具AI or Not,已獲10萬(wàn)用戶 AI or Not是面向新聞媒體、社交平臺(tái)、電子商務(wù)的多媒體檢測(cè)工具,和上述工具不同的是,它能提供詳細(xì)的分析報(bào)告。 具體來(lái)說(shuō),AI or Not可以分析文本內(nèi)容,識(shí)別是否由AI生成,如GPT-3或其他語(yǔ)言模型。圖片方面,它可以利用深度學(xué)習(xí)技術(shù)檢測(cè)圖像是否經(jīng)過(guò)AI生成或編輯,識(shí)別深偽(Deepfake)圖像,也就是說(shuō),它對(duì)AI圖像檢測(cè)的力度更大。 另外,它也可以分析視頻內(nèi)容,檢測(cè)是否經(jīng)過(guò)AI生成或修改,如Deepfake視頻。提供幀級(jí)別的分析,確保檢測(cè)結(jié)果的準(zhǔn)確性和細(xì)節(jié)。 目前月度收費(fèi)為個(gè)人版5美元/月,企業(yè)版250美元/月。該收費(fèi)工具目前已經(jīng)獲得了10萬(wàn)用戶,看來(lái)國(guó)外比較愿意為這種社交內(nèi)容打假付費(fèi)。 ▲使用范例 3、監(jiān)控也要防范AI造假,Nuanced準(zhǔn)確率高達(dá)97% 相比上面主要面向深度仿真、藝術(shù)原創(chuàng)性的AI or Not,Nuanced更適用于超市監(jiān)控、貨物倉(cāng)儲(chǔ)情況等對(duì)圖像質(zhì)量要求不高的低端場(chǎng)景。 Nuanced這個(gè)詞本身有“微妙的”“具有細(xì)微差別的”的意思。也就是說(shuō),Nauanced可以對(duì)一段監(jiān)控報(bào)告視頻進(jìn)行精細(xì)的檢測(cè)。具體來(lái)說(shuō),Nauanced不只是檢測(cè)人和貨物,還能辨別細(xì)微差別,例如面部表情、人們之間的互動(dòng)以及環(huán)境背景。 另外,Nuanced實(shí)時(shí)高效處理大量圖像,適合在線和離線應(yīng)用。 4、預(yù)防電話詐騙,檢測(cè)工具Project Mockingbird準(zhǔn)確率達(dá)90% AI聲音的影響可能比我們想象中得更大,不法分子盯上老年人,利用AI生成的聲音進(jìn)行詐騙。央視網(wǎng)報(bào)道,去年11月,有騙子用AI生成的受害者親人的聲音詐騙,騙去40萬(wàn)。 殺毒軟件McAfee公司推出聲音檢測(cè)工具Project Mockingbird,幫助用戶檢測(cè)、阻止AI生成的語(yǔ)音詐騙行為的項(xiàng)目。它基于由AI驅(qū)動(dòng)的 “深度偽造” 音頻檢測(cè)技術(shù),在聆聽給定的語(yǔ)音之后,可檢測(cè)音頻是否為真人發(fā)音。 為了在視頻中精準(zhǔn)定位并識(shí)別可能由AI生成的音頻片段,Project Mockingbird還融合了 AI 驅(qū)動(dòng)的上下文、行為和分類檢測(cè)模型。官方聲稱該工具成功率超過(guò)90%,目前還不向用戶收取額外費(fèi)用。 5、一分鐘掃5000首歌,幫助唱片平臺(tái)防止發(fā)布的AI音樂侵權(quán) AI生成的音樂一直伴隨著版權(quán)爭(zhēng)議,就連OpenAI都有暗示過(guò)GPT-4o生成的音樂可能會(huì)侵犯別的音樂的版權(quán)。 音樂發(fā)行商如何自我防范?現(xiàn)在已經(jīng)有專門檢測(cè)AI生成式音樂的工具——AI-Generated Detecto,這項(xiàng)工具一分鐘內(nèi)可以掃描5000首曲目!并保證準(zhǔn)確率高達(dá)98.5%。 這是巴黎蓬皮杜音樂技術(shù)研究中心IRCAM的IRCAM Amplify公司推出的識(shí)別AI生成音樂的工具,目標(biāo)客戶主要是唱片公司、出版商、版權(quán)管理組織和音樂流媒體平臺(tái)。 文/朗朗 |
|
來(lái)自: 烏鴉智能說(shuō) > 《待分類》