【原】6個(gè)月新增300萬(wàn)用戶！一眼分辨AI內(nèi)容，又一反AI產(chǎn)品火了

烏鴉智能說(shuō) 2024-08-17 發(fā)布于北京

展開全文

今年6月，烏鴉君曾寫過(guò)，反AI平臺(tái)Cara在短短一周時(shí)間里，用戶量就從4萬(wàn)增至80萬(wàn)，一躍成為美國(guó)社交應(yīng)用榜Top5，甚至超過(guò)了X、Reddit、Discord等。（詳見《9天用戶暴漲80萬(wàn)，躋身美國(guó)社交APPTop5！這款反AI產(chǎn)品火了》）

今天，烏鴉君給大家講下另一個(gè)成功的反AI產(chǎn)品，GPTZero。

與Cara主打防止AI偷圖不同，GPTZero能夠準(zhǔn)確識(shí)別AI創(chuàng)作的內(nèi)容，進(jìn)而有效防止AI生成內(nèi)容的濫用。

隨著AI技術(shù)的滲透，GPTZero的客戶群體正在快速增長(zhǎng)，用戶畫像已經(jīng)從單一的教師群體擴(kuò)展為，政府采購(gòu)機(jī)構(gòu)、慈善機(jī)構(gòu)、招聘經(jīng)理、數(shù)據(jù)標(biāo)注員等。在過(guò)去6個(gè)月里，GPTZero的用戶規(guī)模從100萬(wàn)增長(zhǎng)到400萬(wàn)，增長(zhǎng)300%。

不僅用戶量越來(lái)越多，收入還蹭蹭漲。隨著用戶量的快速上漲，GPTZero的ARR（經(jīng)常性年收入）增長(zhǎng)了500%，并已經(jīng)實(shí)現(xiàn)盈利。

/ 01 / 越好懂越是AI GPTZero有打假絕招

這兩年，最先開始打假AI的是美國(guó)中學(xué)老師，他們從去年4月就開始了。

老師為什么要打擊AI呢？經(jīng)常寫家庭作業(yè)的朋友們就知道了，有軟件幫忙寫作業(yè)是多么爽。而無(wú)論是中國(guó)還是美國(guó)的孩子，都非常依賴借助AI來(lái)寫作業(yè)，所以我國(guó)AI搜題工具（作業(yè)幫旗下Quetion.AI和字節(jié)旗下Gauth）出海成績(jī)優(yōu)異。這個(gè)現(xiàn)象在ChatGPT發(fā)布后變得更猖狂。

道高一尺魔高一丈，從去年開始就有一些聰明的老師想到，用AI來(lái)打敗AI。他們廣泛地使用一個(gè)叫做GPTZero的AI文本檢測(cè)工具。GPTZero公司也迅速與美國(guó)教師聯(lián)合會(huì)達(dá)成了協(xié)議。

有了這個(gè)工具，媽媽再也不用擔(dān)心AI幫孩子寫作業(yè)了。

AI最懂AI，作為一個(gè)反AI產(chǎn)品，GPTZero主打的是識(shí)別文本中的AI成分。老師們只需要在網(wǎng)頁(yè)上放上GPTZero，那么你在作業(yè)里放了任意GPT-4、Claude等大模型生成的文本內(nèi)容，都逃不過(guò)它的眼睛。

它還有相對(duì)精確的數(shù)據(jù)，能算出小孩抄了多少，情節(jié)嚴(yán)重者當(dāng)然會(huì)引起老師的重視。

這樣的AI工具，對(duì)于慣用AI搜索的人群也有意義。AI搜索有時(shí)會(huì)引用純AI生成的文章，普通人有時(shí)很難辨別出AI生成的內(nèi)容，從而錯(cuò)誤地引用。

比如用Perplexity搜索“谷歌前CEO Eric Schmidt的AI無(wú)人戰(zhàn)斗機(jī)”，谷歌引用一條信息來(lái)源（網(wǎng)頁(yè)中文章名為《谷歌前CEO Eric Schmidt正在研發(fā)軍用人工智能無(wú)人機(jī)》），其文章被檢測(cè)出AI成分達(dá)到了98%。

▲用Perplexity搜索“谷歌前CEO Eric Schmidt的AI無(wú)人戰(zhàn)斗機(jī)”，Perplexity的回答出現(xiàn)了問題，P2為Perplexity引用的網(wǎng)址，該網(wǎng)頁(yè)刊登AI生成文章的網(wǎng)頁(yè)

為了更好地了解GPTZero打假AI的能力，烏鴉君將不同類型的內(nèi)容交給GPTZero識(shí)別。從結(jié)果來(lái)看，GPTZero基本能夠準(zhǔn)確分辨人或者AI創(chuàng)作的內(nèi)容。

比如，在我的提示下，GPT-4創(chuàng)作了小故事《西游記新編（一）》，GPTZero準(zhǔn)確地檢測(cè)出AI內(nèi)容（AI生成內(nèi)容占比100%）。另外，對(duì)于Claude和文心一言創(chuàng)作的內(nèi)容，GPTZero也能夠得出較準(zhǔn)確的結(jié)論。

而面對(duì)AI和人類共同創(chuàng)作的內(nèi)容，比如我和GPT-4共同撰寫的小故事《西游記新編（二）》，GPTZero識(shí)別的結(jié)果會(huì)相對(duì)偏離真實(shí)情況。

說(shuō)起來(lái)，GPTZero的工作原理其實(shí)并不復(fù)雜，就是通過(guò)AI算法分析文本的復(fù)雜度和模式，從而判斷其可能的來(lái)源。

烏鴉君將其翻譯成下面這個(gè)秘訣，記住它，你也能變成一眼識(shí)AI：

越簡(jiǎn)單的文字越可能是AI寫的，越難懂的文字越可能是人類寫的。

對(duì)比AI來(lái)說(shuō)，人類寫出的東西的不難被理解，而且還會(huì)不自然。這有些逆反普通人的認(rèn)知了。當(dāng)GPTZero對(duì)一段文字的困惑越多，說(shuō)明這篇文章越接近人類寫作的特征。

原因在于，AI生成的文本內(nèi)容，文字會(huì)更可能通順而自然，也更容易預(yù)測(cè)，不會(huì)給GPTZero造成理解障礙。而人類的寫作則不同，它往往會(huì)包含更具創(chuàng)意的詞語(yǔ)選擇，甚至偶爾還會(huì)出現(xiàn)拼寫錯(cuò)誤等問題，會(huì)讓GPTZero萌生出多個(gè)問號(hào)。

還有一個(gè)識(shí)別AI的訣竅，就是人類寫作的節(jié)奏感，AI學(xué)不來(lái)。

文字的節(jié)奏感，指的是人們文字在表達(dá)過(guò)程中通過(guò)聲調(diào)、節(jié)奏、押韻等方式所形成的音樂感和流暢感。這東西AI根本學(xué)不會(huì)，AI比人類偏好書寫句子長(zhǎng)度平均、結(jié)構(gòu)常規(guī)、風(fēng)格單調(diào)的東西。

說(shuō)完了訣竅，我們看看GTPZero還有哪些功能。除了最核心的AI文本內(nèi)容檢測(cè)外，GTPZero還內(nèi)置了“人類寫作認(rèn)證”，這是他們基于專有寫作模式分析器推出的功能（認(rèn)證文檔確實(shí)由人類寫作，而非AI生成）。

GPTzero在去年1月走紅，最初的客戶是教師群體，宣稱自己可以幫忙檢測(cè)AI生成的學(xué)生作業(yè)，到如今，GPTZero的客戶群體已經(jīng)從單一的教師群體擴(kuò)展為，政府采購(gòu)機(jī)構(gòu)、慈善機(jī)構(gòu)、招聘經(jīng)理、數(shù)據(jù)標(biāo)注員等。

GPTZero將遠(yuǎn)期目標(biāo)定位于AI幻覺檢測(cè)。由于幻覺是生成式AI行業(yè)的難以根除的問題，這家公司預(yù)備推出基于LLM訓(xùn)練數(shù)據(jù)集的免費(fèi)AI文本版權(quán)檢查，幫助他們生成更廣泛的幻覺檢測(cè)訓(xùn)練數(shù)據(jù)。

/ 02 / AI打假方興未艾盤點(diǎn)五大AI打假工具

隨著AI生成創(chuàng)新工具集中爆發(fā)，AI假圖假視頻盛行。

從去年開始，AI打假應(yīng)用發(fā)展迅猛，可檢測(cè)的類型涵蓋文字、圖片、視頻、音頻等內(nèi)容形態(tài)，技術(shù)涉及分類器、水印和元數(shù)據(jù)等。

除了剛剛提過(guò)的文字檢測(cè)工具，在圖像檢測(cè)領(lǐng)域，也出現(xiàn)了許多檢測(cè)圖像的真實(shí)性、來(lái)源以及是否經(jīng)過(guò)篡改的反AI工具。比如通過(guò)分析圖像的像素特征、元數(shù)據(jù)、與已知數(shù)據(jù)庫(kù)的對(duì)比等方式來(lái)進(jìn)行判斷，例如AI or Not和Nuanced。

在聲音、音頻內(nèi)容檢測(cè)工具方面，有以下一些技術(shù)可以實(shí)現(xiàn)，如基于音頻特征分析（細(xì)分為韻律特征、頻譜特征分析），還有利用機(jī)器學(xué)習(xí)和深度學(xué)習(xí)模型（細(xì)分為訓(xùn)練分類器、異常檢測(cè)）等。例如Project Mockingbird（聲音檢測(cè)）、AI-generated Detector（音樂檢測(cè)）

以下是一些烏鴉君認(rèn)為值得關(guān)注的AI檢測(cè)型工具：

1、多媒體內(nèi)容審核工具Hive AI，打擊電商虛假宣傳

AI生成時(shí)代，可能會(huì)讓虛假宣傳更加猖獗。就拿網(wǎng)購(gòu)來(lái)說(shuō)，如果大量商家使用AI生成式圖片，普通人可能會(huì)相信虛假的效果而去購(gòu)買商品。商家有必要去克制AI假圖、假視頻在購(gòu)物平臺(tái)上的含量。

Hive AI就是當(dāng)下較為全能的AI檢測(cè)工具，無(wú)論是文本、圖像還是視頻，都能幫助客戶識(shí)別AI內(nèi)容。通過(guò)將上傳的照片與在線文本材料、圖片、視頻庫(kù)進(jìn)行對(duì)比，找出AI生成的內(nèi)容。

Hive AI如今已經(jīng)有各種各樣的使用案例，主要應(yīng)用于社交和電子商務(wù)平臺(tái)，比如支付平臺(tái)Visa、網(wǎng)劇平臺(tái)Netflix、社交平臺(tái)Reddit。憑借在多個(gè)平臺(tái)進(jìn)行識(shí)別的優(yōu)勢(shì)，Hive AI在去年完成新一輪2億美元融資（但信息未公開）。

2、高端多媒體檢測(cè)工具AI or Not，已獲10萬(wàn)用戶

AI or Not是面向新聞媒體、社交平臺(tái)、電子商務(wù)的多媒體檢測(cè)工具，和上述工具不同的是，它能提供詳細(xì)的分析報(bào)告。

具體來(lái)說(shuō)，AI or Not可以分析文本內(nèi)容，識(shí)別是否由AI生成，如GPT-3或其他語(yǔ)言模型。圖片方面，它可以利用深度學(xué)習(xí)技術(shù)檢測(cè)圖像是否經(jīng)過(guò)AI生成或編輯，識(shí)別深偽（Deepfake）圖像，也就是說(shuō)，它對(duì)AI圖像檢測(cè)的力度更大。

另外，它也可以分析視頻內(nèi)容，檢測(cè)是否經(jīng)過(guò)AI生成或修改，如Deepfake視頻。提供幀級(jí)別的分析，確保檢測(cè)結(jié)果的準(zhǔn)確性和細(xì)節(jié)。

目前月度收費(fèi)為個(gè)人版5美元/月，企業(yè)版250美元/月。該收費(fèi)工具目前已經(jīng)獲得了10萬(wàn)用戶，看來(lái)國(guó)外比較愿意為這種社交內(nèi)容打假付費(fèi)。

▲使用范例

3、監(jiān)控也要防范AI造假，Nuanced準(zhǔn)確率高達(dá)97%

相比上面主要面向深度仿真、藝術(shù)原創(chuàng)性的AI or Not，Nuanced更適用于超市監(jiān)控、貨物倉(cāng)儲(chǔ)情況等對(duì)圖像質(zhì)量要求不高的低端場(chǎng)景。

Nuanced這個(gè)詞本身有“微妙的”“具有細(xì)微差別的”的意思。也就是說(shuō)，Nauanced可以對(duì)一段監(jiān)控報(bào)告視頻進(jìn)行精細(xì)的檢測(cè)。具體來(lái)說(shuō)，Nauanced不只是檢測(cè)人和貨物，還能辨別細(xì)微差別，例如面部表情、人們之間的互動(dòng)以及環(huán)境背景。

另外，Nuanced實(shí)時(shí)高效處理大量圖像，適合在線和離線應(yīng)用。

4、預(yù)防電話詐騙，檢測(cè)工具Project Mockingbird準(zhǔn)確率達(dá)90%

AI聲音的影響可能比我們想象中得更大，不法分子盯上老年人，利用AI生成的聲音進(jìn)行詐騙。央視網(wǎng)報(bào)道，去年11月，有騙子用AI生成的受害者親人的聲音詐騙，騙去40萬(wàn)。

殺毒軟件McAfee公司推出聲音檢測(cè)工具Project Mockingbird，幫助用戶檢測(cè)、阻止AI生成的語(yǔ)音詐騙行為的項(xiàng)目。它基于由AI驅(qū)動(dòng)的 “深度偽造” 音頻檢測(cè)技術(shù)，在聆聽給定的語(yǔ)音之后，可檢測(cè)音頻是否為真人發(fā)音。

為了在視頻中精準(zhǔn)定位并識(shí)別可能由AI生成的音頻片段，Project Mockingbird還融合了 AI 驅(qū)動(dòng)的上下文、行為和分類檢測(cè)模型。官方聲稱該工具成功率超過(guò)90%，目前還不向用戶收取額外費(fèi)用。

5、一分鐘掃5000首歌，幫助唱片平臺(tái)防止發(fā)布的AI音樂侵權(quán)

AI生成的音樂一直伴隨著版權(quán)爭(zhēng)議，就連OpenAI都有暗示過(guò)GPT-4o生成的音樂可能會(huì)侵犯別的音樂的版權(quán)。

音樂發(fā)行商如何自我防范？現(xiàn)在已經(jīng)有專門檢測(cè)AI生成式音樂的工具——AI-Generated Detecto，這項(xiàng)工具一分鐘內(nèi)可以掃描5000首曲目！并保證準(zhǔn)確率高達(dá)98.5%。

這是巴黎蓬皮杜音樂技術(shù)研究中心IRCAM的IRCAM Amplify公司推出的識(shí)別AI生成音樂的工具，目標(biāo)客戶主要是唱片公司、出版商、版權(quán)管理組織和音樂流媒體平臺(tái)。

文／朗朗