日韩黑丝制服一区视频播放|日韩欧美人妻丝袜视频在线观看|九九影院一级蜜桃|亚洲中文在线导航|青草草视频在线观看|婷婷五月色伊人网站|日本一区二区在线|国产AV一二三四区毛片|正在播放久草视频|亚洲色图精品一区

分享

AI 時代的煉金術(shù):Prompt 完全食用指南

 mrjiangkai 2024-07-02

Matrix 首頁推薦

Matrix 是少數(shù)派的寫作社區(qū),我們主張分享真實(shí)的產(chǎn)品體驗(yàn),有實(shí)用價(jià)值的經(jīng)驗(yàn)與思考。我們會不定期挑選 Matrix 最優(yōu)質(zhì)的文章,展示來自用戶的最真實(shí)的體驗(yàn)和觀點(diǎn)。

文章代表作者個人觀點(diǎn),少數(shù)派僅對標(biāo)題和排版略作修改。


2023 年是 AI 的時代,以 ChatGPT 為首的大模型召喚出了一大批「煉金術(shù)士」,他們揮舞著「魔杖」,以自己的智慧、靈感和激情不停地創(chuàng)造著一個又一個絢麗的世界。而 Prompt,就是這個 AI 時代的「煉金咒語」。

假如你是莎士比亞,請幫我寫一首 100 字左右的情詩,獻(xiàn)給我心愛的姑娘。

當(dāng)一位初生的煉金術(shù)士對著這個時代最強(qiáng)大的煉金模型念誦著他的咒語,模型慷慨地回應(yīng)了他的所求:

我最親愛的,我心目中的美麗少女。你是太陽,照耀著我的世界。你的美麗勝過最亮的星,在你面前,我所有的煩惱都遠(yuǎn)去。你是我花園里盛開的玫瑰,最甜美的香氣使我的靈魂變得堅(jiān)硬。你的聲音是我耳邊的音樂,在你的懷抱中,我忘記了所有的恐懼。

如斯美言,讓這位不善傾吐的煉金術(shù)士,有了一展愛意的可能性。

然而正如古老的煉金之神所傳下的箴預(yù):煉金乃一門藝術(shù)而非科學(xué)。咒語時而能達(dá)成煉金者的心意,時而又如充耳的聾子或叛逆的頑童,唯一所長即是同煉金者作對,以不達(dá)心意為最大己任。

所幸煉金界的前輩們已總結(jié)了咒語的最佳實(shí)踐,雖不能在所有實(shí)踐場景下奏效,但已是金玉良言,足以為吾等初學(xué)者鋪路。

大模型的工作原理

咒語是控制大模型的一把鑰匙,若想學(xué)好咒語,需先學(xué)一學(xué)大模型的皮毛。

大模型的本質(zhì),是基于大樣本訓(xùn)練出的預(yù)測模型。模型基于給它輸入的語料,根據(jù)概率預(yù)測可能的回答。模型的預(yù)測結(jié)果受語料限制,譬如,模型所接收的語料是如下內(nèi)容:

  • 中國的首都是哪里?
  • 法國的首都是哪里?
  • 美國的首都是哪里?

當(dāng)提問者提問模型「中國的首都是哪里?」,模型的回答可能是「法國的首都是哪里」。模型實(shí)際上并不理解提問的含義,它只是根據(jù)過往的訓(xùn)練,預(yù)測與該提問最相關(guān)的內(nèi)容 。

為了避免這種情況的出現(xiàn),在預(yù)測模型之上,早期的煉金術(shù)士們想出了一種方案:通過人類的反饋來約束模型,從而讓模型回答出人類滿意的答案。當(dāng)預(yù)測模型執(zhí)行某個任務(wù)時,人類可以提供正面或負(fù)面的反饋,以指導(dǎo)模型的行為。

通過這樣的方式,當(dāng)提問者再次提問「中國的首都是哪里」時,模型就可以回答出人類想要的答案:「北京」。


煉金小密聞:

模型學(xué)習(xí)文本的方式同人類不同,它們會同時查看所有的內(nèi)容,而不是像人類一樣從左到右閱讀。它們輸出的每個字符都基于它們以前看到的和寫下的,每次它們輸出一個新字符時,都會停下來思考下一個字符是什么。

另外,模型定義的字符和人類的定義也不一樣,有時人類以為是一個字符的存在,在模型眼中可能是兩個字符。


大模型的能力

斯溫伯恩曾言:「簡單是真理的明證」,大模型也同樣如此。作為煉金史上最強(qiáng)大的產(chǎn)物之一,它的能力也可以簡單歸為三類:識別、理解、生成。

  • 識別:查找,并從語料中提取特定的信息;
  • 理解(并非人類意義上的理解):對語料加以解釋、概括和推理;
  • 生成:基于識別和理解之上,生成新的語料;

三生萬物,杰出的煉金術(shù)士基于大模型的三種能力,與特定的行業(yè)結(jié)合,迸發(fā)出強(qiáng)大的創(chuàng)新和生產(chǎn)力。

它可以是信息篩選器,如:

請基于我提供的文本,分析文本的內(nèi)容,如果文本主題與 AI 倫理相關(guān),請為我保留下來,并輸出 100 字左右的簡單概述。我希望你能將所有保留的文本梳理成一篇簡報(bào),并基于保留的文本輸出 200 字左右的綜述。

它可以化身個性化客服:

請閱讀我所提供的客戶評論,并分析用戶的情感傾向。你將基于用戶的情感傾向回復(fù)用戶評論。如果用戶評論為正向,請向用戶表示感謝,字?jǐn)?shù)為 50 字左右。如果用戶評論為負(fù)向,請向用戶致以誠摯的歉意,并表明我們的改進(jìn)誠意,字?jǐn)?shù)為 100 - 150 左右。你應(yīng)該在回復(fù)中引用用戶的原文。

它也可以是你的代碼生成器:

假設(shè)你是一個 Python 代碼生成器,你的任務(wù)是基于用戶所給的代碼注釋,生成對應(yīng)的 Python 代碼,你應(yīng)該以 Markdown 的格式輸出你的內(nèi)容。在生成過程中,你應(yīng)該檢查用戶的輸入信息,以確保該信息足以讓你輸出正確的答案。若你在生成過程中有任何不確定的地方,請立即停止你的輸出,并告知用戶。

編寫「咒語」的原則

杰出的煉金術(shù)士總是知道如何編寫好的咒語以充分發(fā)揮大模型的能力,而他們也總是告誡初出茅廬的菜鳥們:編寫咒語是一種藝術(shù)而非科學(xué),因此需要反復(fù)實(shí)踐,在挫敗中總結(jié)。切勿迷信一成不變的最佳模板,每一個發(fā)揮良好功效的咒語都有它的適用場景和局限。

當(dāng)然,一些良好且共通的實(shí)踐規(guī)范仍然可以被分享,這是一條初生的道路,需要所有實(shí)踐者的共同貢獻(xiàn)。

編寫有效咒語的良好實(shí)踐準(zhǔn)則:明確且具體的指令。

初生煉金術(shù)士在編寫咒語,很容易在咒語中泛泛而談?!刚垶槲疑梢皇浊樵姟?,既不知情詩的風(fēng)格,也不知情詩的字?jǐn)?shù)。相較而言,「請為我生成一首 100 字左右的莎士比亞風(fēng)格的情詩」則具體許多。

在具體實(shí)踐時,煉金術(shù)士們應(yīng)該從輸入 、思考 、輸出三個維度思考咒語的編寫,在每個維度都緊扣「明確且具體」的要求。

輸入維度

輸入,指 prompt 的輸入格式,一個良好 prompt 的輸入格式應(yīng)該是層次分明的。不同的內(nèi)容類型最好以分隔符區(qū)分,譬如:

請將下列括號中的內(nèi)容翻譯成英文:(這是一個美好的時代,我們都有美好的未來。我們唯一要做的是耐心等待。)

通過括號的分割,prompt 的指令與文本被分開了,這使得咒語被模型識別時,不同的內(nèi)容以不同的功能被執(zhí)行。分隔符可以是任意類型,核心在于將不同的內(nèi)容類型進(jìn)行區(qū)分。

思考維度

思考,指要求模型執(zhí)行指令時的思維方式。正如人類有系統(tǒng)一和系統(tǒng)二一樣,模型在執(zhí)行時似乎也遵循著同樣的邏輯。因此,當(dāng)我們輸入某些復(fù)雜問題時,模型為了效率優(yōu)先,常常輸出一些貌似正確,實(shí)則荒唐的答案。為了避免類似情況的出現(xiàn),煉金術(shù)士在編寫咒語時可以要求模型按特定的方式進(jìn)行思考。

有兩種方式可以「框定」模型的思考邏輯,一種是案例法,一種是框架法。

案例法:在要求模型輸出特定的結(jié)果前,可以給模型少許樣本參考,讓它學(xué)習(xí)其中的模式。例:

Q:3 + 4 = ?

A:7

Q:3 + a = ?

A:unknown

Q:4 + b = ?

A:

模型通過用戶提供的樣本,識別了其中的模式,最終回答為 unknown。

框架法:案例法相當(dāng)于經(jīng)驗(yàn)材料,讓模型從中提取思維模式。我們也可以直接要求模型模型按照某些特定的思考模式進(jìn)行思考。譬如我們可以要求模型按我們指定的步驟進(jìn)行思考,對于一些鼎鼎大名的邏輯(譬如貝葉斯),我們也可以直接要求模型按照該思維模型進(jìn)行思考。

prompt:

假如你是天氣預(yù)測器,最近 7 天都沒有下雨,請思考明天下雨的概率

output:

作為 AI 語言模型,我沒有能力進(jìn)行天氣預(yù)測,但是從概率角度來看,如果最近 7 天都沒有下雨,那么明天下雨的概率應(yīng)該是比較低的,因?yàn)樘鞖忸A(yù)測是基于歷史數(shù)據(jù)和氣象學(xué)知識進(jìn)行預(yù)測的,而歷史數(shù)據(jù)中連續(xù)多天都沒有下雨的情況比較少見,因此明天下雨的概率應(yīng)該是比較小的。但是天氣變化是不確定的,也有可能出現(xiàn)突發(fā)情況導(dǎo)致明天下雨,因此不能完全排除下雨的可能性。

這是一位初生煉金士的咒語,該咒語中沒有約束模型的思考方式,輸出的結(jié)果則略顯空泛?,F(xiàn)在將咒語修改,增加對思維方式的約束:

prompt:

假如你是天氣預(yù)測器,最近 7 天都沒有下雨,請根據(jù)貝葉斯定理思考明天下雨的概率

output:

作為 AI 語言模型,我并不具備實(shí)時天氣預(yù)測的能力,但我可以根據(jù)貝葉斯定理給出

一個思考過程。

根據(jù)貝葉斯定理,我們可以通過已知的先驗(yàn)概率和新的證據(jù)來更新我們的后驗(yàn)概率。在這個問題中,我們可以將先驗(yàn)概率定義為在這個地區(qū)下雨的概率,而新的證據(jù)是最近 7 天都沒有下雨。

假設(shè)在這個地區(qū)下雨的概率為 P(R),那么沒有下雨的概率為 P(?R) = 1 - P(R)。根據(jù)貝葉斯定理,我們可以得到:

P(R|?R) = P(?R|R) * P(R) / P(?R)

其中,P(R|?R) 表示在沒有下雨的情況下,明天下雨的概率;P(?R|R) 表示在下雨的情況下,明天不下雨的概率;P(R) 表示先驗(yàn)概率,即在這個地區(qū)下雨的概率;P(?R) 表示沒有下雨的概率。

由于最近 7 天都沒有下雨,我們可以將 P(?R|R) 設(shè)為一個較小的值,比如 0.1。而 P(R) 則需要根據(jù)實(shí)際情況來估計(jì)。如果這個地區(qū)經(jīng)常下雨,那么 P(R) 可能會比較高;如果這個地區(qū)很少下雨,那么 P(R) 可能會比較低。

假設(shè)我們估計(jì) P(R) 為 0.3,那么可以得到:

P(R|?R) = 0.1 * 0.3 / (1 - 0.3) = 0.043

也就是說,在沒有下雨的情況下,明天下雨的概率只有 4.3%。但需要注意的是,這個結(jié)果只是一個估計(jì)值,實(shí)際情況可能會有所不同。

相較于未約束的輸出結(jié)果,約束后的模型的輸出結(jié)果則更具體,也更具說服力。

在框架法中,有兩種被推薦的實(shí)踐方法,分別是一致性與 ReAct 模型:

  • 一致性:當(dāng)我們要求模型處理一個復(fù)雜問題時,我們可以要求模型以多種角度進(jìn)行思考,最終以多數(shù)一致性的方式判斷最終的答案(例如我們要求模型以五種不同的思考角度思考同一個問題,最終其中的三種角度都得出了相同答案,根據(jù)多數(shù)原則,最終答案為三種角度得出的共同答案)
  • ReAct 模型:ReAct 是對問題的一種處理輸出,要求模型按照思考 -> 行動 -> 行動結(jié)果 -> 答案呈現(xiàn)的順序處理過程,實(shí)際上是要求模型在輸出答案前要先思考,再基于思考行動,基于行動得出行動結(jié)果,最終基于行動結(jié)果呈現(xiàn)答案;

異常機(jī)制處理

馬爾庫塞說,人類是單向度的生物。此話也可以套用在思考上。無論是人類還是大模型,在思考上往往只考慮如果達(dá)成某項(xiàng)任務(wù),而忽略了如果達(dá)不成某項(xiàng)任務(wù),該如何處理。

富有經(jīng)驗(yàn)的煉金士門在調(diào)教模型時,總是會在 prompt 中作如下約束:

  1. 要求模型檢查用戶所提供的信息,以確保信息的完善性足以保證任務(wù)的完成
  2. 當(dāng)模型運(yùn)行時,若遭遇異常機(jī)制(如無法處理當(dāng)前問題),應(yīng)暫?;貜?fù)生成的過程,及時報(bào)錯

輸出維度

咒語的輸出維度包含兩種要求:內(nèi)容要求和格式要求。

內(nèi)容要求即咒語可要求輸出內(nèi)容包含的相關(guān)要點(diǎn),例如當(dāng)咒語為「輸出莎士比亞風(fēng)格的情詩」時,可要求情詩中包含月亮、玫瑰、夢境等意象;

格式要求指最終的輸出結(jié)果以表格、代碼、Markdown 等形式輸出。甚至,愛搞事的煉金士們還自創(chuàng)模式:

請輸出你的回答,你的回答應(yīng)該以列表的形式呈現(xiàn),每行回答的開頭字母應(yīng)該以「BEHAVIOR」作為開頭。

良好咒語的格式

根據(jù)編寫咒語的原則,煉金術(shù)士們總結(jié)了一套 prompt 的基本格式:

  • 指令:要求模型對文本的處理動作
  • 指令的對象:需要模型處理的文本
  • 示例:案例或思維模型提示
  • 輸出要求:對于輸出內(nèi)容的內(nèi)容和格式要求
  • 異常情況:對于模型無法執(zhí)行,或指令信息缺失時的異常處理機(jī)制

魔法時刻

煉金術(shù)是一種魔法,而魔法總有難以解釋之處。以下是煉金術(shù)士們在經(jīng)驗(yàn)中總結(jié)的魔法訣竅,除了遵循正統(tǒng)的咒語編寫原則和格式外,應(yīng)用這些魔法訣竅也能在實(shí)踐中獲得更好的咒術(shù)效果。

  • 給模型起一個名字
  • 讓它扮演某種角色
  • 賦予它某種任務(wù)
  • 在賦予任務(wù)時,使用「你應(yīng)該…」而不是「禁止你…」的句式
  • 賦予任務(wù)后,要讓模型確認(rèn)你的要求
  • 當(dāng)模型確認(rèn)完(以及每次回復(fù))你的指令時,給它一個鼓勵
  • 請?jiān)?prompt 的開頭和結(jié)尾都重復(fù)下你的指令
  • 如果你不想在 prompt 中輸入示例,請?jiān)?prompt 的結(jié)尾加入如下的魔法咒語:「讓我們一步步思考,以確保得出正確的答案」

大模型的局限

任何一件偉大事物都有它的阿喀琉斯之踵,我們無法要求偉大事物做它能力邊界之外的事情。正如前述指出的,大模型本質(zhì)上是一種預(yù)測模型,它披著語言之神外衣,由概率之神所偽裝,本質(zhì)上只擅長三件事:識別、理解和生成。

所以不要讓它計(jì)算數(shù)學(xué)。盡管它通過了諸多考試,然而你絕不想考驗(yàn)它在關(guān)鍵時刻的準(zhǔn)確性。曾經(jīng)有煉金術(shù)士以小學(xué)的數(shù)學(xué)題讓它思考,盡管它的分析過程并無謬誤,但計(jì)算結(jié)果卻堪稱災(zāi)難。

問題:建筑工地有一批磚,最上層兩塊磚,第 2 層 6 塊磚,第 3 層 10 塊磚……,依次每層比其上一層多4塊,已知最下層有 2106 塊磚,這堆磚共有多少塊? 

另外,大模型在某種意義上是一個記憶不佳的吹牛者。實(shí)際上,模型沒有完全記住它所看到的信息,但它又想在提問者面前逞能,于是經(jīng)常編造一些不存在的記憶。大模型自身無法規(guī)避這種行為的出現(xiàn),煉金術(shù)士在編寫咒語時,應(yīng)鼓勵大模型承認(rèn)自己的無知,敢于將「不知道」宣之于口。同時,咒語中也應(yīng)該要求大模型在列出事實(shí)性的信息時,注明來源和對應(yīng)可核查的地址(盡管它連信息源都會偽造,但提供了一種核查的路徑)。

除了這兩個嚴(yán)重的缺陷外,煉金術(shù)們還發(fā)現(xiàn)了順序?qū)τ诖竽P偷挠绊憽?/strong>有時示例順序的不同,也會影響大模型的結(jié)果輸出。對于這類情況,尚沒有好的解決方案,只能調(diào)整語料順序以找到最佳的輸出結(jié)果。

真正重要的的是……

如果讓杰出的煉金術(shù)士留下他們最寶貴的箴言,那么一定是:沒有什么是重要的,除了在實(shí)踐中反思并重新迭代自己的咒語。即使是再杰出的煉金術(shù)士們,編寫一條可用的咒語也至少需要三到四次的迭代,那些只編寫了一次就開始抱怨大模型不起作用的煉金術(shù)士們,正缺乏這條箴言的鞭笞。

學(xué)習(xí)、運(yùn)用、反思、迭代,正是這樣循環(huán)往復(fù)的過程,才使得咒語的效力被真正發(fā)揮出來。揮動語言的煉金術(shù)士們,無人能夠奪走他們對魔法的幻想和憧憬。


本文參考:

    本站是提供個人知識管理的網(wǎng)絡(luò)存儲空間,所有內(nèi)容均由用戶發(fā)布,不代表本站觀點(diǎn)。請注意甄別內(nèi)容中的聯(lián)系方式、誘導(dǎo)購買等信息,謹(jǐn)防詐騙。如發(fā)現(xiàn)有害或侵權(quán)內(nèi)容,請點(diǎn)擊一鍵舉報(bào)。
    轉(zhuǎn)藏 分享 獻(xiàn)花(0

    0條評論

    發(fā)表

    請遵守用戶 評論公約

    類似文章 更多