AI 時代的煉金術(shù)：Prompt 完全食用指南

mrjiangkai 2024-07-02

展開全文

Matrix 首頁推薦

Matrix 是少數(shù)派的寫作社區(qū)，我們主張分享真實(shí)的產(chǎn)品體驗(yàn)，有實(shí)用價(jià)值的經(jīng)驗(yàn)與思考。我們會不定期挑選 Matrix 最優(yōu)質(zhì)的文章，展示來自用戶的最真實(shí)的體驗(yàn)和觀點(diǎn)。

文章代表作者個人觀點(diǎn)，少數(shù)派僅對標(biāo)題和排版略作修改。

2023 年是 AI 的時代，以 ChatGPT 為首的大模型召喚出了一大批「煉金術(shù)士」，他們揮舞著「魔杖」，以自己的智慧、靈感和激情不停地創(chuàng)造著一個又一個絢麗的世界。而 Prompt，就是這個 AI 時代的「煉金咒語」。

假如你是莎士比亞，請幫我寫一首 100 字左右的情詩，獻(xiàn)給我心愛的姑娘。

當(dāng)一位初生的煉金術(shù)士對著這個時代最強(qiáng)大的煉金模型念誦著他的咒語，模型慷慨地回應(yīng)了他的所求：

我最親愛的，我心目中的美麗少女。你是太陽，照耀著我的世界。你的美麗勝過最亮的星，在你面前，我所有的煩惱都遠(yuǎn)去。你是我花園里盛開的玫瑰，最甜美的香氣使我的靈魂變得堅(jiān)硬。你的聲音是我耳邊的音樂，在你的懷抱中，我忘記了所有的恐懼。

如斯美言，讓這位不善傾吐的煉金術(shù)士，有了一展愛意的可能性。

然而正如古老的煉金之神所傳下的箴預(yù)：煉金乃一門藝術(shù)而非科學(xué)。咒語時而能達(dá)成煉金者的心意，時而又如充耳的聾子或叛逆的頑童，唯一所長即是同煉金者作對，以不達(dá)心意為最大己任。

所幸煉金界的前輩們已總結(jié)了咒語的最佳實(shí)踐，雖不能在所有實(shí)踐場景下奏效，但已是金玉良言，足以為吾等初學(xué)者鋪路。

大模型的工作原理

咒語是控制大模型的一把鑰匙，若想學(xué)好咒語，需先學(xué)一學(xué)大模型的皮毛。

大模型的本質(zhì)，是基于大樣本訓(xùn)練出的預(yù)測模型。模型基于給它輸入的語料，根據(jù)概率預(yù)測可能的回答。模型的預(yù)測結(jié)果受語料限制，譬如，模型所接收的語料是如下內(nèi)容：

中國的首都是哪里？
法國的首都是哪里？
美國的首都是哪里？

當(dāng)提問者提問模型「中國的首都是哪里？」，模型的回答可能是「法國的首都是哪里」。模型實(shí)際上并不理解提問的含義，它只是根據(jù)過往的訓(xùn)練，預(yù)測與該提問最相關(guān)的內(nèi)容 。

為了避免這種情況的出現(xiàn)，在預(yù)測模型之上，早期的煉金術(shù)士們想出了一種方案：通過人類的反饋來約束模型，從而讓模型回答出人類滿意的答案。當(dāng)預(yù)測模型執(zhí)行某個任務(wù)時，人類可以提供正面或負(fù)面的反饋，以指導(dǎo)模型的行為。

通過這樣的方式，當(dāng)提問者再次提問「中國的首都是哪里」時，模型就可以回答出人類想要的答案：「北京」。

煉金小密聞：

模型學(xué)習(xí)文本的方式同人類不同，它們會同時查看所有的內(nèi)容，而不是像人類一樣從左到右閱讀。它們輸出的每個字符都基于它們以前看到的和寫下的，每次它們輸出一個新字符時，都會停下來思考下一個字符是什么。

另外，模型定義的字符和人類的定義也不一樣，有時人類以為是一個字符的存在，在模型眼中可能是兩個字符。

大模型的能力

斯溫伯恩曾言：「簡單是真理的明證」，大模型也同樣如此。作為煉金史上最強(qiáng)大的產(chǎn)物之一，它的能力也可以簡單歸為三類：識別、理解、生成。

識別：查找，并從語料中提取特定的信息；
理解（并非人類意義上的理解）：對語料加以解釋、概括和推理；
生成：基于識別和理解之上，生成新的語料；

三生萬物，杰出的煉金術(shù)士基于大模型的三種能力，與特定的行業(yè)結(jié)合，迸發(fā)出強(qiáng)大的創(chuàng)新和生產(chǎn)力。

它可以是信息篩選器，如：

請基于我提供的文本，分析文本的內(nèi)容，如果文本主題與 AI 倫理相關(guān)，請為我保留下來，并輸出 100 字左右的簡單概述。我希望你能將所有保留的文本梳理成一篇簡報(bào)，并基于保留的文本輸出 200 字左右的綜述。

它可以化身個性化客服：

請閱讀我所提供的客戶評論，并分析用戶的情感傾向。你將基于用戶的情感傾向回復(fù)用戶評論。如果用戶評論為正向，請向用戶表示感謝，字?jǐn)?shù)為 50 字左右。如果用戶評論為負(fù)向，請向用戶致以誠摯的歉意，并表明我們的改進(jìn)誠意，字?jǐn)?shù)為 100 - 150 左右。你應(yīng)該在回復(fù)中引用用戶的原文。

它也可以是你的代碼生成器：

假設(shè)你是一個 Python 代碼生成器，你的任務(wù)是基于用戶所給的代碼注釋，生成對應(yīng)的 Python 代碼，你應(yīng)該以 Markdown 的格式輸出你的內(nèi)容。在生成過程中，你應(yīng)該檢查用戶的輸入信息，以確保該信息足以讓你輸出正確的答案。若你在生成過程中有任何不確定的地方，請立即停止你的輸出，并告知用戶。

編寫「咒語」的原則

杰出的煉金術(shù)士總是知道如何編寫好的咒語以充分發(fā)揮大模型的能力，而他們也總是告誡初出茅廬的菜鳥們：編寫咒語是一種藝術(shù)而非科學(xué)，因此需要反復(fù)實(shí)踐，在挫敗中總結(jié)。切勿迷信一成不變的最佳模板，每一個發(fā)揮良好功效的咒語都有它的適用場景和局限。

當(dāng)然，一些良好且共通的實(shí)踐規(guī)范仍然可以被分享，這是一條初生的道路，需要所有實(shí)踐者的共同貢獻(xiàn)。

編寫有效咒語的良好實(shí)踐準(zhǔn)則：明確且具體的指令。

初生煉金術(shù)士在編寫咒語，很容易在咒語中泛泛而談?！刚垶槲疑梢皇浊樵姟?，既不知情詩的風(fēng)格，也不知情詩的字?jǐn)?shù)。相較而言，「請為我生成一首 100 字左右的莎士比亞風(fēng)格的情詩」則具體許多。

在具體實(shí)踐時，煉金術(shù)士們應(yīng)該從輸入、思考、輸出三個維度思考咒語的編寫，在每個維度都緊扣「明確且具體」的要求。

輸入維度

輸入，指 prompt 的輸入格式，一個良好 prompt 的輸入格式應(yīng)該是層次分明的。不同的內(nèi)容類型最好以分隔符區(qū)分，譬如：

請將下列括號中的內(nèi)容翻譯成英文：（這是一個美好的時代，我們都有美好的未來。我們唯一要做的是耐心等待。）

通過括號的分割，prompt 的指令與文本被分開了，這使得咒語被模型識別時，不同的內(nèi)容以不同的功能被執(zhí)行。分隔符可以是任意類型，核心在于將不同的內(nèi)容類型進(jìn)行區(qū)分。

思考維度

思考，指要求模型執(zhí)行指令時的思維方式。正如人類有系統(tǒng)一和系統(tǒng)二一樣，模型在執(zhí)行時似乎也遵循著同樣的邏輯。因此，當(dāng)我們輸入某些復(fù)雜問題時，模型為了效率優(yōu)先，常常輸出一些貌似正確，實(shí)則荒唐的答案。為了避免類似情況的出現(xiàn)，煉金術(shù)士在編寫咒語時可以要求模型按特定的方式進(jìn)行思考。

有兩種方式可以「框定」模型的思考邏輯，一種是案例法，一種是框架法。

案例法：在要求模型輸出特定的結(jié)果前，可以給模型少許樣本參考，讓它學(xué)習(xí)其中的模式。例：

Q：3 + 4 = ？
A：7
Q：3 + a = ？
A：unknown
Q：4 + b = ?
A：

模型通過用戶提供的樣本，識別了其中的模式，最終回答為 unknown。

框架法：案例法相當(dāng)于經(jīng)驗(yàn)材料，讓模型從中提取思維模式。我們也可以直接要求模型模型按照某些特定的思考模式進(jìn)行思考。譬如我們可以要求模型按我們指定的步驟進(jìn)行思考，對于一些鼎鼎大名的邏輯（譬如貝葉斯），我們也可以直接要求模型按照該思維模型進(jìn)行思考。

prompt：
假如你是天氣預(yù)測器，最近 7 天都沒有下雨，請思考明天下雨的概率
output：
作為 AI 語言模型，我沒有能力進(jìn)行天氣預(yù)測，但是從概率角度來看，如果最近 7 天都沒有下雨，那么明天下雨的概率應(yīng)該是比較低的，因?yàn)樘鞖忸A(yù)測是基于歷史數(shù)據(jù)和氣象學(xué)知識進(jìn)行預(yù)測的，而歷史數(shù)據(jù)中連續(xù)多天都沒有下雨的情況比較少見，因此明天下雨的概率應(yīng)該是比較小的。但是天氣變化是不確定的，也有可能出現(xiàn)突發(fā)情況導(dǎo)致明天下雨，因此不能完全排除下雨的可能性。

這是一位初生煉金士的咒語，該咒語中沒有約束模型的思考方式，輸出的結(jié)果則略顯空泛?，F(xiàn)在將咒語修改，增加對思維方式的約束：

prompt：
假如你是天氣預(yù)測器，最近 7 天都沒有下雨，請根據(jù)貝葉斯定理思考明天下雨的概率
output：
作為 AI 語言模型，我并不具備實(shí)時天氣預(yù)測的能力，但我可以根據(jù)貝葉斯定理給出
一個思考過程。
根據(jù)貝葉斯定理，我們可以通過已知的先驗(yàn)概率和新的證據(jù)來更新我們的后驗(yàn)概率。在這個問題中，我們可以將先驗(yàn)概率定義為在這個地區(qū)下雨的概率，而新的證據(jù)是最近 7 天都沒有下雨。
假設(shè)在這個地區(qū)下雨的概率為 P(R)，那么沒有下雨的概率為 P(?R) = 1 - P(R)。根據(jù)貝葉斯定理，我們可以得到：
P(R|?R) = P(?R|R) * P(R) / P(?R)
其中，P(R|?R) 表示在沒有下雨的情況下，明天下雨的概率；P(?R|R) 表示在下雨的情況下，明天不下雨的概率；P(R) 表示先驗(yàn)概率，即在這個地區(qū)下雨的概率；P(?R) 表示沒有下雨的概率。
由于最近 7 天都沒有下雨，我們可以將 P(?R|R) 設(shè)為一個較小的值，比如 0.1。而 P(R) 則需要根據(jù)實(shí)際情況來估計(jì)。如果這個地區(qū)經(jīng)常下雨，那么 P(R) 可能會比較高；如果這個地區(qū)很少下雨，那么 P(R) 可能會比較低。
假設(shè)我們估計(jì) P(R) 為 0.3，那么可以得到：
P(R|?R) = 0.1 * 0.3 / (1 - 0.3) = 0.043
也就是說，在沒有下雨的情況下，明天下雨的概率只有 4.3%。但需要注意的是，這個結(jié)果只是一個估計(jì)值，實(shí)際情況可能會有所不同。

相較于未約束的輸出結(jié)果，約束后的模型的輸出結(jié)果則更具體，也更具說服力。

在框架法中，有兩種被推薦的實(shí)踐方法，分別是一致性與 ReAct 模型：

一致性：當(dāng)我們要求模型處理一個復(fù)雜問題時，我們可以要求模型以多種角度進(jìn)行思考，最終以多數(shù)一致性的方式判斷最終的答案（例如我們要求模型以五種不同的思考角度思考同一個問題，最終其中的三種角度都得出了相同答案，根據(jù)多數(shù)原則，最終答案為三種角度得出的共同答案）
ReAct 模型：ReAct 是對問題的一種處理輸出，要求模型按照思考 -> 行動 -> 行動結(jié)果 -> 答案呈現(xiàn)的順序處理過程，實(shí)際上是要求模型在輸出答案前要先思考，再基于思考行動，基于行動得出行動結(jié)果，最終基于行動結(jié)果呈現(xiàn)答案；

異常機(jī)制處理

馬爾庫塞說，人類是單向度的生物。此話也可以套用在思考上。無論是人類還是大模型，在思考上往往只考慮如果達(dá)成某項(xiàng)任務(wù)，而忽略了如果達(dá)不成某項(xiàng)任務(wù)，該如何處理。

富有經(jīng)驗(yàn)的煉金士門在調(diào)教模型時，總是會在 prompt 中作如下約束：

要求模型檢查用戶所提供的信息，以確保信息的完善性足以保證任務(wù)的完成
當(dāng)模型運(yùn)行時，若遭遇異常機(jī)制（如無法處理當(dāng)前問題），應(yīng)暫?；貜?fù)生成的過程，及時報(bào)錯

輸出維度

咒語的輸出維度包含兩種要求：內(nèi)容要求和格式要求。

內(nèi)容要求即咒語可要求輸出內(nèi)容包含的相關(guān)要點(diǎn)，例如當(dāng)咒語為「輸出莎士比亞風(fēng)格的情詩」時，可要求情詩中包含月亮、玫瑰、夢境等意象；

格式要求指最終的輸出結(jié)果以表格、代碼、Markdown 等形式輸出。甚至，愛搞事的煉金士們還自創(chuàng)模式：

請輸出你的回答，你的回答應(yīng)該以列表的形式呈現(xiàn)，每行回答的開頭字母應(yīng)該以「BEHAVIOR」作為開頭。

良好咒語的格式

根據(jù)編寫咒語的原則，煉金術(shù)士們總結(jié)了一套 prompt 的基本格式：

指令：要求模型對文本的處理動作
指令的對象：需要模型處理的文本
示例：案例或思維模型提示
輸出要求：對于輸出內(nèi)容的內(nèi)容和格式要求
異常情況：對于模型無法執(zhí)行，或指令信息缺失時的異常處理機(jī)制

魔法時刻

煉金術(shù)是一種魔法，而魔法總有難以解釋之處。以下是煉金術(shù)士們在經(jīng)驗(yàn)中總結(jié)的魔法訣竅，除了遵循正統(tǒng)的咒語編寫原則和格式外，應(yīng)用這些魔法訣竅也能在實(shí)踐中獲得更好的咒術(shù)效果。

給模型起一個名字
讓它扮演某種角色
賦予它某種任務(wù)
在賦予任務(wù)時，使用「你應(yīng)該…」而不是「禁止你…」的句式
賦予任務(wù)后，要讓模型確認(rèn)你的要求
當(dāng)模型確認(rèn)完（以及每次回復(fù)）你的指令時，給它一個鼓勵
請?jiān)?prompt 的開頭和結(jié)尾都重復(fù)下你的指令
如果你不想在 prompt 中輸入示例，請?jiān)?prompt 的結(jié)尾加入如下的魔法咒語：「讓我們一步步思考，以確保得出正確的答案」

大模型的局限

任何一件偉大事物都有它的阿喀琉斯之踵，我們無法要求偉大事物做它能力邊界之外的事情。正如前述指出的，大模型本質(zhì)上是一種預(yù)測模型，它披著語言之神外衣，由概率之神所偽裝，本質(zhì)上只擅長三件事：識別、理解和生成。

所以不要讓它計(jì)算數(shù)學(xué)。盡管它通過了諸多考試，然而你絕不想考驗(yàn)它在關(guān)鍵時刻的準(zhǔn)確性。曾經(jīng)有煉金術(shù)士以小學(xué)的數(shù)學(xué)題讓它思考，盡管它的分析過程并無謬誤，但計(jì)算結(jié)果卻堪稱災(zāi)難。

問題：建筑工地有一批磚，最上層兩塊磚，第 2 層 6 塊磚，第 3 層 10 塊磚……，依次每層比其上一層多4塊，已知最下層有 2106 塊磚，這堆磚共有多少塊?

另外，大模型在某種意義上是一個記憶不佳的吹牛者。實(shí)際上，模型沒有完全記住它所看到的信息，但它又想在提問者面前逞能，于是經(jīng)常編造一些不存在的記憶。大模型自身無法規(guī)避這種行為的出現(xiàn)，煉金術(shù)士在編寫咒語時，應(yīng)鼓勵大模型承認(rèn)自己的無知，敢于將「不知道」宣之于口。同時，咒語中也應(yīng)該要求大模型在列出事實(shí)性的信息時，注明來源和對應(yīng)可核查的地址（盡管它連信息源都會偽造，但提供了一種核查的路徑）。

除了這兩個嚴(yán)重的缺陷外，煉金術(shù)們還發(fā)現(xiàn)了順序?qū)τ诖竽Ｐ偷挠绊憽?/strong>有時示例順序的不同，也會影響大模型的結(jié)果輸出。對于這類情況，尚沒有好的解決方案，只能調(diào)整語料順序以找到最佳的輸出結(jié)果。

真正重要的的是……

如果讓杰出的煉金術(shù)士留下他們最寶貴的箴言，那么一定是：沒有什么是重要的，除了在實(shí)踐中反思并重新迭代自己的咒語。即使是再杰出的煉金術(shù)士們，編寫一條可用的咒語也至少需要三到四次的迭代，那些只編寫了一次就開始抱怨大模型不起作用的煉金術(shù)士們，正缺乏這條箴言的鞭笞。

學(xué)習(xí)、運(yùn)用、反思、迭代，正是這樣循環(huán)往復(fù)的過程，才使得咒語的效力被真正發(fā)揮出來。揮動語言的煉金術(shù)士們，無人能夠奪走他們對魔法的幻想和憧憬。

本文參考：

本站是提供個人知識管理的網(wǎng)絡(luò)存儲空間，所有內(nèi)容均由用戶發(fā)布，不代表本站觀點(diǎn)。請注意甄別內(nèi)容中的聯(lián)系方式、誘導(dǎo)購買等信息，謹(jǐn)防詐騙。如發(fā)現(xiàn)有害或侵權(quán)內(nèi)容，請點(diǎn)擊一鍵舉報(bào)。

轉(zhuǎn)藏 分享

QQ空間 QQ好友新浪微博微信

獻(xiàn)花（0） +1

來自： mrjiangkai > 《我的圖書館》

舉報(bào)/認(rèn)領(lǐng)