隨著對AI的深度使用和更多產品的體驗,近期對大模型的使用心得又有了一些沉淀。下文介紹的技巧,均適用所有大模型應用(如ChatGPT、Claude、Gemini、Kimi、騰訊元寶、智譜、豆包、文心、通義、訊飛星火、海螺AI、百小應、躍問、萬知等),特別是文本生成類AI。這個技巧,一定有很多人已經在用,但鮮有人知道為什么以及怎么用好。“大模型”之所以有個“大”字,就是因為它預訓練的參數(shù)大(最新模型動輒萬億參數(shù))。在大參數(shù)預訓練下,出現(xiàn)了基于 “scaling law”(規(guī)模效應) 的智能涌現(xiàn),你也可以理解為“大力出奇跡”。參數(shù)量的增加,使得大模型變得智能,有著豐富的“能力包”。讓大模型扮演一個角色(role),就是在提示它 “回憶” 起自己的能力,對這個領域的模型能力進行調用,不至于跑偏或迷路。通過“角色扮演”的提示,我們不再需要對每一項能力進行詳細描述,對任務進行細節(jié)分解,而是只需要簡單的設定好角色,就可以調用出大模型對應的能力。那我們該如何設定角色,才是“能力包”的正確打開方式呢?現(xiàn)在你是一位優(yōu)秀的(你想要的身份),擁有(你想要的教育水平),并且具備(你想要的工作年份及工作經歷),你的工作內容是(與問題相關的工作內容),同時你具備以下能力(你需要的能力):通常,角色的定義與任務的關聯(lián)性很大,我們對角色了解越深入(懂行、懂業(yè)務),就越能夠設定出符合預期的角色。工作流(workflow),是我們在與大模型對話中比較重要的輸入(input)技巧。越是復雜任務,越需要拆分,也越考驗我們的能力。工作流,也就是對任務的分解。如果需要大模型完成的任務比較復雜,我們需要先人工對任務進行拆分,并盡量詳細地描述任務的各個部分。其中,可能會有部分任務是AI無法完成的,需要我們人工完成,來提供給AI(人機協(xié)同)。在實踐中,這經常出現(xiàn)。畢竟目前的模型還沒那么智能,AGI還未到來。比如,有用戶找到我,希望幫她寫一個自動抓取、總結并排版文章的提示詞(價格詳情)。按照她對工作任務的描述,我先給她制作了一個工作流程圖。  然后給她介紹了使用流程,最后才是交付提示詞,以及實際演示情況。 對工作流的拆分,我們可以把它當作成一次任務維度的對齊。當我們用文字描述這些任務時,隱含了大量的背景知識和預期。比如,我們想讓大模型整理一份《黑神話:悟空》的游戲攻略,它需要進行游戲了解、信息收集、攻略制作、玩家常見問題整理等步驟的思考,這些都屬于游戲攻略的范疇。提示詞:請幫我制作一份《黑神話:悟空》的游戲攻略,以下是一些基本步驟和思考方式:1.研究和收集信息:查找關于《黑神話:悟空》的游戲信息,包括游戲機制(戰(zhàn)斗系統(tǒng)、角色成長、探索要素等核心玩法)、全劇情流程(主線任務和支線任務)、boss戰(zhàn)策略、技能與物品、隱藏線索與彩蛋等。2.整理攻略。根據你收集的信息,整理一份游戲攻略。這份攻略要充分考慮玩家是新手小白,確保你的攻略是實際和可行的。3.玩家常見問題整理:收集并整理玩家在游戲過程中可能遇到的常見問題,如操作疑惑、游戲bug、配置要求等。如果你對任務的背景知識不太了解,不會做任務拆分,也不懂如何描述任務拆分。這個問題,完全可以交給大模型,讓它來幫你。(你要做的任務),需要哪些步驟,該如何思考? 大模型的推理,本質上是基于用戶輸入的信息進行推理。我們提供的信息越充分,大模型就能越會推理。因此,要想讓大模型的效果更好,我們需要盡量提供更多的輸入(input)信息,也就是最近很火的RAG技術(檢索增強生成)。這與人類的大腦類似,我們并不會把所有知識都放在大腦中,而是通過檢索的方式動態(tài)獲取知識,然后再通過自身的智能進行推理、決策和行動。所以,人類可以后天學習,能夠根據不同場景學習不同知識,擁有動態(tài)獲取知識的能力。對于現(xiàn)階段的大模型,我們可以通過這幾種方式來做RAG,來提升知識的拓展性和時效性,以及在專業(yè)領域的應用。比如通過AI bot平臺(扣子/騰訊元器),創(chuàng)建屬于自己的Agent知識庫,讓模型基于知識庫進行生成。讓模型訪問指定網站(site:域名),檢索信息生成。主流大模型應用均支持十萬甚至百萬、千萬上下文,支持各種格式。向模型提供一定的上下文,可以有效提升生成質量。提供的上下文資料需要注意,文件名、文件內容里的文件名以及與模型對話里的文件名,盡量要保持一致,不沖突。大模型擅長回答通用領域的問題,但是對于專業(yè)領域就顯得沒那么擅長。對于專業(yè)領域的知識調用,我們可以通過使用插件來完成,調用專業(yè)領域的知識。 前面提到,我們要對工作流進行拆分,一步一步分解任務。對于模型從input到output的過程來說,也是如此。我們可以在中間加一個思維鏈(Chain of Thought)的推理過程(reasoning chain )。即:input--> Cot --> output關于Cot,常見提示詞為“Let's think step by step”, 即讓模型一步步思考,來提升模型的生成質量。 比如,如果我想讓大模型幫我寫一篇文章,于是就有了兩種做法:2)輸入信息-輸出大綱-完善大綱-輸出標題和正文-調整內容-輸出文章在《Prompt Engineering Guide》一文中,做了一個簡單的Cot測試,效果是如此有效。 相信你一定看過很多的提示詞模板或提示詞攻略,都建議你放點示例。這個出發(fā)點是好的,但是他們沒有提到示例的質量。當用戶提供示例后,特別是更多示例(Few-shot)后,大模型會主要參照示例來進行回答,從而在某種程度上降低了模型本身的思考能力。現(xiàn)實中,大部分人很難在短時間內完整、準確地表達一個意思。所以你臨時編出來的示例(常存在語言不通或無邏輯等問題),完全沒有必要放上去。如果一定要放示例,那這個示例盡量是“少而精”的。通過提供更具參考性的示例,來減少示例帶來的負面影響。

- 自檢要求(在正式輸出前,請對整個回答再通讀一遍,檢查是否有錯別字、標點誤用或者語病等)
- 其他重要性強調(Improtant/Attention)
通過添加這些限制性要求,來提升AI生成結果的準確率。建議大家在編寫提示詞時,所有限制性要求都放在Prompt的最后,這樣能夠讓大模型更“聽話”。其背后原理是:大模型的本質是在做文本補全,生成內容的輸出會更傾向于距離更近的語境,如果利用 LIME(一種解釋機器學習模型預測的算法) 這樣的模型解釋算法分析,距離更近的文本間權重往往更大,這在Transofrmer中的Attention權重上可以清晰的看到。你好,我是一個對人工智能技術非常感興趣的新媒體編輯,但是沒有相關的技術背景。我想請你幫我深入理解一篇最新發(fā)表的大模型研究論文,以便更好地把握該領域的技術發(fā)展。請從以下7個方面對論文進行詳細解讀:1、論文的研究目標是什么?想要解決什么實際問題?這個問題對于人工智能行業(yè)發(fā)展有什么重要意義?2、論文提出了哪些新的思路、方法或模型?跟現(xiàn)有的模型相比有什么特點和優(yōu)勢?請盡可能參考論文中的細節(jié)進行分析。3、論文通過什么實驗來驗證所提出模型的有效性?實驗是如何設計的?實驗數(shù)據和結果如何?請引用關鍵數(shù)據加以說明。4、論文的研究成果將給人工智能行業(yè)帶來什么影響?有哪些潛在的應用場景和商業(yè)機會?作為媒體人我應該關注哪些方面?5、未來在該研究方向上還有哪些值得進一步探索的問題和挑戰(zhàn)?這可能催生出什么新的技術和商業(yè)機會?6、從critical thinking的視角看,這篇論文還存在哪些不足及缺失?又有哪些需要進一步驗證和存疑的?7、作為非技術背景的讀者,我應該從這篇論文中學到什么,有哪些啟發(fā)?你認為我還需要補充了解哪些背景知識?請用1000-1500字左右的篇幅,對論文進行深入解讀。在講述過程中,請多引用論文中的細節(jié)內容、關鍵數(shù)據和實驗結果,幫助我清楚地理解論文的創(chuàng)新性貢獻。同時也請從技術和商業(yè)的角度,分析其給人工智能領域和產業(yè)界帶來的影響。如果論文中有一些技術概念我可能不太了解,也請給出通俗的解釋。1、用三級標題對應以上7個問題,清晰劃分不同部分。2、使用Markdown格式,適當加入列表、加粗等排版元素。3、引用原文時請使用blockquote的引用格式。如果你不確定大模型是否真正理解了你的問題,我們可以通過提問來確認。比如,“我這樣描述清楚了嗎?”或者“你能明白我的意思嗎?”反饋和確認,可以幫助我們檢驗大模型是否真正理解了自己的意圖,從而減少誤解,提高溝通效率。有效溝通:“我這樣描述清楚了嗎?如果有任何不明白的地方,請告訴我,我可以提供更多的細節(jié)?!?/span>讓大模型評估自己的輸出(output)質量,反思哪些地方還可以優(yōu)化,然后重新輸出,得到更優(yōu)的回答。用戶:我司計劃上線一款人形機器人產品,想結合《黑神話:悟空》游戲進行宣傳,幫我想一句廣告詞。初版:執(zhí)掌神話,智領未來——[公司名稱]人形機器人,與悟空共舞科技巔峰。優(yōu)化版:悟空智勇,觸手可及——[公司名稱]人形機器人,以情感智能,引領科技新紀元。探索無限,立即啟程!  在我們與大模型交互步驟比較多、提示詞比較長的情況下,大模型的回答有可能是錯誤的。這時,一個比較好的選擇是,在工作流里加入讓大模型自檢的環(huán)節(jié),讓大模型自己確認下回答是否正確,是否滿足了我們的要求。類似的方法還有,讓大模型對自己的回答進行評分,直到回答達到大模型自己滿意的分數(shù)為止。 根據個人需要,可以指定模型輸出(output)的字數(shù)、文風、格式、場景和用途等,以及提取特定的細節(jié),格式化輸出為HTML/MD/代碼等。它通過【什么方法】,解決了【什么具體的問題】,類似【通俗易懂的比喻】。 
|