大家都知道,我是一個有兩個女兒的老父親,老大美好 12 歲,上六年級,老二美滿 9 歲,三年級。 ![]() 這是我拿照片給她倆轉(zhuǎn)的吉卜力畫風。 小孩子嘛,從小就喜歡纏著大人沒日沒夜的讓你給她倆講故事,雖然現(xiàn)在長大了,能自己看書了,但偶爾還會撒嬌讓你出點新節(jié)目。 我是個腦子里存不住故事的人,現(xiàn)編吧,講的磕磕絆絆的,整不好我就開始講「從前有座山」這種經(jīng)典故事,然后就被吐槽說我劃水。 唉,現(xiàn)在的小孩大了,真不好糊弄。 以上是背景。 前兩天我不是玩了一下 MiniMax 的音頻模型嗎?就是這個介紹 MiniMax Audio 的:《最強 AI 聲優(yōu)”駕到!10秒復(fù)刻聲音》 我就突發(fā)奇想,要不用這個給她倆做個定制故事,這可比我拿著書給她們念要有意思多了。 再一想,還能再玩點新花樣,她倆不是喜歡米小圈故事嗎,我還可以把她倆的角色加入到「米小圈宇宙」里,生成一個新的故事,聽著自己的名字跟米小圈、鐵頭在一起,還能一起冒險,我自己聽起來都覺得有趣。 好吧,先給大家聽聽效果,不過重點是在后面,成品的展示效果可比這個單一的音頻驚艷多了,記得看完點個贊。 有了點子,那就開干,順便玩玩 MiniMax 新出的 MCP 功能。 你要是玩 AI 的話,最近一定會聽到這個詞吧,可能有的同學(xué)覺得復(fù)雜,其實很簡單。 原來我們要做一個這樣的項目,你得先去 DeepSeek 讓它給你先講個故事,然后再把故事復(fù)制給 MiniMax Audio,讓它再生成音頻。 這樣中間多個環(huán)節(jié)需要你手動來回干一些復(fù)制粘貼的瑣碎事情,就很不智能。 現(xiàn)在 MCP 就是把這些活幫你干了,你不用再到各個 AI 去對話,直接在本地客戶端上調(diào)用對應(yīng)的 MCP,它就自動把這活給你搞定了。 可能你還沒聽懂,不重要,跟著我實操玩起來就行,成就感十足。 配置 MiniMax MCP 1.前期配置 前邊說了,我們要在本地來一波流搞定這個項目,我參考的是@歸藏 的一篇教程《 MCP 教程》,同樣選用的是 ChatWise,它跟我們之前介紹的 Cherry Studio 差不多,都是本地 LLM 客戶端。 MCP 現(xiàn)在一共有兩種模式: Stdio:主要用在本地服務(wù)上;SSE :主要用在遠程服務(wù)上(今天用不到,先不展開)。 我們今天要用的 MiniMax MCP 配置是在 Chatwise 客戶端運行,所以我們就用 Stdio 方式來添加。 Stdio 的配置又分兩個命令,一個是 uvx 一個是 npx(今天不做介紹,說多了怕大家迷糊)。 MiniMax MCP 配置用的就是 uvx,我們就單說這個。 首先需要安裝 uv:如果你是 Windows 的話可以按「Win」鍵,點擊搜索后輸入「PowerShell」,然后右鍵選擇「以管理員身份運行」。 ![]() 粘貼下面的命令回車執(zhí)行就行: powershell -ExecutionPolicy ByPass -c "irm https:///uv/install.ps1 | iex" ![]() 運行完畢之后,系統(tǒng)環(huán)境就支持 uvx 命令了。 2.獲取 MiniMax api 到 https://platform./ 網(wǎng)站注冊賬號,給 API 充個幾塊錢,目前充值還送 15 元代金券,我就沖了 10 塊錢。 ![]() 然后去給 ChatWise 創(chuàng)建一個專用的秘鑰,復(fù)制保存好。 ![]() 3.配置 MiniMax MCP 現(xiàn)在我們就可以在 ChatWise 配置 MCP 了,點擊設(shè)置-工具-左下角的加號-選 Stdio,之后我們把下面的命令對應(yīng)填入。 命令:uvx minimax-mcp 環(huán)境變量:MINIMAX_API_KEY=替換為申請的 API Key MINIMAX_MCP_BASE_PATH=替換為儲存生成內(nèi)容的文件路徑MINIMAX_API_HOST=https://api. ![]() 然后我們在 ChatWise 中新打開一個對話框,勾選下面的錘子圖標,然后啟用 MiniMax MCP,如果這里配置成功,就能看到如圖所示,它已經(jīng)識別到了 MiniMax MCP 中的 6 個工具,如果配置不成功,按鈕就會顯示紅色報錯,需要重新檢查配置。 ![]() 至此,我們已經(jīng)完成了 MiniMax MCP 的配置,稍微有點復(fù)雜,但其實并不難,照做就好,如果發(fā)現(xiàn)報錯,就截圖發(fā)給 DeepSeek ,讓它幫你檢查搞定。 生成內(nèi)容 ![]() OK,我們在 ChatWise 中新開一個對話,記得啟用 MCP,開始享受勝利果實吧。 ![]() 兒童故事生成 **角色設(shè)定** 美好是個 12 歲小女孩,美滿是個 9 歲的小女孩,她倆是姐妹。 **故事原型** 故事設(shè)定來自《米小圈上學(xué)記》,把美好和美滿融入到米小圈的故事中去,要有《米小圈上學(xué)記》中的其他角色出現(xiàn)。 字數(shù)要求 1500 字,故事要完整,要有結(jié)尾,一次性講完。 開場要有懸念,主題是勇敢。故事要模仿《米小圈上學(xué)記》的寫法。 然后它就吭哧吭哧給你寫了一篇故事,生成結(jié)果讓我驚喜——它不僅融合了我女兒們的名字和年齡特征「唯一不足的是把老大安排到了五年級」,關(guān)鍵是真的模仿出了那種俏皮的校園敘事風格,而且米小圈里面的角色都出現(xiàn)在了故事里。 ![]() 我接著生成了兩個不同主題的故事「誠實、勇敢」,這里有個小技巧:在提示詞中加入「請考慮六年級和三年級學(xué)生的不同認知水平」,這樣生成的故事會更貼合實際。 2.轉(zhuǎn)成音頻 接下來就是重頭戲——把文字變成有聲故事。 到這里其實已經(jīng)很簡單了,前期我們已經(jīng)完成了 MiniMax MCP 的配置,只為了接下來的這句話: 把這個故事生成一個完整的單一音頻文件,要全文轉(zhuǎn) ![]() 然后 MCP 就開始干活了,沒過多久,就給你生成了一個適合兒童聽故事音色的音頻,本來我還想著克隆自己聲音給她們講故事,后來聽了這個音頻,還挺像喜馬拉雅上《米小圈上學(xué)記》的那個音色,于是就用這個了。 ![]() 3.生成網(wǎng)頁 到這里還不算完,總不能每次聽得時候還要打開 ChatWise 吧,那多費勁,做一個可以訪問的播放網(wǎng)頁,這樣才舒服。 所以我這里同樣參考的@歸藏 的教程,這套提示詞做出的網(wǎng)頁效果非常舒服: ![]() 下面你要把這個故事文本和音頻生成一個播放頁面,像一個設(shè)計精美的網(wǎng)易云音樂風格播放頁面。 提示詞: 視覺設(shè)計 - 基于網(wǎng)易云音樂風格,以白色為底色,搭配#FE1110(或相近)的高亮色 - 主次分明的視覺層次,運用超大字體/數(shù)字突出核心內(nèi)容 - 中英文混排設(shè)計:中文使用大號粗體,英文作為精致小字點綴 - 高亮色采用自身透明度漸變制造科技感,避免不同高亮色互相漸變 界面元素 - 使用簡潔勾線風格的圖形化元素呈現(xiàn)數(shù)據(jù)和配圖 - 播放控制區(qū)域設(shè)計醒目且易操作 交互與動效 - 模仿 Apple 官網(wǎng)的滾動動效體驗 - 實現(xiàn)音頻播放進度條與時間顯示 - 關(guān)鍵內(nèi)容在滾動時有優(yōu)雅的出現(xiàn)和強調(diào)效果 技術(shù)實現(xiàn) - 使用 HTML5、TailwindCSS 3.0+(通過 CDN 引入)和必要的 JavaScript - 引入專業(yè)圖標庫如 Font Awesome 或 Material Icons (通過CDN) - 實現(xiàn)響應(yīng)式設(shè)計,確保在桌面和移動設(shè)備上都有良好體驗 - 避免使用emoji作為主要圖標,保持設(shè)計的專業(yè)性 內(nèi)容呈現(xiàn) - 播客文字內(nèi)容完整展示,分段清晰 輸出要求 1. 完整的播客腳本文本 2. MiniMax 生成的音頻鏈接 3. 可直接使用的完整 HTML/CSS/JS 代碼,實現(xiàn)上述所有功能和設(shè)計要求 生成的網(wǎng)頁效果如下: ![]() 注意:里面的圖片是調(diào)用的在線圖庫,所以每次打開都是一張隨機圖片,這里不產(chǎn)生 API 費用。 OK,整體效果非常滿意,最后一步,部署成可以訪問的在線網(wǎng)頁。 打開 https://www./ ,注冊賬號,然后把最后一次對話中,生成網(wǎng)頁的代碼復(fù)制粘貼到這里生成: ![]() 就會獲得一個可以在線訪問的網(wǎng)頁,我把地址也貼出來,大家訪問看看: https://wtzt2dcv46.app./ 4.驗收時刻 當天晚上,我故作神秘地拿出平板:「今天有個特別嘉賓給你們講故事...」 當聽到故事里出現(xiàn)自己的名字時,兩個小家伙驚喜的表情讓我覺得折騰了一天也值了。 結(jié)果聽完之后,她倆又給我布置任務(wù)了,「爸爸,還想聽,下次我要先這樣,再那樣,然后我倆再那樣。。?!?/span> 我說,你們盡管出題,想聽啥有啥,量大管飽。 結(jié)語 經(jīng)過這次折騰之后,MCP 的玩法雖然說有些復(fù)雜,但跑通之后,看到兩個女兒驚喜的表情,作為一個老父親的成就感相當爆棚,而且我還有了新的想法,這個項目完全有商業(yè)變現(xiàn)的前景。 這個項目最好的平臺其實是在微信小程序,加上一些后端代碼,生成一個自定義講故事的前端頁面。 家長只用輸入孩子的名字,故事的主題,套用的故事名字,還可以克隆家長的聲音,這樣就有聽不完的專屬定制故事,你說小孩會不會喜歡聽,家長會不會付費呢? |
|
來自: 網(wǎng)羅燈下黑 > 《待分類》