![]() 編輯/排版:卒見 AI工具,我已經(jīng)分享了很多,如類似ChatGPT的對話工具,以及基于GPT開發(fā)的在線創(chuàng)作工具,繪圖、寫作、總結(jié)等等。因為之前有討論過開源和閉源哪一種方式的AI工具發(fā)展的會更好,就想著整理一些開源的AI工具吧,本期給大家分享幾款好用的開源AI項目! 01 clone-voice 一款AI視頻翻譯配音、帶web界面的聲音克隆工具,支持字幕編輯、添加配音,可以使用你的音色或任意聲音來錄制音頻,免費開源、簡單好用! ![]() CV聲音克隆工具,你可以通過它使用任何人類的音色,將一段文字合成為使用該音色說話的聲音,或者將一個聲音使用該音色轉(zhuǎn)換為另一個聲音。 ![]() 使用非常簡單,下載預(yù)編譯版本后,雙擊“app.exe”即可打開一個web界面,鼠標(biāo)點點就能用。 ![]() 它支持 中、英、日、韓、法、德、意等16種語言,可在線從麥克風(fēng)錄制聲音。想要得到好的合成效果,建議錄制時長5秒到20秒,發(fā)音清晰準(zhǔn)確,不要存在背景噪聲。它的英文效果很棒,中文效果也OK。 ![]() 注:該項目所用模型均源于“github.com/coqui-ai/TTS”,模型協(xié)議為CPML只可用于學(xué)習(xí)研究,不可商用! ![]() 官網(wǎng):v.wonyes.org 源碼: github.com/jianchang512/clone-voice 02 screenshot-to-code 一款簡單的應(yīng)用程序,支持將屏幕截圖轉(zhuǎn)換為代碼(HTML/Tailwind CSS,或React/Bootstrap/Vue)。 ![]() 只需給AI看一眼截屏,便能直接生成代碼。該項目可借助 GPT-4 Vision 的能力,直接給你將屏幕截圖轉(zhuǎn)換為 HTML/Tailwind CSS,并利用 DALL-E 3 的圖像生成能力,生成外觀相似的圖像。 ![]() 只需要放入屏幕截圖,就可以將其轉(zhuǎn)換為干凈的代碼。你甚至可以輸入URL來克隆實時網(wǎng)站! ![]() 注:該應(yīng)用程序有一個React/Vite前端和一個FastAPI后端。使用它,你需要擁有自己的OpenAI密鑰,且你的密鑰必須可以訪問GPT-4 Vision。 ![]() 官網(wǎng):screenshottocode.com 源碼:github.com/abi/screenshot-to-code 03 Animated Drawings 一款很有趣的AI工具,它可以借助人工智能技術(shù),讓繪畫作品動起來。我已經(jīng)在網(wǎng)絡(luò)上刷到很多成品了,有興趣的小伙伴可以玩玩兒! ![]() 你只需上傳完繪畫作品,就可以在線編輯作品人物的身體節(jié)點,調(diào)整不同動作,將其生成動圖,讓畫作中的人物“活”起來! ![]() 它的使用方法很簡單,上傳-編輯-提取-標(biāo)記-生成。具體操作如下↓ ①點擊首頁的“Get Started”按鈕上傳圖片。 注:你可以隨便找一張想用于創(chuàng)作的手繪草稿圖,說是自己畫一個。畫的時候要注意:確保白紙沒有褶皺,沒有阻擋;光線充足,拍照時可清晰捕捉到整個畫面;在畫作上不要添加任何暴力信息。 你也可以直接用平臺提供的4張Demo圖片。 挑選好自己的畫作之后,點擊右側(cè)的圖片上傳按鈕“Upload Photo”,把繪畫作品上傳上去。 ![]() ②編輯圖片:上傳作品后,你需要調(diào)整線框,使畫中人物在線框中能完整呈現(xiàn)出來, ![]() 調(diào)整完成后,點擊“Next”進(jìn)入下一步。 ![]() ③提取圖像細(xì)節(jié):對圖片進(jìn)行細(xì)節(jié)提取,用畫筆與橡皮擦,使人物與黑色背景分離,便于后續(xù)處理。 ![]() (如果你上傳的圖片邊界分明,或是直接用的平臺Demo圖片,這一步可以直接跳過)。 ![]() ④標(biāo)記畫作人物:鼠標(biāo)拖拽,用點線將畫中人物的頭部與軀體標(biāo)明出來。 ![]() 完成以上四個步驟后,就可以讓畫作中的人物動起來了。 ![]() 該項目提供32種動作可供選取,包含跳舞、玩耍、跳躍、行走等不同肢體動作。 ![]() PS:我玩意兒有點不好控制! 官網(wǎng):sketch.metademolab.com 源碼: githubdaily.gitee.io/posts/2023-04-16-animated-drawings 04 VideoCrafter 一款開源的AI工具,可直接基于文本,快速生成與編輯視頻??捎糜诟哔|(zhì)量視頻生成的開放式擴(kuò)散模型。 ![]() VideoCrafter 是一個開源視頻生成和編輯工具箱,用于制作視頻內(nèi)容。它可以幫助你快速生成高質(zhì)量的視頻,你可以在 Discord/Floor33 上制作你自己的視頻。它目前包括 Text2Video 和 Image2Video 模型。 源碼: github.com/AILab-CVC/VideoCrafter 05 Alog 一款支持iPhone、Apple Watch 的語音日記應(yīng)用,在 GitHub 15 開源,帶有AI功能,可以實現(xiàn)錄音之后的語音轉(zhuǎn)文字,以及AI總結(jié)兩個功能,讓你每日不停的碎碎念之后,還能有一篇完整的文字日記。 ![]() 不想寫日記,還想記錄怎么辦?Alog是一款A(yù)I語音日記,界面簡潔,只需要在想說話的時候,用它錄音就行了。它會自動幫你把語音轉(zhuǎn)化為文字,然后保存在手機(jī)里。 ![]() 你可以通過不同的提示詞,讓ALog幫你寫出一篇很標(biāo)準(zhǔn)的日記,額,它會幫你寫很多內(nèi)容! iOS: apps.apple.com/cn/app/alog/id6451082482 06 AI Anything 讓人人都可以快速創(chuàng)建ChatGPT小工具。大部分ChatGPT相關(guān)的工具本質(zhì)上就是調(diào)整prompt,AI Anything 基于MIT協(xié)議開源,讓你也能成為技術(shù)人員。 ![]() 它可以幫你幾秒創(chuàng)建一個GPT小工具,提供10萬多個圖標(biāo),允許配置AI的角色;你可以創(chuàng)建無數(shù)個輸入框;支持模板插值,prompt更加靈活; ![]() 擁有干凈的UI,流暢的動畫,支持夜間模式;支持 Nuxt3 驅(qū)動;支持多語言;支持創(chuàng)意工坊,分享并發(fā)布;可關(guān)聯(lián)上下文,進(jìn)行聊天模式交互;無需登錄即可本地使用所有功能! ![]() 這是一個免費的項目,不提供apiKey,代碼開源。 官網(wǎng):aianything.netlify.app/zh-CN 好了,今天的分享就到這里啦,個別軟件可能無法直接使用,安裝配置比較麻煩,有時間小伙伴們可以自行研究研究! ![]() ![]() |
|