大家好,我是蒼何。 作為常年混跡于各種社群的野生 AI 科技博主,看了別人群里每天熱乎乎的 AI 早報(bào)消息,可把我羨慕壞了。 我必須也要給我的社群小伙伴們安排上,說干就干。 經(jīng)過幾個(gè)版本的迭代,我用 Cursor 打造了一個(gè)基于飛書多維表格及工作流的全自動 AI 情報(bào)系統(tǒng)。 這個(gè)系統(tǒng)的流程大概是這樣的: ![]() 最終的效果是,飛書多維表格中每天會自動更新一份 AI 情報(bào)數(shù)據(jù),并生成 3 張高清配圖。 ![]() 在微信群會準(zhǔn)時(shí)收到 AI 早報(bào)信息。(現(xiàn)在已經(jīng)服務(wù)十幾個(gè)群一個(gè)多月啦) ![]() 微信朋友圈也會自動同步一份帶有配圖的早報(bào)信息。 ![]() 而且在飛書會有對應(yīng)的早報(bào)通知及自動生成的 3 張精美的圖片壁紙。(方便外發(fā)其他平臺) ![]() 這份 AI 情報(bào)系統(tǒng)最為有意思的地方是真正做到了全自動,無論是自動搜集 AI 資訊還是自動清洗數(shù)據(jù)輸出,還是自動發(fā)送發(fā)送微信群和朋友圈。 全程沒有人類干預(yù),真正做到了全流程自動化。 這還不是關(guān)鍵,關(guān)鍵是任何無編碼經(jīng)驗(yàn)的小白也能輕松搭建這樣一套專屬自己的 AI 情報(bào)系統(tǒng)。 你只需要復(fù)刻我的 AI 情報(bào)系統(tǒng)模板,并進(jìn)行簡單配置即可輕松實(shí)現(xiàn)。
為了將事情整明白,我決定將這份早報(bào)系統(tǒng)的搭建方法分享給大家,以下將會是超全的干貨教程(不信你可以滑到底,看你需要多久??) 搭建 AI 爬蟲不瞞你說,我實(shí)際無任何爬蟲基礎(chǔ),最多只會幾行 Python 代碼,況且我也真的不想通過編寫一堆網(wǎng)絡(luò)爬蟲腳本來處理我的需求。 你還別說,還真被我找到了這樣的開源項(xiàng)目,他叫 crawl4ai,一個(gè)基于大模型的 AI 爬蟲項(xiàng)目,只需幾行代碼,就可以爬取任何你想要的網(wǎng)頁數(shù)據(jù)。 這是開源地址:https://github.com/unclecode/crawl4ai 我把這個(gè)項(xiàng)目下載到了本地并用 Cursor 打開了代碼。 ![]() 嗶哩吧啦一堆代碼,懶得看了,所以下載這一步,你完全可以不進(jìn)行,你只需要電腦有 Python 環(huán)境,就夠了。
你只需要打開 Cursor,打開終端。 ![]() 然后按照以下步驟,復(fù)制一下指令。 第一步,先安裝crawl4ai pip3 install -U crawl4ai
![]() 安裝過程不會持續(xù)太久,這里會安裝一堆需要的依賴啊什么的。大概等個(gè) 3 分鐘左右會安裝好。 第二步,安裝其他依賴
![]() 大概等個(gè) 2 分鐘,完成所有前置環(huán)境的安裝。 第三步,復(fù)制 Python 代碼模板。 import asyncio from crawl4ai import AsyncWebCrawler asyncdefmain(): # Create an instance of AsyncWebCrawlerasyncwith AsyncWebCrawler() as crawler: # Run the crawler on a URL result = await crawler.arun(url='這里替換為你需要爬取的網(wǎng)站鏈接') # Print the extracted contentprint(result.markdown) # Run the async main function asyncio.run(main()) 新建一個(gè)文件,隨便命名一下,比如就叫 test. py,然后將這段代碼復(fù)制到文件中。 最后在控制臺或終端輕輕執(zhí)行一下命令:
你就可以看到,數(shù)據(jù)已經(jīng)被我成功爬取。 ![]() 上面的圖是我已經(jīng)做好格式調(diào)整后的效果,你想要什么格式,直接在 Cursor 中用 Caude 3.7 來提問,讓他自動幫你優(yōu)化腳本。 當(dāng)然了,過程中你想要爬蟲爬取后做簡單的數(shù)據(jù)處理,你也可以直接發(fā)起提問,描述好需求,選擇對應(yīng)的文件,提問就行。 ![]() 這里需要用到一些情報(bào)源,aibase 和 TechCrunch 這些網(wǎng)站都可以作為你的情報(bào)源,只需要將鏈接狠狠甩進(jìn)去就行。 ![]() OK,腳本有了,情報(bào)源也有了,現(xiàn)在你需要搭建一個(gè)私有化的 AI 爬蟲服務(wù),供之后的多維表格進(jìn)行第三方調(diào)用。如果你是蒼何的 ds 會員,你也直接可以使用我搭建好的 API 服務(wù)。(文末閱讀原文可稍做了解) 無需手動部署,支持 HTTP 方式調(diào)用。 當(dāng)然如果你想本地部署,你只需要將這段腳本轉(zhuǎn)成服務(wù)即可,方式比較多,因?yàn)槲覍?Java 熟悉,所以用了 Java 來調(diào)用腳本,并對外暴露服務(wù)。 ![]() 那么有了 AI 爬蟲服務(wù),接下來就去飛書多維表格配置對應(yīng)的模板就好啦。 多維表格字段在多維表格中主要做以下幾個(gè)事情: ![]() 為了大家能完全理解設(shè)計(jì)邏輯,我會把重要步驟做下全方面無死角的說明。 ![]() 第一步,先建立以下幾個(gè)字段。 1、日期字段 在字段中選擇日期格式,不要勾選「新紀(jì)錄自動填寫創(chuàng)建時(shí)間」,因?yàn)檫@里的日期是由自動化工作流中產(chǎn)出。 ![]() 2、早報(bào)原始內(nèi)容 選擇類型為文字,這里會承接工作流中調(diào)用 AI 爬蟲服務(wù)返回的日報(bào)原始信息。 3、ds 轉(zhuǎn)換后內(nèi)容 這個(gè)字段會將原始內(nèi)容用 DeepSeek 做處理,輸出我們希望的格式。 ![]() 4、根據(jù) ds 結(jié)果生成 3 個(gè)圖片提示詞 字段類型為文本,字段捷徑選擇「自定義 AI 自動填充」。 ![]() 這里需要用到一串提示詞,你也可以參考我的提示詞哦。 請按照以下規(guī)則將 中的結(jié)果生成3條圖片提示詞: 1?? **主題提取**:每條新聞提取「核心實(shí)體」(公司/產(chǎn)品)+「技術(shù)特征」(模型/功能) - 示例:ChatGPT(實(shí)體)→ 手機(jī)助手(特征) 2?? **視覺映射**:根據(jù)特征匹配視覺元素(智能設(shè)備→透明屏幕光效,模型→數(shù)據(jù)晶體結(jié)構(gòu),機(jī)器人→機(jī)械關(guān)節(jié)特寫) 3?? **風(fēng)格混合**:從以下組合隨機(jī)選?。? - 賽博朋克(30%) + 低多邊形(30%) + 故障藝術(shù)(40%) - 用色方案:霓虹雙色(青+品紅 / 藍(lán)+橙)或單色金屬(銀/鈦金) 4?? **參數(shù)控制**:必須包含 --v 5.2 --ar 3:2 --style b --no text 示例輸出: 1.'賽博朋克風(fēng)格,透明安卓手機(jī)浮現(xiàn)ChatGPT流體光效,霓虹青與品紅色調(diào),量子數(shù)據(jù)流背景 --v 5.2 --ar 3:2 --style b --no text'2.'低多邊形3D,漂浮的QwQ-32B模型晶體結(jié)構(gòu),阿里橙色Logo投影,金屬銀質(zhì)感 --v 5.2 --ar 3:2 --style b --no text'3.'故障藝術(shù)風(fēng)格,釘釘AI客服的腦神經(jīng)網(wǎng)絡(luò)界面,藍(lán)橙漸變光效,數(shù)字化粒子流動 --v 5.2 --ar 3:2 --style b --no text' 5、圖片提示詞 這個(gè)字段需要將「根據(jù) ds 結(jié)果生成 3 個(gè)圖片提示詞」中的 3 個(gè)提示詞依次提取放在一個(gè)新的字段上來,方便后面生成每一張不同的圖片。 ![]() 6、圖片 將「圖片提示詞」用 AI 自動生成一張高清圖片,這里字段捷徑選擇「智能繪圖」,配置的話選擇上一個(gè)字段「圖片提示詞」。 ![]() 好啦,表格字段配置好了,接下來只需要配置一下自動化工作流,這個(gè)系統(tǒng)就可以自運(yùn)行啦。 自動化工作流在多維表格的上方選擇自動化按鈕。 ![]() 新建自動化流程。 ![]() 第一步,選擇觸發(fā)器為定時(shí)觸發(fā),選擇每天 10 點(diǎn)重復(fù)觸發(fā)。 ![]() 在右邊配置 3 個(gè) Action,分別是: 1、發(fā)送 HTTP 請求到 AI 爬蟲服務(wù),獲取早報(bào)信息; 2、發(fā)送 HTTP 請求到微信助手,發(fā)送早報(bào)到微信群和朋友圈; 3、在多維表格中自動新增一條記錄。 ![]() 發(fā)送請求就不細(xì)說了,這個(gè)也很簡單,就是調(diào)用對應(yīng) API 就好。
新增記錄這里需要注意按照如下設(shè)置。 ![]() 最后選擇保存并啟動即可完成自動化配置。 呼,看著步驟很多事吧,哈哈,那是因?yàn)檫@是喂飯級別的教程?? 經(jīng)過上面三步,一份 AI 早報(bào)系統(tǒng),其實(shí)已經(jīng)搭建好,只不過現(xiàn)在還沒法自動發(fā)送到微信和朋友圈,那下面的步驟就是通過微信助手達(dá)到自動發(fā)送的目的了。 微信助手我調(diào)研了一下目前大家的實(shí)現(xiàn)方案,無外乎都是以下思路: 要么是通過將微信群變?yōu)槠笪⑷海缓蠼柚笪⒌臋C(jī)器人助手來實(shí)現(xiàn)往群里發(fā)消息,要么是用的網(wǎng)上開源的例如 itchat、wechaty 這些服務(wù)。 我的感受是企微群聊,天然和工作群掛鉤,普通的微信群才是大家最喜歡和樂于交流的最好場所,所以我不會把轉(zhuǎn)變?nèi)盒再|(zhì)。
用開源的微信助手,被封的概率很大,而且三天兩頭掉線,實(shí)在無法大規(guī)模使用。 所以我用的是基于 Ipad 協(xié)議的助手,主打一個(gè)穩(wěn)定可靠。
![]() 當(dāng)然啦,如果你有發(fā)送微信的需求,前期也可以先用開源的來做測試。 經(jīng)過上面一頓操作,你就完全擁有了一套全自動化的 AI 情報(bào)系統(tǒng)。 原理并不復(fù)雜,但你要問搭建這套系統(tǒng)有何意義。 我覺得,最大的意義是,你能通過實(shí)踐掌握 AI 應(yīng)用的搭建流程。 并完成一個(gè)業(yè)務(wù)的閉環(huán),或許這能啟發(fā)你更多的思考。 這就是這篇文章最大的價(jià)值。 好啦,以上全文 7118 字,26 張圖,如果這篇文章對你有用,可否點(diǎn)個(gè)關(guān)注,給我個(gè)三連擊:點(diǎn)贊、轉(zhuǎn)發(fā)和再看。若可以再給我加個(gè)??。 |
|