國(guó)產(chǎn)AI再一次讓世界刮目相看! 在硅谷,DeepSeek 被稱(chēng)為“神秘力量”;在國(guó)內(nèi),是“你可能沒(méi)聽(tīng)說(shuō)過(guò),但確實(shí)?!钡拇嬖凇?/span> 如今,這股神秘力量再次出手,憑著“便宜、強(qiáng)悍、開(kāi)源”的三板斧,震驚整個(gè) AGI (通用人工智能)行業(yè)。 背景:一股清流的出現(xiàn) AGI一直是科技圈的高地,大廠們燒錢(qián)如流水,動(dòng)輒上億美元。 但DeepSeek,不走尋常路,僅用557.6萬(wàn)美元(咱別問(wèn)零頭咋算的)搞出了一個(gè)“能打的”大模型DeepSeek V3。 不僅打破了“燒錢(qián)內(nèi)卷”的慣性,更展現(xiàn)了中國(guó) AI 的自信與創(chuàng)新。 正如一位網(wǎng)友所說(shuō):“硅谷圣誕節(jié)休假,中國(guó) AI 加班發(fā)論文,這種自信,絕了!” 為什么 DeepSeek V3 被稱(chēng)為“開(kāi)源界的天花板”? 來(lái)看幾個(gè)硬核數(shù)據(jù): 6710 億參數(shù),37B MoE 激活參數(shù):只激活必要參數(shù),既保持性能又大幅降低計(jì)算成本。 根據(jù)最新的測(cè)試結(jié)果,DeepSeek V3 在多個(gè)關(guān)鍵指標(biāo)上幾乎與 Claude 3.5 Sonnet 和 GPT-4o 并肩而行。 除此之外,型全面支持互聯(lián)網(wǎng)訪(fǎng)問(wèn),可執(zhí)行實(shí)時(shí)任務(wù),并且提供 免費(fèi)試用,讓更多開(kāi)發(fā)者和用戶(hù)輕松上手。 比如,想要開(kāi)發(fā)一款微信小程序。 DeepSeek V3 可以完美勝任——從生成代碼到優(yōu)化邏輯,一氣呵成,甚至讓“0 基礎(chǔ)”的開(kāi)發(fā)者也能輕松上手。 質(zhì)疑與挑戰(zhàn) 在眾多亮點(diǎn)之外,DeepSeek V3 也因“少了一個(gè)問(wèn)號(hào)竟稱(chēng)自己是 ChatGPT”的 bug 引發(fā)熱議。 進(jìn)一步測(cè)試發(fā)現(xiàn),即便生成笑話(huà),結(jié)果也與 ChatGPT 高度相似。 這一現(xiàn)象加上足夠低成本產(chǎn)生不少質(zhì)疑:是否使用了 ChatGPT 的輸出數(shù)據(jù)進(jìn)行訓(xùn)練? 另外,Altman 的一條推文又讓人浮想聯(lián)翩,仿佛在暗諷什么…… 不過(guò),從技術(shù)報(bào)告和測(cè)試數(shù)據(jù)來(lái)看,DeepSeek V3 的訓(xùn)練主要依托于 Pile 數(shù)據(jù),尤其是其與 Llama 3.1 在 Pile 測(cè)試中的相近表現(xiàn),表明這些質(zhì)疑很可能并不成立。 這一 bug 反而揭示另一個(gè)更深層次的問(wèn)題——AI 行業(yè)正面臨數(shù)據(jù)污染的普遍挑戰(zhàn)。 隨著越來(lái)越多的開(kāi)發(fā)者選擇使用現(xiàn)有 AI 輸出數(shù)據(jù)進(jìn)行訓(xùn)練,“數(shù)據(jù)蒸餾”雖然可以顯著降低成本,卻也不可避免地將其他模型的輸出混入訓(xùn)練集中。 這種現(xiàn)象不僅威脅模型的獨(dú)立性,更為行業(yè)敲響警鐘:如何保證高質(zhì)量、獨(dú)立的訓(xùn)練數(shù)據(jù)? 然而,除了數(shù)據(jù)質(zhì)量問(wèn)題,DeepSeek V3 也讓我們反思另一個(gè)更大的挑戰(zhàn):國(guó)產(chǎn) AI 的問(wèn)題從來(lái)不是錢(qián),而是高端芯片被禁運(yùn)的現(xiàn)實(shí)壓力。 從“性?xún)r(jià)比之王”到開(kāi)源標(biāo)桿 面對(duì)芯片資源的限制,DeepSeek V3 的發(fā)布刷新了行業(yè)認(rèn)知,不僅在技術(shù)層面實(shí)現(xiàn)突破,更以低成本、高效率成為開(kāi)源界的標(biāo)桿: 突破預(yù)算限制:相比閉源大廠動(dòng)輒十億級(jí)天文預(yù)算,DeepSeek V3 的極高性?xún)r(jià)比,為整個(gè)行業(yè)樹(shù)立了新標(biāo)桿。 更令人佩服的是,DeepSeek 團(tuán)隊(duì)始終堅(jiān)持“水到渠成”的發(fā)布節(jié)奏,并沒(méi)有因市場(chǎng)需求而盲目搶跑,而是等模型達(dá)到目標(biāo)時(shí)才自然發(fā)布。 這種以技術(shù)為導(dǎo)向的務(wù)實(shí)態(tài)度,與業(yè)內(nèi)普遍追求商業(yè)化“快錢(qián)”的模式形成了鮮明對(duì)比。 不過(guò),DeepSeek的突破不僅僅體現(xiàn)在技術(shù)層面,其獨(dú)特的商業(yè)與文化理念同樣令人稱(chēng)道。 文化與價(jià)值觀:商業(yè)與理想的平衡 與國(guó)內(nèi)大廠燒錢(qián)補(bǔ)貼、搶占市場(chǎng)的做法不同,DeepSeek選擇了一條獨(dú)立且穩(wěn)健的道路: 1. 不燒錢(qián)、保持盈利 DeepSeek 依靠量化機(jī)構(gòu)幻方的閑置 GPU 時(shí)間進(jìn)行 AI 訓(xùn)練,完全不依賴(lài)燒錢(qián)補(bǔ)貼和資本推動(dòng)。 低調(diào)務(wù)實(shí),從不花錢(qián)做營(yíng)銷(xiāo),DeepSeek靠的不是廣告和補(bǔ)貼,而是實(shí)打?qū)嵉募夹g(shù)創(chuàng)新。 2. 專(zhuān)注技術(shù),賦能行業(yè) DeepSeek 并未推出直接面向終端用戶(hù)的應(yīng)用,而是選擇專(zhuān)注于 API 服務(wù)。 DeepSeek 的目標(biāo)不是做下一個(gè) ChatGPT,而是成為可靠的技術(shù)底座,為開(kāi)發(fā)者和企業(yè)提供靈活的 API 支持,助力更多場(chǎng)景和應(yīng)用的誕生。 3. 開(kāi)源文化與協(xié)作精神 DeepSeek 一直強(qiáng)調(diào)開(kāi)源文化,從 V2 到 V3,論文與模型完全開(kāi)放。團(tuán)隊(duì)用協(xié)作和分享精神為行業(yè)樹(shù)立榜樣。 一個(gè)細(xì)節(jié)特別讓人感動(dòng):V3的論文中,連合規(guī)團(tuán)隊(duì)這樣的“幕后英雄”都得到感謝。 ![]() ![]() 這種對(duì)團(tuán)隊(duì)每一位成員的認(rèn)可,體現(xiàn)出DeepSeek內(nèi)部的凝聚力和文化氛圍。 4. 從“商業(yè)化”到“重創(chuàng)新” DeepSeek的創(chuàng)始人梁文鋒提到,中國(guó)科技企業(yè)習(xí)慣追求快速商業(yè)化,但這種路徑難以支撐長(zhǎng)期創(chuàng)新。 DeepSeek 選擇優(yōu)先投入技術(shù)研究,以開(kāi)放技術(shù)的形式讓行業(yè)在其基礎(chǔ)上發(fā)展出更多應(yīng)用。 這種“重創(chuàng)新”的信念,是DeepSeek真正的護(hù)城河。 正如梁文鋒所說(shuō): “我們不缺資本,缺的是信心和如何高效組織人才的能力?!?/span> 不靠燒錢(qián),也能跑出自己的速度。 硅谷的認(rèn)可與“國(guó)產(chǎn)之光” DeepSeek的技術(shù)實(shí)力早就得到硅谷的關(guān)注。 V2的論文被OpenAI、Anthropic等行業(yè)巨頭公開(kāi)稱(chēng)贊為“今年最好的一篇”。 V3的發(fā)布,則進(jìn)一步確立作為“全球技術(shù)競(jìng)爭(zhēng)者”的地位。 SemiAnalysis首席分析師甚至評(píng)價(jià): “DeepSeek正在用更低的成本和更高的效率,讓全球AI行業(yè)重新洗牌。” 這一次,中國(guó)企業(yè)不再是“跟隨者”,而是真正的“參與者”。 理想點(diǎn)亮未來(lái) DeepSeek V3的橫空出世,不僅僅是一款強(qiáng)大的模型,更是對(duì)行業(yè)慣性思維的一次挑戰(zhàn): 技術(shù)上,以低成本、高性能的模式,讓全球看到中國(guó)AI的潛力。 然而,DeepSeek并不滿(mǎn)足于現(xiàn)階段的成就,還計(jì)劃在未來(lái)3-6個(gè)月內(nèi)發(fā)布新版本,性能有望超越GPT-4o。 這種不間斷的技術(shù)突破,源于對(duì)技術(shù)的熱愛(ài)和對(duì)未來(lái)的信念。 更重要的是,高端芯片被限制的情況下,DeepSeek為中國(guó)AI行業(yè)提供了一種新的可能性: 不再是單純的跟隨,而是從技術(shù)底層的創(chuàng)新入手,站在全球的舞臺(tái)上。 最終,DeepSeek的理想并不是做一個(gè)技術(shù)上的“孤島”,而是通過(guò)技術(shù)共享和生態(tài)構(gòu)建,成為全球AI行業(yè)中不可或缺的一部分。 國(guó)產(chǎn)之光,從理想開(kāi)始 DeepSeek 用實(shí)際行動(dòng)證明:“理想不只是情懷,它可以變成技術(shù)、產(chǎn)品,甚至改變行業(yè)格局?!?/span> DeepSeek V3 無(wú)疑是國(guó)產(chǎn)AI領(lǐng)域的一道亮光。 而這道光,不僅來(lái)自技術(shù)的力量,更來(lái)自那份對(duì)理想的堅(jiān)持。 DeepSeek,中文叫深度求索,寓意在創(chuàng)新中不斷突破邊界。 最后的問(wèn)題交給你: DeepSeek的技術(shù)和理念,你認(rèn)為能持續(xù)推動(dòng)國(guó)產(chǎn)AI的崛起嗎? 歡迎留言,聊聊你的看法! 體驗(yàn)入口:chat.deepseek.com |
|
來(lái)自: 長(zhǎng)沙7喜 > 《新聞》