日韩黑丝制服一区视频播放|日韩欧美人妻丝袜视频在线观看|九九影院一级蜜桃|亚洲中文在线导航|青草草视频在线观看|婷婷五月色伊人网站|日本一区二区在线|国产AV一二三四区毛片|正在播放久草视频|亚洲色图精品一区

分享

一文讀懂 | 關(guān)于DeepSeek公司及其大模型

 蘭亭文藝 2025-01-27

專題:DeepSeek為何能震動(dòng)全球AI圈

作為一家成立僅一年多的人工智能(AI)初創(chuàng)公司,DeepSeek憑借突破性的AI模型在硅谷收獲了驚嘆和錯(cuò)愕:該模型的性能不亞于全球最強(qiáng)的那些聊天機(jī)器人,而成本看起來只有它們的一個(gè)零頭。

DeepSeek的異軍突起,或?qū)I向前發(fā)展將需要越來越多電力能源的普遍看法構(gòu)成挑戰(zhàn)。

隨著DeepSeek創(chuàng)新引發(fā)的熱度越來越高,投資者開始消化它對其美國競爭對手及它們的硬件供應(yīng)商的影響,全球科技股在1月末大跌。

DeepSeek究竟是什么?

DeepSeek是一家于2023年成立的中國初創(chuàng)企業(yè),創(chuàng)始人是AI驅(qū)動(dòng)量化對沖基金幻方量化的掌門人梁文鋒。該公司開發(fā)開源AI模型,這意味著廣大的開發(fā)者社區(qū)可以檢查和改進(jìn)軟件。其移動(dòng)應(yīng)用程序(app)于1月初發(fā)布,然后迅速登頂美國iPhone下載榜。

該app與OpenAI旗下ChatGPT等其他聊天機(jī)器人的區(qū)別是,它會(huì)在對提示做出回應(yīng)之前闡明其推理過程。該公司聲稱,其R1版本的性能與OpenAI的最新版本相當(dāng),并且允許用戶利用模型輸出、通過模型蒸餾等方式訓(xùn)練其他模型。

DeepSeek R1與OpenAI或Meta AI比起來怎么樣?

盡管該公司沒有詳細(xì)說明培訓(xùn)和開發(fā)DeepSeek模型的成本,但其似乎只是OpenAI或Meta最佳產(chǎn)品的一個(gè)零頭。該模型的效率高出了這么多,使得人們懷疑斥巨資購買英偉達(dá)等公司最新、最強(qiáng)大AI加速器的必要性。

DeepSeek R1在幾個(gè)主要基準(zhǔn)測評中的表現(xiàn)接近或優(yōu)于競爭對手模型,例如數(shù)學(xué)領(lǐng)域的2024年美國數(shù)學(xué)邀請賽、常識領(lǐng)域的大規(guī)模多任務(wù)語言理解(MMLU)和問答領(lǐng)域的AlpacaEval 2.0。在加州大學(xué)伯克利分校相關(guān)的排行榜Chatbot Arena上,該模型也名列前茅。

DeepSeek何時(shí)引發(fā)的全球關(guān)注?

自2023年發(fā)布最早一版模型以來,這家AI開發(fā)商就受到了密切關(guān)注。然后在11月,它向世界展示了一下旨在模仿人類思維模式的DeepSeek R1推理模型。該模式支撐起了其移動(dòng)聊天機(jī)器人app,今年1月,作為一種比OpenAI便宜得多的替代品,其app及網(wǎng)頁版在全球聲名鵲起,投資人Marc Andreessen稱其為“AI的人造衛(wèi)星時(shí)刻”。

市場跟蹤機(jī)構(gòu)App Figures的數(shù)據(jù)顯示,截至1月25日,DeepSeek移動(dòng)app在澳大利亞、加拿大、中國、新加坡、美國和英國的iPhone應(yīng)用商店下載量達(dá)到160萬次,排名第一。

DeepSeek的創(chuàng)始人是誰?

梁文鋒1985年出生于廣東,擁有浙江大學(xué)信息與電子工程系學(xué)士和碩士學(xué)位。天眼查數(shù)據(jù)顯示,他創(chuàng)立DeepSeek的注冊資本只有1000萬元人民幣。

梁文鋒曾表示,主要員工大多是中國頂尖高校的應(yīng)屆畢業(yè)生,并強(qiáng)調(diào)英偉達(dá)的領(lǐng)先是整個(gè)西方技術(shù)社區(qū)和產(chǎn)業(yè)共同努力的結(jié)果,中國AI的發(fā)展需要類似的生態(tài)。

“更多的投入并不一定產(chǎn)生更多的創(chuàng)新,否則大廠可以把所有的創(chuàng)新包攬了,”他說。

DeepSeek在中國AI版圖中處于什么位置?

阿里巴巴集團(tuán)、百度騰訊,中國的科技龍頭企業(yè)投入了大量資金和資源來為它們的AI企業(yè)獲取硬件和客戶。DeepSeek和李開復(fù)的初創(chuàng)公司“零一萬物”則另辟蹊徑,采取了開源方式,旨在快速招募盡可能多的用戶,然后再以這些大量用戶為基礎(chǔ)制定變現(xiàn)策略。

由于DeepSeek的模型更便宜,它已經(jīng)在幫助降低中國開發(fā)AI成本方面發(fā)揮了作用;大公司打起了價(jià)格戰(zhàn),在過去一年半時(shí)間里已經(jīng)多輪降價(jià)。

對全球AI市場影響幾何?

DeepSeek的成功可能會(huì)促使OpenAI和其他美國供應(yīng)商降價(jià)以保持現(xiàn)有的領(lǐng)先地位。如果更高效的模型能夠以少得多的支出參與競爭,那么人們就會(huì)質(zhì)疑Meta和微軟等公司的巨額支出 —— 它們分別承諾了今年至少650億美元的資本支出、主要是在AI基礎(chǔ)設(shè)施上。

全球市場掀起風(fēng)浪,阿斯麥、英偉達(dá)等之前受益于AI服務(wù)需求欣欣向榮的股票大跌。科大訊飛等與DeepSeek相關(guān)的中國股票上漲。

世界各地的開發(fā)人員已然在測試DeepSeek的軟件,并考慮用它來構(gòu)建工具。這可能會(huì)加速先進(jìn)AI推理模型的采用 —— 同時(shí)也可能引發(fā)對是否需要限制使用的更多擔(dān)憂。DeepSeek的進(jìn)步可能會(huì)加緊旨在控制AI開發(fā)的監(jiān)管。

DeepSeek有什么缺點(diǎn)?

DeepSeek的云基礎(chǔ)設(shè)施可能會(huì)經(jīng)受流量激增的考驗(yàn)。該公司曾在1月27日短暫大宕機(jī),而隨著新老用戶向其聊天機(jī)器人發(fā)去更多問題,其將得管理甚至更大的流量。

    本站是提供個(gè)人知識管理的網(wǎng)絡(luò)存儲空間,所有內(nèi)容均由用戶發(fā)布,不代表本站觀點(diǎn)。請注意甄別內(nèi)容中的聯(lián)系方式、誘導(dǎo)購買等信息,謹(jǐn)防詐騙。如發(fā)現(xiàn)有害或侵權(quán)內(nèi)容,請點(diǎn)擊一鍵舉報(bào)。
    轉(zhuǎn)藏 分享 獻(xiàn)花(0

    0條評論

    發(fā)表

    請遵守用戶 評論公約

    類似文章 更多