幻方發(fā)布第二代MoE 模型DeepSeek-V2,綜合性能位列第一梯隊。 2024 年5 月6 日,幻方發(fā)布第二代MoE 模型DeepSeek-V2。在AlignBench、MT-Bench、MMLU 等多個benchmark 上表現(xiàn)出色,其中AlignBench 在開源模型中居首位,與GPT-4-Turbo,文心4.0 比肩。MTBench超過最強MoE 開源模型Mixtral 8x22B。 繼今年1月份開源國內(nèi)首個MoE模型后,幻方人工智能公司最新推出了第二代MoE模型——DeepSeek-V2。這款新模型不僅參數(shù)更多、性能更強,訓(xùn)練成本更低的特點,令其在業(yè)界引起廣泛關(guān)注。 DeepSeek-V2采用了創(chuàng)新的模型架構(gòu)和訓(xùn)練方法,在多項綜合評測中均表現(xiàn)出色,有些指標(biāo)甚至媲美或超越目前最強的GPT-4模型。同時,它的推理效率和部署成本也大幅優(yōu)于同類大模型,可謂是性能與成本的完美結(jié)合。 相關(guān)標(biāo)的: $每日互動 sz300766$ :幻方二股東,技術(shù)負責(zé)人是每日互動的聯(lián)合創(chuàng)始人,存在合作基礎(chǔ)。 $卓創(chuàng)資訊 sz301299$ :幻方作為大型私募,卓創(chuàng)資訊金融語料庫。 $陽光照明 sh600261$ :購買幻方3億產(chǎn)品,疊加電器出海,外銷占比75%。 $飛利信 sz300287$ :飛利信是目前市場采用MLA機制不多的上市公司,Multi-headlatent attention,就是多頭注意力機制,簡稱MLA。 $南威軟件 sh603636$ :在人工智能方面,基于多頭注意力機制和增強特征金字塔方法,掌握了新型的生物認(rèn)證技術(shù)。 |
|