創(chuàng )澤機器人 |
CHUANGZE ROBOT |
DeepSeek-V3 和 DeepSeek-R1 陸續發(fā)布,國產(chǎn)大模型能力已可比肩海 外領(lǐng)軍大模型。2024 年 12 月 26 日,杭州 AI 公司深度求索(DeepSeek) 正式發(fā)布 DeepSeek-V3 大模型首個(gè)版本并同步開(kāi)源。根據 DeepSeek 網(wǎng) 站信息,DeepSeek-V3 為自研 MoE 模型,671B 參數,激活 37B,在 14.8T tokens 上進(jìn)行了預訓練。DeepSeek-V3 多項評測成績(jì)超越了 Qwen2.5-72B 和 Llama-3.1-405B 等其他開(kāi)源模型,并在性能上和世界 頂尖的閉源模型 GPT-4o 以及 Claude-3.5-Sonnet 相當。在訓練成本方 面,根據 DeepSeek 發(fā)布的技術(shù)文檔論文信息,DeepSeek-V3 的訓練時(shí) 長(cháng)為 2788K 個(gè) H800 GPU 小時(shí),訓練花費約為 557.6 萬(wàn)美元。2025 年 1 月 20 日,DeepSeek 正式發(fā)布復雜推理類(lèi)大模型 DeepSeek-R1,性能對 齊 OpenAI o1 正式版。以 DeepSeek 系列大模型為代表的國產(chǎn)大模型性 能已可比肩海外領(lǐng)軍大模型,且成本更低。
DeepSeek 系列大模型引發(fā)全球廣泛關(guān)注,海內外巨頭科技公司及云服務(wù) 平臺廠(chǎng)商已相繼接入。2025 年 1 月 15 日,DeepSeek 推出 AI 助手 DeepSeek App。2025 年春節期間,DeepSeek 系列大模型火爆出圈,引 發(fā)全球廣泛關(guān)注。根據新浪財經(jīng) 2 月 1 日引用彭博社信息,DeepSeek 的 AI 助手在 140 個(gè)市場(chǎng)中成為下載量最多的移動(dòng)應用。根據 Appfigures 的 數據,DeepSeek 的推理人工智能聊天機器人在 1 月 26 日登上蘋(píng)果公司 App Store 的榜首,并自那時(shí)以來(lái)一直保持全球第一的位置。同時(shí),全球 也開(kāi)始了對 DeepSeek 大模型的復刻。以港科大團隊為例,港科大助理教 授 何 俊 賢的 團 隊, 只 用了 8K 個(gè) 樣 本, 就 在 7B 模型 上 復刻 出 了 DeepSeek-R1-Zero 和 DeepSeek-R1 的訓練。當前,海內外巨頭科技公 司及云服務(wù)平臺廠(chǎng)商已相繼接入了 DeepSeek 大模型,部分 AI 應用領(lǐng)域 相關(guān)企業(yè)也已開(kāi)始了 DeepSeek 大模型的部署和應用。DeepSeek 大模型 獲得了全球的廣泛關(guān)注,認可度持續提升。我們認為,DeepSeek大模型的開(kāi)源、低成本和高性能將大幅降低大模型的獲得、部署和應用成本,將加快大模型在 B 端和 C 端應用場(chǎng)景的落地。另外,DeepSeek 大模型的出 圈將對全球大模型產(chǎn)業(yè)的競爭格局產(chǎn)生重要影響,將對海外領(lǐng)軍大模型廠(chǎng) 商的領(lǐng)先性產(chǎn)生沖擊,并同時(shí)將對算力的未來(lái)發(fā)展產(chǎn)生重要影響。
DeepSeek 大模型的出圈預計不改算力整體需求向上的態(tài)勢,但推理和端 側算力有望增長(cháng)更快。DeepSeek 在算法效率和計算成本方面有著(zhù)較大的 優(yōu)勢,短期內可能對訓練算力的增長(cháng)有一定的平抑效應,但是不改 AI 算 力整體需求長(cháng)期上升的態(tài)勢。AI 作為全球智能化發(fā)展的主要抓手,大模型 當前已應用于端側、教育、金融、辦公、傳媒、醫療、智能汽車(chē)、企業(yè)服務(wù)等多個(gè)應用場(chǎng)景,應用領(lǐng)域廣闊。DeepSeek 低成本而且開(kāi)源的解決方 案,大幅降低了 AI 在各行各業(yè)應用的技術(shù)和成本門(mén)檻,為 AI 的產(chǎn)業(yè)化落地提供了更快的路徑。推理和端側的算力需求增長(cháng)潛力非常大。同時(shí),較低訓練成本以及開(kāi)源的 DeepSeek,有望帶來(lái)更低 的大模型開(kāi)發(fā)和使用門(mén)檻,基于該大模型開(kāi)發(fā)的主體可能更多,也一定程度上為訓練算力需求提供了支撐。DeepSeek 并不 是壓縮了算力市場(chǎng),反而為算力市場(chǎng)增加了更多的想象空間。DeepSeek 也在積極與國產(chǎn) AI 算力平臺合作。DeepSeek 大模 型與國產(chǎn) AI 芯片適配的逐步成熟,將加快推動(dòng)國產(chǎn) AI 芯片在國內大模型訓練端和推理端的應用,加快國產(chǎn) AI 芯片產(chǎn)業(yè)鏈的 成熟,為國產(chǎn) AI 芯片產(chǎn)業(yè)帶來(lái)發(fā)展機遇,同時(shí)加快我國大模型產(chǎn)業(yè)的發(fā)展。
![]() |
機器人底盤(pán) Disinfection Robot 消毒機器人 講解機器人 迎賓機器人 移動(dòng)機器人底盤(pán) 商用機器人 智能垃圾站 智能服務(wù)機器人 大屏機器人 霧化消毒機器人 紫外線(xiàn)消毒機器人 消毒機器人價(jià)格 展廳機器人 服務(wù)機器人底盤(pán) 核酸采樣機器人 智能配送機器人 導覽機器人 |