最近一間中國科技公司推出了 DeepSeek,一個開放式大型語言模型 (LLM),一推出即引起全球市場巨大震盪,原因就是這個模型的訓練成本僅為美國競爭對手的零頭,無疑對西方企業構成了挑戰。隨着 DeepSeek 的崛起,相關的技術和商業生態也備受關注。
DeepSeek V3 據說是利用 2048 個 Nvidia H800 GPU 訓練而成,這些 GPU 是為了符合美國對中國的出口限制而降低效能的版本,然而據傳其最新的推理模型 R1 可能使用高達 50000 個 Nvidia 的 Hopper GPU 進行訓練,包括 H100、H800 及更新的 H20,這一消息尚未得到 DeepSeek 證實,但如果這消息屬實,則會再次引發人們對中國在高端 AI 硬體獲取方面的擔憂,儘管眾所周知,中國存在不少蓬勃發展的黑市。
更令西方公司感到不安的是,華為科技的雲計算部門最近與北京的 AI 基礎設施初創公司 SiliconFlow 達成合作,決定以極低價格向終端用戶提供 DeepSeek 的模型,這一合作在中國農曆新年期間進行,通過華為的 Ascend 雲服務,讓用戶以高效且經濟的方式接觸到 DeepSeek 的 V3 和 R1 模型。這項服務使用了華為自家的解決方案,包括在美國、英國和歐洲被禁用的 Ascend 910x 加速器。
![](https://www.mobilemagazinehk.com/wp-content/uploads/2025/02/H.jpg)
華為的目標是成為中國的 Nvidia,而其雲端服務的性能宣稱與全球頂級GPU上的模型相媲美。SiliconFlow 則以極具競爭力的價格進入市場,V3 模型的價格為每百萬個輸入標記 1 元人民幣,而輸出標記則為 2 元;R1 模型的接入費用為 4 元和 16 元,這一定價策略無疑將給市場帶來沖擊。
不久前,微軟將 DeepSeek 納入其 Azure AI Foundry,Amazon 也迅速跟進,將該模型加入其 AWS 的 Bedrock 管理服務。AWS 展示了使用 ml.p5e.48xlarge 實例的 AI 模型,這一配置搭載了八個 Nvidia H200 GPU,總計 1128GB 的 GPU 內存。儘管這些雲服務仍處於初期階段,但其成本遠高於 SiliconFlow 的超低定價。
隨著 DeepSeek 的崛起,以及華為與 SiliconFlow 的合作,全球 AI 市場的競爭格局正在發生深刻變化。這不僅是技術的較量,更是一場關於商業模式和市場策略的博弈。未來,這一領域的發展將如何演變,值得我們持續關注。
- DeepSeek 與中國科技巨頭華為合作,以超低價格提供 AI 語言模型,或令 Nvidia 寶座不保?
- iPhone SE 4 即將登場!最強平價 iPhone 傳二月中或三月登場
- 【HUAWEI 實用教室】襟玩三消 Game 限免!繁中介面可離線遊玩、數百關卡豐富內容
- AlipayHK支援公共交通補貼,自動領取比八達通更方便!(附領取教學)
- iPhone SE 4 最快下星期發佈!傳直接上架預售、另 iPhone 17 CAD 圖再曝