DeepSeek 與中國科技巨頭華為合作，以超低價格提供 AI 語言模型，或令 Nvidia 寶座不保？

by 興哥 , 2025-02-09

最近一間中國科技公司推出了 DeepSeek，一個開放式大型語言模型 (LLM)，一推出即引起全球市場巨大震盪，原因就是這個模型的訓練成本僅為美國競爭對手的零頭，無疑對西方企業構成了挑戰。隨着 DeepSeek 的崛起，相關的技術和商業生態也備受關注。

DeepSeek V3 據說是利用 2048 個 Nvidia H800 GPU 訓練而成，這些 GPU 是為了符合美國對中國的出口限制而降低效能的版本，然而據傳其最新的推理模型 R1 可能使用高達 50000 個 Nvidia 的 Hopper GPU 進行訓練，包括 H100、H800 及更新的 H20，這一消息尚未得到 DeepSeek 證實，但如果這消息屬實，則會再次引發人們對中國在高端 AI 硬體獲取方面的擔憂，儘管眾所周知，中國存在不少蓬勃發展的黑市。

更令西方公司感到不安的是，華為科技的雲計算部門最近與北京的 AI 基礎設施初創公司 SiliconFlow 達成合作，決定以極低價格向終端用戶提供 DeepSeek 的模型，這一合作在中國農曆新年期間進行，通過華為的 Ascend 雲服務，讓用戶以高效且經濟的方式接觸到 DeepSeek 的 V3 和 R1 模型。這項服務使用了華為自家的解決方案，包括在美國、英國和歐洲被禁用的 Ascend 910x 加速器。

華為的目標是成為中國的 Nvidia，而其雲端服務的性能宣稱與全球頂級GPU上的模型相媲美。SiliconFlow 則以極具競爭力的價格進入市場，V3 模型的價格為每百萬個輸入標記 1 元人民幣，而輸出標記則為 2 元；R1 模型的接入費用為 4 元和 16 元，這一定價策略無疑將給市場帶來沖擊。

不久前，微軟將 DeepSeek 納入其 Azure AI Foundry，Amazon 也迅速跟進，將該模型加入其 AWS 的 Bedrock 管理服務。AWS 展示了使用 ml.p5e.48xlarge 實例的 AI 模型，這一配置搭載了八個 Nvidia H200 GPU，總計 1128GB 的 GPU 內存。儘管這些雲服務仍處於初期階段，但其成本遠高於 SiliconFlow 的超低定價。

隨著 DeepSeek 的崛起，以及華為與 SiliconFlow 的合作，全球 AI 市場的競爭格局正在發生深刻變化。這不僅是技術的較量，更是一場關於商業模式和市場策略的博弈。未來，這一領域的發展將如何演變，值得我們持續關注。

Categories: Huawei, 新料速報

DeepSeek 與中國科技巨頭華為合作，以超低價格提供 AI 語言模型，或令 Nvidia 寶座不保？

編者

Loading, Please Wait!