AI 密室
← 返回所有集數

Episode 03 · 10-11 分鐘

為什麼一個中國量化基金能一夜嚇到整個矽谷?DeepSeek 創辦人梁文鋒的逆襲

矽谷一夜

黃仁勳AnthropicClaudeOpenAIAltmanDeepSeek

鉤子

2025 年 1 月 27 日,星期一,美國股市開盤。

NVIDIA 股價一開始就崩了,一小時內跌 9%,收盤跌 17%,市值蒸發 6,000 億美金。這是美股歷史上,單日最大市值損失——沒有之一。

所有人都在問同一個問題:發生了什麼事?

答案,是一個中文字:DeepSeek

更精確地說,是一個名字:梁文鋒。39 歲,廣東人,浙江大學畢業,開量化基金出身。他沒有美國名校學歷,沒有 Google 或 Facebook 的工作經驗,甚至在 2024 年之前,矽谷幾乎沒人聽過他的名字。

但在那個星期一,他讓整個矽谷相信:AI 的遊戲規則,已經被一個他們不認識的中國人改寫了

預告承諾

今天這支片,我要帶你搞懂三件事。

第一,DeepSeek 到底做了什麼,讓矽谷嚇成這樣?這不只是「一個中國公司做了 AI」,是他們用了一個連 OpenAI 都沒想到的做法。

第二,梁文鋒這個人為什麼敢做 AI?他背後的那個量化基金「幻方」是什麼來頭?

第三,DeepSeek 事件對未來 AI 產業,意味著什麼?NVIDIA 還會是王者嗎?中國 AI 會不會從此換一條路線走?

看完,你會明白一件事——2025 年 1 月 27 日,是 AI 第一次真正進入多極時代的日子

背景建立:梁文鋒是誰

先講梁文鋒。

他 1985 年出生在廣東湛江一個小縣城。父親是國中數學老師,從小培養他對數學的興趣。2002 年他考上浙江大學電子系,主修信息與電子工程,雙學位拿信息科學。

重點來了——他畢業之後沒進科技業,跑去做量化對沖基金

2008 年,他和兩個同學創立「幻方量化」。這家公司用數學模型和 AI 演算法做股票交易,完全不靠人類判斷。到 2019 年,幻方已經是中國前四大量化私募基金,管理資產超過 1,000 億人民幣。

但 2016 年起,梁文鋒做了一件同行不理解的事——他開始大量買 NVIDIA 的高階 GPU

當時其他量化基金覺得他瘋了。GPU 是拿來玩遊戲和跑 AI 的,你做金融交易要那麼多 GPU 幹嘛?

梁文鋒的回答是:「我想做 AI。做金融只是養自己的方法。」

2019 年,他花了 10 億人民幣買下 1 萬顆 NVIDIA A100 GPU——這是當時全中國最大的民間 GPU 集群,超過大部分大學和很多科技公司。

2023 年 5 月,他正式把 AI 研究單獨拆成一家公司——DeepSeek。團隊 50 個人,全部是頂尖高校的博士。他自己當 CEO,不接受任何外部投資。

所以在 DeepSeek 震撼矽谷之前,這家公司已經低調做了 8 年的準備

衝突升級:那個禮拜發生了什麼

2025 年 1 月 20 日,DeepSeek 發布了一個模型叫 R1

一開始沒什麼人注意。Hacker News 上有幾個工程師說「這個中國模型看起來不錯」,但主流媒體沒報。

到了 1 月 22 日,情況變了。史丹佛大學和 Meta 的 AI 研究員各自獨立做了測試,得到一個讓他們自己都不敢相信的結論:

在數學推理、程式撰寫、邏輯題目這三個硬核項目上,DeepSeek R1 的表現和 OpenAI 當時最新的 o1 模型持平,甚至在某些題目上超過

這還不是最震撼的。最震撼的是——

第一,DeepSeek R1 完全開源。權重、訓練論文、程式碼全部釋出。你可以下載、修改、商用,不用付一毛錢。

第二,DeepSeek 號稱訓練成本只有 550 萬美金。相較之下,OpenAI 訓練 GPT-4 用了 1 億美金以上。差了 20 倍

第三,DeepSeek 用的是被美國制裁的「閹割版」H800 GPU,不是 H100。換句話說,在硬體比美國差一代的前提下,他們追上了。

這三個事實,1 月 25 日週末刊登在華爾街日報頭版。週一開盤,矽谷所有人都看了同一份報導。

NVIDIA 股價崩了,因為投資人想——如果訓練 AI 可以便宜 20 倍,那誰還要一直買 NVIDIA 最貴的卡?

OpenAI 的估值撐不住了,因為市場想——如果有免費的同級模型,為什麼要付錢用 GPT?

Meta 的開源策略被印證了,Llama 4 加速開發。

微軟 Azure、AWS、Google Cloud 緊急開會,三家雲端巨頭同時宣布支援 DeepSeek R1。

梁文鋒在那週做了什麼?什麼都沒做。他連記者都沒見。DeepSeek 官方 X(Twitter)帳號只發了一條推文:「謝謝大家的關注,我們會繼續工作。」

爆點揭示:這個事件真正的意義

讓我告訴你 DeepSeek 事件真正的意義。

表面上,這是一次「便宜的 AI 擊敗昂貴的 AI」。但這不是重點

重點是這三件事。

第一件事——AI 的護城河坍塌了。過去三年,矽谷一直相信:AI 需要最貴的晶片、最多的資料、最大的團隊,所以只有 OpenAI、Google、Anthropic 這種公司能做。DeepSeek 證明了——這都是可以繞開的。一個 50 人的團隊,用一代落後的晶片,就能做到和頂級實驗室並駕齊驅

這意味著什麼?AI 不再是三巨頭的遊戲。任何國家、任何有 GPU 的公司,理論上都可以做出自己的 AI。

第二件事——NVIDIA 的統治邏輯變了。NVIDIA 之所以值兆美金,是因為全世界都相信「要做 AI 就要買最貴的卡」。DeepSeek 打破這個信念。未來 NVIDIA 的護城河,從「最快」變成「最通用」。黃仁勳現在面對的不是 AMD,是「我們真的需要這麼快的卡嗎」這個根本質疑。

第三件事,也是最深的影響——中國 AI 找到了自己的路。過去 2 年,中國 AI 被美國制裁,拿不到最好的晶片。美國人以為這會讓中國 AI 落後 5 年。但 DeepSeek 證明——限制反而逼出了另一條技術路線

梁文鋒在 2024 年的一次閉門訪談裡說過一句話:「我們不是要和 OpenAI 比誰大,我們是要證明——AI 不一定要美國的路徑才能做出來。」

這句話,在 2025 年 1 月 27 日,被市場用 6,000 億美金驗證。

所以那一天不只是 NVIDIA 崩盤,那是美國 AI 單極霸權時代的結束。從那天開始,世界進入了AI 多極時代——美國一派、中國一派、歐洲一派、開源一派,各自走自己的路。

而這個時代的開啟者,是一個矽谷兩年前還沒聽過名字的廣東人。

反思收尾

這個故事告訴我們三件事。

第一——真正的突破,常常來自「不能做」的那群人。DeepSeek 做不到用 H100,所以他們發明了更聰明的演算法架構。限制從來不是創新的敵人,是它的母親。

第二——8 年的沉默,比一年的爆發更可怕。梁文鋒從 2016 年買 GPU 到 2025 年震撼矽谷,整整準備了 9 年。真正的高手,都是在沒人看的時候練功,爆發的那天才讓世界知道。

第三——科技業的下一個十年,會是一場多中心戰爭。不要再用「美國做什麼、中國抄什麼」的舊框架看 AI 了。現在是——中國做什麼、美國學什麼;歐洲做什麼、亞洲學什麼。DeepSeek 只是第一槍。

下一集,我要講一個你可能以為自己認識、但其實根本不認識的人——Jony Ive,蘋果的設計之神。他離開蘋果之後沒有退休,而是和 Sam Altman 密謀一個比 iPhone 還大的事。這個計畫他們已經籌備 4 年了,我會告訴你為什麼這可能是下一個重塑全世界的硬體革命。

如果這集讓你對 DeepSeek 有新的認識,幫我按個讚。然後分享給你那個還在說「中國做不出真正的 AI」的朋友——他可能得更新一下自己的認知了。

我們下集見。

2026 年 4 月最新進展

我們在這支片講完梁文鋒震撼矽谷的故事時,DeepSeek 的第二擊才剛要上演。

2026 年 3 月 9 日,DeepSeek 悄悄上線了 V4 的精簡版「V4 Lite」。業界還沒反應過來,4 月初 Reuters 就爆出一個更大的消息——DeepSeek V4 將完全運行於華為昇騰晶片,不再需要 NVIDIA

這意味著什麼?梁文鋒從 2016 年買 A100 到 2025 年震撼矽谷,走了 9 年的「繞過 NVIDIA」路線,在 2026 年春天進化成「完全告別 NVIDIA」。V4 的規格也同步公布——1 兆參數 MoE 架構、37B 活躍參數、1M 上下文、原生多模態生成(文字、圖像、影片)。坊間流傳的 benchmark 是 HumanEval 90%、SWE-bench 80% 以上,等同 Claude Opus 4.6 的水平。

這不只是中國 AI 再一次追上,這是中國 AI 徹底脫鉤美國晶片生態的第一個實戰案例。從今天開始,AI 世界進入雙軌時代:美國走 NVIDIA、中國走華為。這是 EP03 那個故事沒寫完的下一章。

至於本來要接棒的下一代 R2,因為美國制裁造成的晶片供應不穩而延期。這個延期本身,就是 V4 改走華為路線最好的理由——當制裁變成常態,備援就變成主線