Episode 09 · 10-11 分鐘
為什麼字節跳動的 AI 野心比你想的更可怕?從剪映到豆包的 8 年暗戰
8 年暗戰
鉤子
2024 年底,中國 AI 業界有一個公開的秘密:
在所有中國 AI 公司裡,算力最多的不是百度,不是阿里,不是騰訊。是字節跳動。
他們手上的 NVIDIA H100 和 H800 GPU 數量,估計超過 15 萬顆。這比 OpenAI 當時的估計還多。
但字節跳動幾乎從不公開談 AI。他們不開發表會、不參加技術大會、老闆張一鳴 2021 年就辭職了,從此沒再公開露面。
問題來了——這家公司偷偷囤積全中國最多的算力,到底要做什麼?
答案,藏在一個被全世界忽視的事實裡:你每天在用的抖音、剪映、TikTok,都是字節的 AI 實驗場。過去 8 年,他們用全球 30 億用戶的行為資料,訓練出一個你看不見但影響你每一個決策的 AI。
今天,我帶你看——字節跳動的 AI 全棧戰略。
預告承諾
三件事。
第一,字節跳動的 AI 之路從哪裡開始?張一鳴的本業是「演算法」,今日頭條怎麼變成全球 AI 最強的資料引擎之一?
第二,豆包、PixelDance(Sora 替代品)、火山方舟——這些你聽過但搞不清的東西,到底在字節的版圖上是什麼位置?
第三,為什麼字節同時做模型、晶片、硬體、甚至雲服務?這種「全棧」策略,Google、Meta、微軟都沒有做到,字節為什麼敢?
看完,你會明白——字節跳動不是在追趕 AI,他們在用 30 億人的行為當原料,做一個別人追不上的東西。
背景建立:演算法公司的 DNA
字節跳動 2012 年成立。創辦人張一鳴,那時候 29 歲。
他的第一個產品是「今日頭條」。這個 app 在中國做的事,本質上是——用機器學習演算法,取代人類編輯,決定你看到什麼新聞。
這個做法在 2012 年的中國是革命性的。全球也沒人這樣做。
張一鳴的理念是:「每一個人應該看到不同的新聞——不是因為你有偏見,是因為你的興趣不同。但這件事人類編輯做不到,只有演算法可以。」
今日頭條用了 2 年時間做到 1 億用戶。這時候字節跳動擁有了全中國最大的「使用者行為資料集」。
2016 年,張一鳴看準短影音是下一個流量入口。9 月,抖音上線。一年內 月活躍用戶破 6 億。
2017 年,抖音海外版 TikTok 開始在亞洲推廣。2020 年,TikTok 突破美國年輕人市場。2024 年底,TikTok 全球月活超過 20 億。
這一路下來,字節跳動累積了什麼?
30 億全球用戶的 500 多個維度的行為資料——你滑影片停留多久、哪一幀你暫停、你看到什麼會立刻關、你重看了幾次、什麼時候最活躍、你跟誰互動、你做什麼動作……
這是人類史上最大的「注意力行為資料庫」。
張一鳴從第一天就知道——演算法不是功能,是字節跳動的命。
2018 年,字節跳動成立了「AI Lab」。這個部門不做產品,只做研究。負責人 Dr. Ma Weiying 是前微軟亞洲研究院副院長。AI Lab 的第一個任務——把抖音/TikTok 的推薦演算法,做成人類看過最精準的那一套。
到 2021 年,字節的推薦演算法已經達到——用戶平均單日觀看時間從 30 分鐘暴漲到 95 分鐘。這個數字 Meta、Google、Netflix 都沒做到。
然後張一鳴就退休了。
衝突升級:張一鳴退休的真正原因與 AI 加速
2021 年 5 月,張一鳴突然宣布「辭去 CEO 職位,專注於 10 年後的長期願景」。
那時候他才 38 歲。字節剛完成一輪 4,000 億美金估值 的融資。所有人都看不懂——他為什麼這個時候退?
答案在 2 年後才浮現。
2023 年,字節跳動一口氣公布 5 個 AI 產品:
- 豆包:對標 ChatGPT 的大語言模型 + 消費者 app
- Cici / Coze:國際版 AI 助手,主打東南亞和中東
- 火山方舟:企業 AI 平台,B2B 賣模型 API
- PixelDance:影片生成 AI,後來發展成 Sora 替代品
- 扣子:AI 應用開發平台
這 5 個東西同時發布,你會發現——字節跳動不是要做「一個 AI」,他們要做「整個 AI 生態」。
同時,字節在兩個更底層的地方佈局:
底層一:自研 AI 晶片。2023 年底,字節跳動子公司「上海稷山半導體」(公開資料極少)被爆出正在設計 7nm AI 加速晶片。目標是減少對 NVIDIA 的依賴。字節花了上百億人民幣。
底層二:海外超大算力中心。字節跳動在馬來西亞、新加坡、墨西哥、愛爾蘭秘密建立 AI 資料中心。這些中心擺放 H100——在美國制裁中國高階晶片的限制下,字節用跨境法人迂迴取得算力。
2024 年業界估計——字節跳動的總算力,超過中國其他所有 AI 公司加總。
張一鳴為什麼 2021 年退?
因為他要——從 CEO 變成「10 年戰略總設計師」。
日常營運交給梁汝波。張一鳴自己搬去新加坡,閉關研究「十年後什麼是核心能力」。他告訴身邊人:「我要做的不是明年的 KPI,是 2030 年的字節。」
2024 年 9 月,有記者拍到張一鳴在新加坡一家咖啡店,手上拿的是一本 Stuart Russell 的《Human Compatible》——這是一本關於 AI 安全的經典著作。
這個男人,沒有在退休。他在準備下一場戰爭。
爆點揭示:字節的「全棧閉環」
字節跳動的 AI 戰略,有一個其他所有公司都做不到的東西——從資料到應用的完整閉環。
讓我拆給你看。
資料層:30 億用戶的行為資料。這是 OpenAI、Anthropic、甚至 Google 都拿不到的——因為使用者願意在抖音裡花 95 分鐘,但只在 ChatGPT 裡花 5 分鐘。字節有「深度使用者意圖資料」,這是所有 AI 訓練最稀缺的資源。
算力層:15 萬+ H100/H800。自研晶片補位。加上全球 4 個超大資料中心。
模型層:豆包基礎模型 + PixelDance 影片模型 + 語音/圖像/文字的多模態架構。2024 年豆包在中文大模型測試榜上穩居第一。
產品層:抖音、TikTok、剪映、CapCut、今日頭條、飛書、Lark、Cici、豆包 App——9 個產品,覆蓋 30 億用戶的不同場景。
硬體層:2024 年字節開始試水「智能眼鏡」和「AI 兒童陪伴機器人」。這是他們對抗 Apple + OpenAI io 的佈局。
這個閉環的可怕之處,是什麼?
當你使用豆包,它幫你寫文案。那個文案寫好,你直接複製到抖音發布。抖音的演算法學到「什麼文案會得到高讚」,這個學習反饋回豆包,讓豆包下次寫得更好。
下次你剪映剪影片,剪映的文生圖功能直接調用字節自己的影片模型。沒有延遲、沒有 API 費、沒有資料外洩。
你的企業用火山方舟買豆包 API,企業資料不離開字節雲端。字節雲端用的是字節自己的晶片。
這個閉環不只是成本優勢,是「別人永遠追不上的資料飛輪」。
Google 有使用者資料,但他們不做短影片。Meta 有社交資料,但他們沒有剪輯工具。OpenAI 有最強模型,但他們沒有 30 億用戶。
只有字節同時擁有以上所有東西。
這就是為什麼 2024 年 Meta 開始拼命收購 AI 人才、OpenAI 被迫收購 Jony Ive 的 io、Google 合併 Gemini 和 DeepMind——他們都知道,真正的對手不是對方,是一個他們拿不到資料的中國公司。
反思收尾
三件事。
第一——真正的 AI 戰爭,打的是資料而不是模型。模型可以開源、算力可以買、晶片可以造——唯獨 30 億人自願貢獻的「注意力資料」,無法複製。字節的護城河在這裡。
第二——中國的 AI 巨頭,長得和美國完全不同。Google、Meta、OpenAI 是「應用深度」型——他們在一個領域挖到極深。字節是「生態廣度」型——他們同時在 9 個場景裡佈局。這是兩種不同的遊戲。
第三——當張一鳴 38 歲「退休」閉關研究 2030 年,你應該感到不安。因為他看到了什麼,是大部分 CEO 忙於當季 KPI 時不會看到的事。歷史上所有偉大的 CEO,都是在看起來最安逸的時候,在規劃下一場仗。
下一集,我要講一個看似簡單、實際上藏有哲學密碼的問題——Claude 為什麼叫 Claude? 這個名字不是隨便取的,它指向 20 世紀一位被遺忘的數學天才。我會告訴你 Anthropic 在這個命名背後藏的野心。
如果這集讓你重新看待字節跳動,按個讚。分享給你那個還以為「短影片公司只會做娛樂」的朋友——他可能得更新一下認知了。
2026 年最新數據:Doubao 2.0 時代
我們講完字節的全棧閉環時,Doubao 還是個正在追趕的模型。2026 年春天,它已經不是追趕者了。
2026 年 2 月,字節正式發布 Doubao 2.0,定位是「Agent 時代」。不再只是對話模型,是能自主執行任務的代理系統。配套數據驚人:
月活 2.2 億(中國市場),日調用量 120 兆 tokens——這個數字 3 個月翻一倍,發布以來漲了 1,000 倍。作為對比,OpenAI GPT 系列全球日調用量估計 50-80 兆 tokens。Doubao 一家已經超過 OpenAI 加上 Anthropic 的總和。
2.2 億 × 每人每天打開 20 次 = 字節掌握全中國智慧型手機用戶最密集的 AI 行為資料。這是 EP09 講的「資料飛輪」在 2026 年的實際運轉速度。
更進一步的布局:3 月 Doubao AI 電商灰測(「一句話購物」)、4 月 Doubao × 賽力斯車載 AI 合作(車端部署 300 億參數模型、投資破 1 億人民幣)、MWC 2026 Nubia M153 內建 Doubao Phone Assistant。
唯一延期的是 AI 眼鏡——字節第一代智慧眼鏡原本 2026 上市,3 月公開消息延到 2027。這可能是因為他們想等第一代 OpenAI × Jony Ive 裝置上市後看市場反應。
張一鳴「退休」4 年後,字節的 AI 答卷第一次交出來——不靠明星單品,靠的是一張 30 億使用者編織的網,這張網已經鎖死了中國 AI 應用層的入口。