Scale AI: 數據驅動的 AI 革新
- Dennis Lau @ Trilogies
- 6月18日
- 讀畢需時 4 分鐘

Scale AI 是一家位於美國的 AI 公司,專注於為人工智能應用提供高質素的訓練數據,成立於 2016 年,總部位於舊金山。該公司迅速成為 AI 領域的重要玩家,解決了 AI 發展中的關鍵瓶頸:缺乏足夠且精確標記的數據。以下是對 Scale AI 的詳細介紹,涵蓋其創立故事、服務範圍、行業影響、近期發展和相關爭議。
創立背景與歷史
Scale AI 由 Alexandr Wang 和 Lucy Guo 於 2016 年共同創立。Wang 是麻省理工學院 (MIT) 的輟學生,而 Guo 則是卡內基梅隆大學 (Carnegie Mellon) 的輟學生,並且是 Thiel Fellowship 的獲得者。他們的共同願景是通過提供高質素的數據來普及 AI。最初的靈感來自 Wang 的一個簡單項目:使用 AI 自動補充冰箱的食物,這個項目讓他意識到 AI 訓練需要大量有組織的數據。然而,當時市場上缺乏這樣的數據,這成為了他們創立 Scale AI 的動力。


在早期,Scale AI 專注於自駕車領域,為 AI 系統標記圖像數據。公司在 2016 年獲得 Y Combinator 的青睞,並成功籌集了 12 萬美元的種子輪資金。到 2018 年,兩位創始人都被列入《福布斯》30 歲以下精英榜,證明了他們的快速成功。然而,同年,Guo 因文化和抱負上的分歧離開 Scale AI,並創立了 Backend Capital。
根據 Scale AI 公司概覽,截至 2025 年,Scale AI 擁有約 900 名員工,總投資額達 13.5 億美元,標記數據量超過 130 億次,其中生成式 AI 數據標記達 8700 萬次。

服務範圍
Scale AI 提供了一系列服務,旨在通過提升數據質量來改善 AI 模型的性能。以下是其主要服務的詳細描述:
服務 | 描述 |
Scale Data Engine | 通過整合企業數據定制強大的基礎生成模型,為企業提供戰略優勢。 |
Scale GenAI Platform | 全棧平台,幫助企業利用自身數據開發 AI 應用,包括模型微調和 RLHF (強化學習人類反饋)。 |
數據標記 | 結合 AI 技術和人工審核,提供高質量、可擴展且高效的數據標記服務。 |
數據整合 | 提供智能數據管理工具,包括數據集管理、測試、模型評估和比較。 |
SEAL (Safety, Evaluation and Alignment Lab) | 研究部門,專注於評估和對齊大型語言模型 (LLMs),提升 AI 系統的安全性和可靠性。 |
Scale AI 還與多家領先的 AI 模型提供商合作,包括 OpenAI、Google、Meta 和 Cohere,並支持開源和閉源模型。根據 Scale AI 服務頁面,其數據引擎幾乎支持所有主要的基礎模型,並與生成式 AI 提供商如 Build AI 合作。
對 AI 行業的影響
Scale AI 在 AI 生態系統中扮演著不可或缺的角色,為發展先進的 AI 模型提供必要的數據基礎。該公司客戶遍佈各行各業,包括科技巨頭如 Microsoft 和 Meta、汽車公司如 General Motors 和 Toyota,以及初創公司如 Brex 和 OpenSea。根據 Wikipedia: Scale AI,其商業客戶還包括 Etsy、PayPal、Pinterest、Samsung 和 Uber,並與美國政府機構如美國陸軍和空軍合作,顯示了其在關鍵應用中的重要性和信任度。
Scale AI 的研究部門 SEAL 專注於模型安全性和對齊,通過私密評估和新型研究提升模型能力,並推出 SEAL Leaderboards 以增強 AI 評估的信任度。根據 Scale AI 研究頁面,這一舉措對大型語言模型 (LLMs) 的發展具有重要貢獻。
近期發展與爭議
2025 年 6 月,Meta Platforms 宣布以 148 億美元的價格收購 Scale AI 49% 的股份,這一交易使 Scale AI 的估值超過 290 億美元。根據 Wall Street Journal 報導,這項投資強調了數據在 AI 發展中的戰略重要性,並突顯了 Scale AI 在生成式 AI 領域的關鍵作用。作為這項交易的一部分,Scale AI 的創始人兼 CEO Alexandr Wang 將加入 Meta,領導其 AI 項目,這標誌著兩家公司的新篇章。
然而,這項合作也帶來了一些變化。根據 CNBC 報導,Google,作為 Scale AI 的最大客戶,決定與 Scale AI 斷絕關係,可能因競爭關係而擔憂。但 OpenAI 則表示將繼續與 Scale AI 合作,根據 Reuters 報導,這反映了 Scale AI 服務在 AI 社區中的持續價值。
此外,Scale AI 的子公司也引發了一些爭議。Remotasks 成立於 2017 年,是一個眾包平台,專注於為電腦視覺和自駕車領域創建標記數據。根據 Wikipedia: Scale AI,該平台在東南亞和非洲設有設施,但因工資低、延遲發薪等勞動實踐問題而受到批評。2024 年初,Remotasks 終止了在肯尼亞、尼日利亞和巴基斯坦的運營,原因是行政和運營考慮。Outlier 是一個專注於生成式 AI 數據工作的貢獻者平台,特別是在大型語言模型的開發和微調方面,爭議較少。
這些發展顯示了 Scale AI 在快速成長的同時,也面臨行業競爭和勞動實踐的挑戰。
結論
Scale AI 位於 AI 革命的前沿,為開發尖端 AI 應用提供必要的數據基礎。從其初期的創立到現在的估值超過 290 億美元,Scale AI 證明了數據在 AI 發展中的關鍵作用。隨著最近的投資和戰略合作,Scale AI 將繼續塑造 AI 的未來,儘管其運營環境也面臨著變化和挑戰。
關鍵引用
Comments