輝達(NVIDIA)上週五的股價下跌了3.2%,而在週日的夜盤中仍持續走低,原因是名為DeepSeek的一家中國新創公司以不到600萬美元的成本,開發出了一款能夠與ChatGPT和Meta模型抗衡的AI產品,讓市場對於大規模投資AI基礎設施的必要性產生了懷疑。
這家名為DeepSeek的中國AI新創公司在美國科技界投下一顆震撼彈。該公司在去年聖誕節後不久推出了其最新的AI系統DeepSeek-V3,並且根據第三方的基準測試結果顯示,這個系統的效能超過了多個行業領先的AI模型,包括Meta的Llama 3.1、OpenAI的GPT-4o以及Anthropic的Claude Sonnet 3.5。
美國AI公司Scale AI的執行長亞歷山大‧王(Alexandr Wang)在世界經濟論壇上對DeepSeek-V3讚不絕口,表示該系統的表現達到了頂尖水平,甚至可以媲美美國最優秀的AI模型。亞歷山大‧王在接受CNBC訪問時指出,美國和中國之間的人工智慧競賽實質上是一場「AI戰爭」,他也提到儘管美方對高階晶片實施出口管制,但中國實際擁有的輝達H100晶片數量可能遠超過外界推測,這意味著即便有管制,中國仍然能夠取得最新的AI模型所需晶片。
DeepSeek是由對沖基金幻方量化(High Flyer)所創立,該公司的成功反映了中國AI發展的趨勢。在美國針對高階晶片實施出口管制的背景下,中國企業正積極創新,開發出更具效能的演演算法與訓練技術。因其對成本和效率的重視,DeepSeek甚至贏得了「AI界的拼多多」的稱號,此名稱標誌著它在追求低價上與中國電商巨頭的相似之處。
雖然美國企業在突破性研究上一向領先,但中國企業在執行力、大規模應用及成本效益追求方面表現出色。DeepSeek的最新模型顯示,最頂尖的AI技術並不一定需要龐大的資料中心或數十億美元的資本投入。美國是否能夠保持AI領先地位面臨嚴峻挑戰。
據大陸媒體報導,DeepSeek 團隊主要由中國國內頂尖名校的畢業生組成,成員年齡大多在1998年出生,且工作經驗通常不超過五年。他們徵才的方針著重於「聰明、理工科背景、年輕且經驗少」的人才,包含管理層也不超過35歲。
微軟執行長納德拉(Satya Nadella)也對DeepSeek的新模型表示震驚,認為他們成功地建立了一個運算效率高的開放原始碼推論模型,「我們必須非常認真地看待中國在這方面的發展。」
德國《世界報》(DIE WELT)的知名市場評論員霍爾格(Holger Zschäpitz)將DeepSeek稱為「美股最大的威脅」。同時,美國財經部落客Zerohedge指出,DeepSeek低廉的訓練成本正在對美國之前宣佈的5,000億美元AI基建計畫造成重大的衝擊。