DeepSeek是一款由大陸人工智慧公司研發的大型語言模型,擁有強大的自然語言處理能力,能夠理解並回答問題,還能輔助寫代碼、整理資料和解決複雜的數學問題。與Open AI開發的Chat GPT相比,DeepSeek不僅率先實現了媲美OpenAI-o1模型的效果,還大幅降低了推理模型的成本。美國總統川普(Donald Trump)直言「DeepSeek給美國產業敲警鐘」。
《北京科技報》採訪北京郵電大學人工智慧學院人機交互與認知工程實驗室主任劉偉表示,DeepSeek最大的優勢在於算法的改進和優化,節省了算力和數據量。以前如果說OpenAI是「大力出奇蹟」,如今DeepSeek則是「小力也可以出奇蹟」——小的算力用新的方法也能創造奇蹟。
南京大學人工智慧學院教授俞揚指出,DeepSeek在算法上進行了相應的優化,使得訓練成本大幅降低。俞揚解釋,OpenAI最初在做Chat GPT的時候,用了強化學習的技術,但是強化學習的技術是很通用的強化學習的工具,會導致它的機器要用得很多。後來的研究者們就發現其實不需要這麼複雜的算法,可以針對語言模型來設計出簡單的算法,大概可以節省3/4的機器去訓練強化學習的過程。在DeepSeek的公布的技術方案中,它的強化學習也使用了這種簡化的方案。
俞揚認為,從整個AI大模型產業來看,DeepSeek的成功或許代表了一種全新的發展方向——通過算法優化而非單純依賴算力和數據量來提升模型性能。這也為AI大模型產業的發展提供了新的思路。
據CCTV國際時訊官微報導,當地時間1月27日晚間,美國總統川普在佛羅里達州邁阿密(Miami)發表講話時,對中國人工智慧初創公司DeepSeek攪動納斯達克一事表示,DeepSeek的出現「給美國相關產業敲響了警鐘」,美國「需要集中精力贏得競爭」。川普同時表示,他認為DeepSeek的模型高效且經濟,其出現是一種積極的發展。