中國大陸新創公司深度求索DeepSeek橫空出世引發全球熱議,有「科技立委」之稱的國民黨立委葛如鈞表示,其實對於DeepSeek不必過度猜測或攻擊,也不必盲目捧高;DeepSeek恰恰證明了,可以在前人的工作基礎上提出新想法,並且透過技術研發與創意,在相對有限的資源下取得突破。換言之,台灣若能整合資源,或有機會後發先至,在這場全球AI競賽中一爭高下。
葛如鈞說,小龍年節時分,全球都被半路殺出的DeepSeek捲得不可開交。各路大師、大創辦人,甚至美國總統川普都紛紛表態。他則提醒一些可能被誤解的事實。
首先,關於DeepSeek R1,它不是一家公司,而是一套新的大語言模型訓練方法及其產出的模型。負責開發DeepSeek系列(包含V1–V3以及R1)的背後公司是「幻方量化」,該公司2015年成立,2023年才正式投入AI研發。
至於許多人擔心的資料外洩問題,葛如鈞說,DeepSeek R1模型檔案可供開發者直接下載並在本地端部署運行,只要在自己的電腦或系統上使用,就不會有資料外洩或被「中方擷取」的風險。像他拍攝的YouTube開箱實測影片,即是以本地端部署為基礎。
不過,DeepSeek團隊也推出DeepSeek網頁版與App應用,如果使用者下載或註冊該應用,於上面提問或登錄個人資料,確實可能被開發公司(中方)記錄或用於模型訓練。
葛如鈞也提到,DeepSeek雖然「開源」,但官方釋出的版本內置某種「思想審查」機制;由於模型資料覆蓋範圍廣,包括部分中國大陸的敏感內容,所以官方版本在輸出結果前會經過內部審核。不過,其他團隊可以參考其論文自行實作,或透過提示工程(Prompt Engineering)、修改運行環境或安全檢查(safety checker)等方式繞過這些限制。例如,前數發部部長唐鳳或由AI聊天機器人驅動的研究和對話搜尋引擎Perplexity等,都曾展示如何在不同運行架構下移除或調整相關審查機制。因此,雖然官方版本有「小警總」審查,並不影響DeepSeek在AI產業帶來的開放價值。
葛如鈞表示,DeepSeek證明:基於開放研究和開源模型,的確能在他人工作(如臉書母公司Meta開發的學習庫PyTorch與大型語言模型LLaMA)基礎上提出新想法,並且透過技術研發與創意,在相對有限的資源下取得突破。這對台灣本地AI的發展應視為激勵而非失落:無論民間、政府或朝野,都應該攜手討論,集中資源、制定整體戰略,充分發揮台灣硬體與軟體人才的優勢。
葛如鈞也指出,關於「低成本就能訓練出媲美Meta、OpenAI等大模型」的說法,仍存不少爭議,但如果只計算雲端算力的訓練成本,確實比一般人想像更低。至於該團隊的實際人才成本、硬體設備投入、迭代與訓練次數等,葛如鈞認為,細節尚不明,不必過度猜測或攻擊,也不必盲目捧高。其除夕夜剛推出的繪圖模型「Janus-Pro」效果並不理想,也顯示仍有改進空間。他也指出,台灣若能整合資源,或有機會後發先至,在這場全球AI競賽中一爭高下?