DeepSeek發布新模型稱表現可匹敵Gemini和ChatGPT

中國企業深度求索（DeepSeek）公布數周前發布的實驗性AI模型的兩個新版本，增加了幾處新功能，公司稱它們將有助於結合推理並自主執行某些操作。
DeepSeek在9月發布的模型由於其實驗性質被稱為DeepSeek-V3.2-Exp，但最新版本則被簡單地命名為 DeepSeek-V3.2。該初創公司表示，這項新服務在多項推理基準測試上的表現可與OpenAI的旗艦AI模型GPT-5相匹敵，表明中國的開源系統至少在某些指標方面仍能與矽谷最前沿的模型競爭。
DeepSeek還表示，V3.2版本將類似人類推理的能力與使用搜尋引擎、計算器和代碼執行器等工具的能力相結合。
公司在X上發帖稱，DeepSeek-V3.2是首個將思考融入工具使用的模型，同時支援思考模式與非思考模式的工具調用。
DeepSeek在1月以一個突破性的AI模型震驚全球科技界，該公司將該模型的實驗版本描述為邁向下一代AI的一步。
DeepSeek發布的第二個版本V3.2-Speciale專注於數學計算和其他長時推理能力。該初創公司表示，「DeepSeek-V3.2-Speciale的目標是將開源模型的推理能力推向極致，並探索模型能力的邊界。」
DeepSeek 表示，DeepSeek-V3.2-Speciale在主流推理基準測試上的性能表現媲美Gemini-3.0-Pro，而且在國際數學奧林匹克競賽和國際訊息學奧林匹克競賽等標準化測試中的表現能達到金牌水平。
DeepSeek稱，公司提出了一種大規模Agent訓練數據合成方法。
這是一個新的跡象，表明這間有影響力的AI實驗室正在加力研發以使AI處理更快、更高效。上周DeepSeek發布了一個名為DeepSeekMath-V2的新開源模型，在數學定理證明方面展現出強大能力。
該初創公司在題為《DeepSeek-V3.2：推動開源大語言模型的前沿》的技術報告中表示：「DeepSeek-V3.2 在多個推理基準上實現了與Kimi-k2-thinking和GPT-5類似的性能。」編輯/陳佳靖