【資料圖】
人民財訊11月27日電,11月27日晚間,DeepSeek推出新型數學推理模型DeepSeekMath-V2,采用可自我驗證的訓練框架。該模型基于DeepSeek-V3.2-Exp-Base構建,通過LLM驗證器自動審查生成的數學證明,并利用高難度樣本持續優化性能。
2025-11-27 22:36:50 來源:證券時報
【資料圖】
人民財訊11月27日電,11月27日晚間,DeepSeek推出新型數學推理模型DeepSeekMath-V2,采用可自我驗證的訓練框架。該模型基于DeepSeek-V3.2-Exp-Base構建,通過LLM驗證器自動審查生成的數學證明,并利用高難度樣本持續優化性能。
責任編輯:ERM523