新華社倫敦7月22日電 谷歌旗下“深層思維”公司21日宣布,其搭載了“深度思考”能力的高級版“雙子座(Gemini)”人工智能模型測試得分達到國際數學奧林匹克競賽(IMO)金牌水平,該成績已獲官方認證。
“深層思維”公司在官網發布公報說,高級版“雙子座”模型的“深度思考”模式成功解答了2025年國際數學奧林匹克競賽6道題目中的5道,共獲35分,達到金牌水平。相關解題方案已在網上公布。
“我們可以證實,谷歌‘深層思維’已達成這一備受期待的里程碑,在總分42分中獲得35分——這已達到(今年)金牌分數線。”國際數學奧林匹克競賽主席格雷戈爾·多利納爾教授說。他稱解題方案在諸多方面都“令人驚嘆”。國際數學奧林匹克競賽評分員認為這些方案清晰、精確,且大多數都易于理解。
國際數學奧林匹克競賽自1959年起每年舉辦一屆,參賽選手需在兩天(每天各4.5小時)內解答涉及代數、組合數學、幾何和數論四大領域的6道極具難度的題目。近年來,該競賽成為檢驗人工智能模型解決高級數學問題能力和推理能力的熱門挑戰。
“深層思維”公司推出的人工智能模型AlphaProof與AlphaGeometry 2組合解答了2024年國際數學奧林匹克競賽6道題中的4道,以28分的成績達到當年銀牌水平。為了讓這兩個模型理解題目,專家先將題目從自然語言翻譯成特定計算機語言,解題總共耗費兩到三天的計算時間。今年,高級版“雙子座”測試成果相比去年有顯著進展,它直接根據自然語言描述的題目給出數學證明,并在競賽時限內完成挑戰。競賽協調員采用與學生選手解題方案相同的標準對其進行正式評分和認證。
“深層思維”公司說,今年取得的成果得益于高級版“雙子座”的“深層思考”模式——這是一種針對復雜問題的增強推理模式,融合了“并行思維”等最新技術。這種模式設置可使模型在給出最終答案之前,同時探索并整合多種可能的解決方案,而非沿著單一、線性思路推進。