當(dāng)前位置:首頁 >  科技 >  IT業(yè)界 >  正文

華為小藝AI競賽Agent首戰(zhàn)國際數(shù)學(xué)奧林匹克大賽(IMO)榮獲佳績!

 2025-07-28 11:46  來源: 互聯(lián)網(wǎng)   我來投稿 撤稿糾錯

  阿里云優(yōu)惠券 先領(lǐng)券再下單

在2025年國際數(shù)學(xué)奧林匹克競賽(IMO)官方的特別邀請下,小藝AI競賽Agent亮相本屆全球頂尖的數(shù)學(xué)賽事。經(jīng)過三天的激烈角逐,小藝AI競賽Agent成功攻克6道難題中的5道,以34分的優(yōu)異成績摘得銀牌,距離金牌分?jǐn)?shù)線(35分)僅1分之差。這一歷史性的突破,標(biāo)志著華為AI的邏輯推理能力達(dá)到了一個新的高度。

IMO主席Gregor Dolinar教授對華為AI的表現(xiàn)給予了高度評價:“華為AI提交的答卷獲得了34分(滿分42分),這是一個了不起的成就。(The Huawei AI scripts received a grade of 34 out of 42, which is a remarkable result.)”

不止于答題:小藝AI競賽Agent展現(xiàn)專家級解題藝術(shù)

與傳統(tǒng)模型追求解題套路不同,小藝AI競賽Agent在解題過程中展現(xiàn)了接近頂尖解題方式的創(chuàng)造力和嚴(yán)密性:

專家級推理能力:小藝AI競賽Agent完美攻克第1至第4題,均獲滿分(7分)。其論證過程嚴(yán)謹(jǐn)、邏輯自洽、可讀性強,此外在第3題中還靈活運用了“升冪定理”等技巧,展現(xiàn)了深厚的數(shù)學(xué)知識儲備。值得說明的是第5題,評審組確認(rèn),盡管Agent因?qū)ζ骄智闆r的表述存在細(xì)微瑕疵被扣1分,但其核心思維過程已完整包含了對該情況的嚴(yán)謹(jǐn)證明。這表明,它實際上已具備了解答該題所需的全部數(shù)學(xué)能力。

閃耀的解題靈感在第2題的證明中,小藝AI競賽Agent精準(zhǔn)預(yù)測并添加了唯一一個輔助點,便完成了整個復(fù)雜證明的生成。其解法之高效、思路之凝練,顯著優(yōu)于已知的公開解法。

接近完美的思考深度:第1題的解答思路流程完整,清晰簡潔,對于n=3的情況討論充分,歸納過程嚴(yán)謹(jǐn);同時在第4題的解答中對所有情況討論完備,證明的結(jié)構(gòu)層級分明,易于理解。

> 對IMO競賽感興趣的開發(fā)者,可以前往GitHub了解小藝AI競賽Agent完整的賽題解答,鏈接:https://github.com/Huawei-xiaoyi/IMO2025-solutions

技術(shù)揭秘:驅(qū)動巔峰表現(xiàn)的“雙腦”協(xié)同架構(gòu)

小藝AI競賽Agent的卓越表現(xiàn),源于其創(chuàng)新的“自然語言大模型 + 形式化證明”協(xié)同架構(gòu)。這套系統(tǒng)如同一個擁有“左右腦”的數(shù)字大腦,將人類的直覺創(chuàng)造與機

器的嚴(yán)謹(jǐn)驗證無縫融合。

1、思維風(fēng)暴與“AI同行評審”:孕育創(chuàng)造性解法

面對難題,小藝AI競賽Agent首先通過并行采樣生成海量、多樣化的解題思路,如同進(jìn)行一場“思維風(fēng)暴”。隨后,啟動獨特的“AI同行評審”機制,讓不同的AI模型互相審閱、辯論、評分,從而篩選出最優(yōu)的思路路徑。這一過程還會融合形式化證明的反饋,指導(dǎo)AI模型進(jìn)行多輪自我修復(fù)與迭代優(yōu)化,極大提升了模型攻克精英級難題的創(chuàng)造力。

2、迭代式多層級證明:構(gòu)建嚴(yán)密的邏輯閉環(huán)

為克服高復(fù)雜度數(shù)學(xué)證明嚴(yán)謹(jǐn)性的挑戰(zhàn),華為小藝團隊設(shè)計了迭代式多層級并行證明系統(tǒng)。該系統(tǒng)首先將復(fù)雜的證明目標(biāo)分解為樹狀的多層級子問題,然后由形式化證明模型自下而上地對每個子節(jié)點進(jìn)行大規(guī)模并行驗證。一旦某個環(huán)節(jié)證明失敗,具備反思和自我修正能力的模型將立刻啟動修復(fù)流程,直至整個邏輯鏈條完美閉環(huán)。

里程碑與新起點:共探AI與教育的未來

此次賽事的成果,不僅是華為AI發(fā)展的重要里程碑,更充分地證明了基于大語言模型(LLM)的多Agent協(xié)同系統(tǒng)在解決高階數(shù)學(xué)問題上的強大潛力。

與此同時華為小藝團隊也意識到,當(dāng)前系統(tǒng)在面對極高復(fù)雜度的數(shù)學(xué)問題時(如本屆IMO第6題)仍有局限,未來將會繼續(xù)提升小藝的抽象推理與問題建模能力,持續(xù)向高階數(shù)學(xué)推理探索。

據(jù)悉,小藝AI競賽Agent的核心能力,未來將逐步賦能于小藝教育Agent。華為小藝團隊或?qū)⒁园酌麊螜C制,優(yōu)先向數(shù)學(xué)及AI領(lǐng)域的專業(yè)研究者開放,旨在共同推動智能解題方法論的創(chuàng)新,讓頂級的思維能力普惠每一位學(xué)習(xí)者。

申請創(chuàng)業(yè)報道,分享創(chuàng)業(yè)好點子。點擊此處,共同探討創(chuàng)業(yè)新機遇!

相關(guān)文章

熱門排行

信息推薦