-
潘禺:今年有另一場更值得關(guān)注的數(shù)學(xué)競賽
AI的數(shù)學(xué)能力
ChatGPT這樣的大語言模型在簡單的算術(shù)計(jì)算上會犯錯,因?yàn)槟P筒⒉皇菑幕驹硗茖?dǎo)出答案,而是根據(jù)輸入猜測最可能的輸出,這種方法有時候并不奏效。GPT-4的研究人員測試了數(shù)百道國際數(shù)學(xué)奧林匹克(IMO)級別的問題,成功率只有1%,只有一個被簡化后的特定問題答對了。大型語言模型在生成回答時依賴于訓(xùn)練數(shù)據(jù)中學(xué)習(xí)到的模式,盡管訓(xùn)練數(shù)據(jù)集非常龐大,但它們可能不包含足夠的邏輯推理或數(shù)學(xué)證明的示例。
DeepMind的AlphaProof和AlphaGeometry 2這兩個更專門的系統(tǒng),這次的表現(xiàn)就好得多。
AlphaProof是用于形式化數(shù)學(xué)推理的系統(tǒng),結(jié)合了預(yù)訓(xùn)練的語言模型和AlphaZero強(qiáng)化學(xué)習(xí)算法,也就是之前自學(xué)掌握了國際象棋、將棋和圍棋的算法。它在Lean中訓(xùn)練自己證明數(shù)學(xué)陳述,并通過自動將自然語言陳述翻譯成形式化的數(shù)學(xué)語言陳述,創(chuàng)建了一個不同難度的形式化問題庫。AlphaProof通過在Lean中搜索可能的證明步驟來生成候選解決方案,然后證明或反駁它們。在IMO比賽前幾周內(nèi),它證明或反駁了數(shù)百萬問題進(jìn)行自我訓(xùn)練,涵蓋不同的難度和廣泛的數(shù)學(xué)領(lǐng)域。
AlphaGeometry是一個神經(jīng)符號系統(tǒng),由神經(jīng)語言模型和符號推導(dǎo)引擎組成,它們協(xié)同工作以查找復(fù)雜幾何定理的證明。一個系統(tǒng)提供快速、 “直觀 ”的想法,而另一個系統(tǒng)則提供更深思熟慮、更理性的決策。
語言模型擅長識別數(shù)據(jù)中的一般模式和關(guān)系,可以快速預(yù)測可能有用的結(jié)構(gòu),但通常缺乏嚴(yán)格推理或解釋其決策的能力。符號推導(dǎo)引擎基于形式邏輯,并使用明確的規(guī)則來得出結(jié)論,但緩慢而不靈活。語言模型指導(dǎo)符號推導(dǎo)引擎尋找?guī)缀螁栴}的可能解決方案,從無限的可能性中預(yù)測哪些像點(diǎn)、線或圓這樣的新幾何結(jié)構(gòu)最有用。如果未找到解決方案,語言模型將添加一個可能有用的結(jié)構(gòu),為符號引擎開辟新的推導(dǎo)路徑。此循環(huán)一直持續(xù),直到找到解決方案。
這有點(diǎn)像諾貝爾經(jīng)濟(jì)學(xué)獎得主丹尼爾·卡尼曼在《思考,快和慢》一書中提出的人類思維的兩種系統(tǒng),快速思考系統(tǒng)是一種快速、直覺式的思維方式,慢速思考系統(tǒng)是一種緩慢、邏輯性強(qiáng)、需要集中注意力的思維方式。
AlphaGeometry 2采用的符號引擎比上一代快兩個數(shù)量級。當(dāng)遇到新問題時,使用一種新的知識共享機(jī)制來實(shí)現(xiàn)不同搜索樹的高級組合,以解決更復(fù)雜的問題。在今年的比賽之前,AlphaGeometry 2可以解決過去25年中83%的歷史IMO幾何問題,而上一代為53%。在今年的IMO 2024中,AlphaGeometry 2在收到形式化后的問題后,19秒內(nèi)解決了第4題(下圖,要求證明 ∠KIL 和 ∠XPY 之和等于 180°,AlphaGeometry 2 提議構(gòu)造 E,即 BI上的一個點(diǎn),使 ∠AEB = 90°)。
訓(xùn)練AlphaGeometry并不是依靠人工的示例,AlphaGeometry首先生成了10億個幾何對象的隨機(jī)圖形,并詳盡地推導(dǎo)出每個圖形中點(diǎn)和線之間的所有關(guān)系,找到每個圖形中包含的所有證明,然后逆向工作以找出需要哪些額外的幾何結(jié)構(gòu)(如果有)來得出這些證明。數(shù)據(jù)經(jīng)過過濾,排除相似示例,產(chǎn)生一個包含1億個不同難度獨(dú)特示例的最終訓(xùn)練數(shù)據(jù)集。有了這么多添加新幾何結(jié)構(gòu)而得到證明的例子,AlphaGeometry的語言模型,就能夠在遇到奧數(shù)幾何題時,為添加新結(jié)構(gòu)提出很好的建議。
我們的教育做好準(zhǔn)備了嗎
教育對個人成長、社會進(jìn)步和國家發(fā)展都至關(guān)重要,人工智能對教育的影響已經(jīng)來臨,過去的運(yùn)作模式和利益結(jié)構(gòu)早晚都將受到?jīng)_擊。但或許是因?yàn)榧扔懈窬值母畹俟蹋瑖鴥?nèi)對這方面的討論還不多,但只要想想,同樣長期具備壟斷性的傳媒行業(yè)發(fā)生了多大變化,就很難忽視這種改變的前景。
人工智能已經(jīng)深刻改變了媒體,當(dāng)人們使用TikTok、抖音、今日頭條之類的應(yīng)用獲取信息時,算法主導(dǎo)了內(nèi)容的個性化推薦和分發(fā)。這一結(jié)果對傳媒行業(yè)的影響非常明顯,報(bào)紙、電視臺等傳統(tǒng)壟斷機(jī)構(gòu)無法再占據(jù)流量最大的傳播渠道。
在教學(xué)上,AI同樣已經(jīng)做到了通過分析學(xué)生的學(xué)習(xí)進(jìn)度、錯誤模式和知識漏洞,提供個性化的學(xué)習(xí)路徑和習(xí)題練習(xí)。
比如,Khan Academy就使用機(jī)器學(xué)習(xí)算法,根據(jù)學(xué)生的答題記錄提供個性化的題目推薦,使學(xué)習(xí)更具針對性。AI平臺ALEKS通過自動化反饋機(jī)制幫助學(xué)生在練習(xí)中獲得即時指導(dǎo),并通過不同題型進(jìn)一步鞏固知識。在線平臺DreamBox Learning提供自適應(yīng)數(shù)學(xué)練習(xí)系統(tǒng),學(xué)生的進(jìn)度可以依據(jù)他們的實(shí)時表現(xiàn)進(jìn)行調(diào)整,確保學(xué)習(xí)曲線與能力相匹配。
而在解題和題庫方面,AI也已經(jīng)有了不少實(shí)際應(yīng)用。通過AI應(yīng)用Socratic,學(xué)生可以拍攝問題,系統(tǒng)自動識別問題并提供相應(yīng)的解答提示及詳細(xì)的解題過程。Edmentum使用AI生成多樣化的習(xí)題和測驗(yàn),以幫助教師設(shè)計(jì)針對性的評估,節(jié)省教師設(shè)計(jì)練習(xí)題的時間。
如今,Google DeepMind在高難度的競賽解題上取得突破,意味著對數(shù)學(xué)這樣最重要的基礎(chǔ)學(xué)科,通過AI的加持,使優(yōu)質(zhì)教育資源能充足提供,不再稀缺,技術(shù)上的障礙已經(jīng)基本掃清。
Google正在基于Gemini開發(fā)一種自然語言推理系統(tǒng),這意味著將不需要依賴人類專家將數(shù)學(xué)問題翻譯成形式化的語言進(jìn)行處理,能與其它AI系統(tǒng)順利集成。當(dāng)AI以自然語言解決數(shù)學(xué)問題后,科教系統(tǒng)的面貌必將改變。
中國教育有三大夢想,因材施教、教育公平和減負(fù)。
因材施教的障礙在于,沒有盡全力嘗試,許多人并不能認(rèn)知到自己該走哪條路,家長也不愿接受孩子“是騾子還是馬”。選擇的迷霧加劇了賽道的狹窄,而AI能提供針對性的評估,有效改善個人天賦與才能的識別效率,幫助每個人更早更精準(zhǔn)地定位和把握自己的比較優(yōu)勢。無論是利用圖像識別技術(shù)的體育測評,還是基于機(jī)器學(xué)習(xí)的數(shù)學(xué)評估,AI會公正地幫助你判斷自己。
AI的發(fā)展能否帶來社會公平,這歷來是一個有爭議的問題。對于互聯(lián)網(wǎng)科技公司來說,用戶的增加意味著技術(shù)成本的攤薄。雖然話不能說絕對,但從過去的經(jīng)驗(yàn)看,AI提供的教育資源,與別的互聯(lián)網(wǎng)服務(wù)一樣,也很可能是往普及方向發(fā)展的。這意味著,除了帶來因材施教,AI將促進(jìn)教育公平。
在減負(fù)上,AI也能發(fā)揮巨大作用。就像計(jì)算器對數(shù)學(xué)考試的影響,導(dǎo)致部分價值不大的計(jì)算在教學(xué)和考試中被舍棄,而更專注于考察數(shù)學(xué)思維、概念的理解和運(yùn)用。AI的影響也有希望進(jìn)一步優(yōu)化教學(xué)和考試內(nèi)容,減輕中國學(xué)生在某些解題套路上依靠“題海戰(zhàn)術(shù)”達(dá)到“肌肉記憶”的內(nèi)卷性消耗。
關(guān)注數(shù)學(xué)的人可能都知道今年國內(nèi)的一些輿情。某競賽初賽結(jié)果的爭議徹底出圈了,某數(shù)學(xué)大師領(lǐng)銜的某書院的爭議,則一直在小圈子內(nèi)流傳。但由于涉及到中國教育的金字塔結(jié)構(gòu)和招考錄取的指揮棒,后者對家長和學(xué)生的影響面其實(shí)并不小。
如果把這兩件事放在一起看,這都說明了數(shù)學(xué)競賽的門檻很高,數(shù)學(xué)研究的門檻更高,這條道路只適合極少數(shù)的人。這背后牽涉的討論非常復(fù)雜,但這個結(jié)論大致不差。
為了挑選出這少數(shù)人,需要多數(shù)人的陪跑。這種陪跑不僅發(fā)生在基礎(chǔ)教育階段,很多數(shù)學(xué)競賽的獲獎?wù)撸谝虼吮荛_高考,獲得了頂級學(xué)府的錄取后,最終也都沒有選擇從事數(shù)學(xué)研究的道路,這也是網(wǎng)上“IMO金牌與菲爾茲獎”的老生常談了。偏偏數(shù)學(xué)又是如此重要,社會在一定程度上容忍了投機(jī)與內(nèi)卷的情況,而形成了鼓勵“天才少年”的風(fēng)氣。但對每一個個體來說,內(nèi)卷的代價要獨(dú)自承受,成長選擇的容錯率都是有限的,缺少退路的攀登難以長久,“一將功成萬骨枯”的情況傷害社會的總體利益,國家努力給教輔降溫,阻止家庭為爭奪教育資源而“升級軍備競賽”,背后也有這樣的考量。
教育是強(qiáng)國之基,教育資源和住宅用地一樣,人為制造出稀缺性,也許能夠造成短期的產(chǎn)業(yè)繁榮,卻可能埋下看不見的長久隱患,比如已經(jīng)被一再討論的原始創(chuàng)新不足問題??紤]人口結(jié)構(gòu)的變化和高學(xué)歷人口的規(guī)模,和住房一樣,中國優(yōu)質(zhì)教育資源稀缺的時代終將過去。
目前,還很難說AI提供的充盈教育資源與個性化輔導(dǎo),能不能動搖中國教育的金字塔結(jié)構(gòu),也不清楚教育領(lǐng)域的“今日頭條”,這樣的規(guī)則破壞者和秩序顛覆者會在什么時候出現(xiàn)。但最新的AI技術(shù)進(jìn)展,一定會鼓勵創(chuàng)業(yè)者與投資者摩拳擦掌,技術(shù)將又一次走在從業(yè)者和政策制定者的前面。
本文系觀察者網(wǎng)獨(dú)家稿件,文章內(nèi)容純屬作者個人觀點(diǎn),不代表平臺觀點(diǎn),未經(jīng)授權(quán),不得轉(zhuǎn)載,否則將追究法律責(zé)任。關(guān)注觀察者網(wǎng)微信guanchacn,每日閱讀趣味文章。
標(biāo)簽 心智觀察所- 原標(biāo)題:今年有另一場更值得關(guān)注的數(shù)學(xué)競賽 本文僅代表作者個人觀點(diǎn)。
- 責(zé)任編輯: 李昊 
-
中國貨運(yùn)航天飛機(jī),來了
2024-10-30 07:26 航空航天 -
馬斯克擁抱特朗普的隱秘心境,藏在這部美劇中
2024-10-29 14:35 心智觀察所 -
神十九將帶果蠅上太空 小鼠:等我
2024-10-29 13:34 航空航天 -
我國首艘深遠(yuǎn)海多功能科學(xué)考察及文物考古船完成試航
2024-10-26 19:44 中國精造 -
“把大象裝進(jìn)冰箱”,鴻蒙為什么行?
2024-10-25 14:41 心智觀察所 -
我國科研人員揭示過敏反應(yīng)關(guān)鍵機(jī)制
2024-10-25 13:40 -
我國成功發(fā)射天平三號衛(wèi)星
2024-10-22 08:55 航空航天 -
肖克利的幽靈重現(xiàn)硅谷
2024-10-22 08:39 心智觀察所 -
中方代表:防止出現(xiàn)機(jī)器自主殺人
2024-10-22 08:26 科技前沿 -
中國科學(xué)家讓“死亡”50分鐘豬腦“復(fù)活”
2024-10-20 15:05 科技前沿 -
污蔑寧德時代,美國有著怎樣的怨念與悔恨?
2024-10-17 14:33 心智觀察所 -
我國成功發(fā)射高分十二號05星
2024-10-16 08:33 航空航天 -
我國首個空間科學(xué)規(guī)劃公布!明確這些目標(biāo)
2024-10-15 09:54 航空航天 -
拿下諾貝爾化學(xué)獎的中國血統(tǒng),還將拯救谷歌?
2024-10-15 08:33 心智觀察所 -
星艦第五次試飛實(shí)現(xiàn)重大突破,但我國類似火箭可能得等一等
2024-10-13 23:04 航空航天 -
中國汽車電子產(chǎn)業(yè)將站上兩個世界之巔
2024-10-12 08:29 心智觀察所 -
世界最大!地下700米的這個玻璃球,將探尋宇宙之初
2024-10-11 10:00 科技前沿 -
我國成功發(fā)射衛(wèi)星互聯(lián)網(wǎng)高軌衛(wèi)星
2024-10-10 22:49 航空航天 -
我國科技成果轉(zhuǎn)化問題到了必須要解決的地步
2024-10-08 16:58 心智觀察所 -
2024年諾貝爾生理學(xué)或醫(yī)學(xué)獎揭曉
2024-10-07 17:45 諾貝爾獎
相關(guān)推薦 -
最新聞 Hot
-
馬斯克:拜登,100%叛國
-
“美歐經(jīng)濟(jì)學(xué)家們集體搖頭”
-
“流入中國的主權(quán)基金激增21%”
-
中國首次實(shí)現(xiàn)!“領(lǐng)先馬斯克的星鏈”
-
“我倆聊吧,氣瘋他們”
-
以防長放話:如果哈馬斯不放人,加沙將遭到久違的猛烈打擊
-
《經(jīng)濟(jì)學(xué)人》“勉強(qiáng)”承認(rèn):中國量子發(fā)展模式“也許”更好
-
15死!新年首日,“恐襲”疑云籠罩美國
-
“美國農(nóng)民買中國貨,原因很簡單”
-
美國首席大法官:那誰試圖恐嚇法官
-
“波蘭外長,你被CIA收買了?”
-
他宣布辭職,炮轟內(nèi)塔尼亞胡政府
-
更多細(xì)節(jié):美國公民、退伍老兵、案發(fā)時揮舞ISIS旗…
-
這一領(lǐng)域,普京指示要確保同中國合作
-
哈馬斯譴責(zé)巴勒斯坦權(quán)力機(jī)構(gòu)
-
特朗普“翻車”
-