能力與人類奧林匹亞金牌得主接近!Google DeepMind 已可解決複雜幾何問題Google DeepMind 開發的 AI 系統 AlphaGeometry 已能夠解決複雜的幾何問題,這被認為是...

贴文 1个月前
960 0

能力與人類奧林匹亞金牌得主接近!Google DeepMind 已可解決複雜幾何問題

Google DeepMind 開發的 AI 系統 AlphaGeometry 已能夠解決複雜的幾何問題,這被認為是機器更具人類「推理」能力的一個重要進程。
AlphaGeometry 是一個神經符號系統(neuro-symbolic system ),結合神經語言模型和符號推演引擎組合而成,以解決數學問題,語言模型擅長辨識模式和預測,而符號引擎則基於形式邏輯和嚴格規則進行推斷。
雖然 AlphaGeometry 在「初階」數學中表現出色,但尚無法應對大學教授的高級、抽象問題。

2023 年,具備文字、語言、圖像、音訊能力的大型語言模型(LLM)已經驚艷世人,不過模型是否能在更廣泛的「數學領域」取得一樣的成就,AI 研究者仍在不斷挑戰。Google DeepMind 研究團隊最近就成功創造出一個可以解決複雜幾何問題的 AI 系統,此項研究已經發表在《自然》(Nature)期刊上。

研究的合著者之一 Thang Luong 指出,和那些基於文本的 AI 模型相比,數學的訓練數據明顯較少,且解決數學問題需要邏輯推理,這是大多數現有 AI 模型不擅長的。「這種對推理的需求,成為了數學被用來評估 AI 進展的重要標準之一的原因。」

DeepMind 的程式,名為 AlphaGeometry,結合了一種語言模型和一種被稱為符號引擎( symbolic engine)的 AI,該引擎使用符號和邏輯規則進行推斷。語言模型擅長辨識模式並預測過程中的後續步驟。然而,它們的推理卻缺乏解決數學問題所需的嚴謹性。另一方面,符號引擎則完全基於形式邏輯和嚴格的規則,這使它能夠引導語言模型做出理性的決策。

Google 先前就曾專文解釋,這項作法的靈感來自於《快思慢想》(Thinking, Fast and Slow)中,將人的思考模式分為系統 1(直覺式思考)和系統 2(邏輯式思考)。

可以說,LLM 善於在系統 1 下運行,例如,它可以快速生成文本但沒有經過深入的思考,比如問它一些算數問題,若是單單使用系統 1,雖然它可以快速給出答案, 但卻因為不能停下來算數,所以只能給出第一個想到的答案,所以常常出現計算錯誤的問題。而傳統計算和系統 2 的思維非常相似,公式化且不靈活,不過只要依循正確的步驟順序就能產生對的結果。

當 AlphaGeometry 面臨一個幾何問題時,它首先試圖使用其由邏輯驅動的符號引擎生成證明。如果單單使用符號引擎無法做到,語言模型會向圖表添加新的點或線。這為符號引擎繼續搜尋證明開啟了額外的可能性。這個循環持續進行下去,語言模型增添有用的元素,符號引擎測試新的證明策略,直到找到可驗證的解決方案。

為了訓練 AlphaGeometry 的語言模型,研究人員不得不建立自己的合成訓練數據,以彌補稀缺的、現有的幾何數據。他們生成了 10 億個隨機幾何圖表,並將其提供給符號引擎。這個引擎分析每個圖表並產生有關其性質的語句。這些語句被組織成 1 億個合成的證明,以訓練語言模型。

DeepMind 在與國際數學奧林匹亞德競賽(IMO)相同難度的 30 個幾何問題上測試了 AlphaGeometry。它在限定的時間內完成了 25 個題目。上一次相同的數學系統是在 1978 年由中國數學家吳文俊開發的,僅完成了 10 個問題。

DeepMind 在官方部落格中指出,AlphaGeometry 的能力水準已經接近人類奧林匹亞金牌得主。人類金牌得主平均解決 25.9 個問題。

「這是一個非常令人印象深刻的結果,」波恩大學(University of Bonn)數學教授 Floris van Doorn 說,他並未參與這項研究。「我原本預期這仍需多年才能實現。」

另一位路易斯維爾大學計算機科學和工程副教授 Roman Yampolskiy 則對此表示,除了數學,AlphaGeometry 影響的領域還包括那些依靠以幾何問題解決的領域,像是電腦視覺、建築、理論物理學等。

不過,AlphaGeometry 也仍有進步的空間,目前它僅能解決初階的數學問題,而還無法應對大學教授更先進、抽象的問題。

暂无评论

暂无评论...