芥末堆芥末堆

大模型能答對幾道高考數學(xué)題?國產(chǎn)九章大模型PK國際GPT-4o

作者:舒克 發(fā)布時(shí)間:

大模型能答對幾道高考數學(xué)題?國產(chǎn)九章大模型PK國際GPT-4o

作者:舒克 發(fā)布時(shí)間:

摘要:又是一年高考時(shí),除文作文題目,其他的題你還能看懂嘛?

又是一年高考時(shí),除文作文題目,其他的題你還能看懂嘛?你也許不懂,但大模型可以!

今天的測試,讓國產(chǎn)九章大模型(MathGPT)和GPT-4o一起做今年的數學(xué)題,以2024全國甲卷數學(xué)高考真題為例,讓我們看看結果到底如何。

一、先說(shuō)結論

【九章大模型(MathGPT)】

選擇題12題,做對7題。

填空題4題,做對2題。

九章大模型總分 = 7 * 5分 + 2 * 5分  = 45分 (滿(mǎn)分90分)

【GPT-4o】

選擇題12題, 正確7題。

填空題4題, 正確1題。

GPT-4o總分 = 7 * 5分 + 1 * 5分  = 40分 (滿(mǎn)分90分)

九章大模型作為以數學(xué)領(lǐng)域的解題和講題算法為核心的大模型,在高考數學(xué)題目上更勝一籌,比GPT-4o得分更高。同時(shí)“點(diǎn)睛”分析也是九章大模型的特色,在解題的同時(shí)還拆解了題目的考點(diǎn),更適合給學(xué)習者參考。

但從絕對值的分數來(lái)看,兩個(gè)大模型的整體答題分數都不算太高。大模型做數學(xué)題仍是一個(gè)難度較大的挑戰,短期的模型表現還達不到完美。

二、測試方法說(shuō)明

1、測試題目:2024年高考全國甲卷數學(xué)真題

2、數學(xué)解答題的評分考核步驟過(guò)程,答題準確與否不易評判,所以只針對有明確答案的選擇題和填空題來(lái)測試。

3、在測試中我們發(fā)現,文本輸入格式的不同,會(huì )對測試結果造成比較明顯的干擾。于是此次測試采用了上傳圖片文本識別的方式,讓大模型識別題目并做題,更能保證結果的公平客觀(guān)。同時(shí),這種識圖的方式也更類(lèi)似“人類(lèi)視覺(jué)讀題”的情況,是對大模型能力的全面考驗。

三、選擇題,九章大模型、GPT-4o互有勝負

2024年高考全國甲卷數學(xué)題共12道選擇題,九章大模型和GPT-4o都是有7道正確,但做對的題目不完全相同,互有勝負。

5.png

具體來(lái)看幾道題:

第2題,九章大模型做對,GPT-4o做錯:

原題:

6.png

九章大模型解答:

7.png

GPT-4o解答:

8.png

第9題,九章大模型做對,GPT-4o認為沒(méi)有正確答案:

原題:

9.png

九章大模型解答:

10.png

GPT-4o解答:

11.png

第10題,九章大模型做錯,GPT-4o做對:

原題:

12.png

九章大模型解答:

13.png

GPT-4o解答,答案選擇正確,但其中解題對命題①的分析存在錯誤:

14.png

四、填空題,GPT-4o做對一道,九章做對兩道

15.png

具體來(lái)看兩道題:

第14題,九章大模型和GPT-4o都做對:

原題:

16.png

九章大模型解答:

17.png

GPT-4o解答:

18.png

第16題,九章大模型做對,GPT-4o做錯:

原題:

19.png

九章大模型解答:

20.png

GPT-4o解答:

21.png

關(guān)于GPT-4o

2024年5月14日,OpenAI宣布推出GPT-4o,GPT-4o在處理速度上提升了高達200%,GPT-4o所有功能包括視覺(jué)、聯(lián)網(wǎng)、記憶、執行代碼以及GPT Store等,可以實(shí)時(shí)對音頻、視覺(jué)和文本進(jìn)行推理。

關(guān)于九章大模型

學(xué)而思九章大模型(MathGPT)是學(xué)而思自主研發(fā)的,面向全球數學(xué)愛(ài)好者和科研機構,以解題和講題算法為核心的大模型。2023 年 11 月,九章大模型成為首批通過(guò)備案的教育大模型。

1、本文是 芥末堆網(wǎng)原創(chuàng )文章,轉載可點(diǎn)擊 芥末堆內容合作 了解詳情,未經(jīng)授權拒絕一切形式轉載,違者必究;
2、芥末堆不接受通過(guò)公關(guān)費、車(chē)馬費等任何形式發(fā)布失實(shí)文章,只呈現有價(jià)值的內容給讀者;
3、如果你也從事教育,并希望被芥末堆報道,請您 填寫(xiě)信息告訴我們。
來(lái)源: 芥末堆
芥末堆商務(wù)合作:王老師 18710003484
  • 大模型能答對幾道高考數學(xué)題?國產(chǎn)九章大模型PK國際GPT-4o分享二維碼