南韩团队让AI测验大学入学考试 ChatGPT拔头筹

2025-11-15 17:39来源：未知

ChatGPT在研究中赢得韩国大学入学考试的最高分。示意照。（美联社）

假设AI是一名参加大学入学考试的学生，它会得到怎样的成绩呢？韩联社与延世大学教授金时浩（김시호）的研究团队合作，使用ChatGPT（GPT-5）、Gemini（2.5Flash）、Perplexity（Sonar）的免费版本以及DeepSeek的最新模型，挑战测验2026年韩国大学入学考试（대학수학능력시험，简称CSAT）的韩语、英语与数学。

根据《韩联社》报导，研究团队让4款热门AI参加大考，实测如果这些人工智慧是真正的考生，它们可能会就读哪些大学。为了确保测试环境与考试规定和韩国大学入学考试相同，所有的AI禁止搜寻网路，并被要求自行解决问题。

在测试中获得第一名高分的模型是ChatGPT，尤其「数学」表现出色，尽管今年的数学题目，因穿插了大量高难度题目而被评为难度较高的考科，但ChatGPT仍然取得了优秀成绩。

第二高分则是DeepSeek，它在韩语和英语方面的得分高于GPT，但由于其数学得分较低，导致其总分下降。

Gemini在数学方面表现出了较高的准确率，与ChatGPT类似，但可惜其韩语得分垫底。

而整体得分最低的是Perplexity，测试过程中经常出错，例如在测试过程中突然拒绝回答，而且难以准确测量测试时间，此外，还违反CSAT考试规定，像是在考试期间上网搜寻资讯。

金时浩（김시호）教授表示：「尽管人工智慧模型取得了显著进步，但它们在韩语的表现仍然不尽如人意，似乎无法解决我们所设想的高层次问题」。

来源：自由时报

特色频道

政府部门

南韩团队让AI测验大学入学考试 ChatGPT拔头筹

最新内容