OpenAI顶级o3模型涉嫌作弊 提前获取前沿数学测试题库特权访问权限
来源:互联网时间:2025-01-21 10:40:23
一位名为“Meemi”的EpochAI承包商在《Less Wrong》论坛上透露,OpenAI不仅为FrontierMath基准测试提供了资金支持,还获得了测试题库的特权访问权。这可能是o3成绩在
一位名为“Meemi”的EpochAI承包商在《Less Wrong》论坛上透露,OpenAI不仅为FrontierMath基准测试提供了资金支持,还获得了测试题库的特权访问权。这可能是o3成绩在短时间内显著提高的重要原因。这表明o3在高级数学推理方面具有巨大的优势。斯坦福大学的数学博士生Carina Hong声称,在EpochAI的安排下,OpenAI获得了对FrontierMath的特权访问权。尽管如此,进步的成绩单在承包商的爆料后遭遇了舆论的反转。在面对争议时,EpochAI的副主任兼联合创始人之一Tamay Besiroglu迅速在X平台上承认了这一情况。值得一提的是,FrontierMath是一个极具分量的高级数学推理能力评估基准,它由EpochAI联合60多位顶级数学家共同开发,参与者包括多位菲尔兹奖得主和国际数学奥林匹克竞赛的资深命题人。