OpenAI员工质疑xAI新AI模型Grok3评测数据真实性
来源:互联网时间:2025-02-23 10:20:53
近日,OpenAI的一名员工公开指责埃隆·马斯克旗下的xAI公司,称其发布的最新人工智能模型Grok3的基准测试结果具有误导性。对此,xAI的联合创始人伊戈尔·巴布什金坚决
近日,OpenAI的一名员工公开指责埃隆·马斯克旗下的xAI公司,称其发布的最新人工智能模型Grok3的基准测试结果具有误导性。对此,xAI的联合创始人伊戈尔·巴布什金坚决反驳,公司并无不当行为。xAI的图表显示,Grok3的两个版本——Grok3推理测试版和Grok3迷你推理测试版——在AIME 2025上的表现超过了OpenAI当前最强的可用模型o3-mini-high。然而,OpenAI的员工很快在社交平台上提出,xAI的图表并没有包括o3-mini-high在“cons@64”条件下的AIME 2025得分。巴布什金在社交平台上辩称,OpenAI过去也曾发布过类似的误导性基准测试图表,尽管这些图表是用于比较其自身模型的表现。