OpenAI 员工指责 xAI 的 Grok3 基准测试结果具有误导性

bitget by:bitget 分类:Bitget资讯 时间:2025/02/23 阅读:15500 评论:0

Bitget消息,据 ChainCatcher 报道,OpenAI 的一名员工指责 xAI 公司发布的 Grok3 基准测试结果具有误导性。xAI 联合创始人伊戈尔・巴布什金坚称公司并无不当。


xAI 的图表显示,Grok3 的两个版本在 AIME 2025 上的表现超过了 OpenAI 的 o3-mini-high。然而,OpenAI 员工指出,图表未包含 o3-mini-high 在“cons@64”条件下的得分。


巴布什金辩称,OpenAI 过去也曾发布过类似的基准测试图表,用于比较其自身模型的表现。


TOP