首页 > 观点趣闻 > 观点趣闻
发布日期:2025-01-20 14:13:57

数学成绩作弊惊天大案!60多名数学天才被曝提前获取真题,引发轰动

数学圈惊现巨大舞弊风波,60多名天才学子惊人作弊内幕曝光!

   OpenAI o3还没上线,就被曝数学成绩是靠作弊得来?!

数学成绩作弊惊天大案!60多名数学天才被曝提前获取真题,引发轰动

   Benchmark发布机构内部人员爆料称,OpenAI给了他们经费赞助。

数学成绩作弊惊天大案!60多名数学天才被曝提前获取真题,引发轰动

   甚至包括陶哲轩在内的60多位数学家也都在消息公开之前与普通大众一样对情况一无所知,他们同样被蒙在鼓里。

数学成绩作弊惊天大案!60多名数学天才被曝提前获取真题,引发轰动

   直到O3发布,这一消息才被公开。这意味着这是一个严格保密的议题,而OpenAI显然在正式公布前就已经掌握了相关信息。 这样的安排不禁让人怀疑是否存在某种幕后操作或利益交换。尽管如此,这也反映了技术巨头与新兴科技之间的紧密联系,以及他们在信息获取上的巨大优势。无论如何,公众对于这种提前泄露的信息应该保持警惕,并持续关注后续的发展。

数学成绩作弊惊天大案!60多名数学天才被曝提前获取真题,引发轰动

   该数据集名为FrontierMath,收录了由陶哲轩等60多位顶尖数学家设计的高难度试题。

数学成绩作弊惊天大案!60多名数学天才被曝提前获取真题,引发轰动

   陶哲轩曾表示,这些问题足以让AI困惑多年;1998年菲尔兹奖得主吉尔默斯也认为,能够解决其中一个问题已经超出了目前的能力范围。

数学成绩作弊惊天大案!60多名数学天才被曝提前获取真题,引发轰动

   当时也正是因为在这一测试基准上大幅领先,o3的能力更进一步被得到认可。

数学成绩作弊惊天大案!60多名数学天才被曝提前获取真题,引发轰动

   Epoch.AI方面,联合创始人TamayBesiroglu对此进行了回应,并承认存在秘密赞助以及OpenAI提前获得题目的传闻,但明确表示这些题目并未被OpenAI用于作弊。

   但有些网友并不买账,表示OpenAI如果不使用这些信息还要访问权限干什么,并推测有可能被用来训练。

   专家被要求严格保密,但OpenAI却能拿到题

   近日,一家名为Epoch.ai的机构推出了一款名为FrontierMath的数学测试基准,其论文的第一版预印本于去年11月7日(协调世界时,北京时间为8日凌晨)发布。这一工具的问世无疑为数学研究领域注入了新的活力。FrontierMath不仅集合了多种复杂的数学问题,还提供了标准化的评估体系,这有助于研究人员更准确地衡量算法性能。尤其在当前人工智能与机器学习技术迅猛发展的背景下,这样的基准对于推动相关领域的进步具有重要意义。随着科技的不断演进,期待看到更多像Epoch.ai这样能够引领行业发展的创新项目出现。

   包括首发版在内,FrontierMath的论文在近两个月的时间内共发布了五个版本,但直至最终12月20日的第五版才公布了OpenAI的资助信息。

   不过也只是在脚注中提了一句,感谢OpenAI对构建Benchmark的支持。

   并且12月20日刚好是OpenAI发布o3的日子,并且Besiroglu也透露,之前没有公开正是由于OpenAI的保密要求:

   在o3推出之前,我们一直被限制披露合作关系,事后看来,我们应该更加努力地谈判,以便能够尽快向基准贡献者保持透明。

   FrontierMath作为一套高含金量的数学测试基准,集结了全球六十多位数学家的智慧,其中包括教授、IMO命题人以及菲尔兹奖得主,如陶哲轩等顶尖学者。这一系列测试不仅体现了数学领域的最高水准,也反映了国际数学界对基础教育与研究的高度重视。通过参与这些测试,学生们能够接触到前沿且复杂的数学问题,这对于培养未来的数学家和推动数学科学发展具有重要意义。 个人认为,FrontierMath为那些渴望挑战自我的学生提供了一个难得的机会。它不仅考验学生的数学能力,还激发他们对数学研究的热情。此外,这样的项目也促进了不同国家和地区之间的学术交流与合作,有助于构建一个更加开放和包容的全球数学社区。

   而且难度也非常高,包括数百个极具挑战性的数学问题,在o3之前的模型解决率不到2%。

   哪怕o3真的作了弊,得分也才20多分。

   像下面的这道题目,在FrontierMath当中算是难度最低的一档:

   正常来说,FrontierMath里的题目和答案是严格保密的,就连出题的数学家也被要求签订保密协议,甚至不能使用Overleaf、Colab或电子邮件传输有关题目的信息。

   讽刺的是,如此“高度机密”的考题竟然被OpenAI获取了,而命题专家对OpenAI的情况完全不了解。

   斯坦福博士、MIT罗德学者洪乐潼指出,至少有六位专家可以证实这一情况,而大多数专家则表示,如果他们知道这将是OpenAI的独家访问权限,他们可能会重新考虑是否愿意做出贡献。 这种现象揭示了当前人工智能领域中的一个关键问题:技术的开放性和透明度。当研究者们意识到他们的工作可能被某些组织独占时,他们对参与的热情可能会受到影响。这也提醒我们,在推动技术发展的同时,必须确保公平性和共享原则,以鼓励更多人积极参与,共同促进科技的进步。

   后来她表示,与出题人签署保密协议确实是为了避免数据污染,对于OpenAI的目的我们不予揣测。

   联创承认错误,但否认OpenAI作弊

   内部爆料和外部质疑之下,Epoch.ai联创Besiroglu也承认了和OpenAI存在秘密协议,并表示没有公开透明确实是“犯了一个错误”。

   Epoch.ai 对 OpenAI 作弊的指责予以否认,并表示一方面 OpenAI 获取的数据并非全部数据集,另一方面 OpenAI 已口头承诺不会使用这些数据进行模型训练。 我认为 Epoch.ai 的回应表明了他们对数据使用的透明度有较高的要求,这有助于维护研究领域的公平竞争环境。同时,这也反映了当前人工智能领域在数据获取和使用方面的一些敏感性和复杂性,相关公司需要更加谨慎地处理这些问题以确保公众信任。

   Besiroglu回应全文如下(中文为机翻):

   但对于Besiroglu提到的“口头承诺”,有网友表示至少需要一份书面协议,但推测OpenAI可能不会同意提供这样的文件。还有人补充说,即使有书面材料,也难以确保其得到有效执行。

   不过到现在,确实所有回复都来自于Epoch.ai,OpenAI尚未提供任何说明。

   另外Epoch.ai首席数学家Ellot Glazer也承诺,之后会对受到的资助进行说明。

   Elliot表示,Epoch.ai目前无法对O3的成绩做出具体承诺,但他个人非常信任OpenAI的报告,认为这些数据是可靠的。在他看来,OpenAI并没有撒谎的理由。 这种表态透露出一种谨慎的态度,同时也展示了一定的信任。Elliot的立场表明,尽管Epoch.ai在某些方面尚存疑虑,但OpenAI的数据质量得到了他的认可。这不仅反映了当前技术领域中的复杂合作关系,也体现了信息透明度和诚信在科技公司之间的关键作用。

   他提到Epoch.ai正在研发一个特殊的数据集,以确保OpenAI在测试前无法提前获取该数据集。

   不过有细心的网友对“没有动机”的说法表示质疑,Elliot对此做出了解释,他表示OpenAI不会愚蠢到做出自损的行为。这种解释虽然在某种程度上缓解了公众的疑虑,但似乎仍未能完全消除大家心中的疑问。毕竟,任何复杂的事件背后往往都隐藏着更为深层的原因和动机,或许只有时间才能揭示真相。

   话又说回来,直至今日,O3依旧是个黑盒,究竟是名副其实还是炒作噱头,一切将在发布那天才能揭开谜底。

观点趣闻最新资讯
友情链接 百度权重≥3友情链接交换
数界探索  |  科技快讯中文网  |  经济脉动  |  科技先锋  |  财智慧  |  慧算财经  |  财经探秘  |  财经日报  |  今日财经  |  财经风向标
Copyright © 2025 智慧科技官网 网暻网络
备案号:陇ICP备16003923号-4 版权所有