首页 > 人工智能 > 人工智能
发布日期:2025-01-24 16:36:48

全球顶级AI系统挑战人类终极考验,惨淡表现令人震惊,准确率惨淡不足10%

AI系统挑战人类终极考验,准确率不足10%,人机大战再度引发热议

   1月24日,非营利组织“人工智能安全中心”(CAIS)携手提供数据标注和AI开发服务的公司ScaleAI共同推出了一项名为“人类终极考试”的新型基准测试。这项测试旨在评估前沿AI系统的综合能力,其极高难度引起了广泛关注。 这项测试不仅考验AI系统在复杂任务中的表现,还挑战了我们在设计和实施这些测试时的创新思维。随着技术的进步,我们需要不断更新评估标准,以确保我们能够全面了解这些系统的潜在能力和局限性。这项测试的推出是一个重要的里程碑,它提醒我们要持续关注AI的发展,并确保技术进步服务于社会的最大利益。

   据了解,该基准测试汇集了来自50个国家和地区超过500家机构的近1,000名学科专家撰稿人提出的问题,这些专家主要由教授、研究人员和拥有研究生学位的人士组成,涉及数学、人文科学和自然科学等多个领域。为了提高测试难度,题目形式多种多样,包括结合图表和图像的复杂题型。这种设计旨在全面评估AI系统在跨学科知识和多模态信息处理方面的能力。

   在初步研究中,所有公开可用的旗舰AI系统在该测试中的回答准确率均未超过10%。这一结果表明,尽管当前AI技术在某些特定领域已取得显著成就,但在处理复杂且综合性的问题时依然存在明显的不足。

   CAIS与ScaleAI宣布,他们打算将该基准测试向研究界开放,使研究人员能够“深入分析差异”并测试最新的AI模型。

人工智能最新资讯
友情链接 百度权重≥3友情链接交换
数界探索  |  科技快讯中文网  |  经济脉动  |  财智慧  |  慧算财经  |  财经探秘  |  财经日报  |  今日财经  |  财经风向标
Copyright © 2025 智慧科技官网 网暻网络
备案号:陇ICP备16003923号-4 版权所有