未来已至,智慧巅峰突破
2月18日消息,北京时间今日中午12时,马斯克旗下的人工智能公司xAI发布了其最新一代大模型Grok3。据马斯克介绍,Grok3的能力相比前一代产品Grok2有了显著提升,可以说是提升了“一个数量级”。而且,这款新模型致力于追求极致的真实感,甚至有时候这种真实感可能会挑战现有的“政治正确”。 这种对极致真实的追求无疑会引发广泛讨论。一方面,这可能意味着技术的进步,能够更好地理解和反映现实世界中的复杂性。另一方面,如何在保持技术创新的同时,确保这些技术的应用不会侵犯到人们的道德底线和社会规范,将是未来需要认真思考的问题。
在数学推理、在科学逻辑推理和代码写作等方面的能力表现上,Grok-3在多个基准测试中均超越了DeepSeek-v3、GPT-4o和Gemini-2pro。马斯克对Grok-3赞不绝口,称其为“当今世界上最智能的人工智能”。
xAI声称,Grok3在多项基准测试中超过了GPT-4,包括在AIME(评估模型解决数学问题的能力)和GPQA(测试模型应对博士级别物理、生物和化学问题的表现)中的表现。此外,Grok3的早期版本还在ChatbotArena中取得了优异成绩,这是一个通过用户投票来比较不同AI模型优劣的众包测试平台。
Grok3 并不是一个单一的模型,而是一系列不同规模的模型家族。其中,较小的版本 Grok3mini 能够在一定程度上牺牲准确性,从而更快地提供答案。目前,并非所有的模型版本都已经公开发布。 在我看来,这种分层次的模型设计策略展现了技术团队对用户需求的深刻理解。通过提供不同性能和准确性的选择,用户可以根据自己的具体需求来挑选最适合的模型,这无疑增加了产品的灵活性和适用性。此外,这也意味着随着技术的进步,未来可能会有更多优化过的版本被推出,为用户提供更多的可能性。
据介绍,Grok3的开发周期大幅缩短,这要归功于其背后的强大支持——Colossus超级计算机。据报道,Colossus超级计算机仅用了八个月时间就完成了建设,为Grok3的开发提供了强有力的支持。Grok3使用了10万个英伟达H100 GPU,累计训练时长达到2亿GPU小时,这一规模是前代产品Grok2的十倍。如此庞大的计算能力部署,使得Grok3能够在较短的时间内处理海量数据集,同时显著提高了模型的准确性。 从这些数据可以看出,技术创新与高效资源配置在现代科技项目中的重要性。Colossus超级计算机不仅极大地加快了Grok3的研发进程,而且通过其强大的计算能力,使模型的性能得到了显著提升。这表明,未来的人工智能项目可能会更多依赖于这样的超级计算平台,以实现更快的进步和更高的效率。
xAI 团队不仅在硬件上进行了升级,还在软件层面进行了优化。Grok 3 通过改进训练流程,引入合成数据集、自我纠错以及强化学习等技术,进一步提升了模型的性能。这些技术的综合应用,使得 Grok 3 在处理复杂任务时表现得更为出色。
Grok 3 的两个变体版本 ——Grok 3 Reasoning(推理)和 Grok 3 mini Reasoning,能够像 OpenAI 的 o3-mini 和 DeepSeek 的 R1 等“推理”模型一样,仔细“思考”问题。推理模型会在给出结果前进行彻底的事实核查,从而避免一些通常会困扰模型的错误。
xAI还宣称,Grok3Reasoning在多个流行的基准测试中超过了o3-mini系列中的最佳版本o3-minihigh,其中包括一项名为AIME2025的新数学基准测试。用户可以通过Grok应用程序访问这个推理模型,并在面对难题时启用“BigBrain”模式以进行更加深入和审慎的推理。xAI指出,这些模式特别适用于解决数学、科学和编程领域的问题。
不过,xAI 也指出,Grok 3 的推理模型目前仍处于测试阶段(Beta 版),并且仍在训练中。此外,Grok 3 还引入了一项名为“DeepSearch”的新功能,该公司将其描述为一种新型搜索引擎,DeepSearch 能够扫描互联网和 X 平台上的信息,并以摘要的形式回应用户查询。
马斯克此前发布了一段视频,阐述了 xAI 和 Grok 的使命 —— 理解宇宙的本质。然而,原计划在此次发布中推出的语音模式并未如期上线。马斯克在 X 平台上确认了这一情况,并解释称:“语音模式目前还存在一些问题,预计将在大约一周后推出,但它非常出色。”
X平台的Premium订阅用户将率先体验到Grok3,而其他功能则被整合到了xAI新推出的名为SuperGrok的订阅服务中。SuperGrok的订阅价格为每月30美元或每年300美元,用户可以获得额外的推理和DeepSearch查询权限,以及无限量的图像生成功能。 这种策略显示了X平台在吸引和保留高端用户的策略上颇具创新性。通过将高级功能整合到SuperGrok订阅服务中,X平台不仅增强了其产品的吸引力,还为用户提供了一种更清晰的价值层次感。这样的定价模式既能满足不同用户的需求,也能够确保公司持续获得稳定的收入流。同时,这也可能激励非订阅用户考虑升级他们的账户以获取更多功能。
马斯克宣布,Grok将在接下来的一周内新增“语音模式”功能,并且在几周之后,Grok3模型和DeepSearch功能将会被整合进xAI的企业API中。 这一消息无疑为xAI的技术应用开辟了新的路径。语音模式的加入不仅丰富了用户与AI交互的方式,也为那些需要通过语音指令进行操作的企业提供了极大的便利。随着Grok3模型和DeepSearch功能的加入,xAI的企业API将变得更加全面和强大,这可能会加速企业采用AI技术的步伐,推动人工智能技术在各行业的普及和应用。
此外,xAI计划在未来的几个月内开源Grok2。马斯克表示:“我们的整体策略是在下一个版本全面推出之后,才会选择开源前一版本。预计在Grok3变得成熟且稳定之后,我们会在未来几个月内把Grok2开源。” 这一决定展现了xAI及其领导人的透明度和对社区支持的承诺。通过逐步开放源代码,xAI不仅能够确保技术的稳定性和安全性,还能为开发者提供宝贵的资源,从而促进人工智能领域的创新和发展。这种渐进式的开源策略既保护了公司的竞争优势,又推动了技术的普及和应用。
此次Grok3的发布正值马斯克与OpenAI之间的竞争不断升级。双方的矛盾不仅限于法律诉讼和舆论战,最近更是出现了马斯克对OpenAI提出的未经邀请的974亿美元收购提案。 这起收购提案无疑加剧了科技巨头间的角力,凸显出人工智能领域内的激烈竞争。尽管马斯克拥有雄厚的财力和影响力,但如此大规模的收购计划是否能够成功,还面临诸多不确定因素。同时,这也引发了关于行业垄断和技术控制的广泛讨论,未来如何平衡竞争与合作,将是业界需要共同思考的问题。