首页 > 人工智能 > 人工智能
发布日期:2025-06-06 11:39:46

智源研究院推出悟界大模型家族,Emu3震撼发布:全球首个原生多模态世界模型问世!

Emu3横空出世:开启多模态世界模型新时代!

   6月6日,北京智源人工智能研究院正式推出“悟界”系列大模型,其中最引人注目的是全球首个原生多模态世界模型“悟界・Emu3”,以及开创性的脑科学多模态通用基础模型“悟界・见微Brainμ”。这些成果不仅展示了我国在人工智能领域的持续创新能力,也标志着多模态技术正在从理论探索迈向实际应用的新阶段。 我认为,“悟界・Emu3”的问世意味着多模态融合技术取得了重要突破,这将为未来的智能系统提供更强大的感知与理解能力。而“悟界・见微Brainμ”结合了脑科学研究,这种跨学科的合作模式无疑会激发更多灵感火花。这两款模型的发布,不仅体现了国内科研机构的技术实力,也为推动全球AI技术发展贡献了中国智慧。希望未来能看到更多类似的创新成果,让人工智能更好地服务于社会需求。

   智源研究院推出了悟界・具身智能大模型,其中包括全球首创支持MCP的跨本体大小脑协作平台悟界・RoboOS2.0、具身大脑大模型悟界・RoboBrain2.0以及全原子微观生命模型悟界・OpenComplex2。

   去年10月,智源研究院推出了原生多模态世界模型Emu3。据了解,该模型仅依赖于下一个token的预测机制,无需借助扩散模型或组合方法,就能实现对文本、图像、视频三种模态数据的理解与生成。官方表示,这一成果实现了图像、文本、视频的大一统。Emu3能够支持多模态输入与多模态输出的端到端映射,充分展示了自回归框架在多模态领域的通用性和领先性,为跨模态交互奠定了坚实的技术基础。

   见微Brainμ依托Emu3底层架构,将功能性磁共振成像(fMRI)、脑电图(EEG)、双光子显微镜等神经科学与脑医学相关的脑信号进行统一的token化处理。借助预训练模型在多模态对齐方面的优势,该技术能够实现多模态脑信号与文本、图像等多种模态之间的多向映射,并支持跨任务、跨模态、跨个体的统一通用建模,从而以单一模型完成多种神经科学领域的下游任务。

   相关阅读:

   《智源推出全新原生多模态世界模型Emu3,宣布达成图像、文本、视频一体化》

人工智能最新资讯
友情链接 百度权重≥3友情链接交换
数界探索  |  科技快讯中文网  |  经济脉动  |  科技先锋  |  财智慧  |  慧算财经  |  财经探秘  |  财经日报  |  今日财经  |  财经风向标
Copyright © 2025 智慧科技官网 网暻网络
备案号:陇ICP备16003923号-4 版权所有