「科技创新,智能未来!天工大模型 4.0引领行业风向,开启全新免费时代!」
1月6日,昆仑万维集团宣布,天工大模型4.0o1版和4o版现已同步上线,并全面登陆网页端和App端,用户可以免费使用这些服务。
天工大模型4.0o1版被誉为国内首款具备中文逻辑推理能力的o1模型,它不仅提供了一个上线即开源的版本,还推出了两款性能更优的专用版本。该模型擅长应对各种推理任务,涵盖数学、编程、逻辑分析、常识理解以及伦理决策等多个领域。
天工大模型 4.0 4o 版则是一款多模态模型,官方还推出了由其赋能的实时语音对话助手 Skyo,是一个“具备情感表达能力、快速响应能力、多语言流畅切换”的智能语音对话工具。
从官方获悉,Skywork o1 具备三阶段自研训练方案:
Skyworko1利用自主研发的多智能体架构来实现高质量的分步骤思考、反思及验证数据。通过大量高质量且多样化的深度思考数据,我们持续对基础模型进行预训练和有监督微调。此外,在版本迭代过程中,我们广泛采用自蒸馏和拒绝采样技术,从而大幅提高了模型的训练效率和逻辑推理能力。
Skyworko1团队最新研发了一款名为Skyworko1ProcessRewardModel(PRM)的模型,该模型专门针对分步推理强化进行了优化。实验结果表明,Skywork-PRM能够有效捕捉到在复杂推理任务中各个中间步骤和思考过程对最终结果的影响。通过结合自主研发的分步推理强化算法,进一步提升了模型的推理和思考能力。
基于天工自主研发的Q*线上推理算法,我们的模型能够在线进行深度思考,并寻找到最佳的推理路径。这同时也是全球首次将Q*算法成功实现并公之于众。Q*算法的成功应用极大地提升了我们模型的线上推理性能。
相关阅读:
《昆仑万维推出“天工大模型 4.0”4o 版及实时语音助手 Skyo,号称可克服大模型幻觉》
《昆仑万维“天工大模型 4.0”o1 版启动邀测,具备中文逻辑推理能力》