7月26日消息,在世界大会(WAIC)期间,荣耀正式发布自研多模态感知——大模型。作为荣耀推出的首个GUI开源大模型,MagicGUI以7B(70亿)参数规模,支撑底层 AI 的多模态感知与自动执行规划能力,比肩SOTA模型达到行业领先水平。
凭借独创的"继续预训练+强化微调"两阶段训练方案,荣耀MagicGUI大模型在荣耀Magic V5常用场景用机操控中的准确率达到91.5%,较行业同类顶级开源模型提升16.4%。这背后,是荣耀在AI技术方面的创新突破。
荣耀采用全新的 AI 方案,创新性引入多样化多模态训练数据,并通过继续预训练与强化微调的两阶段训练方法,解决了现有技术瓶颈。在数据工程方面,荣耀构建了高效的数据采集与构造框架,优化数据配比与筛选方案,形成多样且高质量的训练数据集;训练中引入空间增强的复合奖励函数、DF-GRPO 强化学习算法等创新方法,大幅提升模型数据利用效率与泛化能力,使其在未经训练的新场景中仍能保持稳定性能,实现跨场景适应。
对比评测结果显示MagicGUI 大模型已达到行业领先水平。在行业开源和荣耀内部榜单测试中,移动端的视觉定位能力、页面理解问答能力、单步操作能力、动作序列拆解执行能力4类任务跑分全面领先。
荣耀Magic V5作为首款搭载MagicGUI 大模型的折叠屏旗舰,其智能助手 YOYO完成了从单智能体任务执行到多智能体协同的跨越式升级。借助MagicGUI大模型赋予的感知、推理、规划、反思、执行任务的全链路能力,YOYO能够像人类助理般拆解复杂任务、调度跨应用资源、闭环完成操作流程,让“一语打车”等常用场景用机操控成为现实。
基于MagicGUI的多模态感知和自动化执行能力,YOYO还能高效完成常见APP主页搜索、查看订单与购物车等操作。经过训练的 MagicGUI 大模型,在“自动驾驶”时能根据屏幕视觉信息边思考边行动,依据页面反馈精准推理下一步操作,让 YOYO 的操作更智能高效。如果遇到用户指令有误、操作无法完成等突发情况,它还能主动停止,实现自动操作和人工接管的智能切换,保证操作流程顺畅进行。
此次,在WAIC人工智能标准化国际合作论坛上,荣耀作为首批单位将与中国电子技术标准化研究院、阿里、百度等百余家行业企业共同发布《智能体协议共建共享联合倡议》,以进一步推动人工智能技术、标准的国际交流合作以及产业发展。
截至今年6月,荣耀也已联合20余家企业推动终端智能化分级指南标准落地,并联合中国信息通信研究院等牵头10余个AI终端的标准立项及起草,为AI终端技术产品应用普及和产业发展提供中国方案。
在AI隐私保护与安全方面,荣耀在积极推动AI安全治理体系的完善。近日,在中国人工智能产业发展联盟第十五次全会上,荣耀携手中国信息通信研究院、阿里、百度等行业领军企事业单位,共同发布了《人工智能安全承诺》实践披露成果。联盟围绕风险管理、模型安全、数据安全等6大核心内容,提炼了20项关键安全标签,公开了43项企业典型实践,致力于推进我国人工智能安全治理迈入体系化、透明化、实操化新阶段,为全球贡献“以人为本、智能向善”的中国方案。(崔玉贤)
本文来自网易科技报道,更多资讯和深度内容,关注我们。