在最近一次的开放日活动中,RockAI正式推出全新升级的Yan1.3大模型,并展示了其在无人机、机器人、PC、手机等各类终端设备上落地能力。相较于1月份首发的Yan1.0只能处理自然语言,Yan1.3具备了多模态能力,可处理图文及语音等多模态信息,并实现了模型在更广泛设备端上的离线无损部署,普通电脑CPU上也能够流畅运行。
区别于当下多采用的云、边、端协同部署模式,Yan架构大模型能直接部署在设备端,且能够在较小的算力情况下实现较高的性能。
在接受《科创板日报》采访时,岩芯数智CEO刘凡平坦言,从行业叙事看,大部分人工智能从业者所置身的是一场“由OpenAI提出概念,Meta负责开源,国内市场专注应用”的技术接力赛。RockAI不想跟随。
算经济账,Transformer架构的Attention机制,算力耗费高、数据需求大,交付成本也高,成本难以覆盖客户的付费,不少中小型企业望而却步。他们因此在早期就放弃了基于Attention机制的Transformer架构大模型。
最近的面试,刘凡平说自己会经常问候选人一个问题:如果有一天你要离开这个世界,你希望在自己的墓志铭上写什么?
他称,对多数人而言,这是一个需要思考超过30秒甚至更长时间的问题,但是在Transformer机制下,大模型会马上输出答案。
“这是Transformer大模型与人类大脑工作机制的不同,人类回答输出的时间会根据问题的复杂程度变化,复杂问题求解时参与的神经元变多了,所以输出时间会变长。但现在的大模型在面对这个问题时,即使是很复杂的问题,它的输出速度是一样的。”
本质来说,刘凡平认为大模型应当模拟人脑的方式来工作,而不应该是Transformer架构大模型中那样无时间差别的输出。也是刘凡平和他的团队放弃Transformer架构,选择自研架构的一大原因。
刘凡平说RockAI的愿景,是让世界上每一台设备都拥有自己的智能,同时通过群体智能实现通用人工智能。
他期望大模型更像人,自研的Yan模型,是群体智能单元大模型,它会则更注重模拟人脑的工作机制,通过多个智能单元的协作和交互,形成的集体智慧和决策能力,能够具备超越单元个体的能力。
在RockAI的规划中,群体智能的实现包括四个阶段:创新性基础架构、多元化硬件生态、自适应智能进化、协同化群体智能。目前,Yan1.3已经可以在广泛的设备上部署和应用,进入到了多元化硬件生态,下一阶段是自主学习。据刘凡平透露,Yan2.0计划在明年发布。