RockAI:探索群体智能,让大模型更像“人”
发布时间:2024-12-08 17:01分类: 无 浏览:222评论:0
编者按



RockAI CEO刘凡平
以百度、阿里和岩芯数智等为代表的大大小小的AI企业集聚于此,这周边已经形成了一个AI生态圈。AI浪潮加速推进,张江人工智能岛,也正成为上海发展人工智能产业高地的重要承载区。



相较于1月份首发的Yan1.0只能处理自然语言,Yan1.3具备了多模态能力,可处理图文及语音等多模态信息,并实现了模型在更广泛设备端上的离线无损部署,普通电脑CPU上也能够流畅运行。
区别于当下多采用的云、边、端协同部署模式,Yan架构大模型能直接部署在设备端,且能够在较小的算力情况下实现较高的性能。
在接受《科创板日报》采访时,岩芯数智CEO刘凡平坦言,从行业叙事看,大部分人工智能从业者所置身的是一场“由OpenAI提出概念,Meta负责开源,国内市场专注应用”的技术接力赛。RockAI不想跟随。
算经济账,Transformer架构的Attention机制,算力耗费高、数据需求大,交付成本也高,成本难以覆盖客户的付费,不少中小型企业望而却步。他们因此在早期就放弃了基于Attention机制的Transformer架构大模型。
最近的面试,刘凡平说自己会经常问候选人一个问题:如果有一天你要离开这个世界,你希望在自己的墓志铭上写什么?
他称,对多数人而言,这是一个需要思考超过30秒甚至更长时间的问题,但是在Transformer机制下,大模型会马上输出答案。
“这是Transformer大模型与人类大脑工作机制的不同,人类回答输出的时间会根据问题的复杂程度变化,复杂问题求解时参与的神经元变多了,所以输出时间会变长。但现在的大模型在面对这个问题时,即使是很复杂的问题,它的输出速度是一样的。”
本质来说,刘凡平认为大模型应当模拟人脑的方式来工作,而不应该是Transformer架构大模型中那样无时间差别的输出。也是刘凡平和他的团队放弃Transformer架构,选择自研架构的一大原因。
刘凡平说RockAI的愿景,是让世界上每一台设备都拥有自己的智能,同时通过群体智能实现通用人工智能。
他期望大模型更像人,自研的Yan模型,是群体智能单元大模型,它会则更注重模拟人脑的工作机制,通过多个智能单元的协作和交互,形成的集体智慧和决策能力,能够具备超越单元个体的能力。
在RockAI的规划中,群体智能的实现包括四个阶段:创新性基础架构、多元化硬件生态、自适应智能进化、协同化群体智能。目前,Yan1.3已经可以在广泛的设备上部署和应用,进入到了多元化硬件生态,下一阶段是自主学习。据刘凡平透露,Yan2.0计划在明年发布。



刘凡平是中国科学技术大学计算机专业,科班出身,研究生生涯一半时间在微软度过,毕业后进入百度。从大厂出走后的第一次创业,就是搜索引擎,放在当下的生成式AI语境下,这就是ChatGPT的雏形版。
刘凡平认为,在AGI这个终极命题下,无论是云端还是端侧,都只是实现智能普惠及跃迁的一个载体。他始终坚信,只有真正提升每一台设备的自我学习能力,才能激发更高级别智能形态即群体智能的涌现。



之所以继续回到张江发展,既有前东家的邀约,也有当地产业链的集聚效应吸引。
RockAI现在坐落于张江人工智能岛3号楼,周边分布着百度、阿里、IBM、微软等科技巨头。这附近,也是上海发展人工智能产业高地的重要承载区。刘凡平表示,产业上的大厂环绕,一定程度上可以链接更多合作伙伴。
RockAI目前被视为张江重点人工智能企业,当地政府也给予了诸多支持。今年元旦前后,RockAI就将搬入张江的大模型产业生态集聚区“模力社区”,这些场地,当地也给予了场地租金的优惠支持。
AI行业未来面临的星辰大海和公司当下快速的发展线轴,为刘凡平的创业增添不少信心。RockAI岩芯数智目前的团队规模约为50人,但交付跟不上,也困扰着他。

* 转载自张江发布官方微信
- 排行