4月20日,Rokid举办了Rokid Open Day 2024活动,同时发布了一款空间计算新产品——Rokid AR Lite空间计算套装。平心而论,这款产品给我们的第一印象还是很不错的,时尚的外观,金属磨砂的质感,的确很具备吸引力。
然而在深入的了解了Rokid AR Lite的功能后,却让我们对这款所谓的「空间计算套装」产生了三个疑问,希望能够得到Rokid官方的解答。
01 你的空间是什么空间,你的计算又在计算什么?
去年6月,苹果在WWDC上发布了Vision Pro。根据苹果官方的说法,Vision Pro是一台空间计算机(Spatial Computer),瞬间带火了空间计算这一概念。
尽管苹果官方并没有给空间计算下一个直接的定义,但还是在官方的新闻中,还是给Vision Pro的能力做了一个详细的表述,这里我们直接放原文吧:
“Apple Vision Pro打造无边际画布,让app突破传统显示屏的限制,为用户带来全新的3D 交互体验,以最自然、最直观的输入方式来控制——眼睛、双手与语音。Apple Vision Pro 搭载全球首创的空间操作系统 visionOS,通过用户与数字内容互动的模式,让数字内容如同存在于真实世界。”
不难看出其中的几个关键词:无边际画布,突破传统显示屏的限制,3D交互体验,让数字内容如同存在于真实世界。这几个词也很好的描述了空间计算应该是什么模样。
实际上,如果用心揣摩这段话的意思,大家应当能够理解到,空间计算消除了传统屏幕的框架,以现实世界为画布,数字内容可以存在于现实世界的任何角落,并与周围环境很好的融合在了一起,同时因为传统的屏幕概念消失,交互方式也应当出现变革,由平面2D交互向空间交互转变。更简洁一点的表述可以概括为:空间计算,是用计算的方式让数字内容和现实世界相融。
张艺谋的电影《英雄》中,曾经描述了剑术的三层境界:
第一层:手中有剑,心中有剑;
第二层:手中无剑,心中有剑;
第三层:手中无剑,心中也无剑;
这种划分用到空间计算上来,也恰如其分。
第一层,画面有屏,设备有屏;意思是不仅在硬件上依靠显示屏,在人眼中的画面依然要受到一块虚拟屏幕的束缚,这种恐怕不能称之为空间计算,称为HMD或者HUD更合适;
第二层,画面无屏,设备有屏;意思是尽管硬件上需要显示屏充当显示模块的一部分,但人眼中的画面不会再受到虚拟屏幕的束缚,眼光所及皆是画布,都能呈现出数字内容,并且与真实世界相融合。这是空间计算的入门标准,是现阶段技术体系下对空间计算的实践,Vision Pro就处于这样一个层次,HoloLens 1/2、Magic Leap 1/2、Quest Pro以及Quest 3等等具备MR能力的设备也都基本可以纳入这一层次;
第三层,画面无屏,设备也无屏;意思是硬件上不再需要传统的显示屏充当现实模块,人眼中的画面也不受到虚拟屏幕边界的束缚。这是空间计算的终极形态,或许需要脑机接口真正实现后才能达成。
然而处处标榜自己为空间计算OST路线代表、时时刻刻不忘记对标Vision Pro的Rokid,在Rokid AR Lite的宣传上却玩了一手“偷天换日”的把戏,给大家灌输空间计算就是“空间大屏”、“空间多屏”的概念,与空间计算真正的理念,恐怕不说是背道而驰吧,那也是南辕北辙了。
因为归根到底,Rokid AR Lite空间计算套装所谓的“空间大屏”、“空间多屏”和现实空间并没有任何的关系。
仔细查看Rokid AR Lite空间计算套装的规格参数,只在Rokid Max 2眼镜和Station 2的机身里各搭载了一个IMU单元,还有一个距离传感器要于检测用户是否佩戴眼镜,并没有其他任何能用于感知外部环境的传感器。
因此,Rokid AR Lite的画面,锚定的并不是现实空间中某个位置的映射,而是一个和周围空间没有任何映射关系、由IMU数据得出的初始姿势。
换而言之,由于Rokid AR Lite并没有SLAM(同步定位和建图)的能力,它既无法确定自己在现实空间中的位置,也无法感知空间的环境是一个什么模样,自然也谈不上数字内容和真实世界的融合,又怎么能够称得上是一台空间计算设备呢?
实际上,更早发布的Rokid Air这款产品中,Rokid官方已经给这种画面有屏,设备有屏的显示方式给出了很清晰的定义:虚拟屏幕。难道在Rokid的理解中,有虚拟屏幕就是空间计算吗?
那么在这里我们想问Rokid提出第一个问题:关于Rokid AR Lite空间计算套装,你说的空间是什么空间,你说的计算又在计算什么?
02 无SLAM,不空间计算
在《从星际之旅到空间计算:我们发现计算机正通过SLAM重构世界》一文中,我们就曾经详细介绍过,基于摄像头的SLAM技术给予了计算机对世界的感知能力,是走向空间计算时代必不可少的技术底座。
尽管在接受媒体采访时,Rokid创始人祝明铭解释过为什么Rokid AR Lite不搭载「单目摄像头+手势交互」方案,表示摄像头在日常使用对于其他人的打扰,而不管是触摸还是空间射线模式,都是更「静默」的交互方式,因此Rokid AR Lite摒弃了摄像头交互模式。
但这个回答其实只解答了问题的一半。
去年发布的Rokid AR Studio采用了「单目摄像头+3D手势交互」的方案,Rokid声称,Rokid Max Pro仅在双目中间多了一个摄像头,机身重量仅增加1g,却具备了“以手势交互为核心的空间计算能力”,可实现SLAM、微手势交互、第一视角分享、视觉定位VPS能力。带领AR行业进入软件和生态建设的第二阶段。
在去年举办的2023 Rokid Jungle活动上,我们曾经体验过Rokid AR Studio套装,在试用手势交互时,总是会感受到一丝丝的违和——虚拟渲染的手部模型与实际手部的位置总是存在着一定的误差。
当然,这可能是单目摄像头方案的固有缺点——尺度信息的不足很容易造成对深度估计的错误,从而影响到手部定位的精确性。因此,如果从技术成熟度来考虑并删掉了手势交互,尚且算是一个合理的原因。
但是,连带着在Rokid AR Lite上直接砍掉了单目摄像头,却还要继续标榜自己是一款空间计算设备,就是我们难以理解的举动了。单目摄像头并不仅仅用于交互,还承担了SLAM、视觉定位的功能。
祝明铭没有解答的那一半问题,是Rokid AR Lite为什么去掉了SLAM功能,而这恰恰就是空间计算的核心。
本来单目方案的Rokid AR Studio就只能和空间计算扯上一半关系——如果你翻阅过Rokid AR Studio的开发文档,就会发现它只向开发者开放了6DoF追踪的能力。
对比下Quest 3的开发者文档,里面有相当重要的一部分是关于Scene Model,也就是Quest 3会如何感知周围环境并提供哪些数据给开发者。
现在Rokid AR Lite空间计算套装连这一半关系都丢掉,仅剩下个3DoF能力。
就像是你想买辆野马,结果买到了一匹野马。尽管老婆饼里可以没有老婆,消费者可能还是希望空间计算套装里,真的有空间计算吧?
再换一个角度来说,即使Rokid真的担心摄像头对他人的打扰,实现SLAM的传感器可不止视觉一种方案, 像ToF深度传感器这样的非可见光方案依然是一个可选项。
这里我们想向Rokid提出第二个问题,空间计算设备不做SLAM,到底是成本问题、技术问题、还是态度问题?
03 Fake It Till You Make It,要搞噱头,更要重视产品力
「Fake it till you make it」是硅谷秘而不宣的创业潜规则,指先吹嘘你的想法,再通过吸引资本和人才的方式努力地在现实中追赶你的目标,直到你实现了它。
对于创业公司来说,这么做并无可厚非,关键还是在于要让人们相信,你在努力的「make it」。
如果说Rokid AR Studio还能展现出Rokid对于空间计算「make it」的意志,那么Rokid AR Lite空间计算套装,则是宣发攻势掩盖下的躺平和摆烂。
不知什么时候开始,长定语修饰下的首创/第一/最大/最多等等词汇开始被滥用,先不提这么说违不违反广告法,只要定语够长,一头猪也能被定义个第一出来,毕竟定语的解释权在说出这句话的人手里。
例如出现在本次Rokid Open Day海报中的「消费级AR分体式设备首创的多指多手势触控」,去掉任何一个定语还成立吗?这种交互方式真的很新颖吗?任何一台笔记本连上支持的投屏眼镜能不能实现接近的效果?通过2D的触摸板和3D的内容去交互,和在手机上直接玩3D游戏的逻辑有质的飞跃吗?这和空间计算需要的空间交互有一丁点的关联吗?
研发了一种操作映射首创一种交互方式,学到了!容我再多句嘴,Rokid AR Lite的多点触控和Mac上的Multi-Touch手势这么像,拿到专利授权了吗?
在文字上耍花枪是Rokid的老惯例了。
再比如去年3月份,Rokid CEO祝明铭在朋友圈表示6W台Rokid Air已经全部售出,称把“AR行业带入消费者时代”,但实际上根据我们从一些第三方渠道了解到的信息,这6W台Rokid Air中的大部分(或超过5W台)并非流入消费者手中,而是流向了B端,主要是博物馆在使用。而且Rokid存在一种销售模式,即先将Rokid Air销售给入股企业,然后由入股企业以租赁的方式进入博物馆中,运营收益进行分成,和真正的消费市场关联可能并不大。
有兴趣的读者可以去搜索一下22年7月份界面新闻关于海外做空机构灰熊对蔚来和武汉蔚能的调查,但我们要事先声明我们的观点:两件事情毫无关联,仅作为一个有意思的拓展阅读。
去年7月底,祝明铭同样在朋友圈发布了一条信息,称谷歌携手Rokid,打造全球首款AR版Andorid TV设备。也许是我们的阅读能力还不够吧,总是会把祝明铭在朋友圈发的话曲解成谷歌和Rokid一起研发了AR版Andorid TV——Rokid Station(全球版),谷歌还会帮助Rokid做全球的发布和销售。
但是实际上事情要更简单一些,Rokid和海美迪合作开发了Rokid Station(全球版),然后拿去申请谷歌的Android TV认证,并且通过了。
中间为什么多出了海美迪?因为海美迪是电视机顶盒出海的老牌企业,对Android TV认证十分熟悉。
如果你去搜索外网的新闻,你会发现在外网的新闻报道中,并没有出现“谷歌携手Rokid”这种描述,大家通常的表述是Google-Certified(谷歌认证),甚至是在Rokid自己发布的英文通稿中,我们也未找到任何Rokid Google Partnership这样的字眼,所谓的“谷歌携手Rokid”,完全是一条国内的“专供新闻”。这种不一致的表述,是觉得媒体老师们接触不到外网的新闻,还是对巨头的法务部有所畏惧呢?
当然了,创业公司搞搞噱头吸引一下媒体的注意力,增加一些曝光,也不是什么大不了的事情嘛,有曝光才能有资本关注,有资本的支持创业公司才能发展壮大。
但是既然Rokid目前已经是国内融资最多的AR创企了,短短一两年的时间里融资融了十几亿,是不是应该在搞噱头之外,为消费者呈上更好的空间计算硬件呢?
如果说Rokid Station使用电视机顶盒级别的低端芯片是因为Rokid Station的本质就是个便携机顶盒,那么都开始强调空间计算了,都要从2D向3D升维了,为什么还要在Station 2上使用高通骁龙6 Gen 1这款千元机才会用的低端芯片?是因为这款芯片的3D渲染能力出众吗?
不妨再多问一句,2022年4月,曾经有媒体报道过Rokid与安谋科技联合研发Rokid AR芯片。2年时间过去了,这款芯片的研发进度如何?什么时候能正式面世?
当Vision Pro在用M2+R1这种强力的芯片组合,努力的向消费者们呈现空间计算的潜力,号召开发者们开发原生的vision OS应用,而不是简单的将iPad/iPhone应用移植时;处处对标苹果的Rokid,却在Rokid AR Lite空间计算套装上使用千元机级别的芯片,将触屏操作当做创新,指着对周围现实世界一无所知的传统2D/3D应用,告诉消费者和开发者,这就是空间计算,不会觉得有些讽刺吗?
祝明铭曾说过,「未来的 3 到 5 年,Rokid 将会有一个使命,就是把大家的眼镜换成智能眼镜,所有的眼镜默认就是智能的,就像现在所有的手机默认是智能的一样。」
但是这一目标,在我们看来并不能依靠低价策略和对核心体 验的删减来实现。
IDC数据显示,2023年全球AR眼镜销量51万台,以平价的观影类AR眼镜和信息提示类AR眼镜为主。2024年1月29日Vision Pro开启预售后,短短一个月的时间内售出就超过20万台。
这证明了一点,消费者是有意愿为优秀的体验买单甚至是付出高昂溢价的,高端市场大有可为。
而VR行业暴风魔镜与VR纸盒眼镜的黯淡离场,也早已身体力行的告诉我们,如果设备体验达不到一个底线,再便宜也不会有人愿意买单,还让人们将VR和低劣的体验挂上了等号,对整个行业造成了巨大的伤害。低端产品抢占消费市场的逻辑,在XR行业真的走得通吗?
这里,我们想向Rokid抛出最后一个问题:在Rokid眼中,空间计算设备的底线在哪里,才不会透支消费者对空间计算的好奇心?