专访IEEE标准协会首位中国籍主席
袁昱:内容生成AI是元宇宙必要技术之一
人物简介
IEEE(电气电子工程师学会)董事兼IEEE标准协会主席。他是IEEE历史上第一位中国籍董事,也是IEEE标准协会历史上第一位来自美国以外的主席。
袁昱在IEEE等专业技术组织担任多个领导职务,目前兼任美国国家科学院TRB常设委员会委员、欧盟ARETE顾问委员会委员、日本国际元宇宙协会名誉会长、中国通信学会区块链委员会副主任委员等。
袁昱同时也是一位科学家、发明人和创业家。他与盛景嘉成共同创立元创盛景,是立足全球服务中国的元宇宙创新赋能与产业孵化平台。他创立的0xSenses是一家专注于虚拟现实的跨国科技公司。
他曾在IBM研究院工作多年,并拥有清华大学计算机科学学士、硕士和博士学位。
问:你能否介绍一下,电气电子工程师学会(IEEE)是怎样的组织?
袁昱:IEEE我们一般叫“I triple E”,就是它有三个“E”,是全世界最大的专业组织。我们在160多个国家有40多万会员,有近140年的历史。
IEEE也是全球最重要的标准组织之一,我任主席的是IEEE标准协会,它是IEEE下面六大分支机构之一,负责IEEE所有的标准方面的业务,像WiFi、蓝牙、以太网等这些都是IEEE制定的标准,所以从标准的角度讲,IEEE在全球影响力和普及度方面即使不是首屈一指,也是最重要的机构之一。
问:你作为首任IEEE标准协会中国籍的主席,作何感受?
袁昱:应该说是荣誉与责任并存,尤其是作为第一个中国人担任这个职务,而且也是第一个来自美国之外的人担任这个职务,确实是非常的荣幸,但是确实在现在各方面的政治环境下,有更大的责任去担任好这么一个全球化组织的领导,所以我一定要把这工作做好。
问:你的上任是否也说明了IEEE对中国互联网产业的认可?
袁昱:这个职务并不是被任命的,而是竞选上来的,所以这并不是因为谁对咱们认可就任命了我,但统计数据表明中国在IEEE中的参与度的确是越来越高,目前IEEE标准协会的企业会员超过50%都是来自中国的企业,当然这并不是说给我投票的都是中国的会员,我还有很多来自其他国家和地区的选票,因为它是一个全球化的组织,但中国在IEEE标准协会里参与度的提高,确实起到了非常重要的作用。
问:能否介绍一下IEEE在中国做的工作。
袁昱:IEEE在中国的活动也有比较长的历史了。中国科协三四年前开始会每年评比一个全球一流科技社团的排行,第一年IEEE是排第二,之后连续三年都是蝉联第一,这也说明了国内科研体制对IEEE的认可。
另一方面,具体到标准方面,我们确实也为中国企业的出海,或者说为中国企业参与和引领国际标准做出了很大的贡献。很多国内的大企业都非常积极地在IEEE参与和引领很多国际标准。
问:当前我们处于一个历史性的技术变革时代,行业标准是否能跟上时代变化的节奏?有哪些迅速变革的领域是急需由标准制定来进行约束和引导的?
袁昱:过去我们通常讲标准是由市场驱动的,就是说标准的制定一般是等技术、市场相对成熟后才需要制定标准,在此之前大概是一个野蛮生长,或者说百家争鸣的阶段。近几年来,尤其是随着越来越多新兴技术,比如AI、虚拟现实等发展,我们越来越多的看到“市场驱动”,变成了要“驱动市场”,这就意味着标准要走在技术和市场之前,去提前进行一些规划和规范。
规划方面有一个很好的例子是在自动驾驶领域,现在自动驾驶等级分成了0-5级,大家都对号入座,这实际上相当于是通过标准给业界提供了一个路线图,让大家在同一个词典下交流,能够知道你做的自动驾驶先进到什么程度,我做的又到什么程度,有一个交流的基础。当然这不是IEEE的标准,这是SAE的标准,但我觉得是个很好的例子。
从规范的角度说,IEEE确实做了很多我们也很自豪的工作,尤其是在人工智能伦理方面,我们有IEEE标准的7000系列,来解决系统设计中的伦理问题。这个系列在很多国家都非常受欢迎,得到比较多的引进和采用。
所以这就是我们尤其对于新兴技术,在技术和市场本身成熟之前,可能提前需要在伦理方面去做一些规范,一方面为企业和从业者提供指南,一方面也是为立法者约束新兴技术可能带来的风险提供参考。很多时候单纯靠法律,可能不是那么切中要害,如果有相应的标准走在前面,供立法者去参考和引用,那么实际上就会形成比较有效的规范。
所以我觉得在新兴技术领域,标准驱动市场越来越多的成为一个趋势,在规划和规范两方面都有很多成功的例子,这也是我们想再进一步去增强和推广的。
问:当前,ChatGPT为主的内容生成人工智能突然非常火爆,这到底是怎么回事?发生了什么?
袁昱:这里其实是两件事。一个是AI(人工智能),这个其实已经火了好几年了,包括像早期的AlphaGO等等,都是屡次进入公众的视线。
那另一个就是AIGC(人工智能生成内容),就是用AI来产生内容,这个从去年开始比较火。最先比较火的有DALL-E,Midjourney之类的,这些工具是靠AI来产生插图,但是还没火到ChatGPT的程度。
ChatGPT为什么这么火呢?其实这几个工具我都用过,我觉得如果要分析火的原因的话,可以从用户体验的角度看,就是ChatGPT它给你的使用体验,确实是超过了用户的期望值,换句话说,它的体验确实达到了及格线以上。
当然它并不是尽善尽美,比方说,我最近用它来做一些测试或辅助工作的时候,就会发现,很多我很熟悉的话题,它回答的其实不太令人满意。而且它的数据是限制在2021年以前的,所以就不能指望从它那里得到最新的进展。
但如果问一些泛泛的问题,尤其是我专精领域之外的问题,我觉得它回答的还挺好,尤其是比如让它回答英文的问题,因为我们的母语是中文,那会觉得它的语法无懈可击,所以至少在英文写作方面,能够起到很大的辅助,但它至少距离专家的观点,还是有相当的距离。
但相比其它的几个工具,我觉得它的使用体验确实好很多,其它的工具我用的时候,比如要做一些ppt,需要一些配图,可能以前会苦恼图片版权的问题,那我想如果能用AI来帮助我生成图像,去表达一个概念,那当然是非常好了,但实际上我把排名前三的绘图工具都用过一遍后,发现使用体验还是相对比较差的,可能要反复试很多次,都不一定能够拿到一张令我满意的图片,所以觉得都还没有达到能够辅助我工作的程度。
这些工具本身都是在各自的领域里头比较小众的,现在ChatGPT用流行的话说能够“出圈”,确实是因为使用体验是超过了一个临界点,让非专精领域的用户感到能为他们创造价值,辅助工作。
问:这种内容生成AI已经开始走上商业化的路线了,对人们的工作带来了影响,它会带来生产力的革命吗?
袁昱:那其实还没有,我觉得有些媒体报道还是夸大了的。你真要用它来辅助工作,第一你会发现需要对它做很精细的校准,换句话说,它能不能够产生高质量的内容,取决于你怎么去问问题,你要问出高质量的问题,它才能起到帮你查资料,整理成文字的辅助作用,但你要靠它去形成观点,那它可能基本上不会形成什么有洞察力的观点,基本上就是市面上有什么,就给你提供什么,相当于是给你做了一个调查,那很有可能就是”garbage in, garbage out”(垃圾进,垃圾出----计算机术语),而且我刚才讲到它的数据库还限制在2021年以前,即使是2021年之后,它的作用可能类似于一个加强版的搜索引擎,它也不会给你产生比从市面上找到的信息更多的见解。所以我觉得如果你是要写一些比较八股或入门级的文章,要迅速交差的,那可以靠它去写,但如果你是一个领域的专家,要它来写一篇你拿出去不丢自己脸的有观点的文章,那就不太靠谱。
问:但是机器学习速度很快,并且在海量的数据帮助下,在很短的未来,它会跃升到优秀,甚至取代人的水平吗?
袁昱:当然从人工智能本身的研究而言,大家很多都在研究所谓的通用人工智能,希望有朝一日,这个人工智能能够达到人的智能水平。就ChatGPT而言,它其实更像一个统计和综述的工具,我并不认为它有真正的智能,并没有真正的思考,更多的是帮你整合信息。
现在还有一些顾虑,就是随着ChatGPT的数据库不断增长,按照它的原理,它也不会形成真正的洞察和创造,因为很多人都用ChatGPT来写文章,文章上网后可能又成为它的输入,反复重复的输入就形成一个闭环,负循环,并没有带来任何新鲜的输入,变成所谓的信息茧房,而从ChatGPT本身成长角度来讲,它最需要的就是有价值的输入,但这肯定不是来自它自身的输入,所以这也是一个悖论。
问:Open A.I.是非营利机构起步,现在微软的介入让它快速走上商业化的途径,我们看到其它的大公司也都在推自己的类似产品,这些大公司的介入对技术的推动是好事还是坏事?
袁昱:ChatGPT它是大模型,大模型至少从商业来看,应该说是现在人工智能的主流,因为它不是谁都玩得起的,需要很多算力,很多数据,所以它很贵,所以也有观点认为,如果大家都玩大模型的话,以后高校都玩不起了,只能给这几个公司打一些下手,从这点说我觉得的确是这样,大模型的确有门槛比较高的问题。
但另一方面,人工智能随着算力增长,根据摩尔定律成本也在降低,现在也有很多去中心化的努力,有一些去中心化的算力平台,储存平台等,所以我也希望能够靠这种众包,或去中心化的社区的力量,能够产生跟大公司运作的大模型相匹配的人工智能的算力和能力。
问:你是元宇宙专家,在你的元宇宙的愿景中,人工智能和内容生成人工智能技术现在是在哪个阶段?它对元宇宙建设起到什么作用?
袁昱:我把人工智能,主要是算法,归为元宇宙的五个支撑技术之一。在我归纳的元宇宙的两类半核心技术里,其中一类是如何去构建虚拟世界,这包括虚拟环境、虚拟场景、虚拟角色等,要生成这些虚拟内容AIGC肯定是有非常大的帮助,甚至于是一个必然的工具。因为我们要创造足够丰富、多样化的虚拟世界,如果都靠人工建模,从投入产出来讲肯定是不可能的,所以必须要用AI去辅助产生。
另一方面,AIGC也可以在元宇宙的情节设计上去辅助你“开脑洞”,提供灵感,这可能更多是从娱乐应用的角度而言,可以帮助你设计一些场景。
另外还有一个方面,也许比情节设计更重要,它可以去驱动里头的虚拟角色去跟你互动,让虚拟角色跟你对话,不管是文字还是语音的方式进行,比如像NPC(非角色玩家),让玩家觉得好像在跟真人对话一样。
这些都是消费元宇宙的,但元宇宙中还包括了工业元宇宙,那AIGC同样可以去生成一些场景。比如还是以自动驾驶为例,现在自动驾驶主流是在虚拟现实中试车,我可能在虚拟世界里跑了几百万英里后才去实际的道路上测试,这些测试环境如果都靠人工建模,那其实也不可能面面俱到的,但如果靠AIGC,就可以帮助建立这种虚拟的试车环境,如虚拟城市、虚拟道路等,可以覆盖更多的corner case(异常案例)。
另一方面,它也可以减少日常运营中的人工成本,辅助生产,比如可以通过AR去实时协助远程专家或现场操作的工人,这些方面它也都能提供显著的作用。
问:你曾经提过,元宇宙出现后,本身是打工人的,到元宇宙里就可以不再是打工人了,那随着人工智能、元宇宙等技术等发展,今后人类社会的职业和劳动会变成什么样子?
袁昱:我觉得现在有人说ChatGPT好像会把一些工作如程序员替代掉,但其实被替代掉的工作,本身并不真正具有创造性,它可能还是一些体力劳动,哪怕是一些简单的编程,也是某种程度上的体力活,我个人是学计算机出身的,我们也把一些简单的编程工作称为体力活,所以这些当然是会容易被替代掉的,但如果真正要求你去输出你的洞察,你的洞见和创新,我相信ChatGPT这样的AI内容生成工具,对你来讲是一个辅助,而不是去替代你。
元宇宙是另外一个话题,我个人认为,元宇宙会提升我们生活的丰富程度和幸福感,这也是我个人的一个技术信仰,毕竟我们现在现实生活有很多局限性,没法实现一些梦想、对快乐的追求,或者其它一些诉求比如缓解焦虑等,那这些诉求如果能从虚拟世界中实现,我觉得也是对人类整体幸福感一个正面的贡献。
问:你能否描绘一下五年,十年后,互联网技术进一步发展后世界的面貌吗?
袁昱:可能有很多行业会消亡或减小,但一些现实中的问题可能会被解决,比如如果我们很多事情都能够在虚拟世界中进行,可能就没有那么多出行的需求了,那现在很关心的碳排放、可持续发展的问题可能也就迎刃而解了。
其次,我们可能会有更多的朋友,就像在互联网之前,我们的社交圈子其实是比现在更少的,所以在有了比较完善的元宇宙后,我们不用担心说,大家会沉迷于虚拟世界,相反我觉得我们交友的范围会更广,生活也会更加丰富。