作者:王晓,中国指控学会副秘书长
安徽大学人工智能学院
前言
近日,不时有收到部分朋友、同事、同学的感叹:“你们才是元宇宙的祖庭啊!”、“你们做的才是真正的元宇宙!”、“你们团队是国内最早做元宇宙的!”以及疑问“元宇宙和你们做的平行智能是什么关系?” “数字孪生和元宇宙有什么关系?”有感于同事、同学及朋友们对于相关知识的追求,特别是自己曾经有幸翻译了与人工智能的历史与发展相关的三本巨著《机器崛起》、《社会机器》与《AI 3.0》,对于“奇点”、“智能大爆炸”、“思想平线”、“全息玫瑰碎片”、“赛博格”、“虚拟现实”、“元宇宙”等科幻和科技概念的历史与起源都做过调研了解,心想一定要抽时间、力所能及得把自己的所知所想写一段文字以作解答,但一直苦于日常忙碌没有时间。机缘巧合,国庆假日期间,与几位新“老”朋友闲叙,顺便梳理了自己的思路,借今日之讨论、圆昨日之心念。
导读
本文探讨人与虚拟空间的关系。以“元宇宙”概念的提出为起点,相继简要探讨了元宇宙与赛博空间的关系、通往赛博空间的通道与工具、美国空军打造的通往赛博空间的工具、沿着控制论思考人及其生存的物理空间环境的关系、技术发展如何促进了对波普尔的三个世界的开发、数字孪生与平行系统、赛博空间的殖民化、元宇宙与平行智能、智能与想象以及人类的优势、计算机的局限与AI的潜力等主题,试图为当下元宇宙概念的出现以及我们如何看待元宇宙提供一个带有智能科技发展历史沿革的视角。文中展示的内容,仅仅是自二战以来智能科技发展沿革的冰山一角,因个人能力和视角有限,仅做简要探讨,全文共计约1.5万字,敬请大家批评指导。
“元宇宙Metaverse”与赛博空间
众所周知,“元宇宙”的概念来源于尼尔·斯蒂芬森于1992年撰写的小说——《雪崩》,在小说中,尼尔描绘了一个完全沉浸式的虚拟环境,为绝望国家里的所有人提供一个短暂逃离无法忍受的现实的机会。其实,在我2017年翻译詹姆斯·亨德乐的《社会机器》一书的时候,由于书中提到了尼尔于1995年撰写的《钻石时代》一书,认为其中描绘的场景与王飞跃老师提出的“平行世界”理念相呼应,因此在2017年9月曾经买过英文版本的《雪崩(Snow Crash)》以及《钻石时代(Diamond Age)》,计划送给王老师,可惜没有得到王老师的重视与接收(有可能是认为我这个关注科幻小说的学生不务正业)。2021年11月份,王飞跃老师应某部门要求撰写关于我国发展元宇宙的优势、挑战及应对的内部报告,请王雨桐、李小双、杨林瑶、田永林博士和我等共同进行文献调研及探讨,我再次提起此事,才正式把书送与王老师。
元宇宙的本质是探讨人类与虚拟空间的关系,特别是人类在与自身所创造出来的新环境中生存并如何相互影响的关系。而尼尔·斯蒂芬森对于这一关系的描述和思考,实际上反映了上世纪八、九十年代,美国民众在经历“水门事件”、“储蓄贷款危机”后,出于对政府的极度不信任所构想出来的一个逃离现实世界的“赛博空间(Cyberspace)”。
关于“赛博空间”的思考与探索,引发了美国在20世纪90年代的第一波VR浪潮。以凯文·凯利(《失控》一书作者)与斯图尔特·布兰德(《全球概览》杂志创始人、全球电子链接WELL创始人)举办的“赛博颂Cyberthon”为高潮,被《全球评论》认为是“将伯克利瘾君子、科技发烧友、艺术朋克以及那些真正建立了赛博空间的人聚集在了一起”1,并被创造这一单词的作者——科幻小说巨匠威廉·吉布森评价为“我从未想到真的会有人走出来并创造这些东西。”2。
赛博空间(Cyberspace)一词最早出现于吉布森于1982年所创作的《全息玫瑰碎片(Burning Chrome)》短篇小说;两年后,在其闻名世界的《神经漫游者》一书中,吉布森用其标志性的语气介绍了这一机器内部的全新空间:
“赛博空间,每天都有遍及全球的几十亿合法操作者在共同感受这个科幻空间,包括正在学习数学概念的孩子……它是人类系统全部计算数据抽象集合之后产生的图形表示,有着人类无法想象的复杂程度。它是排列在无限思维空间中的光线,是密集丛生的数据。如同万家灯火,模糊不定。3”
吉布森的语言赋予了科技神奇的色彩,引发了人们对计算机生成的这一空间的无限向往,并推动科技的潮流朝着这样几个方向思考:(1)构建什么样的交互界面,才能打通人类通往赛博空间的通道?(2)如何建设并殖民化这一新的虚拟空间环境?(3)人类与自己创造的这一新的空间环境是什么关系?
通往赛博空间的通道与工具
为了打通人类与赛博空间的交互通道,杰伦·拉尼尔(《时代》周刊2010年100位最具影响力的人,评选出的思想家)开始研究一种“后符号”(postsymbolic)的可视化编程语言(Visual Programming Language);托马斯·齐默尔曼研发了一种“数据手套”4,通过在手套的各个指头上安装光线弯曲传感器以测量手指的弯曲度,虽然其初衷是为了通过触摸不存在的琴弦来制造真实的音乐,但后来却发展成为NASA的虚拟操控产品供应商。其他企业也纷纷投入这一浪潮之中,出现了专注视觉反馈系统的欧特克公司(Autodesk, Inc.)、第八感公司(Sense8 Corporation)、头部跟踪设备的布莱姆斯公司(Polhemus, Inc)等,甚至苹果也在考虑加入NASA的埃姆斯研究中心(Ames Researcher Center)。然而,20余家VR公司在缺少4个先决条件的情况下如雨后春笋般出现后,大多又如秋后蚂蚱一般消失了。这4个条件放在今天也是决定科技创新企业是否能够生存下来的关键:足够的预算、技术精湛的工程师、时间,以及最重要的——一个明确的目标。
左图:杰伦·拉尼尔,虚拟现实公司 VPL的创始人,头戴公司的一个原型产品,该头戴式显示器是一个输出设备;右图:VPL公司研发的虚拟现实手套和覆盖全身的数据服装样品(1990s)
左图:《盟多2000》杂志上的一幅“赛博空间”示意插图——可被“殖民化”的新领域。在机器内部虚拟的开放空间,物理学、法律和身份将拥有全新的含义,空间的墙壁则由密码学支撑;右图:一台早期的虚拟现实设备
威廉·吉布森不知道的是,在他们热烈讨论和喧哗的同时间里,美国空军已经在暗地里研发了相关硬件。1984年3月27日,CBS晚间新闻报道了美国空军发明的一种革命性的新型显示技术。一位带着飞行员眼镜、身穿棕色皮夹克的工程师站在摄像机前,向被深深迷住的美国大众解释飞行员如何在“虚拟空间”中对着视频练习飞行——就像是喷气式飞机沿着网格状的电子地球在竞赛5。实际上,空军的工程师是20世纪70年代初第一批阐明虚拟空间想法的人,而这一开创性的军事研究在1984年3月被公开了。
美国空军打造的通往赛博空间的工具:虚拟驾驶舱
在吉布森提出“赛博空间”术语之前,美国空军已经在赛博空间里进行飞行和战斗了。二战期间闪电战中牵引诺伯特·维纳进行研究的“处于压力下的驾驶舱内的人机交互问题”,使得空军工程师们在整个50年代和60年代都忙碌不堪。结果,就是空军在70年代初发明了“虚拟空间”技术。
20世纪70年代,曾经为美国征战立下汗马功劳的F-4“鬼怪式”战斗机和F-105战斗轰炸机已经到其生命末期,它们有限的驾驶舱空间导致无法升级并更新新型的显示设备6。当时,麦克唐纳·道格拉斯(McDonnell Douglas)公司为空军研制了F-15“鹰”式战斗机,而通用动力(General Dynamics)正为研究F-16“战隼”而努力。
然而,这些新一代战斗机不仅没有优化驾驶舱的设计,反而使问题更糟糕了。夜间飞行的F-15机舱内就是一片灯光和仪表的海洋:300个开关和75个显示器,包括所谓的垂直状态显示器、水平状态显示器、备用仪器以及雷达等。仅操纵杆上就有11个开关,油门杆上还有9个。所有这一切连接到大约50台计算机上,这些计算机为飞行员提供增稳控制,飞行数据如速度、高度及温度,推进控制,电子作战系统,以及各式各样的武器。通过这些交互,F-15的飞行员可以有效地控制一个在空中以超声速疾驰的能源输送系统!
经过MSIP改进后依然保留较多机械式仪表的F-15C座舱7
这一复杂性是前所未有的。最新研制的驾驶舱向一个人类飞行员在如此微小的显示器上展示了远超其处理能力的数据,导致飞行员们纷纷抱怨,“脑浆都要从指尖儿上渗出来了”8。
空军的哈利G.阿姆斯特朗航空医学研究实验室(Harry G. Armstrong Aerospace Medical Research Laborary)决定设计“理想的驾驶舱”,但也有一个问题令人对这一目标望而生畏“我们该怎样把信息输入给一个机组人员,才能帮助他快速地做出决定9?”。对此,空军工程师们的指导思想是:“解决这些问题的关键是使机器更加‘人性化’,而不是使人更加‘机器化’”10。
赖特-帕特森空军基地(Wright-Patterson Air Force Base)的托马斯·弗尼斯11少尉及其团队在1976年提出了一种“视觉耦合机载系统模拟器(Visually Coupled Airborne Systems Simulator,简称VCASS)”的设计方案,他们的愿景是“在视觉上耦合人类和机器”12。具体的思路为:通过VCASS显示器,在视觉、听觉和触觉上将信息“输入”到飞行员的大脑里,然后,使用脑磁电扫描法(Magnetoencephalography)测量大脑内部由神经系统诱发的神经电势,把从飞行员大脑皮层“输出”的信息返回到计算机。这样直接的“生物反馈(Biofeedback)”预期使得这些飞行机器“将具备人类无法企及的能力”13,其目标是仅仅通过设想军事演习和发射导弹即可赢得空中混战的胜利。
左图:美国空军在20世纪70年代末开拓了“虚拟现实”的概念。图中所示为1985年6月1日,空军中士弗农·威尔斯在赖特-帕特森空军基地的阿姆斯特朗航天医学研究实验室戴着视觉耦合机载系统模拟器(VCASS);右图:典型的投影到VCASS头盔中的由计算机生成的图像
该实验室研发的复杂头盔显示器原型机在1981年正式投入运作,工程师们后来将其称为“超级驾驶舱”。这个耦合了视觉感官的VCASS头盔是人类迄今为止制造的最为复杂的虚拟现实系统14。
但它看起来相当丑陋和笨拙。当来自加利福尼亚爱德华兹空军基地的首批试飞员来到这个位于俄亥俄州代顿的实验室时,他们震惊了“你肯定是在跟我开玩笑”一位飞行员难以置信地说道“别闹了,弗尼斯,这是怎么回事?15”一则电视报道后来直接称这台头盔原型机是一个滑稽的装置。记者们也经常取笑这个设计16。这台原型机太笨重了! 以至于需要从驾驶舱上面的天花板上把它降到飞行员的头部位置。
值得庆幸的是,科幻小说来救场了。1977年5月,乔治·卢卡斯(George Lucas)的电影《星球大战》上映了,反派达斯·维达的头盔与空军自己的设计简直相似得可怕。突然之间,有着怪异眼睛的超大型头盔变酷了。但空军的头盔不只是看起来跟科幻小说里的很像,甚至卢克·天行者那台计算机控制的瞄准器,与空军的系统一比也似乎有些过时。这一次,科技的发展速度超越了想象(科幻)。
《星球大战》电影中带着头盔的达斯·维达
沿着控制论思考人与物理空间环境的关系
在上世纪六十年代美国出现的反主流文化17的浪潮中,学习——被认为是其中一个关键部分。学习或许是唯一一种可以拓展思维从而使得人们能够看到通往更加美好、更加和平、以及更加公正的未来的道路。人通过观察并改造物理空间环境进行学习,记录所观察出的规律以及改造的过程与结果,形成文字并流传于世。
早在20世纪50年代早期,艾什比和维纳就已经指出,人类及其工具间的界限是很随意的。人在操纵飞机的时候,与机器形成了一个整体的系统,这就是控制论101(Cybernetics 101),基础中的基础。艾什比随即指出,系统及其环境之间的界限也是很随意的。格雷戈里·贝特森将这一想法发展为“思维内在于这个更大的系统——人类与环境共同组成的系统。18”
人与机器的三种控制关系:人在环内的半自动化过程、人类监督下的自动化过程、自主决策的自动化过程
这一描述对于绝大数人来说可能有些怪异,但贝特森认为:任何合理的行为必然代表着一个“整体回路”,一个完整的闭环反馈。因此他认为,显示了反复试错行为的任意单元组合均可被称为是一个思维系统。那些拥有因果回路的简单单元经过“任意集成”所组成的复杂物体,“必然会表现出心理特征”,贝特森如此概括到19。
将该认识上升到整个社会层面后,贝特森认识到:整个社会就是一个自稳态调节器,全动态的社会就是一个“超稳定系统”。他提出,“个体思维是内在的但不仅仅存在于机体内部,他还内在于体外的通道和信息中;并且存在一个更大的思维,而个人思维只是其子系统。20”
丹麦皇家美术学院建筑学院公共空间研究中心的扬·盖尔(Jan Gehl,1936至今)21教授在其《交往与空间》一书中提到“生活是不断变化和极度动态的,人们的感受和行为也在生活中不断地变化和转换,因此建筑同样需要对这些动态做出回应。举个例子,如果说建筑是胚胎,那么建筑的表皮就是无数个细胞,建筑中的人即是信号的发出者。人的感受和行为所组成的动态社会影响着建筑的功能,塑造了不同的建筑形态。”
物理空间的建设、改造和开发往往伴随着大量的基础建设工作,成本高、代价大,往往还无法提前体验并评估。随着人类文明、社会与科技的发展,人类对地表物理空间的开发已经基本完成。接下来,将走向何方?
人类思维的全息碎片、波普尔的三个世界与独立发展的知识
文字是人类思维可视化的一个最主要的途径,也是人类文明发展和传承最重要的手段。近年来,随着手机、笔记本等移动终端的发展,以及快手、bilibili以及Instagram等APP的发展,人们可以随时随地把自己的所看、所思、所关注的内容发布到网络上,不仅有文字,还有图片、视频等等。所有的这些信息,正在组成围绕个人的“全息碎片”;而知识图谱、语音识别、图像检测等技术,就像一只只功能各异又看不见的灵巧的手,把属于每个人的碎片一片一片拼在一起,试图描绘出某个人的数字化信息全景。
出自ACP-based social computing and parallel intelligence: Societies 5.0 and beyond22
然而,自计算机出现之始,直到今天信息技术迅速蓬勃发展的当下,几乎所有的参与者都沉溺于计算机内部世界的开发、跨越计算机屏幕走进机器的新空间或链接计算背后的其他人,但却忘记了去思考背后的科学基础与哲学支撑23。
英国科学哲学家卡尔·波普尔在其1972年出版的《客观知识:一个进化论的研究》一书中,完整地描绘了他的“3个世界”知识论。其中世界1是物理世界;世界2是精神世界;世界3是客观知识世界。钱学森在意识到情报科学和技术与波普尔的三个世界理论的内在关系后,提出了情报“激活”理论24。在王飞跃的《情报5.0:平行时代的平行情报体系》25一文中,他对钱学森如何受到波普尔启发提出了情报激活理论做了详细的介绍,此处不再赘述。比较有意思的是,钱学森批判了波普尔关于三个世界独立发展的思想,“但是在他(指波普尔)看来,这三个世界都是等同的、独立的,世界一就是客观世界,世界二就是精神世界,世界三就是知识世界,而且他强调这三个世界都可以独立地发展,这就搞乱了。特别让人家很难接受的就是说这个知识世界,它自己就有独立性,自己可以自由自在地在那儿发展。这就十分荒谬的了。知识是人去创造的嘛,知识怎么能独立自主地在那儿发展呢!”
近年来,随着人工智能的发展,我们知道,AI不仅仅能够自主学习,都能够发展出自己的语言了。当再次回顾思考的时候,不禁疑问:知识是否可以独立自主在那儿发展呢?如果知识世界可以独立发展,它在哪里发展?会怎么发展?属于谁?将为谁所用?从技术的角度,可能还需要思考,如何保障生产知识的个体的权益、知识存储安全、使用权限管理等。而目前出现的区块链技术、NFT26则有望为保障知识安全和可追溯的传播提供有效手段。
数字孪生与平行系统:描述现实与虚实闭环
在《数字孪生与平行智能: 发展现状、对比与展望》27一文中,作者从哲学基础、研究对象、核心思想、基础设施、实现技术方法和功能六个方面对比了数字孪生与平行智能的区别,得出了“必须建立包含人机物在内的智能实体之间知识层次的联结,实现从相对独立的简单知识系统向知识联结的复杂知识系统的跃进”的结论。
本质上,数字孪生是数字化仿真技术发展的必然阶段,是实现平行系统的基础技术之一。平行理论的基本思想,是借助先进的计算机建模手段,利用人工社会,在网络(Cyber)空间中构造一个与现实世界复杂对象平行的虚拟复杂对象。换言之,人工社会即是平行宇宙在计算机中的虚拟实现,它与物理现实世界中的复杂对象同构并映,构成研究和处理复杂问题的平行系统。几百年前,物理学家们用自己聪明绝顶的大脑设计了各种各样的“思想实验”来研究并验证平行宇宙及其他量子力学的解释;而被称为“电脑”的计算机,自然可以被用作“培育”人工社会/世界的载体,将复杂系统的求解空间从物理空间扩展到网络空间。其核心方法为人工社会(Artificial Societies)、计算实验(Computational Experiments)与平行执行(Parallel Execution)为一体的ACP方法。
人工社会28这一概念是在20世纪90年代初美国兰德公司的Builder和Bankers为研究信息技术的社会冲击影响而提出的。与传统社会仿真不同的是,社会仿真以实际社会为唯一现实存在,并以实际社会作为检验研究成果的唯一参照和标准,追求“真实”;人工社会29则迈向“多重社会”的认识,将人工社会作为未来现实社会发展的一种可能结果或替代形式。事实上,人类对于“人工社会”的思考自古即有。从柏拉图的理想国、陶渊明的桃花源、摩尔的乌托邦,直至近代各类的社会理论都可以视为“人工社会”的一种蓝图,它们存在于人们的脑海中,与现实社会平行互动,并引导我们朝着“人工社会”的目标来改造现实世界。人工社会或人工系统所进行的,其实是把人们脑海中和现实社会里的“平行意图”和“平行行动”迁移到计算中、复制在赛博空间中,并复制多份存储。在现实系统和人工系统所构成的平行系统的基础上,对于无法实验或实验成本太高的物理实验,我们就可以将人工系统作为“社会实验室”,解剖、分析并学习复杂系统的行为特征及规律,实验并评估系统在遇到特定情景之下的性能表现,并进一步围绕相应的问题及场景展开控制与管理。
计算实验30是计算机仿真研究的“平行”扩展与延伸。复杂社会系统或军事系统因涉及大量的人员参与,且“试验”成本高昂,或者涉及国家防卫、军事战备及社会安全问题,以及道德伦理问题,许多时候无法进行“实验”或重复性“试验”。计算机仿真是采用计算手段来模拟复杂系统行为演化与涌现的一种有效手段,其应用于复杂系统研究已有几十年的历史。在计算机一开始被用于仿真或模拟时,研究人员就对此持有两种态度31:1)认为这是一种创新和极有价值的工作,围绕复杂系统的仿真建模开展了大量工作;2)仿真替代不了实际的物理过程,发现不了新东西,有时甚至是多余的。但两种观点都认为,仿真可用于系统分析,有助于分析过程,但是绝不能用于取代实际的工程或物理实验。在复杂社会或军事系统中,由于涉及社会文化因素及人的主观性,可以更进一步,将“仿真”结果作为现实的一个替代版本,或一种可能出现的现实,而实际情况只是可能出现的一种现实。该思路即为系统仿真走向计算实验的思想基础。在计算实验中,传统的计算模拟变成了“计算实验室”里面的“试验”过程,成为“种植培育”各类复杂系统的手段。与仿真遵循实际系统是唯一现实的理念不同;计算实验认为“计算模拟”也是一种“现实”,是现实系统的一种可能替代形式。计算实验以“试错”的方式启发式探索系统解决方案,通过大量实验生成充足的数据与场景,同时为实际系统的演化方向提供可能的借鉴。
平行系统32是指由某一个自然的现实系统和对应的一个或多个虚拟或理想的人工系统所组成的共同系统。从数学建模、计算机仿真模拟、到现在的虚拟现实,实质上都是用平行系统方法进行设计、分析、控制和综合集成的实例,但未形成完整的闭环,而是以离线、静态、被动的形式辅助现实系统的管理和控制。一定程度上,现代控制理论是成功应用平行系统的典范,从经典的传递函数方法到状态空间方法,从最优控制理论到参数识别和变结构自适应控制,特别是基于参考模型的自适应控制等33。不过在一般的控制系统中,控制和决策实施都是针对现实系统的,很少或者根本没有相对应的人工系统进行控制。主要原因在于:首先绝大多数情况下,针对这一类实际系统可以建立足够精确的数学模型,进而分析特性、预测行为、控制发展,这时候根本没有主动在线利用模型的必要;其次,有些实际系统要找到精准建模较难,但可以利用参数识别、结构变化或神经元网络等方法分段建立足够精确的系统模型,这时候模型的角色本身还是被动的。尽管控制信号同时用于实际系统和人工系统,但不是为了控制人工系统,而且两个系统的行为都是可预测的,并且实际与人工系统的行为和结果应当是一致的34。对于社会、经济及军事等涉及人类文化、心理、行为特征显著的复杂系统,多数情况下没有足够精确的模型,也不可能建立可以解析的预测短期系统行为的模型,许多时候只能按照“摸石头过河”的方式一步步探索,即时对复杂系统进行决策和管理。近年来,随着信息技术的发展、网络化的普及和数字社会及数字政府进程的加快,这种对这类复杂系统的管理与控制暴露出越来越多的问题,稍有不慎,就可能会导致社会动荡、政权更迭以及品牌危机,如俄乌战争、香港动乱以及阿拉伯颜色革命等。在这种情况下,我们必须重视并设法挖掘平行系统中人工系统的潜力,使其角色从被动到主动、静态到动态、离线到在线,这就是平行系统的核心思想。
计算机、在线社区、网络游戏与阿凡达:赛博空间的殖民化
上世纪五六十年代,人们曾经把计算机看成是集中控制的化身,代为执掌着可以终结全人类文明的计算机控制的核武器。同一时期兴起的反主流文化先锋们不厌其烦地尝试着各种克服资本主义以及政府自上而下控制的方式。为了与大公司们集中控制的方式对抗,他们先是发明了分时技术机制,让更多的人获得了访问SAGE(Semi-Automatic Ground Environment, 半自动地面防空系统)这类超级计算机/大型机的途径。
到七十年代,他们又通过将个人计算机推向市场完全推翻并颠覆了大型机。其中以史蒂夫·乔布斯(Steve Jobs)和史蒂夫·沃兹尼亚克(Steve Wozniak)为代表:先是通过开发然后销售所谓的蓝盒子35——一种免费拨打电话的盗用电话线路设备,来磨练自己的技能;后来又创立了苹果公司。1984年,苹果推出了麦金塔(Macintosh)——第一台大获成功的带鼠标的计算机图形用户界面电脑。为了表现个人计算机把人类从那些军事化运行、价格昂贵且控制一切的大型机中解救出来的潜力,苹果公司在1984年的超级碗现场播出了至今仍被认为是不可逾越的高度的“一分钟”超级碗广告。这一则广告由雷德利·斯科特(Ridley Scott)执导,内容是:一位穿着T恤和短裤的体格健壮的金发女子,看着像是以前的风暴突击队成员,拿着一把大锤子,直冲进权力的中心;然后她抛出铁锤,砸碎了大屏幕。然后是,“1月24日,苹果计算机公司将推出麦金塔。”
八十年代兴起的网络技术和自由软件运动36,相比科技化而言则更加社会化,时至今日依旧在产生深刻的文化影响。以理查德·马修·斯托曼(Richard Matthew Stallman, RMS)为代表,他也是GNU计划以及自由软件基金会(Free Software Foundation)的创立者、全球著名黑客。到1984年,链接到“网络”上的服务器数量已经超过1000台;而阿帕网已经对公众关闭入口,只有研究人员才可以访问。技术人员和黑客们对于通过网上“冲浪”获取信息和知识的需求日渐增加。这时,又是《全球概览》的创始人斯图尔特·布兰特,通过将这一杂志搬往线上,打造了WELL(Whole Earth’s Lectronic Link,全球电子链接)在线社区。严格意义上,WELL也许是第一个具有普遍吸引力的真正的在线社交网络。WELL的两个创始人,布兰德和马修·麦克卢尔设计出了“YOYOW”:“你为自己的话负责(You own your own words)”。从一开始,布兰德就希望WELL这一“全球”网络是自我管理的:他希望该系统成为一个社会技术的自稳态调节器。
也是在1984年,CBS晚间新闻上空军公布了其革命性的“视觉耦合机载系统模拟器(VCASS)”。自此,一个独立的、虚拟的、与现实物理空间截然不同的计算机生成的空间——先是被称为“赛博空间”、后被广泛称呼为“虚拟空间”,开始了其生机勃勃的全面成长与发展。计算机仿真技术正是兴起于这样一个时代技术大背景下。
随着赛博空间泛在普及,一款早期游戏《栖息地》(Habitat)的创造者—奇普·莫宁斯塔(Chip Morningstar)和伦道夫·法默(Randolph Farmer)—提出了赛博空间殖民化的想法,并在《栖息地》游戏中提出了“阿凡达A(Avatar)”一词。在这款游戏中,由玩家控制的游戏里的微小卡通人物,可以使用存储在玩家银行账号里的代币(Token,游戏中简称为“T”,是《栖息地》国度的通用货币)购买并出售物品。
实际上,阿凡达的想法源自莫宁斯塔和法默对于控制论的失望:“没人知道如何制作一台接近一个真实人类之复杂程度的机器,更不用说一个社会了37。”因此他们决定自己甚至不该尝试。“当时,我们采取阿凡达的方法,甚至都不算是对制造自动机的尝试,而是利用这种计算媒介增强现实中人们的沟通信道。38”方法就是使用小型卡通人物代表虚拟世界里的玩家。莫宁斯塔一直热爱阅读,他曾经读到过印度教(Hindu)中“阿凡达(avatāra)”相关的内容,知道该单词代表着降落或者出现在地球上的神明。在他的记忆里,当神话中链接天堂与世界的绳索突然断掉时,阿凡达就会被拉回去。对莫宁斯塔来说,神明是计算机前的真实玩家,阿凡达代表着游戏中的用户,联通两者的神秘绳索是连接到计算机调制解调器上的电话线。《栖息地》中的阿凡达与人类和机器保持松散而不是紧密的耦合,他们认为这才是赛博空间的意义所在:“赛博空间的根本特征在于其对虚拟环境的共享性,而不是那种把用户送入虚拟环境之中的显示技术。”39
归根结底,赛博空间环境依然是人工建造的环境。建筑师们开始对虚拟世界这一新世界的构建产生了兴趣。德克萨斯大学奥斯汀分校的建筑学教授——迈克尔·本尼迪克特(Michael Benedikt)40,主动联系了吉布森,邀请他共同围绕赛博空间的可能性召开一场大型的学术会议。在本尼迪克特的邮件中,他特别声明强调,这次会议“不是要推动界面技术”。相反,本尼迪克特写到:“它是关于赛博空间作为一个独立领域之本质的会议。”41
本尼迪克特花了近一年的时间来组织这次会议,最终于1990年5月4日至5日,由德克萨斯大学的建筑学院和计算机科学系联合主办了这次会议。会议仅仅通过电子邮件进行宣传——这是一个史无前例的壮举,也开创了学术会议邮件宣传的传统。令人吃惊的是,会议收到了艺术家、技术专家、计算机科学家、企业家、建筑师和社会学家等的60余篇论文摘要。本尼迪克特的第一次会议代表了赛博空间象征含义的转变:在德克萨斯的奥斯汀,赛博空间的含义超越了虚拟现实。
元宇宙与平行智能:虚拟空间的功能分区与有效组织
1990年11月,钱学森在写给时任“863计划”智能计算机专家组组长汪成为的信中,首次提出了对虚拟现实(Virtual-Reality)一词的译名建议:“人为景境”或“灵境”,并强调“我特别喜欢‘灵境’,中国味特浓”。后在写给全国科技名词审定委员会办公室的信中,进一步对Virtual Reality进行了定名遵嘱,并以短文《用“灵境”是实事求是的》做了阐述。
钱学森与汪成为等关于“Virtual Reality”定名的探讨
90年代初,王飞跃在NASA/RPI空间探索智能机器人系统中心工作时,向NASA正式提出了将模型作为数据产生器和可视化工具的“影子系统”思想42。1988年至1996年,在NASA的空间探索智能机器人系统中心(CIRSSE)和本地行星资源利用空间工程研究中心(SERC)做系统集成验证主管和首席研究员时,王飞跃主要负责CIRSSE空间机器人平台的任务流程43和ISRU火星制氧厂及其相应仿真验证系统44相关工作。针对星外无人采矿和无人工厂的建模与管控问题,因为资源有限,面临无法进行外太空实验又要试验、无真可仿又要模拟计算的问题,提出构建地面Shadow System的方案,主要强调嵌入式仿真和分层递阶智能控制,并采用实时嵌入系统的Thread进程和Interrupt中断机制来开展虚拟仿真实验,用虚拟计算实验的手段来应对无法物理实验的问题。
2003年,王飞跃应邀为《天遇——混沌与稳定性的起源》写书评《人间的天遇:从渴求稳定到遭遇混沌》45时,额外得到伽莫夫的名著《从一到无穷大:科学中的事实和臆测》,并撰写《何时从无穷大到一?》书评,得到一位同事建议查看平行宇宙相关工作。进而意识到,这与他自己正在从事的复杂系统计算方法的研究有内在且深刻的联系,从而迫使自己重新审视人工社会、计算机仿真和自适应控制方法,初步形成了以人工系统建模、以计算实验分析、以平行执行控制并管理复杂系统的三步曲想法46,并于2004年相继发表了《复杂系统与智能科学的研究方向和发展策略》47、《平行系统方法与复杂系统的管理与控制》、《计算实验方法与复杂系统行为分析和决策评估》、《人工社会、计算实验、平行系统——关于复杂社会经济系统计算研究的讨论》48等一系列相关工作。正式将平行系统理论发展为一个完整的、逻辑紧凑、虚实一体的闭环。
沿着王飞跃近年来提出的“三个IT”理论:“老”IT(Industrial Technology)是开发物理世界的主打工具,解决了人类发展的资源不对称问题;“旧”IT(Information Technology)是开发心理世界的主打工具,打破了信息的不对称;而人工世界必须依靠“新”IT智能技术(Intelligent Technology),解决人类智力不对称问题49。他认为,农业和工业已经开发了前两者,今天我们面临着开发人工世界的伟大任务,即解放智力,让数据资源、知识体系和社会智慧成为建设新IT时代的原料和动力,让人类进入一个崭新的“智业”社会。
作者认为,元宇宙为解放人类智力提供了新的途径。其本质是虚拟空间的功能分区,是为应对人民群众日益增长的心理需求而必然出现的一种空间形态。物理世界的房屋建筑让我们在真实世界中有了安身之所后,逐渐衍生出办公、娱乐、体育、休闲等功能的专业划分空间。随着新一代人工智能技术(Intelligent Technology)的发展以及人民生活物质水平的提高,人们对更加丰富的精神文化产生了更大的渴求。虚拟空间的开发,有望进一步满足随着社会发展进步而产生的这一普遍需求。但问题是:我们是否已经掌握了开发Cyberspace这一虚拟空间的工具?谁来开发?如何开发?如何保障安全开发?
智能与想象:机器靠什么想象?
2015年3月23日,在新智元的前身静沙龙上,王飞跃分享其对《X 5.0:平行时代的平行智能体系》50的一些思考、想法与见解。他认为,要理解人工智能、首先要知道“什么是智能”。对于“智能”,在牛津词典中英文智能“Intelligence”有两个意思,除了智能之外,还有情报的意思,就是“收集具有军事或政治价值的信息”。对该词,量子力学原理的创始人马克思·波恩(Max Born)认为,“积累和应用知识的过程,作为全人类在长时期中的一种努力,必须遵循按指数增长的统计规律,而且不可能加以阻止。”51 今天的科技现状正验证了波恩的断言:知识的指数积累已经引发了今天的“智力爆炸(Intelligence Explosion)”;甚至近年来有许多知名科技家、科学家已经担心:机器智能超过人类的“奇点”52就要到来了。爱因斯坦则更加“疯狂”,他认为:“智能的真正标识,不是知识,而是想象!(The true sign of intelligence is not knowledge but imagination.)53”
人是有想象的。机器靠什么想象?元宇宙是否是机器的想象空间?要解答这一问题。首先要思考,人是怎么解决问题的。人通过做事情、犯错误、总结经验教训,并类比和联想其他的场景和情景来寻找解决问题的答案。脱离开场景和情景谈工程实践问题,是不切实际的。那么元宇宙是否能创造并提供更多场景和情景,并赋予机器类比和联想的能力?
从当下的发展阶段来看,元宇宙是人类想象在计算机空间中的延伸,是对虚拟空间的进一步专业化分区与功能分工,是科技发展到一定阶段后对波普尔的第三世界的深入与开发。在元宇宙中,知识可以独立生长,沿着人的规划和设计但又保持一定的独立性。仅仅元宇宙自己并不能组成一个完整的闭环系统。本质上,元宇宙是平行理论的一个较为复杂实现,是现实世界与虚拟世界的交互融合54。通过计算机模拟、数字孪生、虚拟现实等技术活动,促进了物理世界实体、设施、资产的数字化;而通过制造、生产、建设等人类活动,推动了数字产品的进一步实际化。现实世界与虚拟世界实现了双向的交互,现实世界可以映射到虚拟世界,虚拟世界的改变同样会带来现实世界的变化。
在虚实平行的未来社会中,元宇宙的基石是区块链55,基本运营模式是分布式自治组织(Distributed Autonomous Organizations,DAO)56,构建元宇宙价值体系的关键技术是NFT57,平行智能成为构建灵活、聚焦、收敛的元宇宙体系的一种可行途径58。在现实世界和虚拟世界的交互过程中,NFT联通了现实世界资产与虚拟世界数字资产,实现了虚实两个世界中价值的统一;DAO协调全网力量、组织角色动态迭代并基于智能合约进行链上、链下治理与激励生态;平行智能打造数字化四胞胎构建有原则、有组织、有因果逻辑并考虑反事实约束的元宇宙,同步实现对物理世界的描述、预测及引导,实现虚实一体的大闭环。
人类的优势、计算机的局限与AI的潜力
人类在创造性和适应性上具有机器不可比拟的优势。从进化的角度来讲,人类是非比寻常的模式识别者,包括发觉尚未形成的模式。尽管,这一赋予我们广泛模式识别能力的认知机制,也限制了我们从许多可选方案中深度地聚焦某单一事务的能力。59
机器与人类之间存在许多差异是一个显而易见的事实。人类风雅、感性、有直觉能力且具有创造性,而机器往往被认为是机械化的、没有感情的(情感计算技术正在改善这一境况)、重复乏味的。我们因自己是人类且具有认知和意识而自豪,同时因机器没有生命和灵魂而轻视他们,倚重它们、又不那么重视它们。关于机器人与人类关系的探讨,已有很多电影、小说、文章60、书籍61,本文不再对此做延伸讨论。
尽管有这些差异,但随着人工智能技术的发展,人与机器之间界限正变得逐渐模糊。特别是,随着机器开始被编程为具有自主学习、更新知识和预测规划的能力后,关于机器智能是否能够在某天超越人类能力的思考又开始出现了。
用梅拉尼·米歇尔62的话说,自始至终,创造具有人类智能的机器,都是一场重大的智力冒险。70多年前维纳曾经探讨过“关于自动化带来的一些道德与技术后果”63,对此,他探讨了博弈、会学习的机器、人与奴隶和时间的尺度等问题,并发出了 “当机器会学习,它们将以其程序设计员也自愧不如的速度发展出无法预料的策略。”的担心。70年过去了,“自动化威胁论”摇身一变成为“人工智能威胁论”或者“元宇宙威胁论”,再次卷土重来。这一次,又将促进人类做出哪些思考?
不可否认的是,元宇宙将有可能进一步把中国的人口红利转变为人脑红利。科学家和大专家并不能解决所有的问题,网络、移动终端、基于位置的服务、权限管理等进一步将人与其周围的人、环境、服务和机构以前所未有的方式连接构成了一个人机物融合的Social-Physical-Cyber Systems (社会物理信息系统)。被公认为是万维网发明者的蒂姆·伯纳斯-李曾在其与马克·菲谢蒂于1999年合作完成的Weaving the Web: The original design and ultimate destiny of the World Wide Web64一书中提到:“现实生活充满且必然充满各式各样的社会约束——社会便是由此而来。借助计算机,我们能够在网络上创造抽象的机器:由人类进行创造性工作而机器完成管理任务的过程……。”以人肉搜索和众包为例的动态网民群体组织,在互联网工具的支撑下,正在发挥愈加显著的作用。如牛津大学的克里苏托夫·林托特与凯文·沙文斯基开发的Galaxy Zoo,通过让志愿者在上面浏览图片并对看到的星系分类,发现了一种之前从未发现的天体——哈尼星体。近年来,越来越多的例子表明,人类智能+AI计算的组合将释放出更大的智能潜力。
先进的人工智能技术,正被想尽办法被用于增强人类解决问题的能力,特别是当人类处在必须处理大量复杂数据或必须在巨大压力下尽快做出关键决定的情况下。自20世纪80年代,帮助人们分析数据、诊断问题和做出决策的AI系统就出现了,它们往往需要一个能够在某个特定领域有效并正确地支持解决问题的知识库。机器学习技术的进步正在缩短AI工具获取知识所需要的时间,并以个性化和友好的方式提供给人类。人工智能与人类智能的融合,已成为一个生机盎然的领域。
尽管有对AI的担心,但我们应该客观认识到,梅尔文·克兰兹伯格的第一定律就提到:技术既无好坏,亦非中立。元宇宙亦是如此。对此,我们要能把握元宇宙带来的风险,有组织、有计划地预测并引导科技向善。始终记得,决定人类会被带向何方的,从来不是技术,归根结底还是人类。
声明:感谢中国科学院自动化研究所复杂系统管理与控制国家重点实验室王雨桐、田永林和戴星原助理研究员以及张翔宇、宋平老师对于文章逻辑和准确性的校对。