摘 要:目前,人工智能的发展呈现出两条日益清晰的路线。其一是离身沟通型AI(“延展的心灵”)。人类对媒介技术的应用经历了从模拟媒介、数字媒介、社交媒体到大语言模型人工智能,这是一个日益虚拟化/去物质化/离身化的过程。这一过程正引导我们脱离碳基身体,最终建构出一个与现实世界共存和交互的虚拟世界,即元宇宙(人、物和环境的数字孪生)。其二是具身沟通型AI(“心灵的延展”)。人工智能延展出硅基身体以与现实环境实时互动和不断学习。这最初体现为各种可穿戴式设备、智能音箱、自动驾驶、宠物机器人,直到基于文生动作(text-to-acts)的人形机器人。上述两跳发展路线呈双螺旋、相互促进的关系。由此,人类将同时面临“离身沟通型AI”和“具身沟通型AI”两类新的沟通主体,人机传播研究中的“具身AI转向”将继续深化。 关键词:人机传播;人工智能;具身AI;人形机器人 “人不仅仅生活在自然物质宇宙中,还生活在符号宇宙中。语言、神话、艺术以及宗教都是这个符号宇宙的组成部分……由此,人无法面对面地直接认识现实了。人的符号活动越是进步,自然物质现实的比例相对来说似乎就越是减少。”(恩斯特·卡西尔,1985:33) “意志不是一种身体外部的力量。意志就是身体。通过构成身体的机制以及表达,意志已经赋予了它自己具体的存在。”(杜威,2010:261) 人工智能被称为“下一个新媒体”(the next new media)。和此前的汽船、电报、电视、个人电脑、互联网以及社交媒体一样,它对人和社会具有重构作用。目前,人工智能的发展呈现出两条日益清晰的路线:(1)“延展的心灵”(离身沟通型AI)和“心灵的延展”(具身沟通型AI)。本文先阐述前一个趋势的缘起、存在的不足,然后根据人工智能业界的最新发展和已有的人机传播研究成果指出人机传播研究正在深化的具身AI转向。
一、延展的心灵:从符号虚拟到世界模型 人类社会的存在和延续必然建立在符号虚拟和媒介技术之上。两者以“记录”和“传输”外化和延展了人类的心灵,从而形成了人类社会和人类文明。 (一)符号虚拟:人类通向文明之路 “人是符号动物”(animal symbolicum)。符号包括语言、艺术形象、神话象征和宗教仪式等,从而构成一个符号系统(symbolic system)。符号系统使人类在现实这一物理层之上多出了一个信息层,因此而获得了一种“元宇宙”体验,也因此能生活在“一个新的、更广阔的现实”中。例如,故事、戏剧、神话和仪式能将“此时此地”的阅听人远距离传输(teleport)到“彼时彼地”。“人类和黑猩猩之间真正不同的地方就在于人类有那些虚构的故事,它像胶水一样把千千万万的个人、家庭和群体结合在一起。这种胶水,让我们成了万物的主宰。”(尤瓦尔·赫拉利,2014:43)人类将自身深深置于这一符号系统中,以至于人只有通过这种“人造媒介”的中介才能认清或认识任何事物,“如此一来我们就可指明人的确切特征,并能理解一条向人敞开的新道路:通往文明之路”(恩斯特·卡西尔,1985:33)。 人从何处来?人在对自我本质问题的询问中产生了人神沟通以及“上帝问题”(the God's Problem)。该问题的核心是“上帝在空间上既无处不在,又无处可寻,在时间上既永恒存在,又从不存在,那么上帝与受到感官局限的凡夫俗子人类之间如何实现沟通?”彼得斯将此问题转换为:信源/信宿在面临一个时空遥远、无形无相的对象时,如何让对方缺席如在场?”(彼得斯,2017:103)。他认为,所有的沟通(包括生者和死者间的)都是与人神沟通类似的“远距离沟通”,都涉及一方对另一方单方面的想象。正是在信徒、祭奠者、法官、文学研究者们对经文、神迹、逝去的亲朋、法律文本和文学作品的单方面想象中,诠释学诞生了——所有的沟通/传播都涉及虚拟和诠释。 即使是在面对面时,人类的沟通也会因为所谓“他者心灵”问题(the problem of other minds)而需要想象对方。人与人的大脑并没有神经或其他物理连接,因此对“他者心灵”是否存在,我们只能靠猜想。“他者的心灵”问题被推演至极端就产生了“唯我论”(solipsism)——交流不可能。因此,人类所有的交流都是中介化的、想象的和虚拟的,都是一种“没有保证的冒险”。“他者心灵”问题也使得人际交流从“一个技术问题”变成“一个伦理和政治问题”(彼得斯,2017)——在任何交流技术都无济于事和于事无补的情形下,我们应该如何对待他人?
(二)媒介技术:从制造幻像、孪生宇宙到生成世界 在前述必然的符号虚拟(以及人类文明)基础上,各种媒介技术层出不穷地出现,这导致人类存在的虚拟化和离身化持续增强,先后经历了制造幻像、孪生世界到生成世界的加速过程。 从部落的“篝火故事”到洞窟壁画,再到文字,人类一直就通过媒介获得“离身体验”(disembodied experience)。在此期间,人的身体痕迹(cues)被越来越多地化约和过滤。在口语文化向书写文化过渡趋势明显的古希腊,苏格拉底敏锐地感到了此种“缺席而又在场”的趋势并对之表示警惕。他认为,文字能够将人的说话声“抛”出去——而正是这一点最让人生疑。但通过媒介技术实现“离身在场”毕竟已成人类社会发展的大势,苏格拉底对它的抵触显然独木难支。在中国,人们自古就有“见字如面”的美好愿望,即希望远距离投送的书信文字——相当于“虚拟化身”(avatar)——让收信人看到后有“如亲见本人”(親)的效果。为实现这一目的,大量文人创造性地使用文字,使其具有了“创造世界”(text as worlds)的能力(邓建国,2022a)。 19世纪中期至20世纪初,各种新型记录和传播技术层出不穷,给人带来了更加新颖的离身体验。摄影、留声机、电影大量增加了人类的幻像,电报则快速压缩时空,首次将物质(身体)运输(transportation)和信息(心灵)传播(communication)两者分离开来(詹姆斯·凯瑞,2005:5)。 20世纪五六十年代,在早期的“人工智能”和人机沟通中,由于哲学范式、科学家自身、科研意图和技术限制等多重原因,心理学视角的人工智能观盛行,导致在人工智能研发中“身体”一直受到压抑甚至消失。例如,人工智能先驱阿兰·图灵提出的“模仿游戏”(图灵测试)认为,测试“机器是否能像人一样思考”的科学方式必须要求在测试过程中排除人和机器的“身体”线索,以让人的智能和机器的“智能”在不受其基质干扰的情形下相互比拼。控制论的先驱诺伯特·维纳的最初专业为生物化学,但因为行动笨拙无法在实验室里操作各种容器和仪器,最终提出了如何绕开身体而“通过信息传播来实现对人、动物和机器的身体进行控制”的控制论。汉斯·莫拉维克(Moravec,1999)认为,生命所依凭的基质(无论碳基或硅基)并不重要,重要的是其“信息模式”(information pattern)。他还预测会出现“新兴无实体的信息智能”。 以上人工智能观催生了“智能即计算机”(mind as computert)的隐喻。它将智能比喻为计算机软件,可以上传和下载,它长期主导着认知心理学、人工智能和机器人学等领域的研究。雷·库兹韦尔(Ray Kurzveil)甚至预测,人类在2045年将能上传大脑意识至计算机,脱离血肉之躯而实现数字化永生(库兹韦尔,2011)。2017年,Facebook已经可以根据用户发布的信息创造出用户本人(包括逝者)的化身(avatar)跟活人对话。通过AI“复活逝者”在中国也已经实现(Sixth Tone,2023)。2021年,Meta的CEO扎克伯格提出要建设“元宇宙”(Metaverse),即通过数字技术“孪生”出现实世界中的人、物体和环境,最终形成一个基于现实世界的、不断生成增长并与现实世界交互的“平行空间”(邓建国,2022a)。 2022—2024年,大语言模型对话平台ChatGPT(文生文字)、DALL·E、Midjourney、Stable Diffusion等(文生图)以及Sora和Genie等(文生视频)应用横空出世——普通网民从此拥有了新的利器:通过纯文字建构元宇宙的“世界模型”(world model)[1]或“世界模拟器”(world simulator)(邓建国,2024)。这意味着,从社交媒体、元宇宙到人工智能,虽然技术有所变化,但其模式却并无根本变革:所有这些应用从专有到大众的发展轨迹都是为了使数字内容(文本、音频、图片、2D视频、元宇宙3D体验)的生产从PGC走向UGC和AIGC。最终,元宇宙成为生态,UGC、AIGC和U-AIGC(人机共创内容)成为元宇宙内容,新型硬件设备(例如Vision Pro)成为元宇宙最新入口。百川入海,殊途同归,一个虚拟的“奇妙的新世界”(a brave new world)即将诞生。 但是,人类社会真能如此无限制地虚拟下去吗?目前看,答案是否定的,因为媒介技术和人工智能的“虚拟化和离身化”既导致了人类“交流的无奈”,也导致人工智能在貌似日益强大的同时面临着一个日益明显的致命局限——其智能是基于强大算力对人类已有数据的“生成”(实际上是重组),而无法像人类一样通过自己的身体与世界互动,不断学习并原创数据。例如,视频游戏《模拟人生》为玩家构建出一个虚拟世界,其中各种非玩家角色(NPC)和真人玩家有各种互动。表面上NPC和真人玩家一样在扮演各种角色——睡觉、吃饭、上班,甚至还有自己的意图和目标。然而,玩家很快发现NPC都只是在“走过场”,它们的所谓“有意图行为”不过是在执行程序预先设定好的步骤。它们没有生命,没有智能,没有思想。 谷歌人工智能科学家李飞飞指出:“今天似乎所有AI都被称为‘生成式AI’,这导致人工智能被言过其实。……我们在一开始谈到生成式AI时,只是将其定义为一种由已有的大规模数据驱动的、包括预训练阶段的一种方法”(汤一涛,2024)。这意味着目前的人工智能永远是面向过去而不是面向未来的,因此对用户关于“未来”的提问,ChatGPT不是就数据滞后表示抱歉,就是一本正经地胡说八道。Sora目前也有胡乱可视化的现象。如此下去,当基于历史数据的AIGC的总量超过人类智能生成内容(HIGC)的总量时,就会导致“数据稀释”(即基于HIGC的AIGC稀释HIGC本身)和“模型自噬”(MAD,即新模型使用旧模型产生的数据来进行训练,导致下一代人工智能水平降低)。 二、智能的再发现:身体、空间和非语言符号 要走出以上包括人工智能在内的媒介技术因“虚拟和离身”带来的困境,我们首先需要重新认识“智能”——即认识到,与智能的心理学视角不同,智能同时是具身的、空间的和非语言的。[2] (一)智能需要身体:“具身的心灵” 拉科夫和约翰逊将第一代认知科学视为“关于离身心灵的认知科学”(the cognitive science of the disembodied mind),将第二代认知科学视为“关于具身心灵的认知科学”,并提出了“具身的心灵/智能”概念(Lakoff & Johnson,1999:122)。《说文》曰:“具,供置也”;《广韵》曰:“具,备也,办也”。与经典的认知科学比,“具身智能”观反对笛卡尔的身心二元论,强调身体、心智、情境在智能过程中的交互性和重要性。 梅洛-庞蒂认为笛卡尔的理性主义不能解释为什么对于同样的感官经验,不同人会有不同的主观感受。他认为,人的知觉活动的主体不是内在心灵,而是“活的身体”(lived body)。认知是具身的,“身体存在于我们的头脑之中”(Gunderson & Johnson,1992)。 在梅洛-庞蒂之前,哲学家托马斯·内格尔(Nagel,1974)在一篇《当一只蝙蝠是什么感觉?》的文章中指出,“意识”是作为一个特定有机体才有的“感觉”,例如“作为一只蝙蝠有何感觉”与“作为一只蝙蝠有何身体”密切相关。因此“蝙蝠的意识”可以被定义为“蝙蝠的感官观经验”,即“质感”(qualia)。类似的,我们作为人类在世界上经历的一切都是通过这些质性的感官体验来获得的,因此我们每个人会在看到蓝天时感受到不同的蓝色,在痛苦时感受到不同的痛苦。 在媒介哲学领域,在基特勒的信息唯物主义(information materialism)(Gane,2005)的基础上,海尔斯指出,将心灵与身体、软件和硬件剥离开来是错误的,即使是在人工智能使得仿生性变得极为复杂的今天,意识和信息仍然总是包含于某一物质媒介之中,仍需要现实世界作为其基础(Hayles,2002)。 以上论者关于“具身智能”的观点得到了认知科学发现的支持。例如,有美国认知科学家提出了以下思想实验: “和人一样,猫的大脑发育有关键的几个月,在此期间如果你带着它在室内室外到处逛,让它看到环境中的一切,但就是不让它自己四处走动与环境互动,那么这只猫可以说是仍然是个“瞎子”。虽然它能完美地感知光线、颜色和阴影——这是动物视觉系统最基本的和硬连线的能力——但它对空间深度的感知和对物体的识别能力却是极糟糕的。尽管这只猫的眼睛和视神经完好无损、运行正常,但它的高级视觉系统几乎毫无用处。”(Blakeslee & Blakeslee,2008:12-13) 由此可见,身体的物理属性对智能有着巨大的塑造作用。智能必然以在环境中具体的身体结构和身体活动为基础,大脑嵌入身体、身体嵌入环境,构成了一体的智能/认知系统(许先文,2010)。“具身的智能”是人工智能研发经历了几十年的挫折之后获得的一个来之不易的教训。今天的研究人员已经明白没有身体的人工智能要么具有重大缺陷,要么根本没有可能成为可比于人类的智能。 (二)智能需要空间:文化的阐释 我们的“身体嵌入世界之中,就像心脏嵌入身体之中,知觉、身体和世界是一个统一体”(叶浩生,2010)。人的身体占据一定空间并对具体的情境作出响应,这意味着人的智能必然以一个存在于具体环境中的具体身体及其与环境(空间)的互动为基础。 智能与空间的关系可以通过“记忆”这一重要因子关联起来。在知觉中,人的记忆(过去的经验)有重要作用。人工智能在某种意义上就是让机器实现保持和持续记忆(杨庆峰、伍梦秋,2018)。记忆又与空间关系密切,例如古希腊诗人西蒙尼蒂斯发明的“记忆宫殿”记忆术,利用空间来增强记忆。公元16至17世纪,意大利传教士利玛窦在中国传教期间著书传播记忆宫殿法,试图用这种记忆术改善人脑记忆(冯惠玲,2020)。 智能、身体、记忆、空间之间的互构关系还可以从“地方”(place)来解释。我们的身体与空间发生关系会产生“具有社会文化意义的空间”——地方——也因此产生了“恋地情结”(topophilia)(Yi-Fu,1974:1)。段义孚认为,地方感的形成与地方的特性与个人的亲身经验与体验密不可分,是一种经过文化与社会特征改造的特殊的人地关系。因此,其意义不能脱离人而存在(曾一果、陈爽,2023)。 地方意味着情境(context),情境形塑了智能水平。格尔兹举“小孩的眨眼(wink)”的例子来说明作为一种民族志方法的“深描”。他认为,人的行为充满了象征性,如眨眼这样的象征性行为就可能蕴涵着某种只有当地人才理解的意义,而人类学家的目的就是深入到情境中去了解并描述这种意义(格尔兹,1999:7)。由此可见,智能、身体、记忆、空间和情境密不可分。 (三)智能需要表达:非语言符号 “存在”是身体在一定时间内占据一定的空间。“存在即与他人的共在”(海德格尔,2019:119)。因为身体共在,人类同时具有了丰富的符号和非符号沟通能力,造成智人(homo sapient)在很大意义上也就是沟通人(homo communicus)。 尽管相对于语言符号,我们容易忽视非语言符号,但后者亦非常重要。非语言交际领域的先驱Ray Birdwhistell指出,人类的大部分交际都是通过手势、姿势、位置和距离来实现的。他认为,人际沟通中,动作(acts)占65%,文字占(words)35% (Littlejohn & Foss,2009:690)。美国Palo Alto学派也指出:(1)所有的人际沟通都同时包含“内容讯息”(语言符号)和“关系讯息”(非语言符号),后者对前者具有分类定性功能,指导接收者“如何”(根据何种关系)解读前者,因此属于元沟通(metacommunication);(2)人际沟通同时涉“数字”(digital)和“模拟”(analogic)两种模态,前者用语言符号清晰地表达内容讯息,后者用非语言符号模糊地表达感觉或语气(Watzlawick et al.,1968)。非语言符号讯息特别有利于情感沟通。在人类不同文化中,人都具有六种基本情感(恐惧、愤怒、哀伤、恶心、幸福、惊讶),它们也被以相似的面部表情进行表达(Ekman,1993)。 人类基于身体共在的沟通具有深刻的生物学基础。在许多物种中,个体都能通过行为模仿来建立情感联系和表达道德关怀,如鸟类、鲸类、啮齿类、犬类、大象、灵长类动物等都能通过相互行为模仿等表达同情。人类的身体模仿在婴儿早期就开始了,此后随着年龄的增加,我们将自己身体的内在感受映射到他人身上,并通过模仿他人的身体动作来加强我们与他们之间的情感纽带(在这个过程中,镜像神经元被认为起着关键作用)(彼得斯,2020:295)。 综合以上关于智能的三方面特征(身体、空间和表达)看,目前的离身人工智能有着巨大的局限。由于缺乏物理身体,它如一只无法触摸环境的小猫一样不具备持续学习的能力,因而不可能成为个性化的、直接为人类的物质生活服务的强人工智能。要解决这一问题,就需要大力推动具身AI,才有可能让“人与技术的双重逻辑、实体空间与虚拟世界的双重行动史无前例地交织互嵌在一起”(孙玮,2018)。 三、心灵的延展: 从身体线索到人形机器人 进入21世纪的第二个十年,计算机芯片技术大幅进步,高性能芯片被广泛应用于各种信息与传播技术(ICTs)中,为人工智能的具身性发展奠定了基础。如彼得斯的《奇云:媒介即存有》(彼得斯,2020)所展示的,宏大的宣称必须建基于弥漫的细节。人工智能发展越来越清晰的具身化趋势,体现在诸多技术细节。 (一)人工智能的多模态和多社会线索趋势 凭借具体的技术细节,在视觉上可以做到极为立体和逼真。在虚拟引擎5(UE 5)的支持下,用户通过一部iPhone手机就能创作出逼真的虚拟人物,该平台存有海量的人类面部特征,包括肤色、肤质、年龄、种族、发色、眼睛颜色、发型和衣着等,用户可以将它们随机组合,几分钟内就创造出多种高度逼真的角色并赋予其动作——被称为“元人”(metahuman)。用户可以将元人用作自己的化身或导入到游戏或者影视剧虚拟作品中去(Unrealengine,2024)。 在声音上,已经出现了三种AI声音技术,包括(1)“声音转换”(voice conversion),比如将奥巴马的声音特征(音色、语调等)转换成特朗普的声音特征,但保留原始语音的内容信息,应用场景包括模仿名人的声音、为角色配音、语音变声等;(2)“声音克隆”(voice cloning)关注通过训练出特定人物(如赵忠祥)的声音模型,实现用他的语言来朗读出新的文本信息,应用场景如同声传译、智能助手、语音合成、有声书等;(3)文本转语音(general text-to-speech),即使用预先训练好的声音模型将普通文本转换为语音,应用场景包括广告、宣传片、有声书和视频配音(谢诗涵,2021)。 在人体姿态方面,人体的姿态(手势、步态)等可以通过可穿戴传感器、加速度计、陀螺仪和压力传感器来捕捉。多种相关技术正在蓬勃发展。 2024年1月,苹果公司推出的Vision Pro混合现实头盔是首次无缝整合用户的以上具身线索和空间计算(space computing)的软硬件一体设备。该设备依靠众多的传感器扫描和处理数据,逼真地呈现用户的身体、所在的物理空间和虚拟空间三者之间的关系。2024年2月,迪士尼公司发布了“全球首款多人、全方向、模块化、可扩展的虚拟现实跑步机地板”——HoloTile。它能让用户在原地踏步的同时,在虚拟世界中实现无障碍全方位移动,并且支持多人同时体验而不会相互干扰,由此解决了用户在虚拟现实空间中移动引起的眩晕不适问题(知乎,2024)。以上新兴技术都极大地增加了人机传播中的多模态信息和社会线索,推动了人工智能的具身化发展。由此,人机互动也开始进入“后符号传播”(post-symbolic communication)时代(邓建国,2022a)。 (二)具身人工智能:人形机器人的出现 在以上技术新发展的基础上,刚进入21世纪的第二个十年,身体之外必须有“延展的心灵”,心灵之外必须有“延展的身体”似乎已经成为软硬件公司产品研发的共识——通用人工智能(AGI)的下一步发展必然是具身人工智能(E-AI)(Paolo et al.,2024)。 2022年8月,著名的人形机器人研发机构波士顿动力公司(Boston Dynamics)宣布成立人工智能研究院,先期投资4亿美元用于研发认知人工智能、运动人工智能、有机硬件设计以及与机器人相关的伦理和政策。“波士顿动力公司过去数年来一直在发力试图研发出一款能为人类可靠地做一些有用事情的机器人,这样才可能将自己的技术商业化”(Evan,2022)。 2024年1月,斯坦福大学AI实验室计算机科学博士生Zipeng Fu,发布了家政机器人Mobile ALOHA(阿罗哈),可以完成做饭、乘坐电梯、清理桌面、洗碗、摆放物品、倒垃圾、扫地、浇花、陪伴宠物等一系列复杂任务,还可以自己寻找插座为自己充电,让人大开眼界(Mobile-aloha,2024)。 特斯拉在其网站上宣称“特斯拉机器人部要创建一个通用的、双足的、自主的人形机器人,能够执行危险、重复或无聊的任务”(Tesla,2024a)。2024年2月24日,马斯克发布了特斯拉人形机器人Optimus(擎天柱)的最新视频。视频中,Optimus的步态更加稳健,行走体态也更接近人类(Tesla,2024b)。 我们从波斯顿机器人公司2023年发布的一个视频可以看出研发中的具身AI的强大的学习和行动能力: 一名工人在高高的脚手架上工作,突然他自言自语地说道:“哎,我又忘记拿工具包了”。此时在地面地的人型机器人听到了这句话,它在自己四周“看看”,发现了地上的工具包,又看到地上离脚手架不远处有一个大木箱子和一块木板,于是它拾起木板,在大木箱子和脚手架的脚步之间搭了一个“木桥”,然后自己拿着工具包走上木桥将工具包递给了工人。任务完成后,它一个后空翻从脚手架上跳落地面,转身向工人作了一个“耶!”的动作,意思是“怎么样,我还不错吧?!”(Boston Dynamics,2023) 这个视频展示了具身AI是如何在真实环境中通过自主感知、推理和行动服务于人的真实需求的。此时,具身AI视身体为其支持,而不是其累赘。 老子曰:“人之有患,在我有身。若我无身,更有何患?”钱穆先生认为,老子之“无我”与佛教之“涅槃”、耶稣之“天堂”一样,“大旨在逃避此人生之有限,而融入于无限”(张方玉,2022)。但是,钱穆认为,唯孔孟儒家主张在此有限人生中觅出路,求安适。我认为,人工智能之发展也曾如老释耶一样,视身体为累赘而欲超越之、抛弃之,但其发展至今,却已仿佛如孔孟儒家,以“具身在此世”和“具身入此世”为追求了。 四、人机传播研究的具身AI转向 综上所述,人工智能正同时朝着“更加虚拟”和“更加具身”两个方向深化发展,人类沟通也因此面临着两个新的沟通主体:沟通型虚拟智能体(communicative AI)和沟通型实体机器人(communicative robots)。此时,此前作为渠道和平台的(channel/conduit/platform)的媒介技术已经转变为能接受、“理解”、生产和发布信息的虚拟或实体的沟通主体,这导致人们日常生活中人机传播(HMC,human-machine communication)[3]越来越常见。作为一个新兴领域,目前人机传播研究使用的各个概念还较为模糊,需要研究者通过更多的经验研究去检验和完善(牟怡,2023)。鉴于用户与虚拟智能体的沟通研究已经有很多,这里我简要梳理一下用户与具身机器人(目前还多为智能音箱、动物形机器人和“智能服务机器人”等低端智能体)的人机传播研究,目的在于以之为棱镜映照出人形机器人出现后人机传播的发展方向。 (一)人机传播研究的四个理论 目前人机传播中的主要理论包括四个:(1)“作为社会行动者的计算机/机器人”理论(computers-as-social-actors,CASA)(Nass & Moon,2000)。该理论认为,如果计算机或社交机器人具有足够的社会线索能让人类用户将其归为人类,那么人类用户就会忽视它不是人的事实而将人际沟通规则套用在计算机或社交机器人上(邓建国,2022b)。人机互动在实践中会促生新的人际互动样式,生成“人—机器—人”三者相互关联和依存的关系等(甘雨梅、郭良文,2022)。(2)期望违反理论(expectation violation theory,EVT)(Burgoon & Hale,1988)指的是,用户对机器人事先会有某种期望,如果实际接触证实或证伪了这一期望,就会激发用户对机器人的正面或负面评价。(3)不确定性降低理论(uncertainty reduction theory,URT)。这种理论指的是,用户在与机器人互动前会猜测后者的行为意图和行为模式以降低互动中的不确定性(De Graaf & Malle,2019)。有研究表明,用户更期待在互动时,机器人的意图和行为是可以预测的(Dragan et al.,2015),以及用户在跟非人形机器人互动时,会比与跟人形机器人或者其他人互动时感受到更多的不确定性(Edwards et al.,2019)。这意味着在人际互动中,机器人的形状和行为都会影响用户对它的期待和形成何种类型的人机关系。(4)恐怖谷假设(the uncanny valley hypothesis)(Mori et al.,2012)。一般而言,机器人的人形外观与其给予用户(或观察者)的正面情感反应(以及因此与之构成人机关系的意愿)成线性正相关;但是在机器人很像但不完全像人类时,用户对它的正面情感会下降,从而产生怪异感(“恐怖谷效应”)。该假设得到了心理学和神经学研究的确证,但仍需要考察文化因素带来的影响——因为“恐怖谷效应”最初主要来自对日本“卡哇伊”(萌感)机器人的考察(Bartneck et al.,2007),而“萌感”和“人形”会相互干扰同时影响人机关系。 (二)人机传播中的三种关系 用户基于以上理论如何看待机器人会决定人机关系的类型和人机关系是否持久。目前相关研究文献区分了三种人机关系:(1)社交型人机关系。有研究发现,用户跟机器人会形成情感纽带,并且在某些情况下能受益于这种关系(De Graaf et al.,2015);机器人的社交回应能力对形成人机陪伴关系至关重要(Birnbaum et al.,2016)。(2)功能型关系。例如,“家庭教师”“家庭护士”和“家庭仆人”等。教师机器人的形象和行为设计会影响学生的学习潜力以及人机关系质量,同时教师机器人的教学效果也不令人满意(Belpaeme et al.,2018)。在关于机器人工作助理的研究中,用户倾向于让机器人完成危险或单调的工作,而不愿意承认它们也具有一定程度的社交性和创造性(De Graaf & Ben Allouch,2016)。(3)娱乐型关系。例如,各种智能音箱和性爱机器人等。有研究关注这些机器人的积极用处,例如满足用户的性幻想和性治疗(Eichenberg et al.,2019),有的则认为它们容易物化女性等(Richardson,2016);但关于用户与性爱机器人之间的关系如何发展以及带来何种后果,相关研究还不足。 (三)人机传播中的三个伦理问题 人机关系伦理涉及三个方面:(1)机器人的个性化设置和个人数据保护。例如,机器人的智能取决于它获得的用户个人数据量,在获取用户信息时应该获得用户的知情同意(Kayal et al.,2018;Neerincx et al.,2019)。在中国,除部分专业用户外,大部分用户对于使用智能音箱的个人数据泄露风险感知并不清晰(王秀丽等,2022)。研究表明,7—10岁的孩子对机器人掌握他们的隐私数据会抱有不快感,虽然这并不会影响他们继续和机器人互动(Leite & Lehman,2016)。(2)人机关系中的欺骗和期待。例如,随着机器人变得越来越具有自主性,用户可能会越来越多地视其为人(Nass & Moon,2000),但这容易导致人对机器人有害的情感依赖甚至单向的、操纵的和PUA式的关系(Burger et al.,2016)。智能音箱可能会使孩子更依赖机器,或者认为语音助手比父母更加权威,这将引发对传统前喻后喻社会的解构(谭雪芳,2020)。对机器的依赖是否一定会增强人类能力,这也是值得思考的问题(彭兰,2020)。(3)人机关系中的机器人行为责任归因。例如,自动驾驶汽车伤害了他人时,该由谁来承担责任(郑志峰,2018)。 以上人机传播研究主要关注的都只是智能音箱、动物形机器人、智能服务机器人等低端智能体,其“理论”“关系”和“伦理”也都以人际传播理论为参照。 五、结语:虚实相生的人工智能时代呼唤跨学科的人机传播研究 本文分析了人类社会的虚拟和离身特征,这种特性给人工智能带来的困境、智能的应有之义、具身机器人的必然出现及其对人机传播研究的意义。亲身传播时代,我们渴望摆脱身体实现心连心;中介化传播时代,我们渴望寻回身体实现手拉手。彼得斯指出,技术史上最古老的叙事之一是刘易斯·芒福德(Lewis Mumford)所说的“以太化”(etherealization),但无数事实已经证明,“奴隶制在数字生活中继续存在,尸体还在流血,矿物仍然被人们从地球上挖出。海洋很重要,地球并没有消失,物质流通仍在推动所有媒体的工作。后勤想象力还活着!”(Peters in Hockenberry et al.,2021:viii)。今天众多的媒介物质性研究以及目前人工智能的发展趋势证明了彼得斯的远见——人类社会必然是虚实相交的(彭兰,2019),人工智能也将从“延展的心灵”发展出“心灵的延展”,而且两者将呈螺旋式相互促进。 凡涉及身体与环境的研究必然是跨学科研究。“20世纪社会,沟通/传播实践在快速变化……正促使传播学研究越来越跨学科化,需要通过人文、社会和自然科学的多个视角来观察沟通/传播”(Jensen,2008:2)。“传播”这一概念的提出,以及传播学学科的历史本身就是建立在跨学科研究基础之上的。在人机传播“具身AI转向”来临时,我们有必要进一步推进跨学科的传播学研究,尽快形成这样的“先锋社群”(pioneer community)(Hepp,2016)。 注释 [1]model有“模型”(名词)和“建模”(动词)之意,所以world model也可以有“为世界建模”的意思。 [2]关于“智能”有多种英文表述,包括智能(intelligence)、心灵(mind)、意识(consciousness)、认知(cognition)和“自我”(sense of self)等,这些词语都具有家族相似性。本文都使用“智能”。 [3] 相关的表达包括人—计算机交互(human computer interface)、人—机器界面(human machine interface)、人—机器人交互(human robot interaction)等,本文根据Sage Handbook of Human Machine Communication(Guzman et al.,2023:xxviiii)而统一都适用HMC(human machine communication)。Guzman将HMC定义为“一个新兴的传播研究领域,关注人与机器之间的意义创造”(Guzman,2018:1)。
来源:新闻大学(公众号) 链接:https://mp.weixin.qq.com/s/vVTVL_IghAitz2oepSgVtQ 编辑:徐思凡 |
掌上论坛|小黑屋|传媒教育网 ( 蜀ICP备16019560号-1 )
Copyright 2013 小马版权所有 All Rights Reserved.
Powered by Discuz! X3.2
© 2016-2022 Comsenz Inc.