内容摘要:Sora展示了文本生成视频的“世界模拟器”的全新可能性,标志着媒介生产自动化与媒体形态一体化的临界点,开启了人类传播史上又一“谷登堡时刻”。我们需要超越技术、产品、应用和资本等层面,从人类传播变革的角度,为理解Sora提供一个更加开阔而深入的视角。现代印刷术开启的“谷登堡时刻1.0”通过工业化信息生产和传播方式实现了信息传播持续线性增长的潜能,跨越长达数百年的大众传播时代,塑造并定义了现代社会。而AI技术开启的“谷登堡时刻2.0”通过数据和算法实现了信息传播的指数化增长,代表了人类传播的又一次根本性变革,开启了智能传播新时代。这一轮变革颠覆并重构了人在信息传播中固有的主体地位,AI生成内容将占据绝对主导,全新的人机融合的合成社会即将到来。如何驾驭技术变革带来的前所未有的高度不确定性和模糊性,成为最大挑战。我们亟须进一步把握当前这场智能传播浪潮的规律与本质,以全新的问题域去审视和反思技术、传播与社会的互动。
引言:Sora冲击波:人类传播的又一次根本性变革
Sora的突现令世人瞩目,收获诸多赞誉。一时间所有人都想知道,该模型到底是如何运作的,它是根据什么数据进行训练的,为什么现在突然发布它,它的真正用途是什么,以及它未来的发展对行业、全球劳动力、整个社会和环境的影响如何,等等。Sora展现了文本、图片和视频等各类媒体之间无缝的自动化生产与跨越的全新可能性,与一年前的ChatGPT一样,掀起全球舆论的又一场冲击波。
但是迄今为止,对Sora的认识主要停留在新闻效应层面,即从技术、产品、应用和资本等层面所作的解析和主观研判。也就是说,对以ChatGPT和Sora等轰动性应用为代表的AIGC浪潮,各界的认识主要还停留在感性认识层面,部分上升到知性层面,还缺乏系统性的理性认识。人类传播变革为我们理解Sora提供了一个更加开阔的视角。在诸多命名和论断中,“谷登堡时刻2.0”可能是最恰当也是最贴切的命名。
人类正处于一个“加速、扩增和民主化”的时代。从印刷术的发明到科学革命、工业革命和核能革命,再到个人计算机和互联网,托马斯·L.弗里德曼(Thomas L.Friedman)将当前的生成式AI时刻称作人类的“新普罗米修斯时刻”。他认为,相较于以往的变革,当前的变革并非由单个的发明如印刷机或蒸汽机所推动,而是由一系列相互关联和增强的技术进步组成的超级循环所驱动。这个技术超级循环包括了从感知世界、将物理信息数字化、处理数据、机器学习、分享信息到采取行动的全过程,人工智能在这一循环中起到了重要作用。同时,我们不该忽视传播在这个技术超级循环过程中所扮演的核心角色,它是连接各个技术环节的关键纽带。从感知世界到采取行动的过程中,信息的生产和分发是至关重要的。人工智能不仅进一步加速了这个过程,还推动着社会信息传播范式的转变。
在这个意义上,我们可以说Sora冲击波的本质是人类传播继谷登堡现代印刷术之后的又一次根本性变革。显然,ChatGPT和Sora仅仅是这一轮技术浪潮的开端而已,更多突破性的技术、产品与应用还将层出不穷。但是,这一切都离不开“谷登堡时刻”的基本逻辑和框架。那就是,15世纪中叶现代印刷术的诞生,使图书出版从手工作坊走向工业化生产。而今,人类信息生产和传播超越人的环节进入一个数据和技术驱动、信息量可以实现指数级持续增长的全新时代。今天的人类社会,显然还没有为迎接这一新时代做好基本的准备。也因此, ChatGPT和Sora会带来如此巨大的全球震动。
一、观察Sora的三个视角及“三个时刻”
对于现代印刷术的影响,启蒙运动者格奥尔格·克里斯托弗·利希滕贝格(Georg Christoph Lichtenberg)说:“比起弹丸中的铅,排字盒中的铅更多地改变了世界。”虽然围绕Sora的评价众说纷纭,但是,结合年鉴学派费尔南·布罗代尔(Fernand Braudel)的时段理论,基本上可以分成三个视角:技术和产品层面的短时段视角,产业格局和行业变革的中时段视角,以及社会传播变革与人类文明进程的长时段视角。三个视角交织综合在一起,造成人们对Sora认知和评价的多样性。
我们围绕三个视角,概括Sora引发的变革,可以发现几个著名的“时刻”。一个是“iPhone时刻”。2023年3月23日GTC大会上英伟达CEO黄仁勋将ChatGPT的出现比喻为“iPhone时刻”,其特指一个革命性的转变时刻——乔布斯在2007年发布的第一代iPhone,标志着手机行业迎来了重大变局。从技术、产品和应用视角,以开启移动时代的“iPhone时刻”来比喻,很生动直观。另一个是 “卫星时刻”,也被称为“Sputnik时刻”。苏联在1957年发射人类首颗人造卫星Sputnik 1,苏联这一划时代成就当即在西方世界引发了一场“卫星地震”,尤其是在美国人当中唤起了一种强烈而复杂的感受。因此,以“Sputnik时刻”来比喻国家创新和科技发展面临的挑战,形象贴切。
克劳斯-吕迪格·马伊(Klaus-R diger Mai)将谷登堡称为“500年前塑造今日世界的人”。“或许可以说,谷登堡的印刷机是从中世纪晚期进入近代的社会范式彻底转变的标志,因为它通过改变传播而深刻地影响了人们的生活,从而改变了社会。”更重要的转折是,“个体——一个此前无人了解的思想史单位——从此踏上了世界的舞台,之前还依赖于上帝的主体迅速成为行为者和决策者。在传播领域,个体成为作者,个人获得的著作权保障了其作为作者的身份。人一跃成为创造者,而且也自知这一身份。”因此,如果要更宏观、深入、系统地洞察Sora冲击波的变革与影响,我们认为将其称为“谷登堡时刻”,更契合本质,也更富有学理。传播是人类和社会存在的基本方式。一部人类传播史,就是一部人类文明史。回顾人类信息传播变革的历程,我们会发现,无论是互联网还是ChatGPT,抑或是Sora,都是传播变革宏大进程中的一朵浪花。它们并非突如其来的创新,而是历史演进逻辑中的一个关键节点。从传播历史的维度审视Sora的意义,可以发现更深远的进程和逻辑。
如果说15世纪中叶谷登堡推动印刷术普及引发的变革可以称为谷登堡时刻1.0,那么,今天ChatGPT和Sora引发的革命可以称为谷登堡时刻2.0。谷登堡时刻1.0开启大众传播时代,确立了人的主体性。而谷登堡时刻2.0正式开启智能传播时代,将颠覆并重构人的固有主体地位。AI生成内容将占据绝对主导,人机融合的全新的合成社会(Synthetic Society)将到来。生成式AI以及深度伪造、类人机器人、增强现实和虚拟现实等技术建构的合成社会,将从人类生存方式上模糊真实和虚拟的界限。
这几个“时刻”可以大致对应于布罗代尔的短时段、中时段和长时段的划分。当然,它们之间的界限并不是泾渭分明的,而是有着相当程度的重合。不同的视角为我们理解Sora呈现了不同的逻辑,具有不同的深度和广度。 从人类传播历史进程看,这一轮以ChatGPT和Sora等生成式AI为代表的智能传播的新突破,很可能开启第二次谷登堡时刻。正如基辛格等人所言,“生成式AI提出了自启蒙运动以来从未经历过的哲学和实践挑战。一项新技术(生成式 AI)正试图改变人类认知过程,这是自印刷术发明以来从未经历过的震动……随着它的能力变得更广泛,它们将重新定义人类知识,加速我们现实构造的变化,并重组政治和社会”。尽管生成式 AI技术的研究仍处于起步阶段,但随着技术的迭代和各种AI 应用和产品的发展,这项颠覆性技术或成为撬动第四次工业革命的杠杆,引发包括传播机制变革、生产方式变革、科研范式变革、教育形式变革和生活方式变革等在内的人类社会更深层次的变革,从而彻底改变人类的生活、学习和工作方式,甚至人类的思维。其最大的变革就是实现了以数据和AI技术驱动的信息传播的指数级增长。
相较于智能传播,20世纪80—90年代的网络传播和21世纪头10年的社交传播,处于两次谷登堡时刻的过渡阶段。互联网革命的短短30年间,人类信息传播从大众传播、网络传播、社交传播转变为智能传播。全局性的革命似乎才真正启航,而过去30年更像是一场“超级热身赛”。当然,目前这一变革浪潮的序幕才刚刚拉开,其未来演进的图景和产生的影响,依然充满更多的未知和风险。
二、谷登堡时刻的共同特性:高度的不确定性和模糊性
迄今为止,人们对Sora影响的预测可谓悲喜交加。OpenAI声称,Sora将成为实现通用人工智能(AGI)的重要里程碑,是朝着AGI迈出的关键一步。特别是随着Sora技术的发展和普及,AI在创造性任务中扮演的角色将持续拓展。目前透露出的状况正预示着各行各业都将经历一次创新和变革的浪潮。Sora不仅仅是一个视频生成模型,作为一个能够模拟世界的“数据驱动的物理引擎”,它能够从大量真实世界的视频中理解物理定律和现象。
人们对Sora的主要担忧是其社会和道德影响。Sora的出现可能会进一步模糊真实与虚构之间的界限,涉及大量的深度伪造和虚假信息,从而加剧 “后真相”状况,我们无意中建立了一个“宣传引擎”(propaganda engines)的世界,并越来越接近难以区分真假的时代。作为一个先进的AI视频生成模型,Sora能够提供更直观的3D建模和动画工具,促进教育和培训,加快电影和游戏制作流程,推动虚拟现实和扩展现实内容的创新。但它也可能导致影视、游戏、广告和短视频等相关行业的运行模式出现变革,而大量失业则将构成重大社会风险;Sora改善和简化视频叙事的同时,也可能加剧互联网虚假信息传播,助长政治传播和社会偏见等风险;它还可能被用来影响选举,危及公共卫生措施,甚至可能因潜在的虚假证据而给司法系统带来负担。史蒂文·利维(Steven Levy)称Sora可能成为“虚假信息的大灾难”)(misinformation train wreck)。加州大学伯克利分校的哈尼·法里德(Hany Farid)认为,Sora技术如果与AI 驱动的语音克隆(voice cloning)相结合,可能为深度伪造开辟出一个全新前沿。因此,如何确保Sora这样的先进技术不会成为虚假信息的传播工具成为一项巨大挑战;如何防范其被用于制造虚假信息、恶意误导公众将成为一个亟待解决的社会议题;如何界定机器生成视频的版权归属、防止滥用侵权行为成为法律法规和伦理规范需要面对的重要问题;监管层和技术开发者共同面临着来自隐私安全问题的严峻考验。
从短期来看,Sora可以被视为一种工具,在技术维度仍然有很多问题需要解决,但有评论家提醒人们不该忽视Sora的双重性。AI是资本逻辑在当代的重要体现。对于OpenAI来说,Sora的重点不止于视频,还应考虑其战略维度。通过消费者产品、企业销售以及开发者社区建设,OpenAI在当前的人工智能领域占据了领先地位。具体而言,通过消费者产品和企业解决方案的实践,OpenAI不断提升其技术水平,为生成式模型设立了新的标准。同时,通过社区建设,其AI应用更为广泛和深入。在对AGI的定义和目标上,OpenAI也不断探索着这一领域的边界,试图定义和构建未来AGI的可能形态。此外,ChatGPT和Sora等生成式 AI对人类全量知识进行整合的能力,对以知识传授为主的教育理念带来了巨大挑战。当我们探索Sora能力的含义时,还必须考虑生活在一个眼见不再可信、真实与人造之间的界限变得越来越模糊的世界给人带来的心理影响,其可能引发关于信任、信仰以及数字增强世界中人类经验本质的重要问题。
这种巨大的不确定性和模糊性,同样发生在印刷革命之后。事实上,直到今天,围绕印刷术的社会影响及其变革意义,依然存在极大的分歧。这一方面涉及究竟如何认识传播在社会建构和变革中的角色与作用,另一方面涉及关于技术对传播的影响与作用机制的认识。迄今为止,人们对信息传播在人类社会发展中的重要性,都缺乏基本的认识,其经常从属于政治、经济和技术等因素。而事实上,传播更可能是政治、经济和社会,甚至也是技术发展演进的关键因素。马克思认为:“火药、指南针、印刷术——这是预告资产阶级社会到来的三大发明。火药把骑士阶级炸得粉碎,指南针打开了世界市场并建立了殖民地,而印刷术则变成了新教的工具,总的来说变成科学复兴的手段,变成对精神发展创造必要前提的最强大的杠杆。” 马歇尔·麦克卢汉(Marshall McLuhan)更加突出了印刷术对资本主义经济发展的关键作用。印刷术引起工业革命——“事实上,活字印刷是一切装配线的祖先”。
美国史学家、传播学家,媒介环境学派代表人物伊丽莎白·爱森斯坦(Elisabeth Eisenstein)认为,作为文艺复兴、宗教改革、科学革命三大思想运动的“变革动因”,印刷术是一个完全独立的技术构件,对当时及其后的政治、经济、社会等方面都有重要影响。她对各学科广泛认可并引用的马克斯·韦伯的《新教伦理与资本主义精神》中对资本主义起源和西方理性化内在动因的解析,以及更被广泛引用的托马斯·库恩(Thomas Kuhn)的《科学革命的结构》对科学范式转变的内在原因的分析,都提出了强有力的质疑,并都将印刷术掀起的大众传播作为上述变革真正的根本动因。马克斯·韦伯主张新教伦理观念和生活方式为资本主义精神的形成提供了重要的精神动力。他认为,新教徒对勤勉工作的重视、对世俗事务的合理安排,以及对经济成功作为神赐福分的解读,为早期资本主义的发展提供了道德上的正当性和精神上的推动力。然而,他忽略了“这一切都和宗教思想的传播有关,没有印刷机,宗教改革这样一场重大的革命是不可能完成的”。印刷术的出现是新教革命重要的先决条件。它使知识的存储和传播更为便捷和广泛,从而加快了知识积累的速度;通过大量复制而保持一致的文本,为封建传统知识权威的崩溃和现代知识体系的建立铺平了道路,为资本主义和理性化的兴起提供了更为具体和实质性的基础。爱森斯坦的研究提供了一个清晰的逻辑来解析资本主义和西方理性化的复杂起源,即传播革命是加强韦伯所说的新教伦理与资本主义精神之间关系的一个决定性因素。爱森斯坦还提供了一个新的视角,用以理解科学知识如何在早期现代欧洲得以迅速传播和接受。托马斯·库恩聚焦于科学领域内部的变化,讨论了科学理论和实践中的范式转变,即科学发展并非通过逐步积累知识,而是通过一系列的革命性转变,这些转变涉及基础理论和观念的根本性更替。科学共同体在一个稳定的范式下工作,直到积累起来的反常现象和问题导致现有范式不足以解决,随后发生一场科学革命,产生新的范式。而爱森斯坦则认为,印刷术的发明和普及使得科学知识可以更广泛、更迅速地传播,使更多的人能够接触到这些知识,并参与到科学辩论和研究中。这种信息传播的加速可能促使了科学理论的更迅速接受和集体思维的变化,从而有利于科学范式的形成和更替。
同样,将传播视为变革的最根本驱动,来理解和研判Sora的发展趋势和社会变革,可能才是最经得起中长时段检验的视角。技术不仅仅是一个工具或者平台,其传播和采纳过程实际上是一个动态的、交互的过程。作为技术体系的传播逻辑不仅是参与控制的内在机制的形式,更多是参与社会构建的阐释机制的增量。换言之,智能技术的传播方式不仅影响信息的控制和管理(包括算法、数据处理和用户界面设计等),也影响信息的社会构建作用的发挥。它深度参与社会认知的形成和价值观的塑造,并在社会构建中逐渐形成新的社会实践、交流方式和思维模式。
三、Sora文本生成视频的原理与机制
如何理解Sora冲击波,首先需要从其底层的核心技术革新和潜在发展来理解其意义。同时,这也将为理解此类技术对传播学所产生的冲击的内在驱动力提供基础。了解这些技术的本质和发展轨迹对于预见它们将如何影响传播至关重要。 |
掌上论坛|小黑屋|传媒教育网 ( 蜀ICP备16019560号-1 )
Copyright 2013 小马版权所有 All Rights Reserved.
Powered by Discuz! X3.2
© 2016-2022 Comsenz Inc.