摘要 本项研究报告一个此前未知的网络舆论现象:若无外来力量干涉或外来信息注入,且读者群体和转者群体的偏好维持稳定,则选择螺旋的数学本性使其趋向“同音”。即,经过选择发布、选择接收、选择转发、再接收、再转发,环生若干轮之后,接收和转发这两个群体之一所偏好的某类信息成为几乎唯一被转被读的信息,从而独霸特定信息场和舆论场,尽管另一群体和发布群体的偏好可能相异甚至相反于主导群体。
本项研究分析的三个案例中,都是读者群体偏好的一类信息最终“霸场”,导致读者意愿主导的同音。发布群体和转发群体的偏好与读者群体的偏好相异甚至相反。发布群体偏好的内容甚至可能在螺旋早期占据信息场的大部空间。群体间的偏好相异或相反影响同音所需的螺旋轮数,从而影响同音速度,但未能改变读者群体主导、同音和霸场的趋向和结局。
本项研究所依据的数据是2015年1月-2017年6月间近30个月中今日头条的帖文。在此期间,作者从该平台下载了全部可爬取的帖文标题与用户回应,从中选取了含有关键词“日本”的全部共47,224条标题和对应的5,237,308,573次点读数据及28,129,768次转发数据。经过“人指机大内容分析”,提取了三个情绪效价(sentiment valence)变量作为可能影响发布、点读和转发行为的选择因素。这三个效价变量分别测量标题内容对中国、对日本、或就事件性质而言的正负方向,形成本研究所基于的三个案例。 作者介绍 赵心树,澳门大学传播系讲座教授。 敖颂,澳门大学传播系研究助理教授。 陆宏驰,深圳预测者科技有限公司技术总监兼创始人,澳门大学传播系研究助理。 邢季成,深圳预测者科技有限公司总经理。 刘莉萍,澳门大学传播系研究助理教授。 王子君,澳门大学传播系博士研究生。 廖圣清,复旦大学新闻学院教授,云南大学新闻学院院长。 曾振华,江西师范大学新闻与传播学院教授,社会科学处处长。 於佩雯,香港城市大学商学院管理科学博士候选人。
基金项目 澳门大学(编号 CRG2021-00002-ICI,ICI-RTO-0010-2021,CPG2021-00028-FSS& SRG2018-00143-FSS,赵心树主持),澳门特别行政区高等教育局(编号 HSS-UMAC-2020-02,赵心树主持),与江西师范大学新闻传播学院省“双千计划”(2018-08-10)。
随着连接信息内容和网民行为的数据(简称“信息—行为”或“信行”数据,content-behavior linked data)的出现和相关理论和分析方法的发展,研究者开始测量和分析隐含在信息中的选择因素对传播行为,例如信息发布、信息点读和信息转发的影响(Ding,2016;Ng et al.,2016;Ng & Zhao,2020;Wang et al.,2016;Zhao et al.,2016;赵心树,陆宏驰,敖颂,2019)。
由于每项研究的数据来自一个平台,这些研究必然局限于螺旋的起始轮(赵心树,陆宏驰,敖颂,2019)。虽然起始轮极为重要,但一轮不成螺旋。螺旋之所以重要,恰在于多轮环生的总合和长远影响;而起始之所以成起始,正因其有后续;起始轮之所以成起始轮,正因为还有后续各轮 (赵心树,2018;赵心树,王丹,2019)。传播科学乃至社会科学的所有学科,最终要能测量、分析和解释螺旋多轮乃至所有各轮的选择行为和社会影响。
但是,起始轮后的行为横跨大量平台。由于资源人力、理论方法和计算能力的限制,要搜集和分析横跨大量平台的、连接内容与行为的数据,目前尚有困难。也就是说,直接测量选择螺旋的多轮行为,目前尚有困难。
本项研究的任务,是结合社会科学中的两种方法“测量与模拟”的核心思想,把起始轮直接观察的发布、点读与转发作为基础,假设起始轮读、转的内容分布比例在以后各轮维持稳定,依照这些基于观察的、合理且谨慎的规则,模拟螺旋各轮的内容分布,预测选择螺旋的演化过程,透视螺旋演化的社会影响。
一、选择螺旋与选择因素
人类社会的信息传播包括四种基本行为,即发送、接收、转发和反应。一次发送、接收、反应和转发构成一个传播单位,称为“轮”。转发和反应所发的信息可以被再次接收、反应和转发,并再被重复,再重复…这种重复称为“环生”。反应效应在环生过程中集聚演化,导致长期影响(赵心树,2018)。由此构成人类信息传播的七种基本现象(参见图1)。
作为初步尝试,本项研究选择了选择螺旋理论模型的一个简化型,包括起始轮的发布、点读和转发以及此后各轮的点读和转发。
“选择”是传播行为最基本最普遍的特性。发送、接收、转发都有选择,于是有选择发送、选择接收、选择转发。对人类选择的默认或关注,是许多经典传播理论的核心部分。既有选择,则必有选择因素(selecting factor),例如议程设置和框架理论中的“议程”(agenda),培植(cultivation)理论中的“暴力”(violence),选择曝光理论中的“曝光前同意度”(prior agreement),都是选择因素的著名例子。
本项研究选取三个选择因素:对中国而言的网帖方向,对日本而言的网帖方向,以及被报道事件本身的方向。每种效价分别以负面、中性、正面为可能的方向取值。
二、选择螺旋与信息内卷(message involution)
英语词involution有很长的历史,广泛运用于许多领域。例如,involution在数学中可指对合函数;在天文学中可指天体向心旋转;在医学中可指人体器官的逐步萎缩;在生物学中可指动物器官的退化或复态;在植物学中可指茎叶的内向卷缩。近年流行的用以描述社会行为的中文词“内卷”,起初似为对人类学家Clifford Geertz 1963年的著作agricultural involution 中的involution的汉译(李金铨,2014)。这个“内卷”(involution)原指农业发展中社会重复和加大劳力资本的投入而缺乏新技术新方法的投入,造成单位地产增加而人均产量停滞不前的过程(Geertz,1963)。中文词“内卷”流行后又演化出新意,例如公司雇员攀比加班加点,或其他形式的内耗内斗。
英文involution经常与evolution 及revolution等对照。这些词有共同的拉丁语词根 volvere,可溯源至印欧语词根wel,指“卷曲”“旋转”。而in指“内”。可见,以“内卷”译involution,恰当精准。
Involution,evolution,revolution 以及“内卷”中的“卷”,都包含和指称一些言语、行为、现象、或事件的重复发生或多次出现,于是就与“螺旋”和英语spiral的含义重合。而in-,e-,re-以及修饰词“内”或对应的“外”可视为“选择因素”(赵心树,陆宏驰,敖颂,2019) 。于是,“选择螺旋”描述了一种普遍现象,而“内卷”或involution 是这种普遍现象的一种特例,也就是以“内外”或in-,e-,re-为选择因素的选择螺旋或selective spiral。
鉴于“内卷”和involution 这一对词本身所隐含的上述词义,我们用它们来代表本项研究所关注的一个信息传播的现象。于是有以下定义:
信息内卷(message involution)的定义:信息接收与转发的多次简单重复的螺旋;这“简单”特指既无外来的新信息的注入,又无内生的新信息的创造。
三、研究设计、研究目标与研究问题
本项研究的基本设计(research design),是从庞大复杂的人类传播过程中,切割出一个过程,即两年又三个月间从今日头条起始的信息螺旋,进行观察。在此过程中,既无外来的新信息的注入,又无内生的新信息的创造,只有网帖的接收—转发的简单重复。根据以上关于“信息内卷”的定义,这是一个信息内卷的过程。换言之,本项研究的设计,就是切割出一个信息内卷的过程来观察;而本项研究的主要目标(research objective),就是回答以下四个相互关联的研究问题(research questions):
问题R1:在内卷螺旋的过程中,被选择而被点读、被转发的信息内容的分布,在轮与轮之间有没有变化?
问题R2:若内卷过程中内容分布有变化,如何变化?
问题R3:在内卷螺旋重复了足够多的轮之后,内容分布的变化会不会稳定在某一个状态?
问题R4:如果稳定在某状态,这是怎样的一种状态?
四、直接观察的研究方法
如上述,本项研究包含两大部分。第一部分是对于今日头条在两年又三个月时间里发布的关于日本的网帖的标题及用户反应的直接观察和分析,第二部分是以第一部分观察结果为基础进行的模拟和预测。本章讨论第一部分的研究方法。
(一)数据
我们从格林尼治时间2015年1月4日14点39分起至2017年6月29日5点21分止从今日头条(https://www.toutiao.com/)网站下载数据。下载内容包括每一条帖文的标题、简介、点读、点转、点赞、点踩等等。在获取期间下载的帖文总数达4,249,240。基于此份数据,还有其他研究(Ng & Zhao,2020;赵心树,陆宏驰,敖颂,2019)报告了更多信息。
本项研究将分析对象限定为“标题含关键词‘日本’的帖文”。满足这个条件的网帖总数四万七千多条,点读总数五十二亿多次,转发总数两千八百万多次。本文以下报告的发现都是基于这四万多条帖文和五十多亿次网民回应。
(二)自变量—三个选择因素(选因)
我们定义了三个自变量,即“对中国而言、对日本而言以及就事件性质而言的效价方向”,用“负面、中性、正面”的有序标尺(ordinal scale)测量。在选择螺旋的理论框架下,这是三个选择因素(选因),用户可能根据这些选因决定是否点读或点转;据此,我们将之用作自变量,预测点读与点转。
1.自变量定义及测量标尺
三个选因的理论定义(conceptual definitions)及测量标尺(measurement scale)如下。
选因一,对华效价:即对中国而言的内容方向。这一变量的理论定义是,根据标值员的判断,在多数汉语读者看来,该帖报告的事实、事件或其他内容对中国的国家利益是有害、中性还是有益。测量标尺包括三个选项,即:负面=0,中性=0.5,正面=1。
0-1或0,1标尺称为“百分标尺”。本项研究所有变量尽可能采用百分标尺。关于百分标尺的理论、技术和应用,见 Jiang等(2021),Zhao等(1994),Zhao等(2022),彭雪华等(2020),赵心树等 (2019,2022),赵心树、张小佳(2014)。
选因二,对日效价:即对日本而言的内容方向。这一变量的理论定义是,根据标值员的判断,在多数汉语读者看来,该帖报告的事实、事件或其他内容对日本的国家利益是有害、中性还是有益。测量标尺包括三个选项,即:负面=0,中性=0.5,正面=1。
选因三,事件效价:即就事件性质而言的内容方向。这一变量的理论定义是,根据标值员理解,根据一般新闻学和传播学教科书的定义和案例,该帖报告的事实、事件或其他内容属于负面内容、中性内容还是正面内容。测量标尺包括三个选项,即:负面=0,中性=0.5,正面=1。
2.标值自变量——“人指机”大内容分析
本项研究关注的三个效价变量需要标值(coding,赋值)。由于数据来自四万七千多条网帖,从资源和效率考虑,人工标值全部网帖不可行。由于缺乏成熟、完整、可靠的关于效价变量的关键词单,关键词标值全部网帖也不可行。有鉴于此,本项研究设计和实施了“人指导机器(人指机)大内容分析”的程序,即Analysis of Big Content by People-Instructed Machine(ABC-PIM)。该方法结合人工与机器的标值,以人工标值结果作为机器标值的学习材料,对近五万条网帖进行了内容分析。关于该“人指机”大内容分析的具体步骤,简述如下:
(1)选材:随机抽取学习材料
机器学习所需的学习材料的抽样步骤如下:
①从母本47,224条网帖中,随机抽取5,000条作为机器学习的学习材料(machine-learning material)。
②从5,000学习材料中,随机抽取100条作为标值员培训的培训材料(codertraining material)。
③从剩余的4,900条学习材料中,随机抽取500条作为试点标值的试点材料(coding-testing material)。
(2)人标:标值员(content coder)分析学习材料、标值变量
人工标值学习材料(content coding of machine learning material,简称“人标”)是内容分析的一种,但又不同于此前常见的内容分析。它是人机共同标值大内容(big content)的两步过程中的第一步。人标的结果被用作机器学习的材料,作为“标准答案”,用以训练机器标值母本(简称“机标”)。人标的“失之毫厘”,可能导致机标的“谬以千里”。考虑人标的这个特殊功能,对其正确度和可复度的要求应高于一般内容分析。(注:正确度即validity常被误译为“效度”,可复度即intercoder reliability 常被误译为“信度”;参见赵心树,张小佳 ,2014)。据此,我们设计执行了比一般内容分析更为细致甚至苛刻的人标程序,简述如下:
①首先,本研究选取了五位受过社科方法训练的硕士研究生作为标值员(coders 1-5),以100条培训材料对标值员们进行培训,帮助他们理解变量的理论定义和操作定义,理解和熟悉标值表。讨论后,所有标值员对每条网帖的标值达成一致意见,也就是“议后同意度”(post-conference agreement rate)post ar=1。
②把500条学习材料分成五组(A-E),每组100条。将五个标值员列入两个名单轮换配对并分配网帖(1-2-A,2-3-B,…,5-1-E,以下简称“轮换配对”rotating pairing),形成五对标值员,每人与不同的人配对两次,每对分配一组共100条网帖,每条网帖配给两人。 |
掌上论坛|小黑屋|传媒教育网 ( 蜀ICP备16019560号-1 )
Copyright 2013 小马版权所有 All Rights Reserved.
Powered by Discuz! X3.2
© 2016-2022 Comsenz Inc.