图2可见,在正式研究开始的第一天,各组被推送的“政治”类主题信息的占比相近,均在10%左右,之后各组开始出现差异。首先,针对“政治”类信息点击量大的组别(第一组和第二组),平台推荐算法在较短时间内快速提高了两个组别政治类信息的推送比例,但随着时间的推进,上述两组该类别信息占比并没有继续上升或持续稳定在高位,而是出现波动和下降趋势。其次,观察从第三组~第十二组的变动趋势可发现,尽管上述各组无政治类别信息点击偏好,但可以看到各组的推送信息流中始终会包括一定比例的政治类主题信息;此外,上述各组在研究实施的前半段变动趋势差异较大,而研究实施的后半段变动趋势差异变小。最后,外部信息内容变化同样对个体信息获得有重要的影响。例如,从研究实施的第18天开始,各组推送政治类信息的比例均开始下降,并均在第20天下降到较低的位置。笔者查询第三方平台热度指数发现,在研究实施的第18天某流量明星的负面舆情开始发酵并在第20天达到峰值。由此可见算法设计原理中的内容热度对各组别信息获取存在直接的影响,算法在特定时间会按“流行度”“热度”等指标推送信息流,而相对忽略个体点击偏好和预测的类别。
(三)基于熵指数的各组别推送信息类别分析 本节进一步借用熵指数对各组别推送信息流中信息类别的多样性程度进行分析。笔者以日为单位计算了每个推送信息流的熵指数,值越高代表该推送信息流中的信息类别多样化程度越高。得到每个推送信息流的熵指数后,使用两层次固定效应模型考察各组别不同日期推送信息主题多样化程度的差异。 表3模型一报告了控制变量、组别变量以及日期变量对推送信息流熵指数的影响。从组别差异来看,第一组、第二组以及第三组被推送信息的类别多样化程度相对较低,而第十一组、第七组、第八组以及第十二组被推送信息的类别多样化程度则相对较高。结合上文各组别点击偏好设置可以看出,偏好多个信息标签的组别(如第二组)被推送信息的多样化程度不一定高,反而偏好特定某类标签的第十一组和第十二组。由于偏好的标签均属于小概率信息类别(偏好信息类别在基准时期占比分别为0.8%和0.6%),点击偏好提升了这些信息类别的概率,因此熵指数更高。从日期变量来看,随着研究的推进,各组推送信息流主题的多样化程度有增加的趋势。
表3模型二主效应和模型二交互效应(组别与推送日期的交互项)则显示,模型二组别变量(主效应)与模型一组别变量的差异情况高度一致(但系数差异更大),如系数均是第二组最低、第十一组最高,表明模型一中不同组别被推送信息多样化程度的差异主要出现在算法与各组别互动的初期,随着时间的推移,时间作为调节变量明显减少了各组别间信息多样化程度的差异。
综上,基于信息主题维度的分析结果显示,平台算法会因个体点击偏好而增加特定信息的推送量,但各组均未出现因迎合个体点击偏好而过度推送特定类别信息的情况,平台始终会给各组推送一定比例的非该组点击偏好的主题信息,且随着算法与个体点击行为交互的深入,各组别间主题信息多样化程度的差异也在降低。这表明从信息推送主题来看,算法可能导致的过滤气泡的威胁被夸大了,算法增加了个体偶遇多样化主题信息的可能性。
五、基于信息语义异质性的实证分析结果 (一)个体账号及所属组别在语义向量空间中的差异 本节从更深层次的信息语义维度分析推送信息异质性。笔者使用Doc2vec模型对平台推送的信息(标题和摘要)进行训练,以个体账号加日期为单位,得到各个体账号每天的200维实数向量表示。在图3中,笔者计算了各个体账号200维实数向量均值,进而使用PCA降维方法将各个体账号的向量表示投影到有实质意义的二维空间中(图3使用个体账号所属的组别来标记每个数据点)。简单来说,通过PCA降维后的主成分一能够发现个体账号向量表示间的最大化方差,即可以捕捉不同个体账号间推送信息在语义上的主要差异(Rheault & Cochrane,2018)。本研究在此部分主要关注同一个组别内部不同账号以及不同组别账号在主成分一上的差异情况。
从同一个组别内部不同账号在X轴的分布可见,各个账号的分布并非是混乱无序的。同一个组别的个体账号在X轴上的分布更为接近,也即同一个组别内账号的推送信息在语义上相对更为接近。从组别间的差异来看,不同组别的推送信息在语义上存在较为明显的差异和分化,其中第一组和第二组位于X轴靠右的位置,第七组和第九组位于X轴靠左的位置。
为更直观地呈现不同组别间推送信息内容的差异,本文进一步对各个体账号的值按照组别加总求均值,结果如图4所示。由图4可见,在主成分一捕捉的推送信息语义差异上,第二组位于最右侧,第十一组位于最左侧,两组之间语义差异最大。另外,以X轴的0值为分界,除去随机测试组(第一组)以及极端测试组(第十组、第十一组和第十二组)外,其余各组在X轴上明显分为两大类,其中第二组、第四组、第六组以及第八组在X轴上为正,而第三组、第五组、第七组、第九组为负。综合图3和图4的结果可以看出,各个虚拟账号在语义向量空间中的分布并非是混乱无序或聚在一团的,同一组别内部各个账号推送信息的内容更为接近,各个组别间内容则出现分化。
(二)不同组别在各子语义向量空间中的差异
需要说明的是,上一小节观察到各组别间推送信息语义的差异和分化可能是由于各账号间推送信息的主题差异导致的,为此,本部分将深入到各个信息主题子空间,进一步观察各个组别间的语义差异。具体而言,首先挑选“政治”“社会”“娱乐”“世界”“历史”“金融”等六个主题的推送信息(标题加摘要),使用Doc2vec模型分别对这六个子数据进行训练,得到各个体账号每天在上述六个子数据中的200维实数向量表示,进而参照上节步骤分别对上述向量表示进行PCA降维并按照组别进行加总求平均,图5展现了不同组别在上述六个子信息空间的分布情况。 由图5可见,当我们将研究范围聚焦至具体的信息子空间时,各组别在不同子空间中同样存在着明显的语义差异。有趣的是,各组别在不同子空间中的语义差异存在惊人的一致。除随机测试组以及极端测试组外,其余各组与上一节一致,在不同子空间的X轴上同样出现明显的分化。其中第二组在各个子空间中均位于X轴的最右侧,第七组和第九组在各个子空间中则位于X轴的最左侧,各组别间在不同子空间中出现了规律且一致的分化。以“社会”主题为例,第三组和第五组均有社会新闻的点击偏好,可以看到上述两个组别在社会子空间X轴上的分布非常接近;同时,其他各组并非是聚成一团或与第三组和第五组距离过远,而是呈现与上一节总体向量空间以及其他子信息空间类似的分布规律。如第一组、第二组、第七组和第九组均无社会新闻点击偏好,但他们被推送的社会新闻在语义上出现了明显的分化。
各子语义向量空间分布情况再次表明,在信息语义维度,算法强化了过滤气泡效应,不同组别的推送信息在语义向量空间中会出现较为明显的差异和分化。尽管从信息主题维度来看,平台会持续推送部分用户完全不会点击的信息类别,这提升了个体偶遇多样化信息的可能性,进而降低了各组别间推送信息在主题维度的异质性。但从信息语义维度来看,算法根据用户点击偏好来捕捉、估计深层次的语义并进行推送,用户被推送的信息在语义维度出现明显的分化,且这种分化在各子空间高度一致。即在更深层的信息语义维度,信息推送出现窄化和固化,不同用户组别像是被算法框定在语义光谱中一个个相对固定的位置,只能看到特定内容的“政治”“社会”“娱乐”“世界”“历史”“金融”信息。
(三)基于两层次固定效应模型的进一步分析 在上文以个体账号加日期为单位训练文档向量的基础上,本节以具体每条推送信息为单位训练文档向量,在不同单位训练文档向量以检验上文结果的稳健性的同时,进一步考察各组别推送信息语义维度分化的动态变化。笔者首先以每条推送信息为单位,使用Doc2vec模型对平台推送的所有信息进行训练,得到每条推送信息的200维实数向量表示,进而通过PCA降维方法计算每条推送信息向量表示的主成分一的值,进而使用两层次固定效应模型考察各组别不同日期推送信息内容在主成分一上的差异与变化。 表4模型一报告了控制变量、组别变量与日期变量对推送信息语义的影响。从组别的差异看,以第八组为参照项,可以看到,第二组和第四组在主成分一上明显高于第八组,第六组则低于第八组,但系数较小。与此对应,第三组、第五组、第七组和第九组在上文中与上述各组内容层面分化明显且位于X轴左侧的组别在模型结果中均明显低于第八组在主成分一上的值。以具体每条推送信息为单位训练文档向量的结果再次验证了上文结果,各组别间出现了明显的语义维度的分化且模式相对稳定。
模型二则进一步加入了组别与推送日期的交互项,从模型二主效应来看,在研究初期,各组别间在主成分一上有差异,但并未呈现上文中各组间稳定的分化模式。而模型二交互效应结果则显示,随着算法与个体点击行为互动的深入,各组间开始呈现上文中(包括模型一)所展示的分化模式。具体而言,相较于第八组,第二组、第四组和第六组在主成分一上的值在增加,第五组、第七组和第九组在主成分一上的值则在降低(第三组在研究初期就明显低于第八组),逐渐形成了在语义空间中更为稳定的分化(第二组、第四组、第六组和第八组在主成分一上取值较高,第三组、第五组、第七组和第九组在主成分一上取值较低)。该结果的重要性在于,它表明,从信息语义维度来看,算法并非从一开始就将不同用户组框定在一个固定的位置,而是随着算法与个体点击行为互动的不断深入,不同组别在语义光谱中不断移动,逐步出现上文中明显且稳定的分化。
六、稳健性检验 为检验信息语义异质性部分的稳健性,笔者提取前述文档向量模型训练的高维向量的前50个主要维度,基于余弦相似度来测量各组间以及各组内部的语义相似度。图6结果显示,各组间出现了与前文结果一致的明显的语义分化。同时笔者计算了各组组内平均语义相似度并赋值给节点权重。由图6可见,各组组内平均语义相似度均较高,组内语义差异明显小于组间差异。 本文图3、图4和图5结果是以个体账号加日期为单位训练文档向量进行计算得出的,为验证上述模型结果的稳健性,本研究同时直接以每条推送信息为单位训练文档向量,结果与上文无明显差异。
七、结论与讨论 我们已经生活在一个充斥着算法的社会中,算法深度介入给社会科学研究带来诸多挑战。针对算法黑箱化、复杂性和难追踪等难题,本研究尝试在研究设计和数据生产环节有所创新(Wagner et al.,2021),通过设置若干不同点击偏好的个体账号与平台进行较长时间的互动,收集不同账号在该平台的推送信息大数据,进而对算法推送信息在主题以及语义两个维度的异质性进行实证分析。 不同组别在信息主题与信息语义两个维度的差异和分化表明,数字时代算法作为社会权力已变得更为隐晦(拉什,2009),算法规制呈现高度复杂化、精细化和隐蔽化等特征。社会层面平台盈利、外部监管、社会舆论等不同甚至是有冲突的需求,以及技术层面算法捕捉深层语义能力的进步,使平台推送的信息呈现主题多样化而深层语义窄化的情况。一方面,平台使用基于内容热度的推荐逻辑,在主题维度上增加了个体偶遇更多样化信息主题的机会,这有利于减少有关算法强化过滤气泡、导致个体信息获取窄化以及个体间信息隔离的争议,也符合外部监管和社会舆论的要求方向。但另一方面,从实证结果可以看到,在更深层、更为隐蔽的信息语义维度,高热度的信息被平台进行了隐蔽的精细化处理,平台通过捕捉和估计用户偏好的语义,试图满足和强化不同个体的语义偏好(尽管这一语义偏好是平台预测的)。随着个体与平台的互动,不同个体逐渐被固定在语义光谱中的特定位置,只被推送特定语义维度的信息,这导致了更为隐蔽的个体信息获取窄化以及个体间的信息隔离。这一发现意味着:首先,在研究中需要重视信息的不同维度,已有文献中看似矛盾的实证分析结果可以通过在研究中细化和统一分析维度来解决。其次,随着平台与深度学习等新技术的不断融合,平台的运行逻辑由传统意义上的分类逻辑(粗粒度、静态的信息类别)向距离逻辑(细粒度、实时变动性的信息距离)转变,平台对信息流的控制在这一过程中变得更加复杂化、精细化和隐蔽化。比较不同用户在传统的信息主题与更深层次的信息语义等两个维度上信息获取的差异,有助于揭示数字时代算法规制如何通过更精细、隐蔽的信息流控制来行使社会权力,进而有助于理解算法带来的潜在社会后果。
上述算法权力运作方式的特征导致我们既难以通过公开的算法原理和代码,也难以通过单个用户的访谈或平台推荐数据来识别和分析算法权力。面对上述难题,本研究尝试借鉴社会科学算法审计(Brown et al.,2021)和计算机科学计算实验(Wang,2007)的研究思路,将虚拟账号作为研究工具,通过设置不同点击偏好的虚拟账号与算法,与真实数据世界进行长时间自动互动,进而尝试挖掘算法与社会更长时间跨度的互动过程及其潜在影响。上述研究方法为社会科学提供了探索黑箱化技术世界的可能接口与路径,有助于我们真正进入算法的政治化空间去评估算法在决策中的具体角色以及可能的社会影响,从而为数字时代实证研究算法影响提供了数据收集以及研究方法上的新选择。
作为一项社会科学实证分析算法的探索性研究,本文还存在需要继续深入之处。第一,未来基于更多参数、更细致的信息主题类别乃至差异化的数字平台来进一步进行研究有助于我们更为深入地了解算法与个体的互动过程。特别是因为平台可获取的数据有限,在本研究设计用户点击偏好时仅依据信息主题这一大的类别而未能将更细致的点击偏好考虑在内,未来研究设计中若能考虑更细致的点击偏好将有助于推进对本文研究问题的理解。第二,本文研究设计中未包括“点赞”(like)、“不感兴趣”(dislike)等改变平台内容的行为,将来在时机成熟时可在研究设计中加入上述内容,以观察平台推送信息的变化情况。第三,在推送信息内容分析部分,本文使用文档向量模型分析各组别在总体信息内容空间以及各子信息内容空间的相对位置,尚未回答各空间中的主成分一的差异究竟是何种层次的语义差异,这种复杂的文档向量模型的可解释性有待进一步研究。
来源 :《社会学研究》2023年第2期 作者 : 刘河庆、梁玉成 链接:https://mp.weixin.qq.com/s/_Jx9dTUdlGh4e2279yKexQ
编辑:徐思凡 |
掌上论坛|小黑屋|传媒教育网 ( 蜀ICP备16019560号-1 )
Copyright 2013 小马版权所有 All Rights Reserved.
Powered by Discuz! X3.2
© 2016-2022 Comsenz Inc.