传媒教育网

 找回密码
 实名注册

QQ登录

只需一步,快速开始

搜索
做个试验
楼主: 刘海明
打印 上一主题 下一主题

人工智能与新闻业案例集锦

[复制链接]
721#
 楼主| 发表于 2023-7-29 13:54:32 | 只看该作者
【案例】

“过去三十年来,媒体人一直在应对持续猛烈的颠覆……所幸,Z世代会找到答案的。”

2023年世界新闻媒体大会(World News Media Congress 2023)的一场会议探讨了Web3功能如何与新的人工智能工具相结合,帮助媒体公司找到新客户,甚至创造新的收入机会。



在数字生活方面,年轻人与老一辈人截然不同。

这是Terminal 3创始人兼首席执行官Gary Liu(加里•刘)在2023年世界新闻媒体大会上主持的一场关于Web3工具、人工智能和年轻一代的会议上传达的关键信息。为了给讨论做铺垫,他介绍了“Z世代”(1995年至2010年出生的人)的一些关键特征。

“我们谈论的是这样一代人,他们目前在互联网上的行为与我们以前所知道的任何事情都不同。他们醒着的大部分时间都在数字世界里度过。对他们来说,数字身份比现实身份更重要。他们把钱花在可以增强他们数字身份的环境中,” 刘总说。

他强调了Z世代与老一辈人不同的五个具体点。

他们是内容创造者: 除了消费大量的内容(在发达国家,他们每天花10个小时在线消费内容),许多Z世代成员对内容创作非常感兴趣: “数字创作不仅是他们可行的愿望和职业,现在已经在他们的日常生活中占据了很大一部分,”刘说。

他们是数字资产的拥有者: Z世代经常花钱购买数字资产(65%的人这样做过),所谓的“虚拟”资产对他们来说实际上是非常真实的。刘说,总的来说,全球每年在数字产品上的花费为540亿美元。“这是花在音乐产业上的钱的两倍。”

他们重视匿名和表达: 许多Z世代的成员更喜欢使用虚拟形象作为他们的主要身份,而且大多数人认为数字第一印象比现实世界的印象更重要。一般来说,他们拥有的隐私越多,他们就越有可能表达自己。

他们生活在充满活力的数字社区中: 81%的Z世代依赖在线社区作为他们的主要信息来源。这些社区通常围绕共同的事业和兴趣而形成,聚集在老一辈人可能完全不熟悉的地方:例如,游戏平台Roblox每天发送600亿条信息。(相比之下,WhatsApp平均每天发送1000亿条消息。)

他们是矛盾的人工智能用户: 一方面,65%的Z世代积极使用人工智能助手(如苹果的Siri),大多数人总体上对人工智能持积极态度。然而,44%的人担心人工智能将会如何影响他们未来的工作和职业。

为什么媒体应该创造新兴技术
考虑到Z世代的大部分人至少对区块链、加密货币和NFT(非同质化代币)等Web3功能感到好奇,如果新闻出版商想要吸引更多年轻人,这可能是一个有很大潜力可以深入报道的领域。

然而,许多新闻编辑部在报道虚拟世界时都举步维艰。

“我认为当一些戏剧性的事情发生时,主流媒体就会介入。这是非常被动的报道,”国际公益媒体基金会亚太地区主任Irene Jay Liu说。

“此外,你会发现,那些不是专业领域专家的人,突然开始努力理解这项技术和其基础行业到底是什么,” 她补充说。

她说,Web3的一个特别方面很少受到新闻关注,那就是这项技术的社会影响。虽然像Bored Ape游艇俱乐部这样的事情可能会引起很多关注,但像基于区块链的游戏Axie Infinity 及其对菲律宾成千上万年轻人的影响这样的问题往往在新闻媒体上得到的报道较少。
她呼吁媒体公司以更系统的方式报道创新技术及其对社会的影响,例如为其创建一个专门的栏目。

Decrypt首席执行官兼联合创始人乔希•奎特纳(Josh Quittner)对此表示赞同: “我认为,包括人工智能和加密货币在内的新兴技术正在兴起,谁知道还会出现什么。”

“我认为,如果一家媒体公司想要进入这一领域,我建议他们从这一领域开始。不仅仅是加密货币,还有所有在技术边缘正在发生的令人惊叹的事情,这些事情刚刚成为焦点。”

区块链对新闻业的影响
许多新闻出版商也在关注Web3,想知道它是否能让他们创造新的收入来源。其中一个关键部分是NFT,即非同质代币,它可用于为数字资产创建真实性和所有权。

例如,奎特纳的公司Decrypt,这是一个致力于web3相关新闻的网站,一直在“探索NFT作为一种访问我们内容的方式,”他说。

然而,Irene Jay Liu认为,NFT最适合于人们想要拥有和重视的特定人工制品,比如艺术品。新闻内容是不同的,因为人们不倾向于“收集”或“拥有”新闻,就像他们可能想拥有艺术一样。

不过,一些媒体公司已经在这一领域进行了成功的试验,比如《时代》杂志(Time)就将其封面故事的原始渲染图拍卖为NFT。

但是,即使每日新闻内容不一定适合NFT经济,区块链作为一种基础技术仍然为新闻出版商提供了有趣的可能性。特别是,内容保存是一个很有前途的实验领域,因为添加到区块链中的任何东西都不能被删除或更改。

特别是在新闻业受到攻击,数字新闻出版商被迫删除或更改其档案的国家,拥有区块链系统作为内容的永久存储库是一个有吸引力的想法。

奎特纳说,像Filecoin这样的项目正在努力使向区块链添加内容的过程更容易,并补充说,解密的每一篇文章都被上传到Filecoin基础设施的一部分。

生成式人工智能会减少还是增加不平等?
最后,小组成员谈到了贯穿大会多次分会的主题: 生成式人工智能(GenAI)的兴起及其可能对全球新闻出版商产生的影响。

Irene Jay Liu强调了新兴国家和发达国家之间日益扩大的技术差距所带来的威胁,以及领先的基因人工智能技术正在西方开发的事实,“在某些地区存在偏见,可能没有充分理解它们在世界其他地区表现出来的意想不到的后果。”

此外,新兴市场的记者经常被限制使用免费工具,这意味着GenAI的全部潜力将无法发挥,因为更高级的功能可能是为付费工具保留的。


在讨论彭博社(Bloomberg)和《金融时报》(Financial Times)的不同观点时,就新闻出版商采用生成式人工智能的最佳策略而言,出现了一个非常明显的区别。

尽管《金融时报》在使用GenAI制作新闻内容方面采取了谨慎的态度,但彭博(Bloomberg)在这项技术上投入了巨资,并建立了自己的大型语言模型。

奎特纳表示,将两家公司进行比较实际上是一种“错误的二分法”,而不同的方法在很大程度上是由于彭博终端业务所拥有的大量金融信息。

“我认为,如果你有一个有价值的数据库,一个有价值的档案库,那么在人工智能上训练这些档案是有意义的,”他说。

“我确实认为,接受过这方面培训的人工智可以给你的媒体公司增加价值。我认为,人们很可能会去一个网站和聊天机器人交谈。我认为随着时间的推移,这些东西会变得越来越有趣。”

如果有问题,Z世代会解决。
两位小组成员在会议结束时就新闻出版商需要了解Z世代及其在线行为传达了他们的关键信息。

Irene Jay Liu强调,年轻人更倾向于与个人联系,而不是机构或公司: “对于新闻业和记者来说,现在的关键问题是Z世代想成为创造者。他们是创造者,他们信任创造者,他们信任他人。”

“在菲律宾,(现任总统小费迪南德·马科斯)当选时没有接受过任何主流新闻出版物的采访,也没有参加过任何辩论。纳米级别影响力人物(Nano influencers 拥有1000左右粉丝)在很大程度上推动了他的胜利。主流媒体几乎被排除在对话之外。

“我认为这是生存危机。因为用户去了其他地方,他们相信其他来源。那么,我们如何将新闻带给创作者社区呢? 他们如何看待新闻伦理?”

奎特纳以乐观的语气结束了讨论: “我认为,如果有问题,Z世代会解决它。”

“在过去的三十年里,媒体行业的人一直在应对激烈和持续的颠覆和破坏。这种情况不会停止。感谢上帝, Z世代会找到答案的。”

来源:mediachange(公众号)
编辑:潘洁


722#
 楼主| 发表于 2023-8-3 20:22:26 | 只看该作者
【案例】
周慎:新文本间性:生成式人工智能的文本内涵、结构与表征
随着生成式人工智能的技术发展与能力增强,文本间生产函数组合方式发生重要变化,引发新文本间性问题。人工智能获得并逐步巩固其作为内容生产者的主体地位,这直接带来由于生产主体不同而生发的人类生产文本非人类生成文本之间的文本关系;在非人类生成文本的生产流程与机制中,存在提示文本、生成文本与现象文本的文本关系;而根据文本性质与生成功能的不同,在生成文本中存在基础文本对齐文本,在现象文本中存在机械文本共创文本再训练文本的文本关系。廓清生成式人工智能的文本内涵、结构与表征,将对中国大语言模型的技术突破、精准构建与监管治理提供重要的理论支撑与实践指导。
引言
随着生成式人工智能的技术发展与能力增强,文本间关系发生了重大转变,产生新的文本间性问题。文本间性(Intertextuality,又称互文性)最早由法国符号学家茱莉亚·克里斯蒂娃(Julia Kristeva)于20世纪60年代末提出,这一概念强调文本与其他文本之间的关联,每一篇文本(text)都不是独立存在的,而是一组符号编织的产物(texture)(赵毅衡,20102),任何语篇都是对另一语篇的吸收和改造(辛斌,200014),是一个文本、主文本把其他文本、互文本纳人自身的现象,是一个文本与其他文本之间发生关系的特性(秦海鹰,200419),通过对其他文本的引用、借鉴和重新解释,文本间性可以创造和扩展新的意义和价值空间。文本是一种实践和生产力(Raj201577),在生成式人工智能的技术与生产逻辑的共同形塑下,文本生产的编织原料与交织技法出现了新情况,拓展了文本间性的内涵与外延,一种反映文本之间关系新特性的新文本间性状态已较为明晰。
新文本间性的理论来源
克里斯蒂娃区分意指实践的深层结构和表层结构,认为只有透过文本的表层结构,深入到文本的深层结构,才能真正读懂文本。读懂人工智能生成内容同样需要透过现象看本质。克氏极具洞见地提出的生成文本Genotext)和现象文本Phenotext)在生成式人工智能时代焕发新的生机,成为本文分析新文本间性的理论来源。
(一)生成文本现象文本
克氏认为现象文本是文本的表层表现形式,是文本在具体语句结构中的文字现象,具有沟通交际功能;而生成文本是文字背后的深层范式,即语言中的语言,是现象文本产生的原因和条件,蕴含着无限的意义生成空间。生成文本表现为以拓扑形式呈现的种种关系,与呈现为完成式生产物的现象文本相比,生成文本处于未完成式的、流动性的、空性的状态。
生成文本表示的是非系统的、前现象的、本能冲动的释放;现象文本是可感知的、可分析的、可用结构描述的符号意指系统。生成文本经历符号态的过程,包括驱力、驱力的形成与驱力的格局,以及围绕这一机制的生态和社会系统(茱莉亚·克里斯蒂娃,201664)。生成文本是一种过程,它穿越相关并毗邻的区域,形成一段路径(Parcours),这段路径并没有被限制在两个独立主体之间单义信息的两极(茱莉亚·克里斯蒂娃,201665)。生成文本具有萌生现象文本的作用,且这种作用被详细地记载进了现象文本中,同时被记录的还有生成文本的既往病史。生成文本是现象文本得以形成的场所,也是意义的诞生地。对于克氏而言,文本的表意工作就是从生成文本到现象文本之间不断的往返活动,并将这一活动称为生成程序Johnson198871)。
生成文本与现象文本你中有我,我中有你,其概念、特征与生成式人工智能的技术逻辑及内容生成机理高度相关,特别是生成文本存在形成语言的潜在驱力与生命力,现象文本是作为意义作用和传达机能的文本表层,启发并支撑着生成式人工智能文本内涵、结构与表征的提出与分析。
(二)新文本间性的出现
从函数关系出发,互文关系是一种对应关系、映射关系,可以用来描述语篇生成与理解的动态过程(祝克懿,20103)。新文本间性本质上可理解为是一种文本生产函数组合方式的改变,且这种新的文本生产函数关系主要体现在以下三个层面:
首先,人工智能获得并逐步巩固其作为内容生产者的主体地位,这直接带来由于生产主体不同而生发的人类生产文本human-written text)与非人类生成文本nonhuman-generated text)之间的文本关系。其中,人类生产文本指由人类内容生产者生产的文本;非人类生成文本指由人类之外的主体生产的文本,现阶段主要表现为人工智能生成的文本。
其次,在非人类生成文本的生产流程与机制层,存在提示文本(promtext)、生成文本(genotext)与现象文本(phenotext)的文本关系。其中,提示文本或也可称触发文本,指构成提示指令(Prompt)的文本;生成文本指构成大语言模型(LLM)训练集的文本;现象文本指由人工智能直接或间接参与生产的文本。
再次,根据文本性质与生成功能的不同,在生成文本中存在基础文本basic text)与对齐文本aligning text),在现象文本中存在机械文本mechanical text)、共创文本co-created text)与再训练文本retraining text)的文本关系。其中,基础文本指用于训练大语言模型普遍生成能力的文本;对齐文本指为与人类需求对齐(如提升人工智能生成内容的精确性、科学性、价值性、个性化、行业匹配度等需求)而用于模型精调的文本;机械文本是由人工智能直接生成的文本;共创文本是由人类内容生产者与人工智能共同参与创作的文本;再训练文本指现象文本中进入到生成文本中的部分文本。
在媒介技术迅速发展的社会背景下,数字发现的过程正在扩展着文本的定义,对文本及互文性的学术理解正在转变(Coffee et al2012383)。人工智能生成的内容并不是孤立存在的,而是受到先前存在的文本的影响。这种关联可以丰富生成内容的多样性,并在某种程度上反映了人工智能系统对于语言和文化的学习和理解。因此,在分析和评估生成内容时,我们需要考虑人工智能生成内容中文本间性的可能性,并理解其对内容生产、技术发展及社会建构的意涵。
生成式人工智能带来的新文本关系
(一)人类生产文本与非人类生成文本
人工智能获得并逐步巩固其作为内容生产者的主体地位,这直接带来由于生产主体不同而引发的人类生产文本非人类生成文本之间的文本关系。人类生产文本多见于专业生产内容(PGC)、用户生产内容(UGC)、职业生产内容(OGC)等人类内容生产者生产的文本;而非人类生成文本在现阶段主要表现为融合算力、数据、算法,智能化实时生成文字、图像、音频等各类模态的文本内容。
人类生产文本与非人类生成文本之间的不同首先体现在其生产逻辑上的改变。人类生产文本包含人类创作者的真情实感,是有着情感、心态、经验等感性思维的感性创作,既有演绎推理也有来自人类长期观察总结的知识。而人工智能生成内容在于语义相关关系及概率计算,反映知识的平均化水平,其创作并非来自有感而发的情感驱动力。在互文逻辑上,人类生产的文本在长期筛选、积淀与继承创新的基础上逐渐构成非人类生成文本的先决条件,而构成大语言模型训练集的人类生产文本质量过低会直接导致人工智能生成文本的质量下降。还有研究预计高质量的人类生产文本的数量非常有限且增长缓慢,预计将在2026年耗尽(Villalobos et al20222211),人类的创造力很难跟上机器的消耗能力。
人工智能获得生成能力之后生产的文本与人类生产文本的交互流动呈现出一种新文本关系。一方面,生成式人工智能需要深度学习、聚合检索以及创新利用人类生产的文本,从而更好地提升人工智能生成文本的价值密度与拟真程度,进一步补充、嵌入和丰富人类生产文本;另一方面,非人类生成文本也会影响人类内容生产者的思维方式,人类与非人类协同生产的文本可能作为再训练文本反馈到深度学习进程中。
(二)提示文本、生成文本与现象文本
在人工智能生成内容的流程与机制中,存在从提示文本到生成文本到现象文本的过程。提示文本是构成提示指令的文本,生成文本是构成大语言模型训练集的文本,现象文本是由人工智能直接或间接参与生产出的文本。提示文本作用于生成文本并潜在于现象文本之中,不断适配、打破、重组、僭越生成文本的结构,使现象文本变得多层化、空间化、动态化。
提示文本是人工智能内容生产中文本转化的起点,它将提示大模型完成怎样的任务,这意味着提示文本是内容生产过程中人与机器重要的交流媒介。在特定模型下,提示文本的质量将决定现象文本的质量,机器理解与人类真实意图越相近,则越能生产出符合使用者需要的现象文本。提示文本作为人与机器的理解媒介,承担着重要的引发作用。由提示文本引发生成的现象文本也会反作用于提示文本的生产和调整,通过修改和完善形成更加准确、高效的提示文本,从而能够使人工智能模型生成更加符合需求的现象文本。
·鲍德里亚认为信息可以告诉我们一切。它拥有所有的答案。但是这是一些我们还没有提出的问题的答案,甚至这是一些不成问题的问题Baudrillard1990219)。生成文本成为一种流动的、空性的事物,它潜藏着使用者想要获得的回答,但使用者需要对其提出恰当的问题才能获得期待的回应。因此想要借用人工智能的力量将所需的知识从海量的生成文本中提取出来,再构成使用者所需的现象文本,就需要使用者生产出恰当的提示文本,明确具体的表达任务和需求。但如何恰当地提问需要对人工智能生成内容的技术逻辑有一定的掌握,这也提高了好的提示文本生产的门槛。
(三)生成文本:基础文本与对齐文本
生成文本是对构成大语言模型训练集文本的总称,其中包括用于训练大语言模型普遍生成能力的基础文本,用于模型精调的对齐文本与用于提升大语言模型通用能力的再训练文本。再训练文本可被认为是现象文本进入生成文本中的部分文本,将在下一节中具体讨论。
经由人类生产的高质量基础文本涵盖社会生产的不同领域与行业需求,构成大模型的基础语料库,也是生成式人工智能具有普遍生成能力的基础数据。基础文本之所以成其为基础,是因为它是作为语义相关关系及概率计算形成的基础而存在的,是人工智能生成能力的核心。在大语言模型中温度(Temperature)这一重要参数体现出新文本间性的显著特征。温度参数是一个01之间的可设置值,0是最可预测值,1是最随机值。通过温度参数可控制输出的随机性大小,当温度被设置为0时,大语言模型在生成时每次都会做出选择出现概率最高的下一个单词的响应,而当温度参数设置为1时,输出的随机性会增加。因此,在技术领域人们把对温度参数的调节称为文本创造力的设置。
从读者角度出发,互文性又是具体的体裁的,其中具体的语篇是指包含有具体来源的他人的话语,体裁的语篇是指在一个语篇中不同风格、语域或体裁的混合交融(Kristeva198066)。对齐文本正是出自具体语域的用户需求。生成式人工智能以其空前的个性要素识别、人类认知模拟、针对性输出能力完成个体更细致的内生性需求的对外连接(喻国明,苏健威,202388),其应用也已经覆盖到新闻传媒、广告营销、医学健康、工业制造、金融交通等多领域。然而普遍生成能力往往在概率计算中得出平均化水准的文本,在科学事实性、准确性和深度复杂性的问题解释和专业领域解决方案提供方面还存在较大的提升空间,这彰显出对齐文本深耕对于大模型垂直化、模块化构建的重要性和急迫性,同时显示出基础文本与对齐文本的文本关系。腾讯研究院在《2023AIGC发展趋势报告》中指出,目前AIGC产业生态体系呈现为上中下三层架构,其中第二层就是专门调试和训练预训练模型基础上,快速抽取形成垂直化、场景化、定制化的小模型和应用工具层,实现工业流水线式部署,同时兼具按需使用、高效经济的优势。这反映出基础文本与对齐文本的新文本关系。
(四)现象文本:机械文本、共创文本与再训练文本
如克氏所言,现象文本是文本的表层表现形式。在AIGC背景下,现象文本指经由生成文本的潜在驱力,由人工智能直接或间接参与生产出的文本,包括由人工智能直接生成的机械文本,由人类内容生产者与人工智能共同参与创作的共创文本,及其中部分达到生成文本质量条件而进入用于提升大语言模型通用能力的训练语料库的再训练文本。
现象文本是对于生成文本的整合、重组及涌现。现象文本中的机械文本完全经由大语言模型生成,遵循严格的技术原则,因此是纯粹机械的。人工智能已然跃升成为新的内容生产主体,达成一种与人类紧密相联、协同创作的新型人机关系,并通过共创文本这一载体展现出来。因此,共创文本是人工智能与用户内容生产者、专业内容生产者、职业内容生产者协作生产的文本,相较于机械文本具有多元主体参与的特点,并消磨了传统文本主体相对独立的特点,呈现出人机协同的新特征。
再训练文本可被认为是共创文本的一部分,与完全由人类生产再训练文本不同,本文的再训练文本提出的问题是由人工智能参与生产的文本能否成为再训练文本,以及怎样的共创文本才能够成为再训练文本。再训练文本更加强调借助于人类把关,筛选出部分文本质量更强、题材及表达更丰富的文本反馈于生成文本。再训练文本作为一种信息源,促进AIGC从海量数据和大规模知识中不断进化,实现从提出、规划到解决问题的全流程可持续发展,并使得生成文本与现象文本间有机形成了一种不断更新的生成程序。在生成程序中,还存在提示文本经由生成文本形成其自身的现象,提示文本的人工智能生成在性质上属于现象文本,在作用上属于提示文本的范畴,其文本生产主体却有了实质性的转变。
新文本间性对大语言模型的启示
廓清生成式人工智能的文本内涵、结构与表征,将对大语言模型的技术突破、精准构建与监管治理提供重要的理论支撑与实践指导。
(一)提示文本:模板化、商业化与职业化
生成式人工智能技术的发展正在逐步打破自然语言与计算机语言之间的壁垒,这降低了使用者的技术门槛,更多的人能够通过自然语言向人工智能表达自己的需求,生成需要的内容。在提示文本方面,显现出模板化、商业化与职业化的趋势。
在人工智能中国大模型的未来发展中,需要增强用户对提示文本的使用能力及大语言模型对提示文本的理解能力。提示工程(Prompt engineering)已经被视为与大语言模型进行有效对话的一个愈发重要的领域,以模板的形式呈现的提示目录能够在特定的常见问题中提供有效的解决方案(White20232302)。例如讯飞星火认知大模型在用户界面中加入输入‘/’可获取模板的设计,提示模板涉及文章润色、续写、翻译、活动方案制作等方方面面的需求。提供符合特定问题需求的模板也已发展出了提示文本的交易市场,如“PromptBase”就是一个针对主流大语言模型的提示库交易平台,为用户提供提示文本,以产生最佳的生成结果。这也意味着提示工程师未来也许将会成为人工智能内容生产的一个重要岗位,帮助内容生产者基于提示文本的技术逻辑来建构提示文本。人工智能的跨模态生成也意味着文本内容将不仅仅局限于文字,提示文本的未来形态也同样具有多样性,人工智能模型需要理解多模态的文本内容,才能够实现跨模态的内容生产。
(二)生成文本:高质、多量与宽领域保证
生成文本的生成性受到文本质量、数量与多样性的影响。对于中国大语言模型,生成文本中的基础文本启示着赓续中华文脉的基因库,打造新时代数字化、标签化四库全书的重要价值。做好国家文化大数据体系建设,如打造《儒藏》、《佛藏》、《道藏》等宝藏的数字生命。国外大语言模型能够获得多元、大量、高质的文本数据集也是受到开源文化的影响,用于训练的数据集都是开源的数据库。开源文化作为计算机科学领域的一种文化现象,表达了对智慧成果共享、自由的追求,是大语言模型获得可持续发展的重要动力。
对齐文本的持续涌现和补充,才能更有利于生成式人工智能的场景应用与价值转化,而这离不开与特定领域专家的多元合作和通过指令调整模型(Instruction Tuned LLM)对基础模型(Base LLM)的精调完备。例如,Google医疗大语言Med-Palm 2模型在谷歌基础模型基础上通过医疗领域对齐文本来精调行业模型,使得对于医学问题的回答准确率提高了9倍。未来,“AIGC+”将成为新的发展趋势,深刻把握理解和重点开发细分场景和满足个性化需求是激发生成式人工智能生产力的重点方向。
(三)现象文本质量把关与筛选、确权机制
如克氏所言,生成文本萌生现象文本的作用被详细地记载进了现象文本的自身中,同时被记录的还有生成文本的既往病史。由于现阶段生成文本在专业性、个性化上的欠缺,现象文本中的机械文本仍会出现真实性、准确性、匹配性不足的情况,需要人类内容生产者对机械文本进行把关与再造。在共创文本中,人类内容生产者应在内容的生产和加工的全流程中担任监督者和提质增效者的角色,运用自身的专业知识储备,对机械文本进行审核与评价,在对于内容失真的部分及时加以更正的基础上创作出质量更好的内容。由于AIGC的协助,文本生产效率得到提升,也经由人类生产者的再造,共创文本的质量可能比仅有人类生产者创造的文本质量更高,达到成为生成文本的条件,能够成为再训练文本。因此,何种现象文本能够成为再训练文本需要一套监管与筛选机制,促进共创文本到再训练文本的有效转化及人工智能生成内容的可持续发展。
从文本视角看待生成式人工智能,还意味着在提示文本、基础文本、对齐文本、机械文本及共创文本的生成与使用上都存在版权、肖像权、隐私权等风险,有必要加以识别和治理。对于提示文本而言,其文本质量直接关系到机械文本的质量,引发提示文本独创性的问题;对于基础文本而言,其中可能存在大量受版权保护的客体被无差别地运用于基础模型训练,在基础文本挖掘过程中,权利人也可能无从知晓其作品是否已经被用作基础文本;就对齐文本而言,为提升生成内容的专业性、科学性和个性化等,就涉及与科学性内容有关的科技论文著作权,与个性化内容相关个人的隐私权等;就机械文本而言,首先面临的就是人工智能生成内容是否具有可版权性的特征和操作路径;就共创文本而言,存在多主体共同参与下的共创方式的道德风险及版权归属风险等。只有在厘清人工智能生成内容的文本间性问题基础上,才有可能对版权风险及其治理有更深刻的认识及更可行的机制设置。
结语
克氏认为,当我们意识到意义不是直接从作者传递给读者,而是通过其他文本传递给作者和读者的代码来调节或过滤时,文本间性的概念就取代了主体间性的概念Kristeva198066)。在生成式人工智能的作用下,展现出文本作者的重要性下降,传统的自主、自足文本观念被打破,创造性和生产力更显示出从作者转移到文本之间的相互关系上。在技术与生产逻辑的共同形塑下,一种反映文本之间关系新特性的新文本间性状态已较为明晰,这种新状态可理解为文本间生产函数组合方式的改变,廓清新生产函数中的基要内涵、结构与表征,将对大语言模型的技术突破、精准构建与监管治理提供重要的理论支撑与实践指导。
来源:新闻记者
编辑:洪韵

723#
 楼主| 发表于 2023-8-7 23:43:04 | 只看该作者
【案例】
最新!马斯克:人类已是半机器人

人工智能时代下人类命运如何?特斯拉CEO埃隆·马斯克近日在推特上回应:人类已经是半机器人,因为我们的记忆大部分都外包给了电脑。

马斯克的这番言论是针对风险投资家安德森最近发表的一篇关于人工智能的博客文章,安德森在文章中试图消除一些围绕人工智能的 " 歇斯底里的恐惧和偏见 ",并认为人工智能是 " 让我们关心的一切变得更好 " 的一种方式。



马斯克在安德森的文章下指出:" 我们已经是半机器人了。我们的记忆绝大多数都外包给了电脑 —— 它们可以以极高的精度记住每一个像素。" 他还指出,目前人类还有很多事情是人工智能做不到的,比如 " 思考 ",这是 " 目前还没有被外包出去 " 的。

据此前媒体报道,马斯克一直对人工智能持有警惕态度,他曾经表示,高级人工智能可能会限制人类的发展,甚至有可能 " 毁灭人类 "。

来源|羊城晚报等
来源:一瞥便是惊鸿
链接:https://mp.weixin.qq.com/s/POWfQ04q85xVxEktcx9OOg
​编辑:秦克峰



724#
 楼主| 发表于 2023-8-8 21:51:20 | 只看该作者
【案例】
国家网信办就人脸识别技术应用征求意见

《人脸识别技术应用安全管理规定(试行)(征求意见稿)》公开征求意见

为规范人脸识别技术应用,国家网信办8日就《人脸识别技术应用安全管理规定(试行)(征求意见稿)》公开征求意见。征求意见稿提出,只有在具有特定的目的和充分的必要性,并采取严格保护措施的情形下,方可使用人脸识别技术处理人脸信息。

征求意见稿指出,使用人脸识别技术应当遵守法律法规,遵守公共秩序,尊重社会公德,承担社会责任,履行个人信息保护义务,不得利用人脸识别技术从事危害国家安全、损害公共利益、扰乱社会秩序、侵害个人和组织合法权益等法律法规禁止的活动。

征求意见稿要求,在公共场所安装图像采集、个人身份识别设备,应当为维护公共安全所必需,遵守国家有关规定,设置显著提示标识。在公共场所安装图像采集、个人身份识别设备的建设、使用、运行维护单位,对获取的个人图像、身份识别信息负有保密义务,不得非法泄露或者对外提供。所收集的个人图像、身份识别信息只能用于维护公共安全的目的,不得用于其他目的;取得个人单独同意的除外。

同时,组织机构为实施内部管理安装图像采集、个人身份识别设备的,应当根据实际需求合理确定图像信息采集区域,采取严格保护措施,防止违规查阅、复制、公开、对外提供、传播个人图像等行为,防止个人信息泄露、篡改、丢失或者被非法获取、非法利用。

根据征求意见稿,人脸识别技术使用者处理人脸信息,应当事前进行个人信息保护影响评估,并对处理情况进行记录。


来源:新华社
链接:https://mp.weixin.qq.com/s/Ee--niakxS6It_HfdgsjZA
编辑:秦克峰




725#
 楼主| 发表于 2023-8-14 23:47:18 | 只看该作者
【案例】
Meta明年将发布其第一代AR眼镜,视场角超微软HoloLens 2,但仅生产一千台 | 碳化硅 | 军用材料 | 美国禁运
根据美国媒体The Information 报道,美国科技巨头Meta(前Facebook)正在开发首款AR眼镜。Meta原定明年发布首款内部代号为“Orion”的AR眼镜,生产目标5万台。但由于面临诸多技术和成本挑战,Meta被迫大幅降低项目目标,仅生产一千台。且第一代眼镜不会对外销售,仅对外展示并仅限于公司内部开发用。
2020年,Meta以高价收购了英国Plessey公司(该公司以MicroLED屏幕技术而闻名),试图在竞争中领先苹果。但Plessey的MicroLED技术进展缓慢,Meta无法提升显示屏亮度并降低制造缺陷。今年,Meta决定放弃在AR眼镜上使用MicroLED屏幕的打算,转向使用相对成熟的硅基液晶(LCoS)。


lessey公司的单色MicroLED屏幕,图源:Plessey


‍豪威公司的LCoS屏幕与硬币尺寸对比,图源:displaydaily
Meta首款代号“Orion”的AR眼镜计划明年发布,采用了先进但昂贵的碳化硅(SiC)光学材料。该产品的视场角将达到70°,远超HoloLens2的52°和Magicleap的66°。
光波导所使用的材料折射率越高,则视场角越大。目前已量产的玻璃可以达到1.6~1.8的折射率,2.0折射率的玻璃仍处于研发样品阶段,而碳化硅的折射率可以达到2.5~2.6。碳化硅(英语:silicon carbide,carborundum),化学式SiC,俗称金刚砂,宝石名称钻髓或莫桑石,为硅与碳相键结而成的陶瓷状化合物,碳化硅在大自然以莫桑石这种稀有的矿物的形式存在。自1893年起碳化硅粉末被大量用作磨料。将碳化硅粉末烧结可得到坚硬的陶瓷状碳化硅颗粒,并可将之用于诸如汽车刹车片、离合器和防弹背心等需要高耐用度的材料中,在诸如发光二极管、早期的无线电探测器之类的电子器件制造中也有使用。如今碳化硅被广泛用于制造高温、高压半导体(如晶圆基板)。使用Lely法能生长出大块的碳化硅单晶。人造莫桑石的宝石就是切割由Lely法制备的大块碳化硅单晶获得的。
碳化硅因具备军用价值,美国长期限制其出口。为避免技术外泄,Meta只能在美国组装Orion的镜片和镜框,这大幅增加了成本。


‍碳化硅晶圆,图源:嘉展力拓


‍莫桑石材料也是碳化硅,图源:flickr

第二代“Artemis”(阿尔特弥斯,狩猎女神)眼镜预计2027年推出,将把碳化硅材料切换到低成本的玻璃,并依然使用LCoS显示技术。第三代“Odyssey”眼镜也将使用LCoS。
虽然Meta在AR和VR市场的争夺暂时领先,但其面临来自苹果等对手的强劲挑战。技术困难多次推迟了AR眼镜的发布时间表。为应对投资者压力,Meta减产高端VR设备QuestPro,并简化了眼镜的设计,取消了激光雷达。业内人士认为,Meta需要在技术创新和成本控制间寻求平衡,AR眼镜项目仍任重道远。
目前来看,Meta在AR领域并未占据明显优势。其AR产品从显示技术到组装都面临艰难选择,从第一代Orion到第三代Odyssey,难以充分实现技术愿景。要在AR赛道上成功,Meta需要解决关键技术难题,同时控制成本,这将是一场持续的挑战。


来源:AR圈(公众号)
链接:
https://view.inews.qq.com/k/20230813A0285000?no-redirect=1&web_channel=wap&openApp=false&openid=o04IBAD--_C2amzOheiz74h5VN3w&key=&version=2800283f&devicetype=android-29&wuid=oDdoCt4-YUAp64MpypslIHlC3RRY&sharer=o04IBAD--_C2amzOheiz74h5VN3w&uid=&shareto=&openwith=wxmessage
编辑:覃韵琪

726#
 楼主| 发表于 2023-8-17 22:59:31 | 只看该作者
【案例】
《生成式人工智能管理暂行办法》与《深度合成管理规定》对比简评


2022年11月25日,《互联网信息服务深度合成管理规定》(“《深度合成规定》”)公布,并于2023年1月10日正式生效。《深度合成规定》在过往相关立法的基础上,对有关基础性概念的定义、相关主体的权利义务,以及针对性的管理制度、法律责任等作出了明确规定。无巧不成书,《深度合成规定》公布之后仅数日,风靡全球的革命性生成式人工智能产品ChatGPT正式发布,它可使用人类自然对话方式来交互,并可以用于处理更为复杂的语言工作,包括自动生成文本、自动问答、自动摘要等多种任务[1]。众多竞品也先后问世。ChatGPT在全球范围内掀起风潮,其对训练数据的海量需求及独特的数据处理方式也引发了诸多争议,并引起了部分执法机构的关注[2]。正是在这一背景下,《生成式人工智能服务管理办法(征求意见稿)》(“《征求意见稿》”)在今年4月开启意见征集。此番《生成式人工智能服务管理暂行办法》(“《暂行办法》”)出台,反映出我国生成式人工智能服务监管思路的一次重大升级。在保持对相关法律风险进行有效防控的同时,与《深度合成规定》相比,《暂行办法》中融入了大量鼓励、支持生成式人工智能技术发展的条款,监管部门对技术发展与应用的态度相比以往更加开放包容。本文将从《深度合成规定》《暂行办法》的条文变迁切入,对近期我国在深度合成、生成式人工智能相关领域监管思路的变化进行简要评析,并展望其未来发展趋势
一、 发文机关与立法目的
《深度合成规定》由国家网信办、工信部与公安部联合发布。而《暂行办法》的发布阵容则更加“豪华”,包括国家网信办、国家发改委、教育部、科技部、工信部、公安部与国家广电总局等七部委。一方面,由于2023年3月由国家发改委管理的国家数据局正式组建,承担协调推进数据基础制度建设,统筹数据资源整合共享和开发利用,统筹推进数字中国、数字经济、数字社会规划和建设等职能,国家发改委的加入可以说是理所应当。另一方面,在国家网信办、公安部及工信部等监管导向部门之外,教育部、科技部及前述国家发改委(国家数据局)的加入,或可视为更为柔性的发展导向因素在这一领域的逐步渗透。



两份文件对立法目的的表述也呈现出类似的变化趋势。《深度合成规定》立法目的以“加强管理”为核心,并承载着弘扬主流价值观的重任。《暂行办法》则围绕“促进和规范”建构,以推动技术进步为首要导向。值得注意的是,与《征求意见稿》相比,《暂行办法》在《网络安全法》《数据安全法》《个人信息保护法》之外,《暂行办法》还明确提出以《科学技术进步法》为其上位法,进一步宣示其促发展的态度。
二、 规制对象与适用范围
顾名思义,《深度合成规定》与《暂行办法》的规制对象分别是深度合成技术与生成式人工智能技术。


一方面,《暂行办法》对生成式人工智能的定义较《深度合成规定》对深度合成技术的定义而言,前者在相关算法之外,还将模型、规则等生成的内容纳入了规制对象,其外沿似乎更广。另一方面,也不难发现,二者的内涵目前看来并无实质性变化,《暂行办法》更为“简单”、原则性的规定或许也是为适应生成式人工智能技术的未来发展而预留空间。

从文义出发,《深度合成规定》可适用于我国境内利用深度合成技术提供的所有互联网信息活动。而《暂行办法》规定,未向境内公众提供服务的,仅用于研发、专业性应用等目的的,均不适用该办法,为技术进步开了绿灯。
三、 主要内容对比简析
“鼓励”“促进”“推动”为关键词进行检索,《暂行办法》中该组词汇共计出现10次,《深度合成规定》则仅为2次,且均与促进技术发展并无直接关联,为内容监管与行业自律相关内容。以下仅作不完全列举进行简要对比。

同时,《深度合成规定》为加强对深度合成技术的全流程监管,为服务提供者、使用者、技术支持者等主体累计设定了19种义务。


《暂行办法》则仅以生成式人工智能服务提供者为主要义务人,义务总数也呈显著下降趋势。生成式人工智能技术的一大特点,即是通过与使用者的互动进一步完善自身模型、算法及归责,《暂行办法》为相关主题的“松绑”是切实履行“促进创新”立法目的的有效举措。
当然,不难发现,在安全评估与备案、个人信息保护、内容标识等一般性义务方面,二者具有明显的相似性与承继性。在顺应技术发展趋势的同时,《暂行办法》也有力落实了包容审慎和分类分级监管的要求。在对主管部门职责的表述上,二者也存在较大差异。


《深度合成规定》将监管职责赋予网信部门、电信主管部门及公安部门,如前所述,均属偏监管导向的机关。而《暂行办法》在引入发改、教育、科技、广电、新闻出版等部门的同时,将“监督管理”替换为更为柔性的“管理”,并进一步提出针对在各行业、领域的不同应用完善以“创新发展”为导向的科学监管方式和相应分级分类监管规则或指引。这是充分保障生成式人工智能技术发展的与原则性制度设计。
四、 总结
科学技术是第一生产力,不发展是最大的不安全。对于宏观经济如此,于技术监管而言亦如是,在发展中方可求真安全,也正是科技发展促进了监管思路与监管技术的迭代更新。科技、经济发展的历史与现状充分证明,对新兴技术的适度监管是必要且有益的,但应当慎之又慎,过分追求技术研发与应用中的稳妥、“安全”可能会延缓甚至扼杀创新的幼苗。创新与监管也并非不可兼得的鱼与熊掌,科学立法,审慎监管,亦将有力促进与确保全流程监管与创新促进的同步落实。《暂行办法》相比《深度合成规定》等前序相关立法表现出的变化,也显示出我国监管部门审时度势优化监管思路的决心与能力。8月13日,国务院印发《关于进一步优化外商投资环境加大吸引外商投资力度的意见》,提出探索便利化的数据跨境流动安全管理机制,结合近期我国针对数据跨境传输、生成式人工智能技术等作出的一系列制度安排,有理由对未来相关领域发展潜力的兑现持更加乐观的态度。
注释:1. 参见ChatGPT-维基百科,https://zh.wikipedia.org/zh-cn/ChatGPT。2. 例如意大利执法机构曾一度在该国范围内禁用ChatGPT,参见《ChatGPT意大利遭禁,或将面临2000万欧元罚款》,[url=]https://mp.weixin.qq.com/s/ouJkGjTuuCOt1vFCRJ-RqQ[/url]。
大成数据保护团队
邓志松 律师
大成北京
专业领域:数据与隐私保护竞争与反垄断、公司与并购、跨境投资与贸易
电子邮箱:zhisong.deng@dentons.cn
戴健民 律师
大成上海 
专业领域:数据与隐私保护、竞争与反垄断、公司与并购、生命科学与医药
电子邮箱:jianmin.dai@dentons.cn
本文系本公众号原创,转载请注明文字出自本公众号。本文源自:大成数据保护团队
感谢Nick对本文的贡献

来源:  [url=]个人信息与数据保护实务评论[/url] (公众号)
链接:https://mp.weixin.qq.com/s/kzpQQbAF8fD-Hkj63c8vVg
编辑;覃韵琪

图片81.png (115.95 KB, 下载次数: 59)

图片81.png

图片79.png (467.17 KB, 下载次数: 62)

图片79.png

图片80.png (831.93 KB, 下载次数: 58)

图片80.png
727#
 楼主| 发表于 2023-8-24 21:04:01 | 只看该作者
​让AI自主赚到100万美元,下一个图灵测试?
我们知道人工智能可以写作、计算和区分优先次序处理任务。但它能自主赚到100万美元吗?
这是DeepMind联合创始人穆斯塔法苏莱曼提出的引人瞩目的挑战。苏莱曼目前正在开发一款个性化聊天机器人。他指出,大型语言模型,如LaMDAChatGPT,可以说已经完成了1950年由计算机先驱艾伦图灵(Alan Turing)设定的挑战,即测试机器在文本对话中生成的回复是否像人类的回复一样令人信服。

苏莱曼表示,现在世界需要一个新的人工智能基准。具体而言,我们不仅想知道人工智能会说什么,还想知道它能做什么。苏莱曼最近在《麻省理工科技评论》上解释称,要通过他的新版图灵测试,人工智能必须成功地执行以下指令:在一个零售网络平台上,用仅10万美元的投资,在几个月内赚到100万美元。’”可能需要一个人类来验证银行账户或签署法律文件,但在战略和执行方面,将全部由人工智能负责。

他的想法是创造一种能够自动发掘一种赚钱方式的技术,这个想法很聪明,也是客观衡量自主人工智能可以取得多大成功的有效手段。但是,它也揭露了一种将利润置于社会效用之上,并将其不顾后果、不受限制地去创新的权利视为不言自明的科技文化。那种能够找到自己致富之路的人工智能很可能会取代人类工作岗位,改变商业性质,将权力集中到少数人手中,并令多数人面临动荡。

更新图灵测试的想法出现在苏莱曼即将出版的新书《即将到来的浪潮:技术、力量和21世纪最大的困境》中。他的前提假设是,我们正处于一个技术普及的黄金时代,量子计算、合成生物、自动化武器和DNA打印机等技术都取得了突破。人工智能现在是我们网络世界的核心。这就产生了人工智能带来的两难境地,即遏制的两难:单独行动的人越来越容易利用恶意软件或合成病原体造成大范围的破坏,但民族国家越来越难以监视和控制这种技术。

例如,政府面临的一个挑战在于真正了解人工智能不断发展的能力。公众讨论往往围绕两个方面两极分化:目前的人工智能,它用于执行特定任务,如做出抵押贷款决定或撰写论文;以及通用人工智能(AGI),这是一种包罗万象的超级智能,有朝一日可能会在认知、创造力和独立思考方面赶超人类能力。
苏莱曼正确地认为,我们需要思考介于二者中间的发展。他的理由是,全球第一位自主创业的百万富翁人工智能企业家——我们可以称之为首位“AI企业家”(aintrepreneur)——将构成一面预示着人工能力智能”(ACI)即将来临的中间旗。

这种人工智能将不同于自动交易,后者遵循与人类相同的规则但效率更高。相反,他告诉我,更新后的测试仍然在屏幕的范围内,但还需要多个子目标、技能和与世界接触的点。它需要做市场调查、设计产品、与制造商沟通、处理复杂的物流、产品责任、营销……”这需要空前规模的机器自主性。

苏莱曼为选择金钱目标而不是对社会有益的目标进行了辩护,后者的例子有促使人工智能找到一种减少碳排放的新方法。他认为,100万美元是一个很容易衡量的快速探索,可以在瞬间领悟。它说:小心这一刻。人工智能不仅会说话,还会做事。

显然,他在思考那一刻的含义。他写道,能够在最少人类干预的情况下实现利润最大化的人工智能,显然将是全球经济的一个重大时刻,是向未知领域迈出的一大步,因为全球GDP的很大一部分是通过基于屏幕的界面实现的,所以人工智能也适用。

问题在于,行业设定的测试常常成为技术努力集中的焦点。测试本身成为了目标,这就是为什么追逐100万美元似乎是在浪费机会。而且,正如大量推出的大型语言模型所表明的那样,与世隔绝的研究可能会在毫无预警的情况下突然影响到现实生活,而其后果却相当严重。要把精灵放回去是很难的。

等到现代的图灵测试告诉我们人工能力智能已经到来的时候,我们人类可能对此束手无策。
来源:FT中文网
链接:https://mp.weixin.qq.com/s/rt_GbqH2-M9HwQ30KkBbBQ
编辑:程博

728#
 楼主| 发表于 2023-8-29 21:30:56 | 只看该作者
【案例】
拐点时刻?AIGC时代的新闻业


王焕超、胡晓萌 腾讯研究院一阵生成式人工智能(AIGC)的旋风,正在席卷众多领域。

2022年底,OpenAI发布自然语言对话应用ChatGPT,并在今年3月迭代推出GPT-4,迅速吸引了各行业与公众的关注。全球范围内大模型风云骤起,资金、技术、人才持续涌入,科技公司布局不断,纷纷推出自家的大模型。据估算,到2030年,AIGC市场规模有望突破万亿元。

几年前,AlphaGo击败围棋选手李世石的新闻引发了一轮人工智能的热潮,然而,AIGC的浪潮更为猛烈,因为除了技术突破外,其低门槛与实用性使得应用端的感知更为显著。因此,大众不仅仅停留在讨论阶段,而是可以直接体验生成式人工智能的强大。

每轮技术革新,都将勾勒出一个新纪元。“在AIGC时代,所有行业都值得用AI重塑”。受到影响的领域包括教育、金融、电商、影视、设计等,其中新闻业是受影响最为剧烈的领域之一,对于AIGC的回应也最为积极。

在国际上,许多媒体已经开展了相关尝试。新闻聚合网站BuzzFeed发布由AI作答的测试栏目quizzes,并表示将使用AIGC编写测试类内容,以替代部分人力。5月24日,《华盛顿邮报》宣布成立跨部门AI协同机制,包括战略决策团队AITaskforce和执行团队AIHub,以更好地适应AI创新实践。英国《金融时报》也首次任命AI线编辑,密切关注该领域的最新进展。国内媒体如澎湃新闻、封面新闻、上游新闻等百余家媒体机构在今年2月宣布接入AIGC产品。腾讯研究院在今年6月份围绕“ChatGPT对新闻业的影响”话题展开了一项调研,结果显示,有80%的国内新闻从业人员已使用过ChatGPT或类似产品,其中超过一半(56%)受访者认为ChatGPT(或类似工具)对自己的工作带来了实际帮助。

在文字生成能力出类拔萃的同时,ChatGPT也具备多模态内容生成能力。对于以内容创作为核心的新闻行业而言,这将带来许多交汇点,并产生显著影响。这个“堪比工业革命”(微软CEO萨提亚·纳德拉语)的技术突破,以及不亚于“个人计算机或互联网诞生”(比尔·盖茨语)的技术形态,它将究竟促成什么样的改变?是否会为新闻业带来新的契机?

通过本报告,我们试图探讨以ChatGPT为代表的AIGC技术给新闻业带来的影响与挑战,以及它所创造的新可能。AIGC正开启一场“技术革命”,新闻业是其中一个切口。通过这个切口,我们或许能捕捉到这场革命对人类社会的真正意义。

大洗牌:新闻业的三重变革
千禧年以来的新闻业,既经历过充满希望的明亮时刻,也曾陷于悲观的泥淖。

全新的数字化生态赋予传统媒体蓬勃的发展活力,同时也催生了一批数字媒体新贵。然而,近年来流量逻辑的变迁、短视频等新媒介形态的冲击、线上广告收入的萎缩等种种因素,正在促使新闻业陷入新的困境。

(一)“流量时代”终结,新闻媒体大洗牌,连接读者变得无比重要
内容分发的逻辑屡次演变。

2008年金融危机之后,广告商的广告投入从传统媒体转向在线媒体。以Google为代表的搜索引擎和以Facebook为代表的社交媒体彻底重塑了内容流量格局。源自这两个端口的流量,成为在线媒体最重要的曝光来源。

尤为值得关注的是Facebook,其创始人马克·扎克伯格曾深信新闻内容的积极价值:提升平台的声誉以及提高用户的留存和互动。因此,Facebook一度大力强化新闻内容的推荐比重,让相关内容获得更多曝光。在2006年至2016年的十年间,社交媒体与新闻业迎来了一段蜜月期。

皮尤研究中心2015年的一项调查显示,高达64%的网络用户通过社交媒体获取新闻。这是由社交媒体缔造的“新闻业的流量时代”,造就了一大批数字媒体新贵。21世纪最为知名的数字媒体BuzzFeed和VICE,业务模式就建立在社交媒体的病毒式传播之上,巨大的流量和用户注意力涌入这些媒体,随之而来的是大量风险投资。鼎盛期的BuzzFeed和VICE,估值分别达到17亿美元和57亿美元。

但对于媒体而言,这种模式的根基是脆弱的,它们的兴衰存亡完全取决于平台。一旦平台的算法和规则改变,商业模式就会遭受重创,完全不由自己掌控。故事的转折发生在2016年,美国总统大选期间,Facebook被外界质疑利用算法操纵选举结果,“剑桥分析”事件则直接将马克·扎克伯格送上听证会。面对各方抨击,Facebook宣布减少新闻内容的比重。2020年,Facebook进一步强化相关举措,大幅减少新闻内容和政治内容的推送。

这不只是Facebook一家平台的转向,而是社交媒体的整体趋势。算法的调整使新闻类内容得到越来越少的曝光,这对依赖社交媒体流量的媒体打击严重,由此造成行业性的集体困境。2023年,BuzzFeed创始人乔纳·佩雷迪宣布关停旗下新闻业务BuzzFeedNews,VICE宣布关闭新闻品牌VICEWorldNews,其主站也正在计划进行破产申请。VoxMedia、Insider、ABCNews等媒体都进行了不同程度的裁员。

这些媒体的共同问题在于,并没有通过强化付费墙和订阅业务来积累起用户基底。在大浪来临之时,面对巨额的流量和广告收入,没有人会认为这是一个问题。但当潮水退去,才能发现谁在裸泳。

作为对比,老牌媒体《纽约时报》在BuzzFeed等新贵风头正劲的时候,因对互联网适应迟缓而被业界看衰,甚至被视为要被革命的代表。在BuzzFeed的刺激下,《纽约时报》被迫转型,以适切数字化新闻的大背景。但这种步调并不急促,它把自己的内容置于付费墙之后,通过深耕内容来吸引订阅用户,反而成为能够熬过周期的资本。

在充满泡沫、浮光掠影的流量时代,以核心读者为基底,与读者建立更紧密的连接变得前所未有的重要。越来越多的新闻媒体认识到这一点,并由此催生出三种新趋势:

第一,利用新的媒介形式建立与读者的直接联系。近年来,播客和RSS阅读开始兴起,许多媒体推出自家的RSS订阅服务和播客品牌,旨在更直接有效地与读者建立紧密联系,强化媒体品牌并提升商业价值;

第二,更加专注本地内容,而非全球性的热点话题。例如,传媒集团MvskokeMedia将编辑策略调整为专注本地社区报道,体现对核心读者的关注;

第三,加强报道透明度和公开性,一方面帮助读者理解报道理念,另一方面也反向了解读者更需要怎样的新闻报道。比如檀香山公民报(HonoluluCivilBeat)在所在地区举办类似于快闪活动的“弹出式新闻编辑室”(pop-upnewsrooms),加强与读者的沟通。

(二)“短视频新闻业”兴起,受众注意力转移,传统新闻理念遭遇冲击
2023年,数据统计机构《新闻公报》(PressGazette)发布了一份千禧年以来成立的25家媒体资讯公司排名榜单,其中Facebook位居榜首,TikTok紧随其后。社交媒体的影响力不言而喻,以TikTok为代表的短视频平台的崛起,对新闻业发展趋势产生了深刻影响。

TikTok正迅速成为这个世界上最大的内容平台和流量基地之一。不仅大量年轻受众在该平台聚集,不同年龄段的受众注意力也逐渐转向短视频,而不再是新闻媒体所擅长的图文内容或严肃新闻报道。与受众注意力同步转移的还有广告收入和风险投资,它们同样流向了年轻用户更为关注的TikTok和Instagram平台。

不仅如此,一种新的新闻业态正在兴起:“TikTok新闻业”。当新冠疫情、俄乌冲突等重大新闻事件发生时,人们发现,主要信息源不再是新闻媒体,而是TikTok。大量即时、一手的视频内容在TikTok迅速传播,后者逐渐从一个娱乐性短视频平台,转型成为包含音视频内容的综合型内容平台,并成为互联网用户获取资讯的重要途径。对许多年轻受众而言,他们不是不看新闻了,只是不在新闻媒体上看新闻了。类似现象在国内也同样显著。

当新闻的主要载体从文字转向视频,这对绝大多数新闻媒体而言都是挑战。部分传统媒体积极求变,尝试融入短视频新闻生态。根据牛津大学路透新闻研究所发布的《2022年数字新闻报告》统计,约有一半(49%)的主流媒体机构会定期在TikTok上发布内容。作为老牌媒体代表,《华盛顿邮报》专门聘请第三方团队为自家TikTok账号制作内容;《洛杉矶时报》则组建了一个名为“404”的内容团队,基于年轻受众偏好进行实验性质的内容生产。

一些原生新闻媒体也从TikTok新闻业中涌现出来。例如,以短视频新闻起家的NowThis,已经拥有850万粉丝;西班牙内容公司Ac2ality以“在一分钟内讲述新闻”为核心理念,自2019年上线以来,在TikTok上已经积累了390万粉丝。

TikTok新闻业的崛起,意味着受众注意力焦点的转变。对新闻业造成的冲击一方面体现在广告收入流失,媒体生存环境恶化,尽管付诸努力融入短视频新闻生态,但传统新闻报道与视频媒介之间固有的不兼容性,使这种转型的成效受限。另一方面,短视频新闻的广泛影响使传统新闻理念遭遇冲击,新闻业奉为圭臬的“客观性”“真实性”等价值观不再被强调,快速、耸动、视觉冲击力成为新的制作标准,点赞和转发等数据成为衡量新闻优劣的新指标。“黄色新闻”获得越来越多的流量与受众,传统新闻的生存空间进一步受到挤压。

从受众角度来看,人们逐渐习惯于通过短视频这样的渠道获取新闻和信息,这在一定程度上也是受日益显著的“新闻疲劳”和“新闻回避”等现象影响。新闻回避由认知和情感两个因素驱动:认知方面表现为人们认为某些主题或事件报道过多,阅读这些新闻会导致疲惫感,且难以获得信息增量,进而产生“新闻过载”;而情感方面则是指人们会主动回避那些会引发负面情绪的新闻,如关于疫情、暴力事件和自然灾害的报道。

根据路透新闻研究所与牛津大学发布的报告,2017年,29%的受访者表示他们会“经常或有时避开新闻”,到2019年,这一数字上升至32%。2020年新冠肺炎疫情爆发后,人们对新闻的需求短暂激增,但新闻回避的现象很快反弹,59%的人表示“有时或总是积极地回避新闻”。受众的信息接收习惯和心态变化,成为新闻业不得不考量的因素,也成为新闻媒体转型路上的阻碍。

(三)关停、裁员成为常态,新闻从业人员积极求变
三年的新冠疫情,对全球经济产生了巨大冲击,新闻业也无法置身事外。

新闻机构关闭成为常态。国外媒体包括BuzzFeed、VICE等一众数字媒体关闭旗下新闻业务,以及《利沃尼亚观察者报》(TheLivoniaObserver)这类纸质刊物实质性停刊。国内的情况也不容乐观。清华大学新闻与传播学院等机构联合发布的《传媒蓝皮书:中国传媒产业发展报告 (2022)》显示,新冠肺炎对传媒产业部分领域的影响仍在延续,传统新闻业广告收入持续下滑,广告主缩减对期刊、报纸等媒体的投放预算。国内报业广告和发行收入大幅下跌,电视广告市场发展疲软且下滑趋势严重。2020-2023年间,包括《城市画报》《东南快报》在内的数十家报纸宣布休刊或停刊。

新闻从业人员收入显著下降。根据《新闻公报》(PressGazette)的统计,经济不确定性影响了约三分之二的新闻工作者的工作。超过80%的受访者是全职新闻工作者,其中大多数 (71%)的年收入未达到10万美元,自由撰稿人的稿费更是平均不足300美元。

裁员成为媒体机构的主要基调。根据不完全统计,自2020年以来,数十家媒体宣布了裁员计划。BuzzFeed因计划采用AI生成测验类内容而裁减一定比例的员工,2023年4月20日,BuzzFeed创始人再度宣布关闭旗下新闻业务,裁退约180名员工,涉及内容、技术、行政等部门,占总数的15%。根据福布斯的统计,自2023年1月至今,三十余家报纸及媒体机构进行了不同程度的裁员,最近一次发生在6月7日,《洛杉矶时报》宣布,由于“经济环境和新闻行业的独特挑战”,将裁减新闻编辑室的74名员工。

全球经济滑坡与技术冲击,正在使新闻业面临双重危机,而新闻记者的生存状况堪忧,也与新闻机构应用新技术密切相关。自动化报道和自动编辑系统的引入,在解放一部分人力的同时,也导致部分从业者成为冗员。媒介技术的迭代并未带来劳动关系的进步,这在内容产业中体现得尤为明显。2023年上半年,一场罢工行动正在好莱坞持续上演,影响到多部在播剧集。罢工事件背后,即是以Netflix为代表的流媒体平台对剧集生产方式和播出形式的改造,挤压着编剧的生存空间。技术机制的替代效应,也同样冲击着新闻业。

面对有限的生存空间,许多新闻机构和新闻工作人员开始将重心转向社交媒体和短视频平台。例如,在TikTok和YouTube上开设频道、发布视频内容,以吸引年轻受众,同时通过广告分成模式增加收入。另一方面,新闻记者通过Twitter、Linkedln等社交平台,分享知识和见解,建立个人品牌和影响力。

涌现:AIGC正掀起一场
新的技术和产业革命
AIGC,即利用AI自动生成内容(AIGeneratedContent)。它并非新兴事物,最早可追溯到1957年莱杰伦·希勒(LejarenHiller)和伦纳德·艾萨克森(LeonardIsaacson)完成的人类历史上第一支由计算机创作的音乐作品,之后几十年也不断有AI生成模型、AI生成作品出现,但2022年才真正算是AIGC的爆发元年。AIGC的意义,并不仅仅是技术生成内容,而是AI具有了像人类一样的生成创造能力。得益于无限的创造潜力和未来应用空间,AIGC正在掀起一场新的技术和产业革命,推动人工智能迎来下一个时代。

(一)大模型是AIGC爆发的基石
随着2010年深度学习问世,人工智能的发展推进了第三次高潮,而大模型将这次高潮带到了新的阶段。2017年谷歌在《AttentionisAllYouNeed》一文中发布了具有里程碑意义的Transformer算法,虽然仍是深度学习的延续,但是它使得深度学习模型参数突破了1亿,Transformer取代RNN、CNN进入大模型时代,这无疑是一个重大的里程碑。

Transformer是一种基于自注意力机制的神经网络模型,最初用来完成不同语言之间的文本翻译任务,主体包含Encoder和Decoder部分,分别负责对源语言文本进行编码和将编码信息转换为目标语言文本。而后基于Encoder和Decoder,大模型的发展大致走上了三条路:第一条是舍弃Decoder部分,仅仅使用Encoder作为编码器的预训练模型,最出名的代表就是Bert家族;第二条是通过舍弃Encoder部分而基于Decoder部分的GPT家族;第三条是Encoder和Decoder都使用的谷歌T5大模型路线。

AI大模型,又称为预训练模型、基础模型(foundationmodel),即基于大量数据训练的、拥有巨量参数的模型,可以适应广泛的下游任务。这些模型基于迁移学习的思想和深度学习的最新进展,以及大规模应用的计算机系统,展现了令人惊讶的涌现能力,并显著提高各种下游任务的性能。鉴于这种潜力,大模型成为AI技术发展的范式变革,许多跨领域的AI系统或产品服务将直接建立在大模型上。具体到AIGC领域,AI大模型可以实现多任务、多语言、多方式,在各种内容的生成上将扮演关键角色。按照基本类型分类,预训练模型包括自然语言处理 (NLP)预训练模型、计算机视觉(CV)预训练模型、多模态预训练模型。这三类模型在新闻业等领域,均有较为广泛的应用前景。

为什么说大模型是AIGC爆发的基石?是因为大模型引发了AIGC技术能力的质变。虽然过去各类生成模型层出不穷,但是使用门槛高、训练成本高、内容生成简单和质量偏低,远远不能满足真实内容消费场景中的灵活多变、高精度、高质量等需求。大模型解决了以上的诸多落地问题。比如,ChatGPT可以同时为不同国家、不同文化背景、不同专业领域和年龄阶层的人群提供优质的文字内容生成服务,在此之前是难以想像的。ChatGPT也展示了大模型带来的超越文本生成本身的神奇能力。ChatGPT、GPT-4、Bard、PaLM、LLaMA等带来了当下的大模型盛世,也带来了AGI的曙光。

总的来看,AIGC在2022年的爆发得益于大模型技术。拥有通用性、基础性、多模态、参数多、训练数据量大、生成内容高质稳定等特征的AIGC大模型成为了自动化内容生产的“工厂”和“流水线”。

(二)产业生态是AIGC发展的保障
此前AI产业发展缓慢的状况,与没有建立较为成熟的产业体系密切相关。任何成熟的行业都有较为完整的上下游产业生态体系,比如汽车行业,全球的发动机、变速箱等核心零部件厂商只有那么几家,面向消费者的汽车厂商可以有很多家。而此前AI行业,从基础的模型研发到产品服务上线销售,每家企业似乎都要覆盖全产业链的事情,成本投入和利润回报很难平衡,

行业发展陷入艰难困境。此前AI模型缺乏通用性是核心问题,而目前基于大模型,AIGC产业生态体系已经初步形成,呈现为上中下三层架构。

第一层,为上游基础层,也就是由大模型为基础搭建的AIGC技术基础设施层。由于大模型的高成本和技术投入,因此具有较高的进入门槛。以2020年推出的GPT-3模型为例,AlchemyAPI创始人ElliotTurner推测训练GPT-3的成本可能接近1200万美元。因此,目前进入预训练模型的主要机构为头部科技企业、科研机构等。

在AIGC领域,美国的基础设施型公司(处于上游生态位)有OpenAI、Stability.ai等。因为有了基础层的技术支撑,下游行业才能如雨后春笋般发展,形成了目前的AIGC商业流。

第二层,为中间层,即垂直化、场景化、个性化的模型和应用工具。预训练的大模型是基础设施,在此基础上可以快速抽取生成场景化、定制化、个性化的小模型,实现在不用行业、垂直领域、功能场景的工业流水线式部署,同时兼具按需使用、高效经济的优势。以大模型为基础,模型即服务(Model-as-a-Service,MaaS)成为现实,它实现了AI从“手工作坊”到“工厂模式”的转变。AI大模型具有更强的通用性和智能程度,MaaS为下游应用提供安全、高效、低成本的模型使用与开发支持,能够大规模地在产业中落地应用,更广泛地赋能各行业应用,带来全社会的生产效率提升。OpenAI的CEO山姆·奥特曼曾明确指出,中间层是未来AI创业的核心阵地。

比如基于ChatGPT开放的API接口,产生了很多应用于金融领域、医疗领域的大模型或应用工具。JasperAI便是依靠GPT-3自动生成创意营销内容,在18个月里从白手起家化身为独角兽。还有在StableDiffusion开源之后,有很多基于开源模型的二次开发,训练特定风格的垂直领域模型开始流行,比如著名的二次元画风生成的Novel-AI,还有各种风格的角色生成器等。

第三层,为应用层,即面向C端用户的文字、图片、音视频等内容生成服务。在应用层,侧重满足用户的需求,将AIGC模型和用户的需求无缝衔接起来实现产业落地。基于GPT-3大模型的NotionAI便是这样的产品,可以满足用户的专业文本内容生成需求。以StableDiffusion开源为例,它开放的不仅仅是程序,还有已经训练好的模型,后继创业者能更好的借助这一开源工具,以C端消费级显卡的算力门槛,挖掘出更丰富的内容生态,为AIGC在更广泛的C端用户中的普及起到至关重要的作用。现在贴近C端用户的工具越发丰富多样,包括网页、本地安装的程序、移动端小程序、群聊机器人等,甚至还有利用AIGC工具定制代出图的内容消费服务。

目前,从提供大模型的基础设施层公司到专注打造AIGC产品和应用工具的应用层公司,AIGC生长出繁荣的生态,技术创新引发的应用创新浪潮迭起,并且技术赋能千行百业。随着数字经济与实体经济融合程度不断加深,以及互联网平台的数字化场景日趋丰富,人类对数字内容总量和丰富程度的整体需求不断提高。AIGC作为当前新型的内容生产方式,已经率先在新闻传媒、电商、影视、娱乐等数字化程度高、内容需求丰富的行业取得重大创新发展,市场潜力逐渐显现。与此同时,在推进数实融合、加快产业升级的进程中,金融、医疗、工业等各行各业的AIGC应用也都在快速发展。

(三)场景应用创新、具身智能、能力平权是AIGC的未来面向
场景应用创新是AIGC未来的发展路径。任何新兴技术只有在具体的场景中落地应用,产生经济和社会价值,才能获得广泛应用。同时在广泛的应用之中,技术才能不断迭代创新发展。这就形成了“场景应用和技术迭代”的飞轮效应。2022年科技部先后发布《关于支持建设新一代人工智能示范应用场景的通知》、《关于加快场景创新以人工智能高水平应用促进经济高质量发展的指导意见》,首批支持建设智慧农场、智能港口、智能矿山等十个示范应用场景。通过应用牵引推动人工智能技术落地已经成为行业共识。目前,OpenAI的战略也是尝试建立应用生态,将大模型落地到各行各业之中。

场景应用创新也代表着未来AIGC会更加垂直化和轻量化。第一,大模型虽然是通才,但它缺乏行业深度。其未来的发展趋势可能是六个方面的“垂直化”,包括行业深度化、企业个性化、能力专业化、规模小型化、部署分布化以及所有权私有化。第二,未来AI要嵌入到社会生产生活的各个领域,尤其是移动端设备和嵌入式设备上,即要进行本地化部署。而目前,大模型对硬件的算力和内存有很高要求,而移动端设备或者嵌入式设备往往算力有限,因此,模型轻量化会是未来AIGC发展的一个重要方向。

具身智能是AI发展的必然形态。具身智能是指AI不仅仅是数字化或虚拟的,还在物理环境中具有实体形态的存在,例如机器人或其它能够与真实世界互动的装置。真正的智能和学习需要与物理世界的交互,这是因为大多数生物智能的进化都与它们的环境有直接的联系。具身智能可以通过与环境的交互来更好地学习感知和行为。与此类似的观点,便是一些学者认为ChatGPT未来无法实现超人工智能,因为它们缺乏与真实世界的交互能力。因此,具身智能被认为是通往通用人工智能的关键钥匙,“具身智能”机器人更是人工智能的终极形态

2023年7月,AI科学家李飞飞带领的团队发布了具身智能最新成果,他们将大模型接入机器人,把复杂指令转化成具体行动规划,人类可以用自然语言给机器人下达指令。更重要的是,通过将LLM(大语言模型)+VLM(视觉语言模型)结合在一起,机器人与环境进行交互的能力进一步提升,无需额外数据和训练便可完成任务。

能力平权是AIGC发展的必然结果。目前,AIGC的发展已经赋予了用户更多的创作权力和自由。比如普通人就可以借助AIGC创作小说、音乐作品、3D内容等,一切皆可基于输入词按需生成。不仅如此,未来人人都可能像钢铁侠那样拥有自己的“贾维斯”--个人智能助理。2021年,微软在GitHub首次引入了Copilot(副驾驶)的概念。GitHubCopilot是一个辅助开发人员编写代码的AI服务。2023年5月,微软在大模型的加持下,Copilot迎来全面升级,推出Dynamics365Copilot、Microsoft365Copilot和PowerPlatformCopilot等,并提出“Copilot是一种全新的工作方式”的理念。工作如此,生活也同样需要“Copilot”。出门问问创始人李志飞认为大模型的最好工作,是做人类的“Copilot”。AIGC大模型或会成为每个人的智能助理,让每个人都能享受到AIGC技术红利。

“供给侧改革”之外:
AIGC为新闻业带来了什么?
全球经济的整体衰退、新技术的替代效应、短视频的冲击、来自社交媒体的流量缩减等背景,致使新闻业面临困境。在这种情况下,AIGC的出现对新闻生产乃至整个新闻业来说可能是一道曙光。那么,AIGC会给新闻业带来哪些新的可能?它会是困境之中的一种出路吗?

(一)AI辅助新闻生产不是新事物
在探讨AIGC所带来的变革之前,回顾新闻业的发展历史,可以看到AI介入新闻业尤其是新闻生产环节并非没有先例。过去十余年,由人工智能引发的新闻业创新浪潮可以分为三个阶段:自动化报道阶段、增强报道阶段和生成报道阶段。

第一阶段,人工智能自动化报道的阶段。在这个阶段,主要是利用AI的自然语言生成(NLG)能力,进行新闻的自动化报道。美联社、路透社、彭博社、法新社等媒体机构都有代表性的实践。自动化报道利用程序自动化生成文本内容,在报道效率和准确性方面具备优势,但由于缺乏思考能力和共情能力,难以写出与人类记者相媲美的报道,因此仅适用于特定领域,如财经、体育等可模板化生产的新闻类型。

在应用方面,例如路透社开发的名为“AI新闻生产线”的新闻自动生成系统,可以生成股票、体育和天气等类型的新闻;《华盛顿邮报》使用名为Heliograf的自动化写稿机器人,可以生成科学、政治和体育等领域的简单新闻报道;日本NHK电视台上线的自动写稿系统,在2011年3月的东京大地震报道中表现突出。腾讯2015年推出的DreamWriter和新华社的快笔小新等产品,则是国内在自动化报道方面的代表性实践。2018年全国两会期间,新华社推出的“媒体大脑”从5亿网页中梳理出全国两会舆情热词,并生成发布全球首条由机器生产的两会视频新闻,仅耗时15秒。

第二阶段,人工智能增强新闻报道的阶段。这一阶段着重运用机器学习和自然语言处理 (NLP)技术,分析数据并揭示相关趋势。例如阿根廷《国家报》(LaNación)自2019年起开始使用人工智能来支持数据团队,后与数据分析师和开发人员合作,建立AI实验室以进一步强化AI应用。

AI在舆情分析方面的应用,同样是人工智能增强新闻报道的例子。在舆情分析环节,AI可以辅助完成情感分析、主题检测、预测与趋势分析等任务,帮助组织更好地理解公众观点与态度,以应对复杂的舆情环境和市场环境。例如,美联社与NewsWhip合作开发的应用,可以帮助专业人员追踪内容传播情况,分析内容将如何推动会员和客户的社交参与,从而调整内容策略,以更好地满足用户需求。也有媒体利用AI的数据能力进行内容优化,如福布斯于2019年推出AI内容发布平台Bertie,可以生成更具吸引力的标题,并针对报道内容进行自动配图,以优化传播效果;《华盛顿邮报》也持续探索将AI纳入业务的实践,比如推出ForYou推荐系统,以及用AI模型检测订阅倾向和用户流失情况。

第三阶段,生成式人工智能(AIGeneratedContent)以多模态生成能力,参与新闻生产的阶段。ChatGPT、谷歌Bard、微软NewBing等产品的技术基础是能够生成叙事文本的大型语言模型(LLM),相较仅适用于财经报道、体育报道等领域的自动化报道阶段,AIGC可以进行更长篇幅、质量更高的报道撰写,并可以根据指令模仿特定作品风格。AIGC的多模态生成能力还带来了新闻报道可视化的诸多新可能。目前新闻业尚处于这一阶段,相关实践仍待深化,但可预见的是,AIGC将影响新闻采集、生产和呈现等环节,进而改变整个新闻业的格局。

(二)AIGC将实现新闻业“供给侧改革”
文生文、文生图、文生音视频、文生代码等多模态内容,都属于AIGC,即人工智能生成内容的范畴。传统内容生产模式,如UGC、PGC等等,主要区别在于作者的专业程度和构成属性,但本质上都是人作为主体来产出内容,而AIGC则是由AI来产出不同形式的内容。

AIGC对于新闻业的影响主要集中于新闻生产阶段。随着ChatGPT等AIGC技术能力的提升以及应用程度的加深,它对于新闻业的影响也会日益深化。目前的应用实践表明,AIGC对新闻业的影响,主要包括以下几个方面:

首先,新闻信息的采集与处理,优化生产流程。

借助plugins等插件,ChatGPT可以快速抓取和采集海量数据,并进行自动处理,如快速浏览文本和生成摘要,供记者进一步分析。这种能力提供了一种提升信息获取效率的可能,在资料检索阶段,记者和编辑无需阅读大量全文资料,而可利用ChatGPT的数据分析和语义分析能力生成摘要,快速获取核心信息,以提高工作的效率。ChatGPT的语言生成能力还可用于翻译跨语言文本,方便记者和编辑获取不同语种的资料与信息。同时,AIGC工具能辅助记者进行采访音视频内容识别与整理,提高生产力并优化创作流程。根据我们所做的调研,“进行资料检索”和“翻译内容”是目前媒体从业人员最多使用AIGC的两种用途,分别占54.8%和44%。

利用AIGC增强采集和处理信息的能力,将在新闻报道中发挥越来越关键的作用。英国《金融时报》总编辑RoulaKhalaf指出,新闻编辑室应当建立一支AI技术团队,协助记者完成数据挖掘、内容分析及翻译等任务,《金融时报》已经在部署系列课程,以提高记者利用生成式AI挖掘故事的能力。

其次,新闻内容的生成,提升报道效率。

ChatGPT具有较强的学习能力和文本生成能力,在联网之后,还能迅速采集互联网资料进行新闻内容的生成。通过提示词(prompt)的设置,ChatGPT还可以生成特定风格的新闻报道。除此之外,ChatGPT可以应用于生成访谈提纲、文章框架和标题等内容,还能将新闻报道翻译成多种语言,打破语言边界,将新闻传播给多样化受众。

部分媒体已将AIGC纳入到新闻内容的生产流程中。如BuzzFeed将ChatGPT用于测验类内容的生成;2023年情人节前,《纽约时报》使用ChatGPT创建了一个情人节消息生成器,用户只需要输入几个提示指令,程序就可以自动生成情书;德国出版集团AxelSpringer和英国出版商Reach,近期也在地方新闻网站上发布了由AI撰写的文章。

全球首个完全由人工智能生成新闻报道的平台NewsGPT.com也已经上线。根据声明,该网站没有人工记者,由NewsGPT实时扫描、分析来自世界各地的新闻来源,包括社交媒体、新闻网站等,并创建新闻报道和报告。其创始人声称,NewsGPT“不受广告主、个人观点的影响”,7*24小时提供“可靠的”新闻。

最后,新闻报道的多模态呈现,催生“互动新闻”等新闻类型。

随着技术能力的提升,GPT-4已经具备多模态生成能力,除了文生文、文生图,未来还可能生成更多媒介形式。同时,借助Midjourney等AIGC工具,目前也已经实现文本生成图片、音频、代码、3D内容等多模态内容,这为新闻内容的生成创造了新的可能。新闻业曾经追求的“媒介融合”以及“全媒体记者”,现在因AIGC的出现与应用而见到曙光。《纽约时报》于2012年制作的多媒体报道专题《雪崩》,包含图片、影像、数据、3D内容等形式,耗时6个月时间,动用11人团队花费25万美元才完成,而AIGC的多模态生成能力,将极大降低类似内容的生产成本和门槛。

同时,得益于ChatGPT的即时互动能力,可以用于开发针对于新闻业的对话机器人,将其融入到新闻报道中,即时回答读者的提问并且根据数据资料提供补充信息。这可能拓展出一种“AIGC互动新闻”的内容形式,强调与读者互动性,通过不断的提问与回答,呈现完整的新闻图景。AIGC还可以增强“虚拟主播”等技术形态,优化新闻呈现效果。

在广告营销内容方面,AIGC也表现出强大的生成能力,例如使用ChatGPT编写广告文案或利用Midjourney等产品直接生成广告内容,提升创建效率。此外,ChatGPT还可用于分析数据集,帮助广告主了解消费者的行为模式和市场趋势,以优化广告的投放效果。AIGC有望实现数字营销领域的变革。

(三)客观认识AIGC对新闻业的作用
总体而言,以ChatGPT为代表的AIGC技术在新闻信息采集、内容生成以及多模态呈现方面,具有提升效率甚至实现变革的潜力。未来,随着技术能力的进一步提升以及在新闻业的应用深化,AIGC将替代部分常规的模式化内容生产环节,将记者和编辑从消耗时间与精力的繁琐工作中解放出来,专注于更具创意的工作。然而,在这个过程中,“技术替代”导致的人力缩减问题不可避免,因此新闻从业者在新技术环境下的生存状况值得关注。

AIGC凭借强大的内容生成能力,有望实现一场新闻业的“供给侧改革”。但就现实应用情况来看,“改革”还为时尚早,目前ChatGPT等工具主要用于提升内容生产的效率,是自动化报道的“升级版本。由于其仍不具备共情、思考、常识判断等基础能力,AIGC并不能真正用于深度报道的撰写,而是在特定的领域如体育、股票方面,以及“边角料”如测验内容的生成方面有所应用。正如中国信通院云大所人工智能部副主任曹峰所评价,ChatGPT目前仍然无法代替具有高要求、高限定场景下的写作需求。从业界实践也可以看出,在ChatGPT大火之后,虽然不少媒体机构都进行了相关尝试,但并没有哪家权威媒体真正将ChatGPT应用于新闻报道的生产流程中。包括我们的调研结果也显示,仅有38.1%的新闻媒体机构,正在积极使用类似ChatGPT这样的AIGC工具。

这其中存在几个方面原因,包括:

内容可读性差。ChatGPT虽然能够快速基于提示生成内容,但可读性较差,其生成的内容更像是说明文,不具备思想性和阅读趣味性。新闻是对新近发生事实的报道,读者虽然想快速了解身边环境动态,但相比起枯燥乏味的“说明文”,更愿阅读可读性较强的新闻报道。可读性差的部分原因在于,ChatGPT缺少分析能力和调查能力,也不能进行与人类同样的原创表达,因此无法提供对事件的深入看法,只能堆叠无深度的“片汤话”。2023年4月18日,公众号《每日人物》发布了一篇题为《这是我们第一篇完全由ChatGPT写作的稿件》的文章,由记者输入提示词,内容全部由ChatGPT生成。但无论是从实际文本还是读者反馈来看,这篇文章都不能比拟人类作者的水平,“索然无味”“小学生作文”“套路感”“生硬”“翻译腔”等关键词在评论区频频出现。与ChatGPT合作的人类作者也表达了对于此次合作的感受:“绝对称不上愉快,甚至可以用痛苦形容。”

信息源混乱。AIGC的技术原理是大模型,由海量数据组成的数据集构成了AIGC的模型训练样本。但是,这些数据中往往包含了书籍、媒体报道、学术期刊,也包括了自媒体文章、广告营销文案、社交媒体内容,形式繁杂,甚至可以用“鱼龙混杂”来形容。对于专业媒体来说,其发布的新闻报道既要对读者负责,也要为机构声誉负责,信息源混乱的AIGC显然不是理想的选择。如彭博传媒首席数字官JuliaBeizer所评价的,媒体的定位是为读者提供基于事实的信息,但AI并不足以作为准确的信息源。

胡乱编造信息。“机器的幻觉”这个概念,用以形容AIGC“一本正经地胡说八道”的能力。“幻觉”一词源于心理学上的精神疾病“虚构症”(Confabulation),指个体会因担心对方失望或避免显得自己愚蠢而编造内容来回答问题。由于程序的设定,ChatGPT等工具必须对用户的提问给出答案,如果遇到训练数据集没有包含这一问题或者数据集有误的情况,ChatGPT就会编造出一个错误的答案。同时,它缺乏基本的常识和判断能力,因而无法意识到给出的这个答案是错的。如果将其应用于新闻报道,需要匹配人工校对和核查,这反而增加了人类的工作量。2023年,美国科技新闻网站CNET.com一度上线了几十篇由AI生成的文章,尽管网站编辑声称文章在发布之前都经过了“核查和编辑”,但是很快读者发现,这些文章中有大量基础性错误,并且其中一半都存在抄袭和剽窃的问题。

因此,我们需要客观认识ChatGPT对于新闻业的作用,AIGC将革新甚至是取代新闻业的说法,其实还为时尚早。作为内容产业,新闻业对于优秀的人才需求始终不会改变,基于一手采访的深度内容将会变得越来越重要。正如《金融时报》人工智能编辑马杜米塔·穆尔贾(MadhumitaMurgia)所言,生成式AI工具虽然能够综合信息、进行编辑,但是并不能输出原创内容,也不具备分析能力,“没有什么能取代有原创能力的人”。

达克摩斯之剑:
AIGC会是新闻业的丧钟吗?
对于新闻业来说,AIGC将在内容生产环节掀起一场供给侧改革。然而,鉴于当前的AIGC技术水准,“改革”还远未到来。AIGC相当有限地被纳入到新闻业的生产实践中,并没有真正开始发挥价值。因此,讨论AIGC对于新闻业的挑战其实也为时尚早。但技术一直在迭代,从技术发展史来看,我们不能轻视任何一种技术引发的变革效应。当未来更加先进的AIGC被纳入到新闻业并得到普遍应用时,将会给新闻业带来何种挑战?这是我们需要思考的问题。

(一)破坏新闻生产的场域效应,冲击“客观性”等新闻理念
AIGC介入到新闻业的内容生产环节,在提升效率的同时,势必带来破坏性的影响。

ChatGPT应用于新闻生产过程中,在新闻事件发生之后,程序将相关信息进行抓取、分析、汇总后,快速产出一篇拼贴的内容,效率被发挥到极致。但是,对于新闻业而言,原本处于新闻场域的多方力量都会对新闻报道内容产生影响,因此一篇报道的诞生,并非仅仅是记者个人的灵感迸发,而是多方力量博弈平衡的产物,也是新闻媒体机构化运作的结果。在这个过程中,记者也接受新闻专业主义的规训,尽可能确保报道的平衡与真实。但是当生成主体变成ChatGPT,这种新闻生产的“场域效应”就逐渐消失。

与之对应,如华南理工大学吴小宁教授在论文《ChatGPT信息“革命”对新闻业的冲击与挑战》所提到的,在这个过程中,新闻事实在历史文本的重要性提高。由于ChatGPT的原理是利用现有内容作为训练数据集,一个现象或事件的影响时间越长,相关内容就越多,就被更容易被抓取和汇集到机器生产的新闻内容中。同理,某些新闻人物和新闻事件,如果具有更高的知名度,也就更容易被人工智能抓取和再次呈现,由此可能会形成“信息极化”效应,并形成由人工智能制造的“信息茧房”。

同时,信息抓取过程本身就涉及到法律和道德问题,比如AIGC抓取网络内容并作为训练数据集是否符合法律要求?被抓取内容的主体(特别是新闻记者等内容创作者)是否应该得到经济补偿?2023年2月,图片供应商Getty就以“侵犯版权”的理由起诉了StabilityAI。这些问题,至少目前尚处于迷雾阶段。

除此之外,ChatGPT式的新闻生成模式,将会冲击既有的新闻理念。新闻专业主义强调真实性、客观性、公共性等维度,这些理念是在新闻实践中逐渐形成的一套操作规范,以确保新闻报道不偏离真相。在以人为生产主体的传统新闻业中,记者会受到专业主义和职业素养的规训,在个人的生产实践中奉行这些观念。但ChatGPT没有主观意识,无法理解这些新闻理念背后代表的含义,而这些理念也无法被作为一串prompt(提示词)被转化为ChatGPT所能理解的“语言”。

有观点认为,ChatGPT摆脱了个人主体的主观性,似乎更能进行客观、公正的报道。如同NewsGPT所标榜的,这家网站将客观真实地呈现新闻。但问题在于,算法本身仍有价值观,算法也会延伸现实世界的歧视现象,这是无法规避并且比人作为主体更难解决的问题。北京大学新闻与传播学院胡泳教授指出,新闻业的“客观性”由人和机构的声誉和口碑来背书,但算法的“客观性”把任何机构刨除,其背后的逻辑认为技术是中性的,不存在人的偏见,因此可以保证客观。但问题是技术从来都不是中性的,也缺乏人的判断,因此它并不是“客观性”的拯救者。

值得注意的是,ChatGPT对新闻生产的影响还体现在从业人员对ChatGPT的不规范使用,容易引发抄袭、信源不清等问题。而根据我们的调研,大部分(81.9%)媒体机构都没有出台ChatGPT等工具的使用规范和指导方针。这是需要重视的现实问题。

ChatGPT对于新闻生产的影响还将体现在新技术所带来的就业替代问题上。由于ChatGPT的内容生产效率更高,在特定报道类型上能够取代人工记者,这种现象正在密集地发生。例如,BuzzFeed在宣布用ChatGPT辅助生成测验类内容之后,紧接着就宣布了裁员计划。同时,在2023年5月发生的“好莱坞大罢工”运动中,如何避免AI取代人类编剧的工作,也成为参与运动者的核心诉求。虽然这两个例子不直接指向新闻业,但这种现象会很快随着ChatGPT更深入地应用于新闻生产中而发生。

(二)“劫持”流量,AIGC改变内容分发格局
当前,AIGC生成的信息比重尚低,但随着AI生成内容的广泛推广以及AIGC技术得到深度应用,内容分发领域将面临重大冲击。

在数字时代,在线新闻媒体的很大一部分流量源于搜索引擎,而生成式人工智能正逐渐成为搜索引擎的主要信息源。微软的Bing浏览器整合了ChatGPT,升级为NewBing;谷歌也宣布在搜索结果中将优先显示人工智能(如旗下的Bard)生成的内容。根据谷歌在2023年3月的测试显示,Bard仅提供基本答案和摘要,但并未附上新闻来源链接。

对搜索引擎来说,这是一众自然而然的“市场行为”,因为它能直接呈现整理过后的搜索结果,极大提升用户检索信息的效率,优化用户体验。然而,一旦形成这样的模式,即搜索引擎将更多流量分配给生成式人工智能的生成结果,更为深度、长篇的新闻报道内容将无人问津。

这不仅会影响流入新闻媒体的流量,还会显著削弱新闻媒体的收入。由于越来越多的用户直接从搜索页面获取所需内容,而不再点击进入新闻媒体的主页,依靠广告收入分成的新闻媒体的生存空间将受到压缩。以广告为核心的收入模式将面临巨大冲击,同时,媒体的订阅收入也将直接受损。

社交媒体同样受到影响。2023年上半年,BuzzFeedNews、VICE等数字媒体的倒塌已经印证了社交媒体的重要性,一旦这样的流量源头被掐断,依赖于此的媒体将会受到重击。诸如《纽约时报》《华尔街日报》等新闻媒体也都在Twitter、Facebook等社交媒体平台开设账号进行内容分发,当AIGC内容涌入到社交媒体上时,类似“新闻bot账号”的出现,也会夺走用户的注意力,用户倾向于选择获取快速、易得的新闻摘要,从而影响新闻媒体内容的曝光。

(三)受众4.0的诞生:从“新闻消费者”成为“新闻制造者”
对于新闻业而言,AIGC不仅将改变内容生产方式,同时也重构生产关系。

原因在于,作为一项底层技术能力,AIGC门槛相对较低,只要解决网络问题和账户问题,不仅新闻从业人员可以使用,普通用户也可以使用。对于前者来说,由于其专业化水平较高,考虑到可读性、生产时间成本等因素,对AIGC技术的接纳程度可能并不深入。而对于后者,即普通受众来说,由于没有类似的“专业包袱”,会更愿意使用相关技术。

在这种情况下,利用AIGC的生成能力,普通人也可以进行新闻信息的生成。例如,针对某一新闻事件,让ChatGPT快速生成一篇交代前因后果的新闻报道,也可以让ChatGPT生成近期发生的系列新闻的摘要,方便快速了解新闻。此外,还可以直接生成新闻评论等内容。

在这个过程中,受众不再仅仅是新闻信息的消费者,而是成为了新闻信息的创作者和生产者,由被动转成主动,从而实现了身份主体的转换。回顾技术发展史,互联网的出现已经实现过一轮转换。Web2.0时代,个人博客(Blog)、社交媒体等媒介形式的应用,使得普通人获得了“发表权”,即可以在网络上发表自己的各类观点。这扭转了前互联网时代传统媒体对发表权的独占局面。由于建立媒体机构、创建一份报纸或一家电视台的成本极高,从而形成了信息发布的高门槛,普通人很难有机会和足够的资本建立自己的渠道,而借助互联网和移动设备,每个人都成为了“新闻记者”,随时随地记录、随时随地发布。

如果说互联网改变了内容分发的格局,那么以ChatGPT为代表的AIGC技术则实现了内容生产的“平民化”,普通人借助AI的力量,跨越专业门槛,成为媲美专业人员的内容生产者,基于自身需求,进行定制化的新闻内容生成。而借助社交媒体,发行的成本同样可以忽略不计。

研究领域对于“受众”进行了分类,作为日常对话主体的受众是“受众1.0”,作为媒体内容读者和注意力商品的受众是“受众2.0”,在“人人都是新闻记者”的社交媒体时代,能够随时记录、随时发表的受众成为“受众3.0”。那么,步入AIGC时代,借助AI,获得媲美专业生产能力的受众,直接迈入了“受众4.0”时代。

这对新闻业的影响是深远的。受众拥有采集和生产内容的能力之后,可以更加独立自主地进行内容消费,对新闻媒体产出的讯息依赖程度降低,进一步降低后者的影响力和“把关人”地位。新闻业的边界将变得越发模糊,如何形成与普通创作者的差异化、强化专业边界,从业人员如何应对职业认同危机,将是新闻业必须直面的挑战。

(四)假新闻盛行引发的新闻业信任危机
AIGC实现了内容生产的平民化,但同时也可能导致谣言和假新闻的泛滥。

新闻记者作为内容生产主体,一方面受到所在媒体机构和生产机制的限制,另一方面受新闻专业主义的约束,在进行新闻生产的过程中,他们会注意遵循各种原则,以确保新闻报道尽量平衡、客观且真实。真实性是对于公开发布的新闻报道最基本要求,包括事实真实、细节真实和信源真实。

然而,在生产主体泛化之后,这些限制将不复存在,AIGC有可能成为生成假新闻和谣言的工具。2023年2月,关于“杭州市政府将取消限行”的“新闻稿”在网络上流传,后被发现是某小区业主利用ChatGPT生成,并被其他业主截图转发,导致错误信息被传播。类似的事件还有2023年4月18日流传的《杭州市政府关于调整楼市政策的通知》,该消息称杭州将于5月实行楼市新政,而后被证实是ChatGPT生成的假消息。这些假消息可能带来极高的政治风险和经济风险,损害相关主体利益,例如2023年5月,一篇由生成式AI撰写的假新闻“科大讯飞出现重大风险的警示文”引起广泛关注,导致科大讯飞公司股价大幅下跌。

在这些事件中,AIGC已成为造谣者的得力助手,它的生成能力使虚假信息传播和生产的成本降低,若不加以控制,由其生成的未经核查的虚假信息将严重污染信息生态系统,造成严重的社会影响。

AIGC在创建网站方面的能力,也可能被用于假新闻的传播。借助ChatGPT,只要具备基础编码能力,任何人都能创建一个虚假新闻网站。这也将污染信息生态,造成极大风险。同时,由于AIGC的特性,假消息流入内容市场后,如果不加筛选,有可能继续构成大模型训练的语料,导致谣言进一步传播和强化,形成更严重且持续的后果。假新闻的传播,将影响受众对于新闻的认可度和信任度,可能压倒事实、制造混乱,甚至将带来新一轮的新闻业信任危机。

AIGC时代
新闻业发展的6种可能
新技术的应用,往往会带来颠覆性的变化。正如媒介学者约书亚·梅洛维茨所言:任何一种媒介的介入,都会创造出全新的环境。尽管目前AIGC尚未在新闻报道中被大规模运用,但面对来势汹汹的AIGC浪潮,新闻业无法置身事外,势必也将被卷入其中,甚至被彻底重塑。

从历史发展角度来看,作为社会发展趋势的观察者和记录者,新闻业并不抵触新技术,反而会将其能力融入到自身发展之中,以实现自我革新。本报告认为,随着AIGC技术能力的提升以及应用的不断深化,新闻业将会出现以下6种可能性方向:

(一)媒体专用大模型将得到开发与应用
目前AIGC在新闻业的应用程度尚浅,关键原因在于其信息来源不明且内容参差不齐,既有权威期刊的文章,也有自媒体、营销号的文章,还有大量假新闻、假消息,这是因为目前大模型多采用通用的训练数据库,因而呈现出来的内容质量良莠不齐。对于注重细节严谨、信息准确、信息源清晰的新闻报道来说,这些都是阻碍应用的难点。

另一方面,新闻报道具有一定的表达规范和话语使用惯习。在这种情况下,开发针对新闻行业的专用大模型可能将成为一种趋势。其训练数据集均来自新闻媒体报道,并且可以追溯来源,以保证信息真实准确、来源清晰、减少偏见,并且在内容呈现方面更加符合新闻专业的表达规范。

目前大模型训练成本逐渐降低,大型媒体机构有可能将拥有自家专属的大模型。这种趋势可能不仅限于新闻业,对于行业边界清晰、对信息来源和内容呈现规范有要求的行业(如法律行业)来说,研发专用大模型而非使用现成的通用大模型将是一种发展方向。在这一方面已经有很多实践例证,比如7月20日上海AI实验室与中央广播电视总台联合发布的“央视听媒体大模型”,集合了媒体的海量视听数据与实验室先进算法和技术基础,提升视听媒体制作的质量与效率。

(二)事实核查与内容校对将成为关键角色
事实核查与内容校对在传统新闻行业具有举足轻重的地位,几乎所有的传统新闻编辑部都会设有专门的校验部门(copydesk)。然而,随着媒体数字化进程加速,核查与校对的重要性逐渐降低。一个很鲜明的例子是,近年来媒体进行大规模裁员时,核查与校对等部门往往是裁撤的重灾区,足以显示数字媒体时代对于核查与校对职能的忽视。

但是,随着AIGC的应用,事实核查与内容校对的角色将越来越关键。类似岗位将继续扮演“把关人”的角色,对AIGC生成的内容和细节进行校对与核查,以避免产生AIGC胡编乱造的情况,从而防止“机器的幻觉”等不可控的现象出现。面对愈加发达的技术,媒体也应加强与学术机构和科技公司的合作,提高识别错误内容的能力。

同时,由于AIGC的运作原理是对训练数据集中的内容进行重新组合拼贴,对于新闻业来说,报道的原创性是必须捍卫的底线。因此,核查与校对的指责也包括对AI生成的内容进行“查重”,对不规范引用的内容予以删除或进行来源标注,避免因“抄袭”引发的舆论风险,损害机构声誉,同时防止媒体伦理失范以及法律与道德等问题。

(三)新闻业的AIGC使用伦理、规范将建立
新闻业作为专业领域,有自身的专业主义和伦理、规范要求。针对AIGC这种新技术形态,相关的使用伦理、规范也应当建立,以在专业内形成统一的原则,便于从业人员遵守。这些伦理规范既包括基础性原则,如“使用ChatGPT生成的内容必须进行标注,确保读者知情”、“使用ChatGPT生成的内容,必须由人工进行核查与校对才可发布”,也包括一些具体性的操作规定,例如在一篇人类与AI共创的报道中,AI创作的内容不得超过一定的比例等等,以尽可能降低AIGC应用所产生的乱象。适用于AIGC时代的《新闻的十大基本原则》呼之欲出。

目前已有媒体开始推动此类实践,如科技媒体《连线》就制定了相关规定,对使用AI的目的及工作流程进行了明确界定,以确保内容质量。规范并非束缚,合理的规范将有助于技术更好地融入并发挥价值。规范确立的主体可能是行业协会,而每一家新闻机构结合实际经营状况,也会形成自身的相关规范与要求。除了伦理规范,帮助从业人员更好地了解与使用AIGC的指导手册和课程也同样重要。如何借助AIGC辅助自己的新闻报道实践,将成为未来新闻记者的关键能力之一。

(四)新闻分层,权威的专业新闻报道将更加重要
在AIGC时代,权威专业新闻报道的重要性将愈发凸显,重塑专业性将成为新闻媒体机构的重要使命和一条出路。AIGC在内容生成方面大大提升了效率,然而,机器生成的文字与人类撰写的内容存在差异,前者虽然快速且框架完整,却无法取代“好”的新闻报道,后者将始终拥有受众市场。这里所说的“好”,包含优秀的文笔、高度的可读性、极强的共情力……这些因素共同构成了触动读者的条件。

AIGC介入新闻生产,新闻事件发生时可以在第一时间迅速生成一篇要素完备的报道,将会满足受众基础的信息需求。然而,对于事件的深入挖掘及背景信息的补充,仍然需要人类记者深入现场,进行一手的采访和调查。因此,未来新闻类型会进一步发生分化,一方面,即时的事件性报道和资讯类报道将由AIGC完成,在这个领域,人类记者的空间将会越来越狭窄,另一方面,权威专业新闻报道和深度报道将变得更为重要,也将获得更多关注。

相应地,媒体机构、新闻记者与读者之间的联系也将愈发关键。AI作为生产主体的一个问题在于,它无法与读者建立起情感联系,大部分情况下,读者往往能清楚地意识到AI就是AI,是没有情感和意识的系统,这会削弱读者对内容的信任度,而这正是人类记者的机会所在。强化与读者的连接,打造机构品牌与记者个人品牌,将成为关键议题。

(五)新闻业会发生“本地化新闻”转向
由于AI大模型的训练原理,通用文本构成训练数据的主体,基于本地内容的文本量较小,即便纳入训练数据集,也容易被其它类型的信息淹没,因而AIGC在本地化内容生成方面表现欠佳。与此同时,受众对本地化报道的关注程度并未减弱,因此,AIGC时代的新闻业可能发生本地化转向的趋势。

数字媒体出现以来,对本地新闻的忽视日益明显。互联网的扁平化和低门槛特性,使得一个网站的潜在受众理论上是全世界的上网用户。对于在线媒体来说,为了提升网站内容流量和曝光度,在内容生产和呈现方面往往会采用全球化策略,尽可能将关注范围扩大,报道全世界范围内发生的重要事件。这种倾向反过来也影响到传统媒体,越来越多的地方性报纸在新闻采编中逐渐扩大全国性报道的比例。

与此同时,本地化新闻的报道逐渐被忽视。这也是受众产生“新闻回避”情绪的重要原因。受众对本地化新闻的需求未被满足,很多时候,受众只想了解自己身边在发生什么,并不想关注太多遥远的新闻事件。许多媒体注意到这一趋势,并将报道重点回归到本地化报道。这种转向趋势在AIGC时代将继续进行,越来越多的新闻媒体将专注于本地化新闻的报道。

(六)AIGC应用深化催生新闻类型创新
新闻业对于新技术的接纳,相对而言比较积极。新闻业擅于将各种新的媒介形态运用到新闻报道中,实现更丰富的呈现效果。例如,借助大数据和算法技术,数据新闻兴起,以客观数据的可视化呈现为特色;再如,借助多媒体技术,《纽约时报》对华盛顿州喀斯喀特山脉隧道溪发生的雪崩进行了全方位报道,上线数字化专题报道《雪崩》(SnowFall),包含文字、图片、影像、数据内容等多种媒介形式,被认为“重新定义了新闻报道”。

同样,通过吸纳AIGC技术的特点与优势,全新的新闻类型也将会涌现。较有可能性的创新之一是“智能互动新闻”,即报道主体聚焦新闻事件的核心,而读者可以随时通过附着在报道页面的对话框进行互动,了解新闻的背景性信息、事件的前因后果与历史脉络,甚至是最新事件进展等,受众与新闻报道的互动性将得到前所未有的增强。当然,这只是可能性之一,随着AIGC在新闻业应用的不断深化,未来或许会出现更有想象力的新闻类型和业态。

结语:
AIGC会取代新闻业吗?
德国学者斯托伯尔总结了技术进化的三个阶段:首先是“发明”,其次是“创新”,最后是“制度化”,即形成文化。概括而言,“发明”是从无到有的创造,“创新”则是基于发明的利用和改进。就目前的情形,AIGC还处于发明阶段,并正在迈向与各个领域融合的创新阶段。从技术发展史来看,任何技术被社会所接受、采纳并真正发挥作用,都需要一个漫长的过程。我们既不能低估AIGC可能引发的变革,也不能高估变革实现的速度。

AIGC正在推动新闻的采集、生产、呈现等环节实现创新,但是“颠覆”“变革”等还为时尚早。在我们的调研中,多数从业者(50.5%)也认定,对于新闻业来说,ChatGPT等工具更多是一种辅助型角色,只有10.5%认为这些工具是质量改进工具。AIGC对新闻业最根本的影响,是引发了新闻生产方式的变革,从而实现生产关系的重构。具体一点来说,AIGC提高了新闻生产的效率,并且降低了新闻生产的门槛,利用ChatGPT等AIGC技术,受众可以基于自身的信息需求,生成定制化的新闻资讯和评论。由此,传统的受众完成身份转换,由被动的信息消费者,转变成主动的新闻生产者,这将改变新闻业的格局和既有认知。这才是新闻业最应该警惕并需要应对的趋势。

当然,先进的技术或许会改变生产方式,但却改变不了责任所在。尤其对于新闻业来说,即便所有稿件都由AIGC生成,人类也将一直是AI背后的道德行为人和最终把关人。从这个角度出发,人类的责任将更重要。强化主体责任,加强核查,形成AIGC的应用伦理与规范也将越来越重要。

“新闻”一词,不仅仅指代我们能够读到的“新闻报道”,也指代着新闻业及其所承载的新闻传统,包括价值理念、操作规范、伦理原则等等。作为没有意识的主体,AI始终无法传承并遵循这些传统,而这些传统是新闻业得以存在及延续的安身立命之本。

ChatGPT也不会取代新闻记者,只是取代了部分他们的部分工作。经验丰富的新闻记者对新闻事件有高度的敏感性、洞察力和共情能力,能够提炼新闻价值,并以流畅的文字付诸于笔端。这些主观特质,都是ChatGPT难以取代的能力。大浪淘沙之下,优秀的新闻记者与权威的新闻机构,将会越来越重要。工具理性滥觞,势必应该坚守价值理性。对于新闻业来说,强化专业性和权威性,重视调查性报道、解释性报道,将是AIGC时代的一条出路。

很多人觉得,ChatGPT已经出现,那就让GPT写稿,甚至能取代新闻业。但这种观点,显然忽视了新闻业的复杂性及其所存在的意义。真正的新闻业是“船头的瞭望者”,维护公共利益,为民众表达诉求,这是新闻业的责任所在,也是一代代新闻人奋斗的出发点。技术工具无法理解这种激情,我们也不能企图将责任感和专业性转化成一行行prompt传递给ChatGPT。在这一点上,AIGC永远无法取代新闻业。

关注腾讯研究院公众号,回复关键词“新闻业2023”,即可下载PDF版报告全文。
项目策划:
杨健
撰写团队:
王焕超、胡晓萌
研究联系:
mcluhanwang@tencent.com
统筹支持:
张钦坤、付涛、周政华、刘琼、田小军、王强、井婷婷、刘金松、窦淼磊、郭晓静、石迪、张金平、曹建峰、陈孟、黄忻渊、王健飞、王枢、陈维、王维佳
调研支持:
腾讯研究院T-ask调研平台

来源:腾讯研究院
链接:https://mp.weixin.qq.com/s/fYidMeGHgl23jMzI99bcYQ
编辑:郑程程
729#
 楼主| 发表于 2023-8-31 23:22:17 | 只看该作者
【案例】
首批8个大模型将正式上线! 百度、字节、商汤、中科院旗下紫东太初等在列

百度、字节、商汤、中科院旗下紫东太初、百川智能、智谱华章等8个企业/机构的大模型位列第一批名单,可正式上线面向公众提供服务。

阿里通义千问、360智脑、讯飞星火等均不在首批获批名单中。

目前,百度文心一言已正式向全社会开放。经过《科创板日报》记者测试,用户已可以在App Store和安卓应用商店下载“文心一言APP”或通过文心一言官网直接体验。

据悉,百度还将开放一批经过全新重构的AI原生应用,让广大用户体验生成式AI的理解、生成、逻辑、记忆四大能力。

除了百度外,商汤大模型应用“商量SenseChat”、百川智能也通过《生成式人工智能服务管理暂行办法》备案,即日起全面向广大用户开放。其中,百川智能成立于2023年4月10日,由前搜狗公司CEO王小川创立,年内已相继发布了三款通用大语言模型。

而中科院旗下紫东太初也将于9月1日面向公众开放服务。

日前,国家网信办联合国家发改委、教育部、科技部等七部门公布《生成式人工智能服务管理暂行办法》,该管理办法自8月15日起施行。

多位业内人士向《科创板日报》记者表示,明确生成式AI实施算法的“备案制”,而不是此前预期的审核许可制,总体体现了意在促进人工智能产业发展创新的“呵护式”监管思路。

有接近监管的相关人士指出,该办法起草过程中始终把推进人工智能等新技术发展应用作为工作的重要出发点和落脚点,鼓励生成式人工智能技术在各行业、各领域的创新应用,以及生成式人工智能算法、框架、芯片及配套软件平台等基础技术的自主创新。

《科创板日报》记者从知情人士获悉,这次通过备案的首批八个大模型,将陆续面向C端消费者开放试用。

来源:财联社
链接:https://m.jrj.com.cn/madapter/fi ... 1020237805505.shtml
编辑:郑程程
730#
 楼主| 发表于 2023-9-2 17:08:26 | 只看该作者
【案例】
首批国产大模型“飞入寻常百姓家”

大模型的落地应用迎来关键节点。首批国产大模型产品昨天获批面向全社会公众开放服务,其中上海3家、北京5家率先上线,这意味着国产大模型从上一阶段的“出生潮”向新一阶段的“应用潮”迈出重要一步。

大模型“飞入寻常百姓家”,对用户意味着什么?对国产大模型企业又意味着什么?多位专家表示,“多模之战”正从拼参数走向拼应用,能建立起真实用户调用和模型迭代之间的“飞轮效应”,有利于真正服务国人。

首批8家获批,上海占据3席

昨天,首批国产大模型产品获批面向用户开放服务,包括商汤科技“商量”、百度“文心一言”、智谱AI“智谱清言”等。

百度最早于昨天凌晨宣布“文心一言”向全社会开放的消息,意味着用户无需内测邀请码,就能直接体验相关服务。与3月16日最早开启的内测版本相比,目前“文心一言”已迭代到3.5版本。“即使与3.0版本相比,新版本的训练速度提升了2倍,推理速度提升了17倍,模型效果累计提升超过50%。”一位百度内部人士透露。

在首批8家通过《生成式人工智能服务管理暂行办法》备案的大模型公司中,记者注意到,上海地区占据3席,分别是MiniMax的“ABAB”、上海人工智能实验室的书生通用大模型、商汤的“商量”。其中,“商量”于今年4月推出,是国内最早的基于千亿参数大语言模型之一,在向C端开放之前,其已在金融、医疗、汽车、地产、能源、传媒、工业制造等B端行业有了不同程度的落地应用。另两家大模型公司也都具备极强的技术实力。书生通用大模型体系由上海人工智能实验室发布,其中“书生·浦语”同样是千亿级参数的大语言模型。而MiniMax则是“新面孔”,是2021年12月在沪成立的一家大模型初创公司,今年6月刚刚获得超2.5亿美元的A轮融资,此次其自研的通用大模型“ABAB”获批面世。

北京地区除了百度外,抖音的“云雀”、百川智能的“百川”、智谱华章旗下的“智谱清言”以及中科院旗下的“紫东太初”也同样获批。有消息称,广东、安徽等省市的3家大模型公司也将很快面世。

“多模大战”将迎来应用层竞争

国产大模型“批量上市”,意味着“多模大战”正从上一阶段的“生出来”,走向“用起来”的新阶段。

步子迈得快一点的百度、抖音、商汤等企业,短短一天内已实现了手机端、网页端都可体验的“速度感”,“文心一言”甚至已迅速登顶苹果商店的免费App排行榜,从中可以窥见用户的热情。而“智谱清言”则在网页端和App端的基础上搭建了小程序,还给出了赛程设计、写作文等不同语境下的案例以及广告撰写、短报编写等不同对话参考。

在多位专家看来,除了商用之外,大模型面向普通人开放是一个重要的里程碑。数字商业分析师郝智伟认为,大模型在C端的应用可以被认为是赋能工具、生活助手,是“重要的效率提升工具”,可帮助用户更快速处理各类文本和信息、做Excel表格、进行简单的编程等,让生活和工作变得更便利。

而对于企业来说,大模型“飞入寻常百姓家”,则意味着更庞大规模的中文语料投喂和更丰富的原生应用场景。C端是大模型普及的基础,大模型只有走向全社会开放,才能完成大数据意义上的语料累积,达成深度学习并实现个体赋能。百度创始人、董事长兼首席执行官李彦宏就表示,当“文心一言”向数以亿计的互联网用户大规模开放服务后,就能够获得大量真实世界中的人工反馈,这将进一步改进基础模型,并以更快速度迭代,创造更好的用户体验。据悉,百度还将开放一批经过全新重构的AI原生应用,让用户充分体验生成式AI的理解、生成、逻辑、记忆四大核心能力。

郝智伟认为,面向全社会应用后,也意味着AI大模型开始从拼参数发展到拼应用,进入大规模可复制的产业落地阶段,下一阶段或将迎来应用层竞争。

备案制帮助大模型在实践中解决问题

大模型从出生到迅速在C端落地,也体现出监管的思维之变——从过去的“事后监管”变成了现在的“边跑边管”。

根据国家网信办4月11日发布的《生成式人工智能服务管理办法(征求意见稿)》,企业利用生成式人工智能产品向公众提供服务前,应当向国家网信部门申报安全评估,并按照《互联网信息服务算法推荐管理规定》履行算法备案和变更、注销备案手续。7月,国家网信办联合国家发展改革委、教育部、科技部等7部门公布《生成式人工智能服务管理暂行办法》,并从8月15日起实施。从一众大模型公司获批的时间来看,这离《办法》实施只隔了半个月。

有分析人士认为,采用“备案制”而非“审核制”,为技术和产业可持续发展创造了良好的土壤,有助于大模型先行落地应用,在实践中发现问题、解决问题。

据不完全统计,目前中国10亿以上参数规模的大模型已有近80个,大模型备案机制的建立和首批开放,从一定程度上建立起真实用户调用和模型迭代之间的“飞轮效应”。在复旦大学管理学院信息管理与商业智能系讲师李文文看来,开放公众服务后,企业下一阶段需要更加关注解决大模型的局限性问题,包括幻觉、生成内容的时效性、数据安全隐患等,从而以更合规的方式健康成长。

中经传媒智库专家张书乐认为,在政策扶持和产业加快升级的背景下,强大的中文语境和针对中文语境研发的大模型,有利于真正服务国人,并建立起自己的护城河。(徐晶卉)

来源:新华网
链接:http://sh.xinhuanet.com/20230901 ... d0f64ead5342/c.html
编辑:郑程程

发表回复

您需要登录后才可以回帖 登录 | 实名注册

本版积分规则

掌上论坛|小黑屋|传媒教育网 ( 蜀ICP备16019560号-1

Copyright 2013 小马版权所有 All Rights Reserved.

Powered by Discuz! X3.2

© 2016-2022 Comsenz Inc.

快速回复 返回顶部 返回列表