传媒教育网

 找回密码
 实名注册

QQ登录

只需一步,快速开始

搜索
做个试验
楼主: 刘海明
打印 上一主题 下一主题

人工智能与新闻业案例集锦

[复制链接]
571#
 楼主| 发表于 2022-12-29 15:10:00 | 只看该作者
【案例】
ChatGPT 引发对学生作弊的担忧
OpenAI 的新通用聊天机器人原型 ChatGPT 展现出了令人称奇的问题解决能力和问题回答能力(答案未必正确),它能帮助你撰写论文,从而引发对学生利用 ChatGPT 作弊的担忧。学者、高等教育顾问和认知科学家建议大学开发新的评估模式以应对 AI 对学术诚信构成的威胁。本周大约 130 所大学的代表出席了英国慈善组织 JISC 举办的研讨会。防剽窃软件开发商 Turnitin 的高管 Annie Chechitelli 表示正在开发帮助评估作业中是否存在 AI 辅助痕迹的工具,她同时警告与生成式 AI 展开军备竞赛是没有好处的,教师应该鼓励学生发展批判性思维。此外有研究表明过度依赖此类在线工具可能会影响创造力。
来源:搜狐网
编辑:邓秋雨

572#
 楼主| 发表于 2022-12-31 12:38:09 | 只看该作者
【案例】


前沿译介 | 算法厌恶、可见性、算法与新闻业




本期内容主要包含算法厌恶、可见性、算法新闻等,论文选自《Journal of Computer-mediated Communication》《New Media & Society》《Digital Journalism》等。

01 算法厌恶
How do people react to AI failure?
Automation bias, algorithmic aversion, and perceived controllability
作者:S Mo Jones-Jang ,Yong Jin Park
来源:Journal of Computer-mediated Communication

尽管人们从人工智能(AI)中获得了很多好处,但一次不愉快的遭遇可能会将他们的欣赏转化为对AI的厌恶。这种负面经历尤其会在医疗、金融、招聘等涉及重大决策的领域产生重大影响。因此,本文研究人们在经历人工智能产生的负面影响后,如何感知和评估人工智能。与以往研究不同,之前有研究考察人们是否喜欢人工智能,这项研究旨在确定和理论化人们在经历人工智能决策导致的负面事件后的心理机制

研究者进行了2组在线实验。研究1和研究2的结果表明,两种心理路径,即感知到的对预期一致性能的违反和感知到的人工智能的可控性,显著决定了人工智能决策的公平性判断。

具体而言,首先,当用户意识到人工智能无法实现预期功能时,他们倾向于对人工智能的失败后果做出相较于人主体更严厉的评估。其次,与人类相比,人工智能被认为对结果的控制力较弱,这种认知会使人们对人工智能带来的不满意结果进行更积极、可容忍的评价

作者认为,该研究的发现突出了一些有趣的现象,这些现象表明人工智能具有其他技术所缺乏的独特品质。与其他技术不同,人工智能被认为可以像具有高度自主性的人一样思考和行动,能做出明智、独立的判断,同时也会犯下意想不到的错误。为了证明人工智能的人性,该研究利用了人类专家占据垄断地位的高风险场景,但研究表明,尽管人工智能具有半人半机器的特性,用户在做出关键人工智能决策时仍然高度看重人工智能类似机器的特性

原文链接:
https://doi.org/10.1093/jcmc/zmac029

02 可见性
Tactics of invisibility: How people in vulnerable positions make datafied everyday life livable
作者:Karoliina Talvitie-Lamberg
来源:New Media & Society

数据以及我们与数据的关系深刻地塑造了我们在成为一个数字主体方面的日常生活。各种数据平台迫使个人保持持续存在和可见性,并使日常生活中的监控文化正常化。所谓可见性,本文指的是当代数字生活的逻辑和它对被看见的要求。有一种隐含的紧张关系通过被看到的义务而产生:要在分享过多和分享不足之间取得平衡

本文使用de Certeau开发的战术概念,目的是了解个人如何通过所谓的隐形战术使日常监控文化变得宜居。本文引用的实证证据包括对三个可能是弱势群体的成员进行的定性访谈和撰写的日记:未就业人员、无证人员和老年人。参与者在7到10天的时间里记录他们的日常生活,重点关注数字维度。参与者被要求每天至少记录一次他们与数字技术的接触,包括对自己经历的反思。采访和日记一样,都是在数据分析的背景下关注日常生活。研究人员和参与者讨论了参与者对互联网、数字服务和(社交)媒体的使用,以及相关的体验和感受。

基于分析,本研究得出了在这种情况下的三种策略:保持世界的距离、把自己裁剪在框架之外,以及避开。研究补充了之前将策略概念应用于数据化平台的研究,因为除了具体的策略之外,本研究还揭示了生活在数据化环境中的弱势群体的生活经历。研究结果明确了参与这些策略给参与者带来的感受。研究者发现,我们发现,将这些战术解释为与Phelan(2003)的 “可视性”意识形态的交会,为考虑个人使用这些战术的成本以及它们挑战现有权力结构的潜力提供了一种新的方式。

原文链接:https://doi.org/10.1177/14614448221136077

03 算法与新闻业
Go, Robots, Go! the Value and Challenges ofArtificial Intelligence for Local Journalism
作者:Alexandra Borchardt
来源:Digital Journalism

本文探讨了人工智能冲击下的新闻业危机以及解决方式。随着注意力经济的衰退和免费数字新闻的丰富发展,许多出版商都在缩减收入。此外,由于能源危机,传统媒体的印刷产品生产成本高昂。这对新闻从业者的工资、福利和工作保障都是不利的。工作要求越来越高,回报越来越少,新闻人何去何从?

文章指出,解决方案需要尽可能围绕数据分析和客户服务来推动订阅。人工智能驱动的数据新闻可以在许多方面提供帮助。机器人进行简单采访可以鼓励用户生成内容。交通堵塞和火车延误等数据点可以自动分析,以服务于特定地区。新闻内容可以根据位置和偏好进行个性化生产。此外,人工智能可以确保某些价值观在报道和新闻供应中得到反映,在不同的社区,它可以推送反映少数群体的内容,控制男性和女性是否被平等地报道,帮助突出显示具有重大意义的话题。

但同时,也必须关注人工智能运用带来的风险和挑战。首先,数据安全或保护问题非常重要,特别是在地方层面。其次,要减少对大型科技公司的依赖。必须集中力量为小型新闻室开发人工智能解决方案,只有他们才能被信任仔细评估特定领域的需要,并帮助其参与者实现其战略目标。第三,在旧的新闻界,以白人男性为主导的权力结构决定了发表的内容。在人工智能带来的新结构中,多样性需要得到支持和重视。第四,使用游戏化来改善新闻教育。当所有的常规工作都由人工智能覆盖时,记者需要其他形式的学习来练习和完善那些只有人类才有的技能。第五,道德监督至关重要,新闻的重点应该是“什么可以留给人工智能?”。

原文链接:https://doi.org/10.1080/21670811.2022.2149584


Chinese Digital Platform: “We Write What theAlgorithm Wants”
作者:Emeka Umejei
来源:Digital Journalism

2019年,中国内容共享平台Opera News Hub在尼日利亚推出,该平台使用推荐算法来管理和分发媒体内容。该平台使用推荐算法,帮助内容创作者“瞄准受众,帮助用户找到符合他们兴趣的内容”Opera News Hub使用自动把关流程,在该流程中,推荐算法在发布内容之前对其进行审核。

为了创造吸引尼日利亚观众的内容,Opera News Hub招聘了资深编辑和记者,他们接受传统媒体实践的培训,来自不同的领域,包括社会与娱乐、政治、调查报道、商业等。

本研究聚焦于这一类内容创作者,试图阐明非洲记者在新闻制作和传播中亲身体验算法的感受。本研究是一项新颖的尝试,旨在填补学术文献中关于算法在过渡民主国家(如尼日利亚)数字平台上新闻制作和发布中的作用的空白,在这些国家,记者仍在努力应对数字媒体对传统新闻规范的入侵。

本文采用了内容分析、半结构化内部视图和焦点小组讨论(FGD)等方法。研究表明,Opera News Hub的推荐系统在个性化新闻的分发方面有效,但在内容生产者制作的媒体内容的把关方面有限。参与者一致认为,将新闻个性化引入尼日利亚媒体领域可能成为一个游戏规则的改变者,这将提高媒体业务并改善尼日利亚记者的福利。然而,有限的多样性仍然是新闻个性化的一个挑战。

原文链接:
https://doi.org/10.1080/21670811.2022.2151026


来源:清华大学智能与科技应用传播


编辑:邓秋雨

573#
 楼主| 发表于 2023-1-8 21:05:54 | 只看该作者
【案例】
武沛颍、陈昌凤 | 社交机器人能否操纵舆论——以Twitter平台的北京冬奥舆情为例

【摘要】社交机器人已经成为舆论建构中不可忽视的重要主体。为探究社交机器人是否具有操纵舆论的能力,本文以网络议程设置理论为基础,在Twitter平台抓取与外交抵制北京冬奥会事件的相关推文49734条,提炼出关于该议题的客体议程和属性议程,在此基础上分别绘制人类和机器人的议程网络并分析网络间的相似性。研究结果显示,有近四分之一与冬奥相关的推文都由机器人生产;机器人用户倾向于关注冬奥相关的负面话题,多持反对冬奥的态度;人类与机器人的议程网络显著相关,存在网络议程设置效果,说明社交机器人可能已经具备操纵舆论的能力。
【关键词】社交机器人网络议程设置 计算传播

目前,人工智能技术已经深度嵌入社交媒体中,重塑了信息生产、分发、交互的全流程,并出现了模仿人类行为、与人类用户进行交互的智能账户——社交机器人。此前研究表明,机器水军大量参与到了英国脱欧、美国总统选举等政治事件中,Twitter平台上与中国有关的议题也常常被社交机器人操纵。它们通过与用户互动、大量发帖等手段营造虚假的舆论环境,以影响公众的政治倾向和选择。由此可见,社交机器人是舆情建构中不可忽视的重要推手,在话题凸显、关联建构等方面发挥着独特的作用。
针对社交机器人大量介入公共讨论这一现象,关键问题是探究社交机器人是否具备操纵舆论的能力,这涉及到社交机器人能在多大程度上影响人类用户。因此,本文采用计算传播学方法,以Twitter上与“外交抵制冬奥会”相关的推文内容为研究对象,探究其中是否存在社交机器人操纵舆论的情况。具体而言,本文聚焦以下问题:在关于外交抵制北京冬奥会的话题讨论中,社交机器人关注哪些冬奥相关话题?社交机器人对北京冬奥持怎样的态度?社交机器人如何构建议程网络?社交机器人能否操纵北京冬奥的相关舆论?
一、文献综述
(一)社交机器人与政治传播
社交机器人是人工智能技术应用于在线社交网络的产物,具体指在线社交网络中模拟人类用户,自主运行、自动生产发布内容的算法智能体,它承担着聊天网友、智能客服等角色。其中,用于承担政治传播任务的一类机器人被称为政治机器人(political bots),主要应用场景包括政治选举、社会动员与政治干扰。此前研究已经表明,在许多重大政治事件中均存在政治机器人操纵舆论的痕迹。如在2014年日本大选中,社交机器人通过大量转发或重复发布某一条信息为舆论造势。在2016年的美国大选中,支持特朗普的推文中有三分之一都由自动化账户生成。在2019年的西班牙大选中,社交机器人积极参与到选举过程中,在社交网络中支持了五个政党。特别值得注意的是,与中国相关的议题在Twitter平台上也常常受到机器人操纵。陈昌凤、师文对社交机器人操纵中国相关议题的现象进行研究,发现与中国相关的推文中有超过1/5疑似由机器人用户发布,且不同议题的自动化操纵程度存在差异。香港“修例”风波系列报道在Twitter上进行扩散时,社交机器人在一级传播中无差别地进行新闻扩散,在二级传播中则表现出对香港问题的明显关注并支持抗议者。在关于新冠疫情的讨论中,社交机器人常常把“corona-virus”(冠状病毒)与“wuhancoronavirus”(“武汉冠状病毒”)进行关联构建,试图在病毒起源问题上进行倾向性影射。此外,张洪忠等发现大多数社交机器人(55%)在中美贸易战的Twitter话题讨论中表达了反对贸易谈判的倾向。
我国新闻传播学科内对社交机器人的研究主要有以下几个面向:一是对概念本身及研究路径进行探讨。如张洪忠等指出社会学科主要将社交机器人视为异类,从文化批判、人机关系、传播效果、政策法规等角度进行探讨。二是结合具体案例对社交机器人的参与情况进行探讨,如有学者关注社交机器人参与的新冠疫情讨论。三是探究社交机器人的行为特征和传播机制。有学者指出,社交机器人在社交媒体账号的元特征、网络特征、内容特征、时间特征四个维度与人类用户有显著差别,可以基于这四个维度对机器人进行识别。还有学者基于社会传染理论,发现社交机器人是通过按需高效地改变社交网络的动态结构,来相应控制社会扩散的范围和速率。四是针对社交机器人带来的负面影响提出治理对策。社交机器人有良性、恶性、中性之分,一方面可以运用法律与技术双管齐下地整治有害机器人,另一方面还要挖掘低阶与高阶社交机器人的正向价值。在理论方面,目前我国学术场域内已有许多学者尝试将传播学理论与社交机器人研究相结合,如师文等引入了二级传播,范红等使用了社会传染理论,但目前我国学界还较少将议程设置理论与社交机器人研究相结合。
(二)网络议程设置理论
议程设置理论有三个层次:麦库姆斯和肖的教堂山研究指出,大众传播媒介通过对信息的报道影响人们关注哪些事实以及关注的先后顺序。此为第一层议程设置,也被称为客体议程设置。在对1995年西班牙地区和市政选举的研究中,麦库姆斯等发现,媒体还可以将积极、消极、中性的情感属性传递给大众。这种议程设置效果被称为属性议程设置。即媒体不仅能够设置议题的重要性,还能够影响公众对议题属性的判断。随着媒介技术的快速变化,仅仅用于解释媒体与公众间离散议程传递的理论呈现出局限性,故而郭蕾和麦库姆斯提出了第三层议程设置,即网络议程设置。媒体不仅能够设置报道对象和属性的显著性,还能将对象和属性联系起来,并把这种联系传递给公众。网络议程设置理论的重要来源是心理学中的认知地图(cognitive map)。心理学研究表明,人们的认知结构呈现网状,以图画、图解或制图的方式运作。因此受众可能会根据报道对象和属性之间的相互关系,在脑海中勾画出类似网络的图式。
在网络议程设置相关的学术研究中,大数据挖掘、社会网络分析和可视化是经常被用到的技术手段。如郭蕾等对2012年美国总统大选期间Twitter上收集的大数据集进行了分析,发现新闻媒体可以通过议题网络来影响网民对竞选者的态度。随着相关研究的进一步深化,还有学者通过时间序列分析网络议程设置的动态演化机制,探究何种主体在议程设置中起主导作用。结果发现在野生动物相关话题的议程网络中,新闻媒体和公众之间在进行不断的相互作用。也有学者指出,目前对于网络议程设置的研究仅仅讨论了议题网络和情感网络,而较少把议题属性和情感属性相结合以建构议程网络。Chen 等对微博上的民族主义话语进行了研究,并运用了机器学习的方法构建议题网络。结果表明,媒体议程影响个体议程,而民族主义的建构遵循自下而上的方向。还有学者关注中国媒体的网络议程设置作用,发现无论是危机案例还是非危机案例,中国传统媒体都未能在微博上引导讨论,商业精英往往是最有影响力的意见领袖。
我国学术场域内对网络议程设置的研究也多使用社会网络分析的研究方法构建不同媒体间的议程网络,探究在媒体间、媒体与民众间以及公众之间是否存在网络议程设置效果。如蒋俏蕾等发现萨德事件中,中国媒体报道的议程网络与公众网络之间存在显著的正相关,网络议程设置模型在隐性层面和显性层面都呈现出了显著的解释力。韩晓宁等发现在2020年新冠肺炎疫情期间的健康信息传播中,党媒与社交媒体舆论场影响显著,公众和社交媒体意见领袖的网络议程均与党媒相关。王晗啸等以“红黄蓝事件”为例,使用基于上下文语义的 word2vec模型探究不同媒介网络的相似度,发现知乎意见领袖对公众议程的影响程度最大,党媒和都市类媒体报道基本一致,且二者对公众的影响均高于商业媒体。黄敏从议题关联和关系建构两个方面分析了有关中国扶贫报道的媒体网络议程,初步展示了媒体网络议程得以影响公众网络议程的机制,揭示了网络议程设置效果得以产生的原因。
既有研究已经表明,除了媒体对公众进行议程设置,公众内部也可能存在相互的议程设置,如意见领袖也具有设置公众议程的能力。目前对网络议程设置的研究中,多集中于探索媒体间、公众间以及媒体与公众之间的网络议程设置。随着社交机器人介入传播进程,社交机器人也成为一种特殊的传播主体,“人+社交机器人”正成为传播学的一个新研究领域,但目前探究人类和机器人之间议程设置的研究还相对较少。在研究方法方面,我国的研究在建构议程网络时,大多选择单独构建议题网络、语义网络和情感网络,较少把客体属性和情感属性相结合以描绘议程网络。
据此,本研究提出以下问题和假设:
RQ1:在外交抵制北京冬奥会的讨论中,人类用户和社交机器人用户分别呈现出怎样的客体议程?
RQ2:在外交抵制北京冬奥会的讨论中,人类用户和社交机器人用户分别呈现出怎样的属性议程?
RQ3:在外交抵制北京冬奥会的讨论中,人类用户和社交机器人用户分别呈现出怎样的议程网络?
RQ4:在外交抵制北京冬奥会的讨论中,社交机器人是否具备操纵舆论的能力?
本研究将通过LDA主题建模探究客体议程,通过有监督的机器学习识别推文态度以探究属性议程,最后通过社会网络分析的方法,描绘人类用户和社交机器人用户的议程网络,并使用QAP探究其相关性,以回答社交机器人能否操纵舆论这一问题。
二、研究设计
(一)案例选取
本文选取的研究案例是2021年末发生的外交抵制北京冬奥会事件。2022年2月4日至2月20日,第24届冬季奥林匹克运动会在北京举办。北京冬奥会是世界性的运动盛会,是我国唱响中国声音、塑造大国形象的重要契机,同时也是大国政治博弈的角力场。自北京冬奥会申办成功以来,海外社交媒体上就存在反对北京冬奥会的声音。2021年12月份,美国、英国、加拿大等国家相继对北京冬奥会进行外交抵制,激起了Twitter用户的广泛讨论。海外主流社交媒体上关于北京冬奥会的信息传播将对这一大型赛事的形象建构产生重要影响。此外,外交抵制北京冬奥会事件已经结束,其舆情发展有一个较为完整的周期,选择该事件也可避免得出阶段性的结论。因此,本文选取外交抵制北京冬奥会事件作为研究案例。
(二)数据获取
本研究选取海外社交媒体平台Twitter上有关外交抵制北京冬奥会的推文作为研究对象。在Twitter中,标签起到了聚合话题的功能,用户习惯于使用标签(hashtag)标记自己推文的主题及检索特定主题的推文。本研究选取“#BoycottBeijing2022”“#BoycottBeijingOlympics”“Genocide games”“BeijingOlympics”“BeijingWinterOlympics”“NoRightsNoGames”“NoRightsNoShow”“WinterOlympics”“Bei-jing2022”“NoBeijing2022”十个标签作为抓取数据的关键词。为了防止原始数据的态度倾向对最终结果产生影响,本文选取话题标签时特别注意话题本身的倾向性,既选择了诸如“#BoycottBeijing2022”“#BoycottBeijingOlympics”等带有明显反对意味的标签,也选择了“Beijing2022”“BeijingOlympics”等带有中立价值意味的标签。
本研究使用自主设计的Python代码对包含以上标签的Twitter数据进行抓取。9月17日,北京冬奥会和冬残奥会口号发布;12月6日,美国发布声明宣布不参加北京冬奥会,7日,新西兰宣布外交抵制北京冬奥会,8日,英国、加拿大、澳大利亚等国也宣布不参加北京冬奥会。故本研究将抓取将时间范围设置为2021年9月17日0点-12月15日24点(以GMT+8时区时间为标准,共90天),即从冬奥会口号发布至各国宣布外交抵制北京冬奥会一周后。
(三)机器人识别:Botometer
本研究采用印第安纳大学开发的开源工具Botometer进行机器人身份的识别。Botometer是一个经过训练的机器学习算法,通过标记数万个示例账号来提取一千多个特征,表征账户的个人资料、朋友、社交网络结构、时间活动模式、语言以及情绪。当检查一个账户时,Botometer会调用Twitter API获取该账户的公开资料,并传送到Botometer API中,将一个账户与数万个已经标记的账号进行比较,最终得出分数。Botometer技术成熟度较高,被广泛应用于社交机器人的学术研究中。Botometer提供的API接口可用于大规模数据检测。本研究将人与机器人的区分值设置为0.5分。若用户得分小于等于0.5分,则其更可能是人类,若用户得分大于0.5分,则其更可能是机器人。
(四)主题建模:文档主题生成模型
LDA模型是一种用于对离散数据集(如文本语料库)进行建模的概率主题模型,由David M. Blei等学者于2003年提出。LDA是一个三级生成式贝叶斯网络结构,基本假设为文档是由若干个隐含主题构成,而这些主题是由文本中若干个特定词汇构成,忽略文档中的句法结构和词语出现的先后顺序。它可以将文档集中每篇文档的主题以概率分布的形式给出,抽取出文档的主题分布后,便可以根据主题分布进行主题聚类或文本分类。LDA作为全概率生成模型,具有清晰的层次结构,且LDA在主题层与词层都引入了Dirichlet先验参数,解决了LSI模型与PLSI模型中主题参数个数随训练文档数目增加而线性增加,从而导致过度拟合的问题,因此更适合处理大规模语料库,提出后被广泛应用于文本分类、语义理解等领域。
本研究使用LDA模型以探究Twitter平台上对北京冬奥议题的讨论集中于哪些话题,从而获取客体议程。在一条推文中可能包含多个主题,多个主题存在于一条推文中的情况被称之为主题的共现。LDA模型会返回一个文档—主题矩阵,标注出每一个文本属于每一个主题的概率,概率大于某个阈值即认为该文本包含这个主题。本研究将阈值设置为0.2,以使得一条推文可以包含多个主题。
(五)态度编码:支持向量机
本研究采用支持向量机(support vector machinse,SVM)这一有监督的机器学习方法对推文的态度进行编码。SVM的机理是寻找一个满足分类要求的最优分类超平面,使得该超平面在保证分类精度的同时,能够使超平面两侧的空白区域最大化。理论上,支持向量机能够实现对线性可分数据的最优分类。机器学习需要人类先对要处理的数据打上分类标签。在正式编码前,笔者和另一位编码员对50条推文进行预编码,编码者间信度为0.86。然后对1448条推文的态度进行正式编码,态度分为三类:支持北京冬奥、反对北京冬奥、中立/无明显态度。最终模型识别的精确度达到85.3%,可以进行大规模编码。本研究通过SVM对态度进行编码,从而获取用户的属性议程。在对态度进行编码时,以该推文中体现最明显的态度为依据进行编码,每条推文仅体现一种态度倾向。
(六)议程网络相关性:QAP
QAP(QuadraticAssignment Procedure,二次指派过程)是一种对两个方阵中各个格值的相似性进行比较的方法,即对方阵的各个格值进行比较,给出两个矩阵之间的相关性系数,同时对系数进行非参数检验,它以对矩阵数据的置换为基础。QAP相关分析可用来分析两个矩阵之间的相关性,是常用的社会网络分析方法。
三、研究结果
本研究共获取推文61102条,保留英语语言后获得50004条推文。经检测,其中有47位用户账号被封禁或无法访问,此类用户产出的推文数量为270条。Botometer对此类用户无法判定身份,故予以剔除,最终获得数据49734条。其中12365条由机器人生产,占比24.9%。37369条由人类用户生产,占比75.1%。以上推文由41130名用户生产,其中11752名是机器人用户,占比28.6%,29378名是人类用户,占比71.4%。
(一)抵制北京冬奥舆情中的客体议程
本研究使用Python中的Gensim包进行主题建模,把所有推文都输入到主题模型中,并在主题数3—25之间分别进行尝试。主题数的选择并无严格规定,依解释力强弱而定。最终发现主题数为20时建模的效果最好。考虑到机器建模的局限性,两位编码员手动编译了模型返回的20个主题,对相似性较高的主题进行合并,最终获得与冬奥相关的12个主题,代表议程设置中的客体议程。12个主题分别为:抵制北京冬奥会、中国台湾领土主权、北京冬奥会竞赛项目、北京冬奥会开幕式、北京冬奥会疫情防控情况、中国新疆领土主权、支持北京冬奥会、政治与政党、人权议题、北京冬残奥会、加拿大外交抵制北京冬奥会、北京冬奥圣火传递。
由主题聚类的结果可知,在抵制北京冬奥议题的讨论中,除了对诸如开幕式、竞赛项目、疫情防控情况等赛事相关话题的讨论,更有中国台湾、中国新疆、人权议题等涉及中国内政的话题。
可见冬奥会虽然是运动类事件,但其背后都涉及到复杂的国际政治形势,一些国家试图在社交媒体上模糊重点,借冬奥之名对中国的发展进行攻讦,将体育赛事政治化。
在冬奥相关的讨论中,不同主题的自动化操纵程度存在差别。“北京冬奥会竞赛项目”下的机器人参与程度最高,有2873名机器人用户(占比28.2%)参与了讨论,该主题下的主要内容是北京冬奥会的滑冰、滑雪、曲棍球等竞赛项目,以及世界各国的冰上运动员是否取得了冬奥会参赛资格。其次是“人权议题”,该主题下的推文多伴有对中国侵犯人权的不实指控,有1486名(占比 26.1%)机器人用户参与讨论。再者是“加拿大外交抵制冬奥会”,该主题主要围绕2021年12月8日,加拿大总理特鲁多公然诬称中国存在“侵犯人权”的行为,并以此为借口宣布加方不派“外交代表”出席北京冬奥会这一事件进行讨论。有1015名(占比25.7%)机器人用户参与其中。在“中国台湾领土主权”主题中,有352名(占比24.9%)机器人发出推文。该主题下许多推文公然鼓吹“台独”,是对我国领土主权的公然挑衅,并以台湾为由对北京冬奥会进行抵制。结合数据结果可知,社交机器人参与操纵的主题多以负面话题为主,且在以上四个主题下的参与程度均在25%左右,显示出对中国进行恶意操纵的传播机制。
(二)抵制北京冬奥舆情中的属性议程
在态度倾向上,表达反对北京冬奥态度的推文有31525 条,其中有7800条(24.7%)由机器人发出,23725 条(75.3%)由人类发出。表达中立态度或无明显态度倾向的推文有7446条,其中1848条(24.8%)由机器人发出,5598条(75.2%)由人类发出。表达支持北京冬奥态度的推文有10763条,2985条(27.7%)由机器人发出,7778条(72.3%)由人类发出。因此,社交机器人在引导网络意见形成中发挥的意见不容小觑。在表达支持和反对北京冬奥会的态度倾向下,均有近四分之一的社交机器人用户发声。而且,无论是人类用户还是机器人用户都很难做到客观中立,大多带有支持或反对北京冬奥会的倾向。以推文作者身份作为分类标准,把讨论议题与态度倾向综合进行分析,结果如表1、表2所示。
(三)抵制北京冬奥舆情中的议程网络
结合客体议程与属性议程的分析结果,笔者使用 Python中的“networkx”工具绘制议程网络。在每个网络中,如果客体议程被提到的频率越高,它的节点就越大。此外,如果两个节点与一个更强的边相关联,这意味着两个客体议程在一个分析单元中同时出现的频率更高。节点的颜色代表情感属性。颜色越深,这种颜色所代表的态度属性就越频繁地被嵌入到客体议程中。
如图1所示,在人类用户的议程网络中,被提及次数最多的话题是“抵制北京冬奥会”,其中表达反对北京冬奥会的态度占绝大多数。与“抵制北京冬奥会”联系最紧密的两个话题是“人权议题”和“政治与政党”“,人权议题”和“政治与政党”两个话题之间联系也较为紧密,表明人类用户习惯将冬奥会与中国的人权议题和政党相联系,这也是国际反华势力常用的污名化中国的理由。此外“,抵制北京冬奥会”与“中国新疆领土主权”话题联系也较为紧密,许多反华势力以新疆存在强迫劳动、压榨维吾尔族的不实理由对北京冬奥会进行抵制。以上四个话题都呈现出了强烈的反对冬奥的态度。
在表达支持冬奥态度的话题中,被讨论最多的是“冬奥会竞赛项目”。该话题下涉及各个国家的参赛选手,因而许多人类用户对北京冬奥会表达了支持、期许的态度。与“冬奥会竞赛项目”联系最紧密的是“加拿大外交抵制冬奥会”这一话题。对于加拿大外交抵制冬奥会这一政治事件,尽管加拿大表示了外交抵制的态度,但人类用户大多仍支持和期待北京冬奥会的举办。
如图2所示,就网络图来看,机器人议程网络与人类议程网络在结构上表现出高度的相似性,仅存在节点大小和连线粗细的差别,即讨论量和共现次数不同。在机器人的议程网络中,被提及次数最多的话题也是抵制北京冬奥会,且该话题与政治与政党、人权议题联系最为紧密,主导态度倾向均为反对北京冬奥会。在表达支持北京冬奥会态度的推文中,被讨论最多的也是“北京冬奥会竞赛项目”和“加拿大外交抵制北京冬奥会”两个话题。
(四)抵制北京冬奥舆情中的网络议程设置效果分析
QAP相关分析被用来检测人类用户议程网络与机器人议程网络的关联。分析结果显示,人类用户议程网络与机器人议程网络之间呈现出正向的显著相关(r=.617, p< .001)即人类用户和机器人用户之间存在网络议程设置效果。
四、结论与讨论
本研究以外交抵制北京冬奥会事件为例,抓取了2021 年9月—12月Twitter平台上包含北京冬奥的相关话题标签,发现有近四分之一的推文都由社交机器人生产。在客体议程方面,使用LDA主题模型对人类用户和机器人用户的语料进行主题建模后,发现社交机器人多见于对“北京冬奥会竞赛项目“”人权议题“”加拿大外交抵制冬奥会“”中国台湾领土主权”四个话题的讨论,可见社交机器人参与操纵的话题以负面为主。在属性议程方面,社交机器人产出的表达反对冬奥态度的推文数量最多,显示出对中国话题进行恶意操纵的传播机制。
值得思考的是,在本研究中,人类用户议程网络与社交机器人议程网络显著相关,显示出网络议程设置效果。这说明社交机器人已经具备操纵舆论的能力,而这种操纵舆论的能力可能来源于三个方面。就社交机器人的数量而言,根据媒介等同理论,尽管参与者知道与其互动的是非人类主体,但仍会以对待人类的方式对待该非人类主体。因此,当机器人用户大量进入社交媒体平台并模仿人类行为进行发帖时,许多用户由于缺少辨别能力,可能会将机器人用户误当做人类用户,造成“很多人持有某一观点”的印象,进而选择跟随大多数观点或不发声,最终受到机器人用户操纵的影响。就社交机器人的内容生产而言,社交机器人的推文内容呈现出泛政治化的特征,对北京冬奥会的议题建构并非以体育赛事为核心,而是以政治为切入点,偏离了对冬奥赛事本身的讨论,展现出背后操纵者通过相互攻讦以达到抹黑他国形象的目的。而且,社交机器人还会内嵌人类的价值取向,使得人类更容易接受其传递的信息。当态度倾向与社交机器人产出的大量推文形成合力后,社交机器人对人类的影响便不止于使某个话题进入大众视野,凸显其重要性,而是能够进行情感态度的传递。在社交媒体平台上,具有情感属性和态度表达的信息也往往能够取得更大的传播影响力。就社交机器人背后的技术机制来看,目前的机器人文本生成技术已经不仅停留在传递事实和情感的层面,还会充分利用人们网状的认知结构,使人类用户把多个议题结合起来思考,构建议题之间的关联。这使得社交机器人的舆论操纵得以作为一个整体传递给人类用户,而非简单地扩大某一议题的声量。
本研究的主要贡献在于:一、通过实证研究证明了社交机器人具备操纵舆论的能力,提示我们社交机器人的影响力可能远比我们想象中强大。二、厘清了社交机器人操纵舆论的策略。社交机器人的作用已经不仅仅局限于放大某些特定信息的声量,还善于嵌入价值取向并建立事件间的联系。而以往的研究大多还停留在对社交机器人内容数据的描述层面,较少深入到内容背后探究更为抽象的生产机制。三、丰富了智能传播时代下网络议程设置理论的内涵。以往的研究还未将社交机器人视为议程设置的主体,而本文则指出,社交机器人对人类感知现实具有网络议程设置作用,深化了对人机交互机制的认识,也更符合目前人机共生的社交媒体生态。
最后,本研究也存在着一些局限:本研究以社交机器人和人类用户生产的推文作为研究对象,而社交机器人是通过生产推文、点赞、关注等一系列行为进行舆论操纵,仅对文本进行分析难以反映社交机器人参与议题建构活动的全貌;人类用户中包含政府机构、媒体、意见领袖等多元主体,各个主体间也存在国别差异,未来研究也可以对人类用户进行进一步细分,以探究多元主体在议程设置中起的不同作用,细化舆论操纵的机制。
原文刊载于《新闻与写作》2022年第9期,学术引用请参考原文。

来源:再建巴别塔(公众号)

编辑:陶鹏辉

574#
 楼主| 发表于 2023-1-8 22:55:02 | 只看该作者
【案例】

人工智能迎来破局之年?
去年底推出的ChatGPT令用户见识到了生成式AI的威力,但此类模型虽说有助于启发第一缕灵感,却终究是不能信赖的。
2023年1月4日 英国《金融时报》社评
再见,加密货币!你好,生成式人工智能(AI)!凭借着他们这一行特有的选择性健忘症,风险投资家已经放下了他们与暴雷的加密货币交易所FTX倒霉的短暂情史,转而爱上了“下一个大热点”。他们说,今年将是AI的破局之年。如今可能年年都有人发出这样的断言,但这一次他们是说真的。
我们有相当充分的理由相信这一次的断言可能会应验。去年11月,OpenAI推出了语言生成模型ChatGPT,它有着惊人的能力,能够非常迅速地生成具有说服力的文本段落,令用户见识到了生成式AI的威力。像ChatGPT这样的大型语言模型是以来自互联网的海量数据为素材训练出来的,几乎是瞬间就能识别并复制各种文本、图像、计算机代码、视频和音频。还没有人能确切地知道这个领域的杀手级应用会是什么样子的,但已经有160多家初创公司怀着探索这个答案的目的问世。
生成式AI带给人们的希望是,它能提高创意行业工作者的生产率,如果不是彻底取代他们的话。就像工业革命中机器增强了肌肉的力量一样,AI也能在认知革命中增强人类的脑力。对于绞尽脑汁的广告策划、程序员、编剧以及因为不能按时交作业而着急的学生们来说,这或许是特大喜讯。但它也可能会对形形色色的领域——客户服务自动化、营销材料、科研和数字助理等——都产生重大影响。一个耐人寻味且尚无定论的问题是,它将增强现有的搜索引擎——比如谷歌(Google)——的支配性地位,还是会取代它们?
生成式AI是一个很好的例子,它折射出了一个更大的趋势:一些强大的技术不再是只有专家能玩转的领域,寻常用户也逐渐能涉猎其中。对许多企业来说,技术使用上的民主化可能会产生巨大影响,并创造出不同寻常的机遇。例如,随着“低代码/无代码”软件平台的日渐流行,越来越多的非专家级用户将能够自己打造功能强大的手机和网络应用。产品经理再也不用非得仰赖技术团队来制定开发计划。

除了机遇,这显然也蕴含风险。最大的风险之一是生成式AI输出的结果经常是错误的,或者让人误以为是真的。此类模型有时会对同样的问题作出不同的回答,这取决于人类输入的指令和用于训练模型的数据。如果是确定性技术,比如袖珍计算器,当你输入19乘以37时,答案永远是一样的。但如果是概率性技术,比如生成式AI,答案就只能是在统计上存在可能的一个近似值。正如前谷歌研究员蒂姆尼特•格布鲁(TimnitGebru)所形容的,它们是“随机的学舌者”(stochastic parrot)。出于这个原因,面向程序员的问答网站Stack Overflow已禁止使用ChatGPT来生成答案,因为这样的答案是不可信的。
由于生成式AI具有这个明显的缺点,正在开发此类模型的人负有一项特殊的责任,他们应考虑清楚这些模型可能会遭到什么样的滥用,之后才能发布出去任人使用。但考虑到这些模型发展之快,这事是越来越难了。用户是可以从使用这些模型中得到乐趣并从中获利,但他们也应该始终慎重地对待它们。生成式AI或许有助于启发第一缕灵感,但它们终究是不能信赖的。
来源:知乎
编辑:陶鹏辉

575#
 楼主| 发表于 2023-1-19 00:23:36 | 只看该作者
案例】
微软100亿美元潜在投资将开启AI新时代
这家软件巨头100亿美元入股ChatGPT开发者OpenAI的交易如果成为现实,可能在“生成式人工智能”领域引发一轮投资竞赛。
微软(Microsoft)正考虑向总部位于旧金山的研究实验室OpenAI投资100亿美元,这看起来将成为开启人工智能(AI)新时代的一笔标志性交易。
如果这家美国软件巨头对这项技术具有深远影响的判断是正确的,随着其他科技集团竞相在生成式人工智能(generative AI)这一新领域占据一席之地,此举还可能引发整个AI世界重绘版图。
来源:FT中文网
编辑:吴漫

576#
 楼主| 发表于 2023-2-1 16:20:08 | 只看该作者
【案例】

腾讯发布 AIGC 发展趋势报告:迎接人工智能的下一个时代|附报告下载

2022年,从引爆AI作画领域的DALL-E 2、Stable Diffusion等AI模型,到以ChatGPT为代表的接近人类水平的对话机器人,AIGC不断刷爆网络,其强大的内容生成能力给人们带来了巨大的震撼。学术界和产业界也都形成共识:AIGC绝非昙花一现,其底层技术和产业生态已经形成了新的格局。

就内容生产而言,AIGC作为新的生产力引擎,让我们从过去的PGC、UGC,已经不可避免地进入AIGC时代。AIGC代表着AI技术从感知、理解世界到生成、创造世界的跃迁,正推动人工智能迎来下一个时代。

经过了2022年的预热,2023年AIGC领域将迎来更大发展。AIGC生成内容的类型不断丰富、质量不断提升,也将有更多的企业积极拥抱AIGC。在这个背景下,腾讯研究院正式发布《AIGC发展趋势报告2023:迎接人工智能的下一个时代》。报告从技术发展和产业生态、应用趋势、治理挑战等维度,对AIGC的发展趋势进行了深入思考。

本文为报告核心内容摘要(文末附下载):

AIGC技术和产业生态
迎来发展快车道

AIGC的大爆发不仅有赖于AI技术的突破创新,还离不开产业生态快速发展的支撑。在技术创新方面,生成算法、预训练模型、多模态技术等AI技术汇聚发展,为AIGC的爆发提供了肥沃的技术土壤。



图:AIGC技术累积融合

第一,基础的生成算法模型不断突破创新。比如为人熟知的GAN、Transformer、扩散模型等,这些模型的性能、稳定性、生成内容质量等不断提升。得益于生成算法的进步,AIGC现在已经能够生成文字、代码、图像、语音、视频、3D物体等各种类型的内容和数据。

第二,预训练模型,也即基础模型、大模型,引发了AIGC技术能力的质变。虽然过去各类生成模型层出不穷,但是使用门槛高、训练成本高、内容生成简单和质量偏低,远远不能满足真实内容消费场景中的灵活多变、高精度、高质量等需求。而预训练模型能够适用于多任务、多场景、多功能需求,能够解决以上诸多痛点。预训练模型技术也显著提升了AIGC模型的通用化能力和工业化水平,同一个AIGC模型可以高质量地完成多种多样的内容输出任务,让AIGC模型成为自动化内容生产的“工厂”和“流水线”。正因如此,谷歌、微软、OpenAI等企业纷纷抢占先机,推动人工智能进入预训练模型时代。

第三,多模态技术推动了AIGC的内容多样性,进一步增强了AIGC模型的通用化能力。多模态技术使得语言文字、图像、音视频等多种类型数据可以互相转化和生成。比如CLIP模型,它能够将文字和图像进行关联,如将文字“狗”和狗的图像进行关联,并且关联的特征非常丰富。这为后续文生图、文生视频类的AIGC应用的爆发奠定了基础。

未来,算法的进步将带来更多激动人心的应用,语言模型会得到进一步发展,可以自我持续学习的多模态AI将日益成为主流,这些因素会进一步推动AIGC领域的蓬勃发展。

在产业生态方面,AIGC领域正在加速形成三层产业生态并持续创新发展,正走向模型即服务(MaaS)的未来。

目前,AIGC产业生态体系的雏形已现,呈现为上中下三层架构。


第一层是基础层,以预训练模型为基础搭建的AIGC技术基础设施层。在国外,以OpenAI、Stability.ai为代表,通过受控API、开源等方式输出模型能力。

第二层是中间层,是在预训练模型基础上,通过专门的调试和训练,快速抽取形成垂直化、场景化、定制化的小模型和应用工具层,可以实现工业流水线式部署,同时兼具按需使用、高效经济的优势。比如,知名的二次元画风生成模型Novel-AI,以及各种风格的角色生成器等,就是基于Stable Diffusion开源进行的二次开发。随着AIGC模型加速成为新的技术平台,模型即服务(Model-as-a-Service,MaaS)开始成为现实,预计将对商业领域产生巨大影响。

第三层是应用层,依托底层模型和中间层的垂直模型,各厂商进一步开放面向C端和B端用户的各种各样的AIGC产品和服务,满足海量用户的内容创建和消费需求。例如群聊机器人、文本生成软件、头像生成软件等AIGC消费工具。

目前,从提供预训练的AI大模型的基础设施层公司到专注打造垂直领域内AIGC工具的中间层公司、再到直接面对消费者和终端用户提供产品和服务的应用层公司,美国围绕AIGC生长出繁荣的生态,技术创新引发的应用创新浪潮迭起;中国也有望凭借领先的AIGC技术赋能千行百业。

AIGC在消费互联网、产业互联网
和社会价值领域持续产生变革性影响

AIGC领域目前呈现AIGC的内容类型不断丰富、内容质量不断提升、技术的通用性和工业化水平越来越强等趋势,这使得AIGC在消费互联网领域日趋主流化,涌现了写作助手、AI绘画、对话机器人、数字人等爆款级应用,支撑着传媒、电商、娱乐、影视等领域的内容需求。目前AIGC也正在向产业互联网、社会价值领域扩张应用。


图:AIGC应用现状概览(引用自红杉资本)

在消费互联网领域,AIGC牵引数字内容领域的全新变革。目前AIGC的爆发点主要是在内容消费领域,已经呈现百花齐放之势。AIGC生成的内容种类越来越丰富,而且内容质量也在显著提升,产业生态日益丰富。这其中有三个值得关注的趋势:

第一,AIGC有望成为新型的内容生产基础设施,塑造数字内容生产与交互新范式,持续推进数字文化产业创新。过去AI在内容消费领域的作用主要体现在推荐算法成为了新型的传播基础设施。推荐算法对数字内容传播,短视频为主的数字内容新业态发展,起到了颠覆式的变革作用。而现在,随着AIGC生成的内容种类越来越丰富,内容的质量不断提升,AIGC将作为新型的内容生产基础设施对既有的内容生成模式产生变革影响。

第二,AIGC的商业化应用将快速成熟,市场规模会迅速壮大。当前AIGC已经率先在传媒、电商、影视、娱乐等数字化程度高、内容需求丰富的行业取得重大发展,市场潜力逐渐显现。比如,在广告领域,腾讯混元AI大模型能够支持广告智能制作,即利用AIGC将广告文案自动生成为广告视频,大大降低了广告视频制作成本。巨大的应用前景将带来市场规模的快速增长,根据6pen预测,未来五年10%-30%的图片内容由AI参与生成,有望创造超过600亿以上市场规模。也有国外商业咨询机构预测,2030年AIGC市场规模将达到1100亿美元。

第三,AIGC还将作为生产力工具,不断推动聊天机器人、数字人、元宇宙等领域发展。AIGC技术让聊天机器人接近人类水平日益成为现实,当前以ChatGPT为代表的聊天机器人已经在刺激搜索引擎产业的神经,未来人们获取信息是否会更多通过聊天机器人而非搜索引擎?这已经使谷歌等公司面临的巨大压力。AIGC也在大大提升数字人的制作效能,并且使其更神似人。比如腾讯AI LAB的虚拟歌手AI艾灵,能够基于AIGC实现作词和歌曲演唱。在元宇宙领域,AIGC在构建沉浸式空间环境、提供个性化内容体验、打造智能用户交互等方面发挥重要作用。比如,扎克伯格在元宇宙的岛屿上,可以通过发出语音命令生成创造海滩、变换天气,添加不同的场景等。只有借助AGIC,元宇宙才可能以低成本、高效率的方式满足海量用户的不同内容需求。

在产业互联网领域,基于AIGC技术的合成数据(synthetic data)迎来重大发展,合成数据将牵引人工智能的未来。MIT科技评论将AI合成数据列为2022年10大突破性技术之一;Gartner也预测称,到2030年合成数据将彻底取代真实数据,成为训练AI的主要数据来源。


图:合成数据发展预测(来源:Gartner)

合成数据的用途是成为真实世界数据的廉价替代品,用来训练、测试、验证AI模型。AIGC技术的持续创新,让合成数据迎来新的发展契机,开始迸发出更大的产业发展和商业应用活力。这主要体现在以下四个方面:

第一,合成数据为AI模型训练开发提供强大助推器,推动实现AI 2.0。过去用真实世界数据训练AI模型,存在数据采集和标注的成本高昂,数据质量较难保障、数据多样化不足、隐私保护挑战等多方面问题。而合成数据可以很好的解决这些问题。使用合成数据不仅能更高效地训练AI模型,而且可以让AI在合成数据构建的虚拟仿真世界中自我学习、进化,极大扩展AI的应用可能性。从某种意义上也可以说合成数据让AI模型训练从1.0阶段发展到2.0阶段。

第二,合成数据助力破解AI“深水区”的数据难题,持续拓展产业互联网应用空间。目前,合成数据正迅速向交通、金融、医疗、零售、工业等诸多产业领域拓展应用,帮助破解产业互联网应用中的数据难题。比如,腾讯自动驾驶团队研发的仿真系统TAD SIM可以自动生成各种交通场景数据,助力自动驾驶系统测试、开发。在医疗领域,美国国立卫生研究院和合成数据服务商合作,基于其COVID-19病人病历数据库,合成了不具有可识别性的替代数据,可供世界范围内的研究人员自由分享和使用。


图:腾讯自动驾驶数字孪生仿真平台

第三,正是由于合成数据对人工智能未来发展的巨大价值,合成数据正加速成为一个新产业赛道,科技大厂和创新企业纷纷抢先布局。目前,全球合成数据创业企业也已经达到100家,英伟达、亚马逊、微软等头部科技企业也在加速布局,涌现了合成数据即服务(SDaaS,synthetic data as a service)这一全新商业模式。

第四,合成数据加速构建AI赋能、数实融合的大型虚拟世界。合成数据指向的终极应用形态是借助游戏引擎、3D图形、AIGC技术构建的数实融合的大型虚拟世界。基于合成数据构建的大型虚拟世界,为测试、开发新的人工智能应用,提供了一个安全、可靠、高效以及最重要的是——低成本的、可重复利用的环境,将成为AI数实融合的关键载体,包括为AI开发提供数据和场景、试验田等。比如腾讯开悟的AI开放研究环境,已经吸引了国内外众多决策智能领域的研究团队使用。

在社会价值领域,AIGC也在助力可持续社会价值的实现。比如,在医疗健康方面,AI语音生成帮助病人“开口说话”。语音合成软件制造商Lyrebird为渐冻症患者设计的语音合成系统实现“声音克隆”,帮助患者重新获得“自己的声音”。AI数字人也能帮助老年痴呆症患者与他们可能记得的年轻面孔或者逝去的亲人互动。此外,AIGC也可以用于文物修复,助力文物保护传承。腾讯公司利用360度沉浸式展示技术、智能音视频技术、人工智能等技术手段,对敦煌古壁画进行数字化分析与修复。在国外,DeepMind合作开发的深度神经网络模型Ithaca可以修复残缺的历史碑文。


图:腾讯利用AIGC技术手段,助力敦煌古壁画修复

总之,随着AIGC模型的通用化水平和工业化能力的持续提升,AIGC的根本影响在于,将极大降低内容生产和交互的门槛和成本,有望带来一场自动化内容生产与交互变革,引起社会的成本结构的重大改变,进而在各行各业引发巨震。未来,“AIGC+”将持续大放异彩,深度赋能各行各业高质量发展。

以可信AIGC
积极应对科技治理问题与挑战,

拥抱人工智能的下一个时代

发展总是与挑战并生,AIGC的发展也面临许多科技治理问题的挑战。目前,主要是知识产权、安全、伦理和环境四个方面的挑战。

首先,AIGC引发的新型版权侵权风险,已经成为整个行业发展所面临的紧迫问题。因版权争议,国外艺术作品平台ArtStation上的画师们掀起了抵制AIGC生成图像的活动。其次,安全问题始终存在于科技发展应用之中。在AIGC中,主要表现为信息内容安全、AIGC滥用引发诈骗等新型违法犯罪行为,以及AIGC的内生安全等。较为著名的案例是,诈骗团队利用AIGC换脸伪造埃隆·马斯克的视频,半年诈骗价值超过2亿人民币的数字货币。再次,算法歧视等伦理问题依然存在。比如,DALL·E 2具有显著的种族和性别刻板印象。最后是环境影响,AIGC模型训练消耗大量算力,碳排放量惊人。此前就有研究表明,单一机器学习模型训练所产生的碳排放,相当于普通汽车寿命期内碳排放量的5倍。


图:腾讯优图实验室推出FaceIn人脸防伪产品,能够自动检测精准识别视频、图像中是否应用人脸伪造技术

为了应对以上挑战,面向人工智能的下一个时代,人们需要更加负责任地、以人为本地发展应用AIGC技术,打造可信AIGC生态。面对AIGC技术应用可能带来的风险挑战,社会各界需要协同参与、共同应对,通过法律、伦理、技术等方面的多元措施支持构建可信AI生态。在立法方面,网信办等三部门出台的《互联网信息服务深度合成管理规定》针对深度合成技术服务提出的要求和管理措施,诸如禁止性要求、标识要求、安全评估等,亦适用于AIGC。接下来,需要着重从以下方面持续推进AIGC的政策和治理。

其一,政府部门需要结合AIGC技术的发展应用情况,制定并明晰AIGC的知识产权与数据权益保护规则。目前,AIGC的知识产权与数据权益保护规则的不明确,在某种程度上导致甚至加剧了AI领域的乱象。

其二,研发应用AIGC技术的主体需要积极探索自律管理措施,例如,秉持不作恶、科技向善等目的,制定适宜的政策(消极要求和积极要求),采取控制和安全措施保障AIGC的安全可控应用,采取内容识别、内容溯源等技术确保AIGC的可靠来源。

其三,打造安全可信的AIGC应用,需要深入推进AI伦理治理。例如,行业组织可以制定可信AIGC的伦理指南,更好地支持AIGC健康可持续发展;AIGC领域的创新主体需要考虑通过伦理委员会等方式,推进落实AI风险管理、伦理审查评估等,在AIGC应用中实现“伦理嵌入设计”(ethics by design)。

其四,社会各界需要携手应对AIGC领域的能源消耗问题,推行绿色AI的发展理念,致力于打造绿色可持续、环境友好型的AI模型,实现智能化与低碳化融合发展。

未来已来,让我们拥抱AIGC,拥抱人工智能的下一个时代,打造更美好的未来。

来源:腾讯研究院
链接:https://mp.weixin.qq.com/s/9AjTpyL4HmQ6BDhWIDbD0A

编辑:张铭麟

577#
 楼主| 发表于 2023-2-1 16:20:08 | 只看该作者
【案例】

腾讯发布 AIGC 发展趋势报告:迎接人工智能的下一个时代|附报告下载

2022年,从引爆AI作画领域的DALL-E 2、Stable Diffusion等AI模型,到以ChatGPT为代表的接近人类水平的对话机器人,AIGC不断刷爆网络,其强大的内容生成能力给人们带来了巨大的震撼。学术界和产业界也都形成共识:AIGC绝非昙花一现,其底层技术和产业生态已经形成了新的格局。

就内容生产而言,AIGC作为新的生产力引擎,让我们从过去的PGC、UGC,已经不可避免地进入AIGC时代。AIGC代表着AI技术从感知、理解世界到生成、创造世界的跃迁,正推动人工智能迎来下一个时代。

经过了2022年的预热,2023年AIGC领域将迎来更大发展。AIGC生成内容的类型不断丰富、质量不断提升,也将有更多的企业积极拥抱AIGC。在这个背景下,腾讯研究院正式发布《AIGC发展趋势报告2023:迎接人工智能的下一个时代》。报告从技术发展和产业生态、应用趋势、治理挑战等维度,对AIGC的发展趋势进行了深入思考。

本文为报告核心内容摘要(文末附下载):

AIGC技术和产业生态
迎来发展快车道

AIGC的大爆发不仅有赖于AI技术的突破创新,还离不开产业生态快速发展的支撑。在技术创新方面,生成算法、预训练模型、多模态技术等AI技术汇聚发展,为AIGC的爆发提供了肥沃的技术土壤。



图:AIGC技术累积融合

第一,基础的生成算法模型不断突破创新。比如为人熟知的GAN、Transformer、扩散模型等,这些模型的性能、稳定性、生成内容质量等不断提升。得益于生成算法的进步,AIGC现在已经能够生成文字、代码、图像、语音、视频、3D物体等各种类型的内容和数据。

第二,预训练模型,也即基础模型、大模型,引发了AIGC技术能力的质变。虽然过去各类生成模型层出不穷,但是使用门槛高、训练成本高、内容生成简单和质量偏低,远远不能满足真实内容消费场景中的灵活多变、高精度、高质量等需求。而预训练模型能够适用于多任务、多场景、多功能需求,能够解决以上诸多痛点。预训练模型技术也显著提升了AIGC模型的通用化能力和工业化水平,同一个AIGC模型可以高质量地完成多种多样的内容输出任务,让AIGC模型成为自动化内容生产的“工厂”和“流水线”。正因如此,谷歌、微软、OpenAI等企业纷纷抢占先机,推动人工智能进入预训练模型时代。

第三,多模态技术推动了AIGC的内容多样性,进一步增强了AIGC模型的通用化能力。多模态技术使得语言文字、图像、音视频等多种类型数据可以互相转化和生成。比如CLIP模型,它能够将文字和图像进行关联,如将文字“狗”和狗的图像进行关联,并且关联的特征非常丰富。这为后续文生图、文生视频类的AIGC应用的爆发奠定了基础。

未来,算法的进步将带来更多激动人心的应用,语言模型会得到进一步发展,可以自我持续学习的多模态AI将日益成为主流,这些因素会进一步推动AIGC领域的蓬勃发展。

在产业生态方面,AIGC领域正在加速形成三层产业生态并持续创新发展,正走向模型即服务(MaaS)的未来。

目前,AIGC产业生态体系的雏形已现,呈现为上中下三层架构。


第一层是基础层,以预训练模型为基础搭建的AIGC技术基础设施层。在国外,以OpenAI、Stability.ai为代表,通过受控API、开源等方式输出模型能力。

第二层是中间层,是在预训练模型基础上,通过专门的调试和训练,快速抽取形成垂直化、场景化、定制化的小模型和应用工具层,可以实现工业流水线式部署,同时兼具按需使用、高效经济的优势。比如,知名的二次元画风生成模型Novel-AI,以及各种风格的角色生成器等,就是基于Stable Diffusion开源进行的二次开发。随着AIGC模型加速成为新的技术平台,模型即服务(Model-as-a-Service,MaaS)开始成为现实,预计将对商业领域产生巨大影响。

第三层是应用层,依托底层模型和中间层的垂直模型,各厂商进一步开放面向C端和B端用户的各种各样的AIGC产品和服务,满足海量用户的内容创建和消费需求。例如群聊机器人、文本生成软件、头像生成软件等AIGC消费工具。

目前,从提供预训练的AI大模型的基础设施层公司到专注打造垂直领域内AIGC工具的中间层公司、再到直接面对消费者和终端用户提供产品和服务的应用层公司,美国围绕AIGC生长出繁荣的生态,技术创新引发的应用创新浪潮迭起;中国也有望凭借领先的AIGC技术赋能千行百业。

AIGC在消费互联网、产业互联网
和社会价值领域持续产生变革性影响

AIGC领域目前呈现AIGC的内容类型不断丰富、内容质量不断提升、技术的通用性和工业化水平越来越强等趋势,这使得AIGC在消费互联网领域日趋主流化,涌现了写作助手、AI绘画、对话机器人、数字人等爆款级应用,支撑着传媒、电商、娱乐、影视等领域的内容需求。目前AIGC也正在向产业互联网、社会价值领域扩张应用。


图:AIGC应用现状概览(引用自红杉资本)

在消费互联网领域,AIGC牵引数字内容领域的全新变革。目前AIGC的爆发点主要是在内容消费领域,已经呈现百花齐放之势。AIGC生成的内容种类越来越丰富,而且内容质量也在显著提升,产业生态日益丰富。这其中有三个值得关注的趋势:

第一,AIGC有望成为新型的内容生产基础设施,塑造数字内容生产与交互新范式,持续推进数字文化产业创新。过去AI在内容消费领域的作用主要体现在推荐算法成为了新型的传播基础设施。推荐算法对数字内容传播,短视频为主的数字内容新业态发展,起到了颠覆式的变革作用。而现在,随着AIGC生成的内容种类越来越丰富,内容的质量不断提升,AIGC将作为新型的内容生产基础设施对既有的内容生成模式产生变革影响。

第二,AIGC的商业化应用将快速成熟,市场规模会迅速壮大。当前AIGC已经率先在传媒、电商、影视、娱乐等数字化程度高、内容需求丰富的行业取得重大发展,市场潜力逐渐显现。比如,在广告领域,腾讯混元AI大模型能够支持广告智能制作,即利用AIGC将广告文案自动生成为广告视频,大大降低了广告视频制作成本。巨大的应用前景将带来市场规模的快速增长,根据6pen预测,未来五年10%-30%的图片内容由AI参与生成,有望创造超过600亿以上市场规模。也有国外商业咨询机构预测,2030年AIGC市场规模将达到1100亿美元。

第三,AIGC还将作为生产力工具,不断推动聊天机器人、数字人、元宇宙等领域发展。AIGC技术让聊天机器人接近人类水平日益成为现实,当前以ChatGPT为代表的聊天机器人已经在刺激搜索引擎产业的神经,未来人们获取信息是否会更多通过聊天机器人而非搜索引擎?这已经使谷歌等公司面临的巨大压力。AIGC也在大大提升数字人的制作效能,并且使其更神似人。比如腾讯AI LAB的虚拟歌手AI艾灵,能够基于AIGC实现作词和歌曲演唱。在元宇宙领域,AIGC在构建沉浸式空间环境、提供个性化内容体验、打造智能用户交互等方面发挥重要作用。比如,扎克伯格在元宇宙的岛屿上,可以通过发出语音命令生成创造海滩、变换天气,添加不同的场景等。只有借助AGIC,元宇宙才可能以低成本、高效率的方式满足海量用户的不同内容需求。

在产业互联网领域,基于AIGC技术的合成数据(synthetic data)迎来重大发展,合成数据将牵引人工智能的未来。MIT科技评论将AI合成数据列为2022年10大突破性技术之一;Gartner也预测称,到2030年合成数据将彻底取代真实数据,成为训练AI的主要数据来源。


图:合成数据发展预测(来源:Gartner)

合成数据的用途是成为真实世界数据的廉价替代品,用来训练、测试、验证AI模型。AIGC技术的持续创新,让合成数据迎来新的发展契机,开始迸发出更大的产业发展和商业应用活力。这主要体现在以下四个方面:

第一,合成数据为AI模型训练开发提供强大助推器,推动实现AI 2.0。过去用真实世界数据训练AI模型,存在数据采集和标注的成本高昂,数据质量较难保障、数据多样化不足、隐私保护挑战等多方面问题。而合成数据可以很好的解决这些问题。使用合成数据不仅能更高效地训练AI模型,而且可以让AI在合成数据构建的虚拟仿真世界中自我学习、进化,极大扩展AI的应用可能性。从某种意义上也可以说合成数据让AI模型训练从1.0阶段发展到2.0阶段。

第二,合成数据助力破解AI“深水区”的数据难题,持续拓展产业互联网应用空间。目前,合成数据正迅速向交通、金融、医疗、零售、工业等诸多产业领域拓展应用,帮助破解产业互联网应用中的数据难题。比如,腾讯自动驾驶团队研发的仿真系统TAD SIM可以自动生成各种交通场景数据,助力自动驾驶系统测试、开发。在医疗领域,美国国立卫生研究院和合成数据服务商合作,基于其COVID-19病人病历数据库,合成了不具有可识别性的替代数据,可供世界范围内的研究人员自由分享和使用。


图:腾讯自动驾驶数字孪生仿真平台

第三,正是由于合成数据对人工智能未来发展的巨大价值,合成数据正加速成为一个新产业赛道,科技大厂和创新企业纷纷抢先布局。目前,全球合成数据创业企业也已经达到100家,英伟达、亚马逊、微软等头部科技企业也在加速布局,涌现了合成数据即服务(SDaaS,synthetic data as a service)这一全新商业模式。

第四,合成数据加速构建AI赋能、数实融合的大型虚拟世界。合成数据指向的终极应用形态是借助游戏引擎、3D图形、AIGC技术构建的数实融合的大型虚拟世界。基于合成数据构建的大型虚拟世界,为测试、开发新的人工智能应用,提供了一个安全、可靠、高效以及最重要的是——低成本的、可重复利用的环境,将成为AI数实融合的关键载体,包括为AI开发提供数据和场景、试验田等。比如腾讯开悟的AI开放研究环境,已经吸引了国内外众多决策智能领域的研究团队使用。

在社会价值领域,AIGC也在助力可持续社会价值的实现。比如,在医疗健康方面,AI语音生成帮助病人“开口说话”。语音合成软件制造商Lyrebird为渐冻症患者设计的语音合成系统实现“声音克隆”,帮助患者重新获得“自己的声音”。AI数字人也能帮助老年痴呆症患者与他们可能记得的年轻面孔或者逝去的亲人互动。此外,AIGC也可以用于文物修复,助力文物保护传承。腾讯公司利用360度沉浸式展示技术、智能音视频技术、人工智能等技术手段,对敦煌古壁画进行数字化分析与修复。在国外,DeepMind合作开发的深度神经网络模型Ithaca可以修复残缺的历史碑文。


图:腾讯利用AIGC技术手段,助力敦煌古壁画修复

总之,随着AIGC模型的通用化水平和工业化能力的持续提升,AIGC的根本影响在于,将极大降低内容生产和交互的门槛和成本,有望带来一场自动化内容生产与交互变革,引起社会的成本结构的重大改变,进而在各行各业引发巨震。未来,“AIGC+”将持续大放异彩,深度赋能各行各业高质量发展。

以可信AIGC
积极应对科技治理问题与挑战,

拥抱人工智能的下一个时代

发展总是与挑战并生,AIGC的发展也面临许多科技治理问题的挑战。目前,主要是知识产权、安全、伦理和环境四个方面的挑战。

首先,AIGC引发的新型版权侵权风险,已经成为整个行业发展所面临的紧迫问题。因版权争议,国外艺术作品平台ArtStation上的画师们掀起了抵制AIGC生成图像的活动。其次,安全问题始终存在于科技发展应用之中。在AIGC中,主要表现为信息内容安全、AIGC滥用引发诈骗等新型违法犯罪行为,以及AIGC的内生安全等。较为著名的案例是,诈骗团队利用AIGC换脸伪造埃隆·马斯克的视频,半年诈骗价值超过2亿人民币的数字货币。再次,算法歧视等伦理问题依然存在。比如,DALL·E 2具有显著的种族和性别刻板印象。最后是环境影响,AIGC模型训练消耗大量算力,碳排放量惊人。此前就有研究表明,单一机器学习模型训练所产生的碳排放,相当于普通汽车寿命期内碳排放量的5倍。


图:腾讯优图实验室推出FaceIn人脸防伪产品,能够自动检测精准识别视频、图像中是否应用人脸伪造技术

为了应对以上挑战,面向人工智能的下一个时代,人们需要更加负责任地、以人为本地发展应用AIGC技术,打造可信AIGC生态。面对AIGC技术应用可能带来的风险挑战,社会各界需要协同参与、共同应对,通过法律、伦理、技术等方面的多元措施支持构建可信AI生态。在立法方面,网信办等三部门出台的《互联网信息服务深度合成管理规定》针对深度合成技术服务提出的要求和管理措施,诸如禁止性要求、标识要求、安全评估等,亦适用于AIGC。接下来,需要着重从以下方面持续推进AIGC的政策和治理。

其一,政府部门需要结合AIGC技术的发展应用情况,制定并明晰AIGC的知识产权与数据权益保护规则。目前,AIGC的知识产权与数据权益保护规则的不明确,在某种程度上导致甚至加剧了AI领域的乱象。

其二,研发应用AIGC技术的主体需要积极探索自律管理措施,例如,秉持不作恶、科技向善等目的,制定适宜的政策(消极要求和积极要求),采取控制和安全措施保障AIGC的安全可控应用,采取内容识别、内容溯源等技术确保AIGC的可靠来源。

其三,打造安全可信的AIGC应用,需要深入推进AI伦理治理。例如,行业组织可以制定可信AIGC的伦理指南,更好地支持AIGC健康可持续发展;AIGC领域的创新主体需要考虑通过伦理委员会等方式,推进落实AI风险管理、伦理审查评估等,在AIGC应用中实现“伦理嵌入设计”(ethics by design)。

其四,社会各界需要携手应对AIGC领域的能源消耗问题,推行绿色AI的发展理念,致力于打造绿色可持续、环境友好型的AI模型,实现智能化与低碳化融合发展。

未来已来,让我们拥抱AIGC,拥抱人工智能的下一个时代,打造更美好的未来。

来源:腾讯研究院
链接:https://mp.weixin.qq.com/s/9AjTpyL4HmQ6BDhWIDbD0A

编辑:张铭麟

578#
 楼主| 发表于 2023-2-1 16:20:08 | 只看该作者
【案例】

腾讯发布 AIGC 发展趋势报告:迎接人工智能的下一个时代|附报告下载

2022年,从引爆AI作画领域的DALL-E 2、Stable Diffusion等AI模型,到以ChatGPT为代表的接近人类水平的对话机器人,AIGC不断刷爆网络,其强大的内容生成能力给人们带来了巨大的震撼。学术界和产业界也都形成共识:AIGC绝非昙花一现,其底层技术和产业生态已经形成了新的格局。

就内容生产而言,AIGC作为新的生产力引擎,让我们从过去的PGC、UGC,已经不可避免地进入AIGC时代。AIGC代表着AI技术从感知、理解世界到生成、创造世界的跃迁,正推动人工智能迎来下一个时代。

经过了2022年的预热,2023年AIGC领域将迎来更大发展。AIGC生成内容的类型不断丰富、质量不断提升,也将有更多的企业积极拥抱AIGC。在这个背景下,腾讯研究院正式发布《AIGC发展趋势报告2023:迎接人工智能的下一个时代》。报告从技术发展和产业生态、应用趋势、治理挑战等维度,对AIGC的发展趋势进行了深入思考。

本文为报告核心内容摘要(文末附下载):

AIGC技术和产业生态
迎来发展快车道

AIGC的大爆发不仅有赖于AI技术的突破创新,还离不开产业生态快速发展的支撑。在技术创新方面,生成算法、预训练模型、多模态技术等AI技术汇聚发展,为AIGC的爆发提供了肥沃的技术土壤。



图:AIGC技术累积融合

第一,基础的生成算法模型不断突破创新。比如为人熟知的GAN、Transformer、扩散模型等,这些模型的性能、稳定性、生成内容质量等不断提升。得益于生成算法的进步,AIGC现在已经能够生成文字、代码、图像、语音、视频、3D物体等各种类型的内容和数据。

第二,预训练模型,也即基础模型、大模型,引发了AIGC技术能力的质变。虽然过去各类生成模型层出不穷,但是使用门槛高、训练成本高、内容生成简单和质量偏低,远远不能满足真实内容消费场景中的灵活多变、高精度、高质量等需求。而预训练模型能够适用于多任务、多场景、多功能需求,能够解决以上诸多痛点。预训练模型技术也显著提升了AIGC模型的通用化能力和工业化水平,同一个AIGC模型可以高质量地完成多种多样的内容输出任务,让AIGC模型成为自动化内容生产的“工厂”和“流水线”。正因如此,谷歌、微软、OpenAI等企业纷纷抢占先机,推动人工智能进入预训练模型时代。

第三,多模态技术推动了AIGC的内容多样性,进一步增强了AIGC模型的通用化能力。多模态技术使得语言文字、图像、音视频等多种类型数据可以互相转化和生成。比如CLIP模型,它能够将文字和图像进行关联,如将文字“狗”和狗的图像进行关联,并且关联的特征非常丰富。这为后续文生图、文生视频类的AIGC应用的爆发奠定了基础。

未来,算法的进步将带来更多激动人心的应用,语言模型会得到进一步发展,可以自我持续学习的多模态AI将日益成为主流,这些因素会进一步推动AIGC领域的蓬勃发展。

在产业生态方面,AIGC领域正在加速形成三层产业生态并持续创新发展,正走向模型即服务(MaaS)的未来。

目前,AIGC产业生态体系的雏形已现,呈现为上中下三层架构。


第一层是基础层,以预训练模型为基础搭建的AIGC技术基础设施层。在国外,以OpenAI、Stability.ai为代表,通过受控API、开源等方式输出模型能力。

第二层是中间层,是在预训练模型基础上,通过专门的调试和训练,快速抽取形成垂直化、场景化、定制化的小模型和应用工具层,可以实现工业流水线式部署,同时兼具按需使用、高效经济的优势。比如,知名的二次元画风生成模型Novel-AI,以及各种风格的角色生成器等,就是基于Stable Diffusion开源进行的二次开发。随着AIGC模型加速成为新的技术平台,模型即服务(Model-as-a-Service,MaaS)开始成为现实,预计将对商业领域产生巨大影响。

第三层是应用层,依托底层模型和中间层的垂直模型,各厂商进一步开放面向C端和B端用户的各种各样的AIGC产品和服务,满足海量用户的内容创建和消费需求。例如群聊机器人、文本生成软件、头像生成软件等AIGC消费工具。

目前,从提供预训练的AI大模型的基础设施层公司到专注打造垂直领域内AIGC工具的中间层公司、再到直接面对消费者和终端用户提供产品和服务的应用层公司,美国围绕AIGC生长出繁荣的生态,技术创新引发的应用创新浪潮迭起;中国也有望凭借领先的AIGC技术赋能千行百业。

AIGC在消费互联网、产业互联网
和社会价值领域持续产生变革性影响

AIGC领域目前呈现AIGC的内容类型不断丰富、内容质量不断提升、技术的通用性和工业化水平越来越强等趋势,这使得AIGC在消费互联网领域日趋主流化,涌现了写作助手、AI绘画、对话机器人、数字人等爆款级应用,支撑着传媒、电商、娱乐、影视等领域的内容需求。目前AIGC也正在向产业互联网、社会价值领域扩张应用。


图:AIGC应用现状概览(引用自红杉资本)

在消费互联网领域,AIGC牵引数字内容领域的全新变革。目前AIGC的爆发点主要是在内容消费领域,已经呈现百花齐放之势。AIGC生成的内容种类越来越丰富,而且内容质量也在显著提升,产业生态日益丰富。这其中有三个值得关注的趋势:

第一,AIGC有望成为新型的内容生产基础设施,塑造数字内容生产与交互新范式,持续推进数字文化产业创新。过去AI在内容消费领域的作用主要体现在推荐算法成为了新型的传播基础设施。推荐算法对数字内容传播,短视频为主的数字内容新业态发展,起到了颠覆式的变革作用。而现在,随着AIGC生成的内容种类越来越丰富,内容的质量不断提升,AIGC将作为新型的内容生产基础设施对既有的内容生成模式产生变革影响。

第二,AIGC的商业化应用将快速成熟,市场规模会迅速壮大。当前AIGC已经率先在传媒、电商、影视、娱乐等数字化程度高、内容需求丰富的行业取得重大发展,市场潜力逐渐显现。比如,在广告领域,腾讯混元AI大模型能够支持广告智能制作,即利用AIGC将广告文案自动生成为广告视频,大大降低了广告视频制作成本。巨大的应用前景将带来市场规模的快速增长,根据6pen预测,未来五年10%-30%的图片内容由AI参与生成,有望创造超过600亿以上市场规模。也有国外商业咨询机构预测,2030年AIGC市场规模将达到1100亿美元。

第三,AIGC还将作为生产力工具,不断推动聊天机器人、数字人、元宇宙等领域发展。AIGC技术让聊天机器人接近人类水平日益成为现实,当前以ChatGPT为代表的聊天机器人已经在刺激搜索引擎产业的神经,未来人们获取信息是否会更多通过聊天机器人而非搜索引擎?这已经使谷歌等公司面临的巨大压力。AIGC也在大大提升数字人的制作效能,并且使其更神似人。比如腾讯AI LAB的虚拟歌手AI艾灵,能够基于AIGC实现作词和歌曲演唱。在元宇宙领域,AIGC在构建沉浸式空间环境、提供个性化内容体验、打造智能用户交互等方面发挥重要作用。比如,扎克伯格在元宇宙的岛屿上,可以通过发出语音命令生成创造海滩、变换天气,添加不同的场景等。只有借助AGIC,元宇宙才可能以低成本、高效率的方式满足海量用户的不同内容需求。

在产业互联网领域,基于AIGC技术的合成数据(synthetic data)迎来重大发展,合成数据将牵引人工智能的未来。MIT科技评论将AI合成数据列为2022年10大突破性技术之一;Gartner也预测称,到2030年合成数据将彻底取代真实数据,成为训练AI的主要数据来源。


图:合成数据发展预测(来源:Gartner)

合成数据的用途是成为真实世界数据的廉价替代品,用来训练、测试、验证AI模型。AIGC技术的持续创新,让合成数据迎来新的发展契机,开始迸发出更大的产业发展和商业应用活力。这主要体现在以下四个方面:

第一,合成数据为AI模型训练开发提供强大助推器,推动实现AI 2.0。过去用真实世界数据训练AI模型,存在数据采集和标注的成本高昂,数据质量较难保障、数据多样化不足、隐私保护挑战等多方面问题。而合成数据可以很好的解决这些问题。使用合成数据不仅能更高效地训练AI模型,而且可以让AI在合成数据构建的虚拟仿真世界中自我学习、进化,极大扩展AI的应用可能性。从某种意义上也可以说合成数据让AI模型训练从1.0阶段发展到2.0阶段。

第二,合成数据助力破解AI“深水区”的数据难题,持续拓展产业互联网应用空间。目前,合成数据正迅速向交通、金融、医疗、零售、工业等诸多产业领域拓展应用,帮助破解产业互联网应用中的数据难题。比如,腾讯自动驾驶团队研发的仿真系统TAD SIM可以自动生成各种交通场景数据,助力自动驾驶系统测试、开发。在医疗领域,美国国立卫生研究院和合成数据服务商合作,基于其COVID-19病人病历数据库,合成了不具有可识别性的替代数据,可供世界范围内的研究人员自由分享和使用。


图:腾讯自动驾驶数字孪生仿真平台

第三,正是由于合成数据对人工智能未来发展的巨大价值,合成数据正加速成为一个新产业赛道,科技大厂和创新企业纷纷抢先布局。目前,全球合成数据创业企业也已经达到100家,英伟达、亚马逊、微软等头部科技企业也在加速布局,涌现了合成数据即服务(SDaaS,synthetic data as a service)这一全新商业模式。

第四,合成数据加速构建AI赋能、数实融合的大型虚拟世界。合成数据指向的终极应用形态是借助游戏引擎、3D图形、AIGC技术构建的数实融合的大型虚拟世界。基于合成数据构建的大型虚拟世界,为测试、开发新的人工智能应用,提供了一个安全、可靠、高效以及最重要的是——低成本的、可重复利用的环境,将成为AI数实融合的关键载体,包括为AI开发提供数据和场景、试验田等。比如腾讯开悟的AI开放研究环境,已经吸引了国内外众多决策智能领域的研究团队使用。

在社会价值领域,AIGC也在助力可持续社会价值的实现。比如,在医疗健康方面,AI语音生成帮助病人“开口说话”。语音合成软件制造商Lyrebird为渐冻症患者设计的语音合成系统实现“声音克隆”,帮助患者重新获得“自己的声音”。AI数字人也能帮助老年痴呆症患者与他们可能记得的年轻面孔或者逝去的亲人互动。此外,AIGC也可以用于文物修复,助力文物保护传承。腾讯公司利用360度沉浸式展示技术、智能音视频技术、人工智能等技术手段,对敦煌古壁画进行数字化分析与修复。在国外,DeepMind合作开发的深度神经网络模型Ithaca可以修复残缺的历史碑文。


图:腾讯利用AIGC技术手段,助力敦煌古壁画修复

总之,随着AIGC模型的通用化水平和工业化能力的持续提升,AIGC的根本影响在于,将极大降低内容生产和交互的门槛和成本,有望带来一场自动化内容生产与交互变革,引起社会的成本结构的重大改变,进而在各行各业引发巨震。未来,“AIGC+”将持续大放异彩,深度赋能各行各业高质量发展。

以可信AIGC
积极应对科技治理问题与挑战,

拥抱人工智能的下一个时代

发展总是与挑战并生,AIGC的发展也面临许多科技治理问题的挑战。目前,主要是知识产权、安全、伦理和环境四个方面的挑战。

首先,AIGC引发的新型版权侵权风险,已经成为整个行业发展所面临的紧迫问题。因版权争议,国外艺术作品平台ArtStation上的画师们掀起了抵制AIGC生成图像的活动。其次,安全问题始终存在于科技发展应用之中。在AIGC中,主要表现为信息内容安全、AIGC滥用引发诈骗等新型违法犯罪行为,以及AIGC的内生安全等。较为著名的案例是,诈骗团队利用AIGC换脸伪造埃隆·马斯克的视频,半年诈骗价值超过2亿人民币的数字货币。再次,算法歧视等伦理问题依然存在。比如,DALL·E 2具有显著的种族和性别刻板印象。最后是环境影响,AIGC模型训练消耗大量算力,碳排放量惊人。此前就有研究表明,单一机器学习模型训练所产生的碳排放,相当于普通汽车寿命期内碳排放量的5倍。


图:腾讯优图实验室推出FaceIn人脸防伪产品,能够自动检测精准识别视频、图像中是否应用人脸伪造技术

为了应对以上挑战,面向人工智能的下一个时代,人们需要更加负责任地、以人为本地发展应用AIGC技术,打造可信AIGC生态。面对AIGC技术应用可能带来的风险挑战,社会各界需要协同参与、共同应对,通过法律、伦理、技术等方面的多元措施支持构建可信AI生态。在立法方面,网信办等三部门出台的《互联网信息服务深度合成管理规定》针对深度合成技术服务提出的要求和管理措施,诸如禁止性要求、标识要求、安全评估等,亦适用于AIGC。接下来,需要着重从以下方面持续推进AIGC的政策和治理。

其一,政府部门需要结合AIGC技术的发展应用情况,制定并明晰AIGC的知识产权与数据权益保护规则。目前,AIGC的知识产权与数据权益保护规则的不明确,在某种程度上导致甚至加剧了AI领域的乱象。

其二,研发应用AIGC技术的主体需要积极探索自律管理措施,例如,秉持不作恶、科技向善等目的,制定适宜的政策(消极要求和积极要求),采取控制和安全措施保障AIGC的安全可控应用,采取内容识别、内容溯源等技术确保AIGC的可靠来源。

其三,打造安全可信的AIGC应用,需要深入推进AI伦理治理。例如,行业组织可以制定可信AIGC的伦理指南,更好地支持AIGC健康可持续发展;AIGC领域的创新主体需要考虑通过伦理委员会等方式,推进落实AI风险管理、伦理审查评估等,在AIGC应用中实现“伦理嵌入设计”(ethics by design)。

其四,社会各界需要携手应对AIGC领域的能源消耗问题,推行绿色AI的发展理念,致力于打造绿色可持续、环境友好型的AI模型,实现智能化与低碳化融合发展。

未来已来,让我们拥抱AIGC,拥抱人工智能的下一个时代,打造更美好的未来。

来源:腾讯研究院
链接:https://mp.weixin.qq.com/s/9AjTpyL4HmQ6BDhWIDbD0A

编辑:张铭麟

579#
 楼主| 发表于 2023-2-1 16:20:08 | 只看该作者
【案例】

腾讯发布 AIGC 发展趋势报告:迎接人工智能的下一个时代|附报告下载

2022年,从引爆AI作画领域的DALL-E 2、Stable Diffusion等AI模型,到以ChatGPT为代表的接近人类水平的对话机器人,AIGC不断刷爆网络,其强大的内容生成能力给人们带来了巨大的震撼。学术界和产业界也都形成共识:AIGC绝非昙花一现,其底层技术和产业生态已经形成了新的格局。

就内容生产而言,AIGC作为新的生产力引擎,让我们从过去的PGC、UGC,已经不可避免地进入AIGC时代。AIGC代表着AI技术从感知、理解世界到生成、创造世界的跃迁,正推动人工智能迎来下一个时代。

经过了2022年的预热,2023年AIGC领域将迎来更大发展。AIGC生成内容的类型不断丰富、质量不断提升,也将有更多的企业积极拥抱AIGC。在这个背景下,腾讯研究院正式发布《AIGC发展趋势报告2023:迎接人工智能的下一个时代》。报告从技术发展和产业生态、应用趋势、治理挑战等维度,对AIGC的发展趋势进行了深入思考。

本文为报告核心内容摘要(文末附下载):

AIGC技术和产业生态
迎来发展快车道

AIGC的大爆发不仅有赖于AI技术的突破创新,还离不开产业生态快速发展的支撑。在技术创新方面,生成算法、预训练模型、多模态技术等AI技术汇聚发展,为AIGC的爆发提供了肥沃的技术土壤。



图:AIGC技术累积融合

第一,基础的生成算法模型不断突破创新。比如为人熟知的GAN、Transformer、扩散模型等,这些模型的性能、稳定性、生成内容质量等不断提升。得益于生成算法的进步,AIGC现在已经能够生成文字、代码、图像、语音、视频、3D物体等各种类型的内容和数据。

第二,预训练模型,也即基础模型、大模型,引发了AIGC技术能力的质变。虽然过去各类生成模型层出不穷,但是使用门槛高、训练成本高、内容生成简单和质量偏低,远远不能满足真实内容消费场景中的灵活多变、高精度、高质量等需求。而预训练模型能够适用于多任务、多场景、多功能需求,能够解决以上诸多痛点。预训练模型技术也显著提升了AIGC模型的通用化能力和工业化水平,同一个AIGC模型可以高质量地完成多种多样的内容输出任务,让AIGC模型成为自动化内容生产的“工厂”和“流水线”。正因如此,谷歌、微软、OpenAI等企业纷纷抢占先机,推动人工智能进入预训练模型时代。

第三,多模态技术推动了AIGC的内容多样性,进一步增强了AIGC模型的通用化能力。多模态技术使得语言文字、图像、音视频等多种类型数据可以互相转化和生成。比如CLIP模型,它能够将文字和图像进行关联,如将文字“狗”和狗的图像进行关联,并且关联的特征非常丰富。这为后续文生图、文生视频类的AIGC应用的爆发奠定了基础。

未来,算法的进步将带来更多激动人心的应用,语言模型会得到进一步发展,可以自我持续学习的多模态AI将日益成为主流,这些因素会进一步推动AIGC领域的蓬勃发展。

在产业生态方面,AIGC领域正在加速形成三层产业生态并持续创新发展,正走向模型即服务(MaaS)的未来。

目前,AIGC产业生态体系的雏形已现,呈现为上中下三层架构。


第一层是基础层,以预训练模型为基础搭建的AIGC技术基础设施层。在国外,以OpenAI、Stability.ai为代表,通过受控API、开源等方式输出模型能力。

第二层是中间层,是在预训练模型基础上,通过专门的调试和训练,快速抽取形成垂直化、场景化、定制化的小模型和应用工具层,可以实现工业流水线式部署,同时兼具按需使用、高效经济的优势。比如,知名的二次元画风生成模型Novel-AI,以及各种风格的角色生成器等,就是基于Stable Diffusion开源进行的二次开发。随着AIGC模型加速成为新的技术平台,模型即服务(Model-as-a-Service,MaaS)开始成为现实,预计将对商业领域产生巨大影响。

第三层是应用层,依托底层模型和中间层的垂直模型,各厂商进一步开放面向C端和B端用户的各种各样的AIGC产品和服务,满足海量用户的内容创建和消费需求。例如群聊机器人、文本生成软件、头像生成软件等AIGC消费工具。

目前,从提供预训练的AI大模型的基础设施层公司到专注打造垂直领域内AIGC工具的中间层公司、再到直接面对消费者和终端用户提供产品和服务的应用层公司,美国围绕AIGC生长出繁荣的生态,技术创新引发的应用创新浪潮迭起;中国也有望凭借领先的AIGC技术赋能千行百业。

AIGC在消费互联网、产业互联网
和社会价值领域持续产生变革性影响

AIGC领域目前呈现AIGC的内容类型不断丰富、内容质量不断提升、技术的通用性和工业化水平越来越强等趋势,这使得AIGC在消费互联网领域日趋主流化,涌现了写作助手、AI绘画、对话机器人、数字人等爆款级应用,支撑着传媒、电商、娱乐、影视等领域的内容需求。目前AIGC也正在向产业互联网、社会价值领域扩张应用。


图:AIGC应用现状概览(引用自红杉资本)

在消费互联网领域,AIGC牵引数字内容领域的全新变革。目前AIGC的爆发点主要是在内容消费领域,已经呈现百花齐放之势。AIGC生成的内容种类越来越丰富,而且内容质量也在显著提升,产业生态日益丰富。这其中有三个值得关注的趋势:

第一,AIGC有望成为新型的内容生产基础设施,塑造数字内容生产与交互新范式,持续推进数字文化产业创新。过去AI在内容消费领域的作用主要体现在推荐算法成为了新型的传播基础设施。推荐算法对数字内容传播,短视频为主的数字内容新业态发展,起到了颠覆式的变革作用。而现在,随着AIGC生成的内容种类越来越丰富,内容的质量不断提升,AIGC将作为新型的内容生产基础设施对既有的内容生成模式产生变革影响。

第二,AIGC的商业化应用将快速成熟,市场规模会迅速壮大。当前AIGC已经率先在传媒、电商、影视、娱乐等数字化程度高、内容需求丰富的行业取得重大发展,市场潜力逐渐显现。比如,在广告领域,腾讯混元AI大模型能够支持广告智能制作,即利用AIGC将广告文案自动生成为广告视频,大大降低了广告视频制作成本。巨大的应用前景将带来市场规模的快速增长,根据6pen预测,未来五年10%-30%的图片内容由AI参与生成,有望创造超过600亿以上市场规模。也有国外商业咨询机构预测,2030年AIGC市场规模将达到1100亿美元。

第三,AIGC还将作为生产力工具,不断推动聊天机器人、数字人、元宇宙等领域发展。AIGC技术让聊天机器人接近人类水平日益成为现实,当前以ChatGPT为代表的聊天机器人已经在刺激搜索引擎产业的神经,未来人们获取信息是否会更多通过聊天机器人而非搜索引擎?这已经使谷歌等公司面临的巨大压力。AIGC也在大大提升数字人的制作效能,并且使其更神似人。比如腾讯AI LAB的虚拟歌手AI艾灵,能够基于AIGC实现作词和歌曲演唱。在元宇宙领域,AIGC在构建沉浸式空间环境、提供个性化内容体验、打造智能用户交互等方面发挥重要作用。比如,扎克伯格在元宇宙的岛屿上,可以通过发出语音命令生成创造海滩、变换天气,添加不同的场景等。只有借助AGIC,元宇宙才可能以低成本、高效率的方式满足海量用户的不同内容需求。

在产业互联网领域,基于AIGC技术的合成数据(synthetic data)迎来重大发展,合成数据将牵引人工智能的未来。MIT科技评论将AI合成数据列为2022年10大突破性技术之一;Gartner也预测称,到2030年合成数据将彻底取代真实数据,成为训练AI的主要数据来源。


图:合成数据发展预测(来源:Gartner)

合成数据的用途是成为真实世界数据的廉价替代品,用来训练、测试、验证AI模型。AIGC技术的持续创新,让合成数据迎来新的发展契机,开始迸发出更大的产业发展和商业应用活力。这主要体现在以下四个方面:

第一,合成数据为AI模型训练开发提供强大助推器,推动实现AI 2.0。过去用真实世界数据训练AI模型,存在数据采集和标注的成本高昂,数据质量较难保障、数据多样化不足、隐私保护挑战等多方面问题。而合成数据可以很好的解决这些问题。使用合成数据不仅能更高效地训练AI模型,而且可以让AI在合成数据构建的虚拟仿真世界中自我学习、进化,极大扩展AI的应用可能性。从某种意义上也可以说合成数据让AI模型训练从1.0阶段发展到2.0阶段。

第二,合成数据助力破解AI“深水区”的数据难题,持续拓展产业互联网应用空间。目前,合成数据正迅速向交通、金融、医疗、零售、工业等诸多产业领域拓展应用,帮助破解产业互联网应用中的数据难题。比如,腾讯自动驾驶团队研发的仿真系统TAD SIM可以自动生成各种交通场景数据,助力自动驾驶系统测试、开发。在医疗领域,美国国立卫生研究院和合成数据服务商合作,基于其COVID-19病人病历数据库,合成了不具有可识别性的替代数据,可供世界范围内的研究人员自由分享和使用。


图:腾讯自动驾驶数字孪生仿真平台

第三,正是由于合成数据对人工智能未来发展的巨大价值,合成数据正加速成为一个新产业赛道,科技大厂和创新企业纷纷抢先布局。目前,全球合成数据创业企业也已经达到100家,英伟达、亚马逊、微软等头部科技企业也在加速布局,涌现了合成数据即服务(SDaaS,synthetic data as a service)这一全新商业模式。

第四,合成数据加速构建AI赋能、数实融合的大型虚拟世界。合成数据指向的终极应用形态是借助游戏引擎、3D图形、AIGC技术构建的数实融合的大型虚拟世界。基于合成数据构建的大型虚拟世界,为测试、开发新的人工智能应用,提供了一个安全、可靠、高效以及最重要的是——低成本的、可重复利用的环境,将成为AI数实融合的关键载体,包括为AI开发提供数据和场景、试验田等。比如腾讯开悟的AI开放研究环境,已经吸引了国内外众多决策智能领域的研究团队使用。

在社会价值领域,AIGC也在助力可持续社会价值的实现。比如,在医疗健康方面,AI语音生成帮助病人“开口说话”。语音合成软件制造商Lyrebird为渐冻症患者设计的语音合成系统实现“声音克隆”,帮助患者重新获得“自己的声音”。AI数字人也能帮助老年痴呆症患者与他们可能记得的年轻面孔或者逝去的亲人互动。此外,AIGC也可以用于文物修复,助力文物保护传承。腾讯公司利用360度沉浸式展示技术、智能音视频技术、人工智能等技术手段,对敦煌古壁画进行数字化分析与修复。在国外,DeepMind合作开发的深度神经网络模型Ithaca可以修复残缺的历史碑文。


图:腾讯利用AIGC技术手段,助力敦煌古壁画修复

总之,随着AIGC模型的通用化水平和工业化能力的持续提升,AIGC的根本影响在于,将极大降低内容生产和交互的门槛和成本,有望带来一场自动化内容生产与交互变革,引起社会的成本结构的重大改变,进而在各行各业引发巨震。未来,“AIGC+”将持续大放异彩,深度赋能各行各业高质量发展。

以可信AIGC
积极应对科技治理问题与挑战,

拥抱人工智能的下一个时代

发展总是与挑战并生,AIGC的发展也面临许多科技治理问题的挑战。目前,主要是知识产权、安全、伦理和环境四个方面的挑战。

首先,AIGC引发的新型版权侵权风险,已经成为整个行业发展所面临的紧迫问题。因版权争议,国外艺术作品平台ArtStation上的画师们掀起了抵制AIGC生成图像的活动。其次,安全问题始终存在于科技发展应用之中。在AIGC中,主要表现为信息内容安全、AIGC滥用引发诈骗等新型违法犯罪行为,以及AIGC的内生安全等。较为著名的案例是,诈骗团队利用AIGC换脸伪造埃隆·马斯克的视频,半年诈骗价值超过2亿人民币的数字货币。再次,算法歧视等伦理问题依然存在。比如,DALL·E 2具有显著的种族和性别刻板印象。最后是环境影响,AIGC模型训练消耗大量算力,碳排放量惊人。此前就有研究表明,单一机器学习模型训练所产生的碳排放,相当于普通汽车寿命期内碳排放量的5倍。


图:腾讯优图实验室推出FaceIn人脸防伪产品,能够自动检测精准识别视频、图像中是否应用人脸伪造技术

为了应对以上挑战,面向人工智能的下一个时代,人们需要更加负责任地、以人为本地发展应用AIGC技术,打造可信AIGC生态。面对AIGC技术应用可能带来的风险挑战,社会各界需要协同参与、共同应对,通过法律、伦理、技术等方面的多元措施支持构建可信AI生态。在立法方面,网信办等三部门出台的《互联网信息服务深度合成管理规定》针对深度合成技术服务提出的要求和管理措施,诸如禁止性要求、标识要求、安全评估等,亦适用于AIGC。接下来,需要着重从以下方面持续推进AIGC的政策和治理。

其一,政府部门需要结合AIGC技术的发展应用情况,制定并明晰AIGC的知识产权与数据权益保护规则。目前,AIGC的知识产权与数据权益保护规则的不明确,在某种程度上导致甚至加剧了AI领域的乱象。

其二,研发应用AIGC技术的主体需要积极探索自律管理措施,例如,秉持不作恶、科技向善等目的,制定适宜的政策(消极要求和积极要求),采取控制和安全措施保障AIGC的安全可控应用,采取内容识别、内容溯源等技术确保AIGC的可靠来源。

其三,打造安全可信的AIGC应用,需要深入推进AI伦理治理。例如,行业组织可以制定可信AIGC的伦理指南,更好地支持AIGC健康可持续发展;AIGC领域的创新主体需要考虑通过伦理委员会等方式,推进落实AI风险管理、伦理审查评估等,在AIGC应用中实现“伦理嵌入设计”(ethics by design)。

其四,社会各界需要携手应对AIGC领域的能源消耗问题,推行绿色AI的发展理念,致力于打造绿色可持续、环境友好型的AI模型,实现智能化与低碳化融合发展。

未来已来,让我们拥抱AIGC,拥抱人工智能的下一个时代,打造更美好的未来。

来源:腾讯研究院
链接:https://mp.weixin.qq.com/s/9AjTpyL4HmQ6BDhWIDbD0A

编辑:张铭麟

580#
 楼主| 发表于 2023-2-1 16:20:08 | 只看该作者
【案例】

腾讯发布 AIGC 发展趋势报告:迎接人工智能的下一个时代|附报告下载

2022年,从引爆AI作画领域的DALL-E 2、Stable Diffusion等AI模型,到以ChatGPT为代表的接近人类水平的对话机器人,AIGC不断刷爆网络,其强大的内容生成能力给人们带来了巨大的震撼。学术界和产业界也都形成共识:AIGC绝非昙花一现,其底层技术和产业生态已经形成了新的格局。

就内容生产而言,AIGC作为新的生产力引擎,让我们从过去的PGC、UGC,已经不可避免地进入AIGC时代。AIGC代表着AI技术从感知、理解世界到生成、创造世界的跃迁,正推动人工智能迎来下一个时代。

经过了2022年的预热,2023年AIGC领域将迎来更大发展。AIGC生成内容的类型不断丰富、质量不断提升,也将有更多的企业积极拥抱AIGC。在这个背景下,腾讯研究院正式发布《AIGC发展趋势报告2023:迎接人工智能的下一个时代》。报告从技术发展和产业生态、应用趋势、治理挑战等维度,对AIGC的发展趋势进行了深入思考。

本文为报告核心内容摘要(文末附下载):

AIGC技术和产业生态
迎来发展快车道

AIGC的大爆发不仅有赖于AI技术的突破创新,还离不开产业生态快速发展的支撑。在技术创新方面,生成算法、预训练模型、多模态技术等AI技术汇聚发展,为AIGC的爆发提供了肥沃的技术土壤。



图:AIGC技术累积融合

第一,基础的生成算法模型不断突破创新。比如为人熟知的GAN、Transformer、扩散模型等,这些模型的性能、稳定性、生成内容质量等不断提升。得益于生成算法的进步,AIGC现在已经能够生成文字、代码、图像、语音、视频、3D物体等各种类型的内容和数据。

第二,预训练模型,也即基础模型、大模型,引发了AIGC技术能力的质变。虽然过去各类生成模型层出不穷,但是使用门槛高、训练成本高、内容生成简单和质量偏低,远远不能满足真实内容消费场景中的灵活多变、高精度、高质量等需求。而预训练模型能够适用于多任务、多场景、多功能需求,能够解决以上诸多痛点。预训练模型技术也显著提升了AIGC模型的通用化能力和工业化水平,同一个AIGC模型可以高质量地完成多种多样的内容输出任务,让AIGC模型成为自动化内容生产的“工厂”和“流水线”。正因如此,谷歌、微软、OpenAI等企业纷纷抢占先机,推动人工智能进入预训练模型时代。

第三,多模态技术推动了AIGC的内容多样性,进一步增强了AIGC模型的通用化能力。多模态技术使得语言文字、图像、音视频等多种类型数据可以互相转化和生成。比如CLIP模型,它能够将文字和图像进行关联,如将文字“狗”和狗的图像进行关联,并且关联的特征非常丰富。这为后续文生图、文生视频类的AIGC应用的爆发奠定了基础。

未来,算法的进步将带来更多激动人心的应用,语言模型会得到进一步发展,可以自我持续学习的多模态AI将日益成为主流,这些因素会进一步推动AIGC领域的蓬勃发展。

在产业生态方面,AIGC领域正在加速形成三层产业生态并持续创新发展,正走向模型即服务(MaaS)的未来。

目前,AIGC产业生态体系的雏形已现,呈现为上中下三层架构。


第一层是基础层,以预训练模型为基础搭建的AIGC技术基础设施层。在国外,以OpenAI、Stability.ai为代表,通过受控API、开源等方式输出模型能力。

第二层是中间层,是在预训练模型基础上,通过专门的调试和训练,快速抽取形成垂直化、场景化、定制化的小模型和应用工具层,可以实现工业流水线式部署,同时兼具按需使用、高效经济的优势。比如,知名的二次元画风生成模型Novel-AI,以及各种风格的角色生成器等,就是基于Stable Diffusion开源进行的二次开发。随着AIGC模型加速成为新的技术平台,模型即服务(Model-as-a-Service,MaaS)开始成为现实,预计将对商业领域产生巨大影响。

第三层是应用层,依托底层模型和中间层的垂直模型,各厂商进一步开放面向C端和B端用户的各种各样的AIGC产品和服务,满足海量用户的内容创建和消费需求。例如群聊机器人、文本生成软件、头像生成软件等AIGC消费工具。

目前,从提供预训练的AI大模型的基础设施层公司到专注打造垂直领域内AIGC工具的中间层公司、再到直接面对消费者和终端用户提供产品和服务的应用层公司,美国围绕AIGC生长出繁荣的生态,技术创新引发的应用创新浪潮迭起;中国也有望凭借领先的AIGC技术赋能千行百业。

AIGC在消费互联网、产业互联网
和社会价值领域持续产生变革性影响

AIGC领域目前呈现AIGC的内容类型不断丰富、内容质量不断提升、技术的通用性和工业化水平越来越强等趋势,这使得AIGC在消费互联网领域日趋主流化,涌现了写作助手、AI绘画、对话机器人、数字人等爆款级应用,支撑着传媒、电商、娱乐、影视等领域的内容需求。目前AIGC也正在向产业互联网、社会价值领域扩张应用。


图:AIGC应用现状概览(引用自红杉资本)

在消费互联网领域,AIGC牵引数字内容领域的全新变革。目前AIGC的爆发点主要是在内容消费领域,已经呈现百花齐放之势。AIGC生成的内容种类越来越丰富,而且内容质量也在显著提升,产业生态日益丰富。这其中有三个值得关注的趋势:

第一,AIGC有望成为新型的内容生产基础设施,塑造数字内容生产与交互新范式,持续推进数字文化产业创新。过去AI在内容消费领域的作用主要体现在推荐算法成为了新型的传播基础设施。推荐算法对数字内容传播,短视频为主的数字内容新业态发展,起到了颠覆式的变革作用。而现在,随着AIGC生成的内容种类越来越丰富,内容的质量不断提升,AIGC将作为新型的内容生产基础设施对既有的内容生成模式产生变革影响。

第二,AIGC的商业化应用将快速成熟,市场规模会迅速壮大。当前AIGC已经率先在传媒、电商、影视、娱乐等数字化程度高、内容需求丰富的行业取得重大发展,市场潜力逐渐显现。比如,在广告领域,腾讯混元AI大模型能够支持广告智能制作,即利用AIGC将广告文案自动生成为广告视频,大大降低了广告视频制作成本。巨大的应用前景将带来市场规模的快速增长,根据6pen预测,未来五年10%-30%的图片内容由AI参与生成,有望创造超过600亿以上市场规模。也有国外商业咨询机构预测,2030年AIGC市场规模将达到1100亿美元。

第三,AIGC还将作为生产力工具,不断推动聊天机器人、数字人、元宇宙等领域发展。AIGC技术让聊天机器人接近人类水平日益成为现实,当前以ChatGPT为代表的聊天机器人已经在刺激搜索引擎产业的神经,未来人们获取信息是否会更多通过聊天机器人而非搜索引擎?这已经使谷歌等公司面临的巨大压力。AIGC也在大大提升数字人的制作效能,并且使其更神似人。比如腾讯AI LAB的虚拟歌手AI艾灵,能够基于AIGC实现作词和歌曲演唱。在元宇宙领域,AIGC在构建沉浸式空间环境、提供个性化内容体验、打造智能用户交互等方面发挥重要作用。比如,扎克伯格在元宇宙的岛屿上,可以通过发出语音命令生成创造海滩、变换天气,添加不同的场景等。只有借助AGIC,元宇宙才可能以低成本、高效率的方式满足海量用户的不同内容需求。

在产业互联网领域,基于AIGC技术的合成数据(synthetic data)迎来重大发展,合成数据将牵引人工智能的未来。MIT科技评论将AI合成数据列为2022年10大突破性技术之一;Gartner也预测称,到2030年合成数据将彻底取代真实数据,成为训练AI的主要数据来源。


图:合成数据发展预测(来源:Gartner)

合成数据的用途是成为真实世界数据的廉价替代品,用来训练、测试、验证AI模型。AIGC技术的持续创新,让合成数据迎来新的发展契机,开始迸发出更大的产业发展和商业应用活力。这主要体现在以下四个方面:

第一,合成数据为AI模型训练开发提供强大助推器,推动实现AI 2.0。过去用真实世界数据训练AI模型,存在数据采集和标注的成本高昂,数据质量较难保障、数据多样化不足、隐私保护挑战等多方面问题。而合成数据可以很好的解决这些问题。使用合成数据不仅能更高效地训练AI模型,而且可以让AI在合成数据构建的虚拟仿真世界中自我学习、进化,极大扩展AI的应用可能性。从某种意义上也可以说合成数据让AI模型训练从1.0阶段发展到2.0阶段。

第二,合成数据助力破解AI“深水区”的数据难题,持续拓展产业互联网应用空间。目前,合成数据正迅速向交通、金融、医疗、零售、工业等诸多产业领域拓展应用,帮助破解产业互联网应用中的数据难题。比如,腾讯自动驾驶团队研发的仿真系统TAD SIM可以自动生成各种交通场景数据,助力自动驾驶系统测试、开发。在医疗领域,美国国立卫生研究院和合成数据服务商合作,基于其COVID-19病人病历数据库,合成了不具有可识别性的替代数据,可供世界范围内的研究人员自由分享和使用。


图:腾讯自动驾驶数字孪生仿真平台

第三,正是由于合成数据对人工智能未来发展的巨大价值,合成数据正加速成为一个新产业赛道,科技大厂和创新企业纷纷抢先布局。目前,全球合成数据创业企业也已经达到100家,英伟达、亚马逊、微软等头部科技企业也在加速布局,涌现了合成数据即服务(SDaaS,synthetic data as a service)这一全新商业模式。

第四,合成数据加速构建AI赋能、数实融合的大型虚拟世界。合成数据指向的终极应用形态是借助游戏引擎、3D图形、AIGC技术构建的数实融合的大型虚拟世界。基于合成数据构建的大型虚拟世界,为测试、开发新的人工智能应用,提供了一个安全、可靠、高效以及最重要的是——低成本的、可重复利用的环境,将成为AI数实融合的关键载体,包括为AI开发提供数据和场景、试验田等。比如腾讯开悟的AI开放研究环境,已经吸引了国内外众多决策智能领域的研究团队使用。

在社会价值领域,AIGC也在助力可持续社会价值的实现。比如,在医疗健康方面,AI语音生成帮助病人“开口说话”。语音合成软件制造商Lyrebird为渐冻症患者设计的语音合成系统实现“声音克隆”,帮助患者重新获得“自己的声音”。AI数字人也能帮助老年痴呆症患者与他们可能记得的年轻面孔或者逝去的亲人互动。此外,AIGC也可以用于文物修复,助力文物保护传承。腾讯公司利用360度沉浸式展示技术、智能音视频技术、人工智能等技术手段,对敦煌古壁画进行数字化分析与修复。在国外,DeepMind合作开发的深度神经网络模型Ithaca可以修复残缺的历史碑文。


图:腾讯利用AIGC技术手段,助力敦煌古壁画修复

总之,随着AIGC模型的通用化水平和工业化能力的持续提升,AIGC的根本影响在于,将极大降低内容生产和交互的门槛和成本,有望带来一场自动化内容生产与交互变革,引起社会的成本结构的重大改变,进而在各行各业引发巨震。未来,“AIGC+”将持续大放异彩,深度赋能各行各业高质量发展。

以可信AIGC
积极应对科技治理问题与挑战,

拥抱人工智能的下一个时代

发展总是与挑战并生,AIGC的发展也面临许多科技治理问题的挑战。目前,主要是知识产权、安全、伦理和环境四个方面的挑战。

首先,AIGC引发的新型版权侵权风险,已经成为整个行业发展所面临的紧迫问题。因版权争议,国外艺术作品平台ArtStation上的画师们掀起了抵制AIGC生成图像的活动。其次,安全问题始终存在于科技发展应用之中。在AIGC中,主要表现为信息内容安全、AIGC滥用引发诈骗等新型违法犯罪行为,以及AIGC的内生安全等。较为著名的案例是,诈骗团队利用AIGC换脸伪造埃隆·马斯克的视频,半年诈骗价值超过2亿人民币的数字货币。再次,算法歧视等伦理问题依然存在。比如,DALL·E 2具有显著的种族和性别刻板印象。最后是环境影响,AIGC模型训练消耗大量算力,碳排放量惊人。此前就有研究表明,单一机器学习模型训练所产生的碳排放,相当于普通汽车寿命期内碳排放量的5倍。


图:腾讯优图实验室推出FaceIn人脸防伪产品,能够自动检测精准识别视频、图像中是否应用人脸伪造技术

为了应对以上挑战,面向人工智能的下一个时代,人们需要更加负责任地、以人为本地发展应用AIGC技术,打造可信AIGC生态。面对AIGC技术应用可能带来的风险挑战,社会各界需要协同参与、共同应对,通过法律、伦理、技术等方面的多元措施支持构建可信AI生态。在立法方面,网信办等三部门出台的《互联网信息服务深度合成管理规定》针对深度合成技术服务提出的要求和管理措施,诸如禁止性要求、标识要求、安全评估等,亦适用于AIGC。接下来,需要着重从以下方面持续推进AIGC的政策和治理。

其一,政府部门需要结合AIGC技术的发展应用情况,制定并明晰AIGC的知识产权与数据权益保护规则。目前,AIGC的知识产权与数据权益保护规则的不明确,在某种程度上导致甚至加剧了AI领域的乱象。

其二,研发应用AIGC技术的主体需要积极探索自律管理措施,例如,秉持不作恶、科技向善等目的,制定适宜的政策(消极要求和积极要求),采取控制和安全措施保障AIGC的安全可控应用,采取内容识别、内容溯源等技术确保AIGC的可靠来源。

其三,打造安全可信的AIGC应用,需要深入推进AI伦理治理。例如,行业组织可以制定可信AIGC的伦理指南,更好地支持AIGC健康可持续发展;AIGC领域的创新主体需要考虑通过伦理委员会等方式,推进落实AI风险管理、伦理审查评估等,在AIGC应用中实现“伦理嵌入设计”(ethics by design)。

其四,社会各界需要携手应对AIGC领域的能源消耗问题,推行绿色AI的发展理念,致力于打造绿色可持续、环境友好型的AI模型,实现智能化与低碳化融合发展。

未来已来,让我们拥抱AIGC,拥抱人工智能的下一个时代,打造更美好的未来。

来源:腾讯研究院
链接:https://mp.weixin.qq.com/s/9AjTpyL4HmQ6BDhWIDbD0A

编辑:张铭麟

发表回复

您需要登录后才可以回帖 登录 | 实名注册

本版积分规则

掌上论坛|小黑屋|传媒教育网 ( 蜀ICP备16019560号-1

Copyright 2013 小马版权所有 All Rights Reserved.

Powered by Discuz! X3.2

© 2016-2022 Comsenz Inc.

快速回复 返回顶部 返回列表