人工智能与新闻业案例集锦

刘海明 · 发表于 2023-9-22 23:02:02

【案例】

Meta、X 集体“发难”，新闻媒体面临的挑战与机遇 | 德外视窗

1

海外社交媒体与新闻业“脱钩”似乎正愈演愈烈。

据外媒，社交媒体X（原Twitter）日前正在进行一项新的功能测试，计划不再显示新闻链接中的标题和其他文本，而仅显示图片。这项举措将限制新闻媒体在该平台的内容曝光量，从而制约后者向官网到导流的能力。

无独有偶，继今年8月份为抵制加拿大“在线新闻法案”的出台，Meta宣称在Facebook平台宣布屏蔽加拿大新闻，9月5日，Facebook母公司Meta再次官宣，将从12月初起暂停Facebook在英国、法国和德国的新闻服务。

海外社交媒体为何对新闻媒体集体“发难”？新闻业将面临哪些新的挑战？这场“博弈”又有哪些新的变数？下文就针对上述问题，以Facebook为例进行剖析。

Meta为何与新闻业渐行渐远？

Meta9月5日宣布，将从12月初开始在英国、德国和法国停止使用Facebook新闻。随后Meta强调，它并没有屏蔽文章或出版商页面的链接——它只是取消了专门的“新闻”选项卡。“欧洲新闻媒体可以继续访问他们的Facebook账号和页面，他们可以在其中发布故事链接，并以任何其他个人或组织的方式引导人们访问他们的网站。”

但是，Meta还表示将逐渐减少向英国、法国和德国的新闻媒体支付费用，Meta资助的社区新闻项目也将在当前合同期满后停止。社区项目自2019年启动，目前已资助超过100名记者进行本地新闻报道。这个项目的目的是为那些被忽视或缺乏新闻报道的社区提供新闻报道和信息服务。这些记者将继续工作到合同结束。

Meta此次关闭Facebook新闻专栏、减少在相关国家和新闻媒体的商业合同、终止社区新闻项目资助的决定，都让Meta与新闻业的关系日趋疏远。这引发了业内对Meta减少新闻支持的担忧。

研究发现，Meta作出减少对新闻内容支持的决定，主要基于以下几方面考虑：

1.新闻占比及用户吸附力有限

Meta宣称：“新闻内容在其全球用户信息流中的比例还不到3%。”也就是说对于绝大部分用户来说，在Facebook上发现新闻只是使用体验的一小部分。用户使用Facebook主要是为了加强社交联系和发现感兴趣的新事物，而不是有目的地浏览新闻。

Meta认为，新闻内容对于提高Meta平台的用户黏性作用非常有限。这是其大幅减少对新闻内容支持的一个重要考量因素。新闻内容在Facebook整体业务中的比重和重要性较低，进一步减少与新闻业合作，这符合Meta的商业逻辑。研究发现，在Meta旗下的新应用Threads上，新闻记者及传统的新闻内容的占比被进一步降低。

2.减少新闻付费，规避监管风险

虽然Meta声称新闻内容不再是Facebook平台及其用户的首选，但不少新闻从业者对这一说法提出异议，并认为这家科技巨头对新闻明显失去兴趣的动机是希望不再向新闻机构付费。特别是澳大利亚去年通过法案，有效地迫使Meta和谷歌为新闻付费，加拿大、英国和美国的类似立法也使meta面临压力。

Meta于2019年在美国首次推出Facebook News服务，然后从英国、德国、澳大利亚和法国开始走向国际市场，该公司原计划将该服务带到巴西和印度，但这些推出似乎从未完全实现，任何参与该计划的新闻机构都可以获取内容收益。

多国政府加强了对科技巨头的监管，要求其与新闻机构分享部分收入。在Meta做出减少新闻支持的决定之前，全球范围内的监管机构就已经注意到了平台与新闻业之间存在的利益失衡问题。一些政府或立法机构试图通过立法来干预科技企业的行为，但遭到了部分科技企业的抵制。Meta减少对新闻内容支持的决定正是在这种监管背景中展开的。

此外，新闻内容的推送，曾让“小扎”深陷政治风波。2016年，美国总统大选期间，Facebook被外界质疑利用算法操纵选举结果，“剑桥分析”事件更是直接将马克·扎克伯格送上听证会。这是Facebook逐步减少新闻内容的比重推动因素之一。

3.整合资源，专注高用户参与度产品

Meta认为公司需要关注用户最感兴趣的内容形式，以提高用户参与度。这就要减少对新闻内容的投入，将资源集中在短视频等更受用户欢迎的产品和服务上。Meta表示，Facebook新闻专栏中最吸引用户的内容往往是娱乐八卦类内容和与犯罪有关的报道，而不是高质量新闻。所以在Meta看来，减少“成本高但用户黏性较低”的新闻内容，可以使其集中资源发展更吸引用户参与的产品，这是Meta调整策略的商业考量。

综合来看，新闻内容对Meta的商业价值有限，而与新闻机构分享收入又违背其商业利益，减少新闻支持可以避免监管压力，并能集中资源发展用户需求度更高的产品。这些因素共同推动了Meta减少新闻投入的决策。

新闻业面临挑战升级

植根于社交媒体流量模式的数字媒体——BuzzFeed和VICE相继陨落，让海外新闻媒体意识到该模式的脆弱性。新闻业对Meta的举动表示担忧和强烈不满，新闻业或面临新的行业困境。

1.收入下滑

Meta的决定给参与Facebook新闻专栏的新闻机构造成了直接的经济损失。从英国最大的地区性新闻出版商Reach最新的半年业绩中可以看出，Facebook平台上新闻可见性的降低，导致了网页浏览量下降和自动售出的程序化广告收益降低，而使数字收入大幅下滑。

Reach总收入同比下降6.1%，降至2.794亿英镑，营业利润下降23.5%，降至3610万英镑。印刷报纸（包括《曼彻斯特晚报》《镜报》和《每日明星报》）的收入下降2.7%，降至2.173亿英镑。数字收入下降16.1%，降至6080万英镑。

Reach首席执行官Jim Mullen表示，数字收入增长受到整个行业推荐流量下降的重大影响，Facebook取消新闻内容优先级的做法，导致新闻媒体的页面浏览量下降，但他们将继续执行客户价值战略，推动更高质量、更可持续的数字收入增长。

2.数字化转型受阻

Meta的决定给新闻业的数字化转型进程造成了阻碍。英国新闻媒体协会首席执行官Owen Meredith表示，Meta的举动“令人非常失望”，他认为Meta关闭Facebook新闻专栏和停止资助社区新闻项目的行为，都是对新闻业数字化转型的打击。

他指出Facebook新闻专栏是“一个重要的创新项目”，为新闻媒体提供了一个“有价值的数字化转型平台”。而社区新闻项目则将资金投入到地方新闻报道中，满足了Facebook用户对可信赖的、权威的本地新闻的需求，有巨大价值。他还表示，Meta应该“支持而不是破坏”新闻业，并呼吁Meta重新考虑其决定。

3.数据依赖和新闻伦理的侵蚀

新闻业对Meta的缺乏透明度和责任感表示了担忧和质疑。Facebook新闻专栏的具体策展工作由Axel Springer旗下的新闻聚合Startup Upday完成。Upday的策展人员需要遵循Facebook提供的新闻来源清单和策展指南进行工作。一位前Facebook新闻专栏策展工作者透露，Meta从未向公众或策展团队公开过用户数据或反馈情况，也没有明确说明其关闭新闻专栏的原因或时间表。

他还表示，Meta对策展团队施加了不合理的限制和压力，要求他们签署禁止为竞争对手工作的合同条款，并可能随时被解雇。Meta对新闻内容和记者缺乏尊重。

Meta减少新闻内容支持导致新闻业的数字收入下滑、数字化转型进程受阻，加剧了新闻业对平台的依赖，并暴露出新闻伦理问题，对新闻业造成伤害。

监管机构与公众的态度带来更多变数

监管机构在加强对数字平台的干预和制约，要求其与新闻业公平分享收入。用户则面临着获取新闻的渠道、质量和多样性受限的问题。

1.监管机构加强干预和制约

近年来，多国政府加强了对科技巨头的监管，要求其与新闻机构分享部分收入，以维护新闻业的利益。例如，早在2020年，澳大利亚就率先采取立法手段，提出《新闻媒体和互联网平台强制议价法案》，直指Facebook动态消息（News Feed），强制新闻机构和互联网平台就新闻内容分发进行价格商议，“平衡”新闻媒体和互联网巨头之间的利益关系，让科技企业为使用新闻机构的内容支付费用；加拿大也提出了类似法律要求；英国《数字市场、竞争和消费者法案》正在通过国会审议。

2.用户获取新闻的渠道、质量和多样性受限

Meta关闭Facebook新闻专栏，意味着Facebook将不再作为一个新闻获取的途径而存在，这可能导致用户获取新闻的渠道变得更加有限，长期来看对新闻生态产生负面影响。一位曾经为Upday工作过的记者表示，他曾经收到来自Facebook新闻专栏用户的反馈邮件，有些用户感谢他们提供了高质量和多样化的新闻来源，有些用户则抱怨他们看到的是他们不喜欢或不认同的新闻内容。这表明用户对新闻内容的需求和偏好是多元的，而Meta的决定可能会对这种多元性带来损害。

监管部门和公众越来越关注科技企业的社会责任和透明度。Meta的举动可能会招致更多反弹。

结语

海外社媒巨头与新闻业的博弈，给高度依赖社交媒体流量的媒体敲响了警钟——平台规则的改变，可能对媒体流量造成致命性的伤害，这种模式的根基是不够稳固的。

社交媒体与新闻业的关系演变还存在诸多变数，新闻虽然“非刚需”，但它毕竟源于现实社会与生活，“脱离”新闻的社媒如缺失了对公共事件的关注，市场或将培育出新的新闻消费阵地，这也许是新闻业真正的机会。

正如路透社新闻研究所《2023数字新闻报告》揭示的那样：“大多数消费者寻找的并不是更多的新闻，而是更强的相关性。人工智能（AI）将进一步推动个性化内容的发展，但也会带来更多不可靠的信息。新闻报道在准确性、实用性和人性化方面的突出表现将比以往任何时候都更加重要。”

来源：德外5号（公众号）

链接：https://mp.weixin.qq.com/s/p6sBl7WWXvWWiYMioCeACQ

编辑：覃韵琪

刘海明 · 发表于 2023-9-24 22:03:17

【案例】

拐点时刻？AIGC时代的新闻业

一阵生成式人工智能(AIGC)的旋风，正在席卷众多领域。

2022年底，OpenAI发布自然语言对话应用ChatGPT，并在今年3月迭代推出GPT-4，迅速吸引了各行业与公众的关注。全球范围内大模型风云骤起，资金、技术、人才持续涌入，科技公司布局不断，纷纷推出自家的大模型。据估算，到2030年，AIGC市场规模有望突破万亿元。

几年前，AlphaGo击败围棋选手李世石的新闻引发了一轮人工智能的热潮，然而，AIGC的浪潮更为猛烈，因为除了技术突破外，其低门槛与实用性使得应用端的感知更为显著。因此，大众不仅仅停留在讨论阶段，而是可以直接体验生成式人工智能的强大。

每轮技术革新，都将勾勒出一个新纪元。“在AIGC时代，所有行业都值得用AI重塑”。受到影响的领域包括教育、金融、电商、影视、设计等，其中新闻业是受影响最为剧烈的领域之一，对于AIGC的回应也最为积极。

在国际上，许多媒体已经开展了相关尝试。新闻聚合网站BuzzFeed发布由AI作答的测试栏目quizzes，并表示将使用AIGC编写测试类内容，以替代部分人力。5月24日，《华盛顿邮报》宣布成立跨部门AI协同机制，包括战略决策团队AITaskforce和执行团队AIHub，以更好地适应AI创新实践。英国《金融时报》也首次任命AI线编辑，密切关注该领域的最新进展。国内媒体如澎湃新闻、封面新闻、上游新闻等百余家媒体机构在今年2月宣布接入AIGC产品。腾讯研究院在今年6月份围绕“ChatGPT对新闻业的影响”话题展开了一项调研，结果显示，有80%的国内新闻从业人员已使用过ChatGPT或类似产品，其中超过一半(56%)受访者认为ChatGPT(或类似工具)对自己的工作带来了实际帮助。

在文字生成能力出类拔萃的同时，ChatGPT也具备多模态内容生成能力。对于以内容创作为核心的新闻行业而言，这将带来许多交汇点，并产生显著影响。这个“堪比工业革命”(微软CEO萨提亚·纳德拉语)的技术突破，以及不亚于“个人计算机或互联网诞生”(比尔·盖茨语)的技术形态，它将究竟促成什么样的改变？是否会为新闻业带来新的契机？

通过本报告，我们试图探讨以ChatGPT为代表的AIGC技术给新闻业带来的影响与挑战，以及它所创造的新可能。AIGC正开启一场“技术革命”，新闻业是其中一个切口。通过这个切口，我们或许能捕捉到这场革命对人类社会的真正意义。

大洗牌：新闻业的三重变革

千禧年以来的新闻业，既经历过充满希望的明亮时刻，也曾陷于悲观的泥淖。

全新的数字化生态赋予传统媒体蓬勃的发展活力，同时也催生了一批数字媒体新贵。然而，近年来流量逻辑的变迁、短视频等新媒介形态的冲击、线上广告收入的萎缩等种种因素，正在促使新闻业陷入新的困境。

(一)“流量时代”终结，新闻媒体大洗牌，连接读者变得无比重要

内容分发的逻辑屡次演变。

2008年金融危机之后，广告商的广告投入从传统媒体转向在线媒体。以Google为代表的搜索引擎和以Facebook为代表的社交媒体彻底重塑了内容流量格局。源自这两个端口的流量，成为在线媒体最重要的曝光来源。

尤为值得关注的是Facebook，其创始人马克·扎克伯格曾深信新闻内容的积极价值：提升平台的声誉以及提高用户的留存和互动。因此，Facebook一度大力强化新闻内容的推荐比重，让相关内容获得更多曝光。在2006年至2016年的十年间，社交媒体与新闻业迎来了一段蜜月期。

皮尤研究中心2015年的一项调查显示，高达64%的网络用户通过社交媒体获取新闻。这是由社交媒体缔造的“新闻业的流量时代”，造就了一大批数字媒体新贵。21世纪最为知名的数字媒体BuzzFeed和VICE，业务模式就建立在社交媒体的病毒式传播之上，巨大的流量和用户注意力涌入这些媒体，随之而来的是大量风险投资。鼎盛期的BuzzFeed和VICE，估值分别达到17亿美元和57亿美元。

但对于媒体而言，这种模式的根基是脆弱的，它们的兴衰存亡完全取决于平台。一旦平台的算法和规则改变，商业模式就会遭受重创，完全不由自己掌控。故事的转折发生在2016年，美国总统大选期间，Facebook被外界质疑利用算法操纵选举结果，“剑桥分析”事件则直接将马克·扎克伯格送上听证会。面对各方抨击，Facebook宣布减少新闻内容的比重。2020年，Facebook进一步强化相关举措，大幅减少新闻内容和政治内容的推送。

这不只是Facebook一家平台的转向，而是社交媒体的整体趋势。算法的调整使新闻类内容得到越来越少的曝光，这对依赖社交媒体流量的媒体打击严重，由此造成行业性的集体困境。2023年，BuzzFeed创始人乔纳·佩雷迪宣布关停旗下新闻业务BuzzFeedNews，VICE宣布关闭新闻品牌VICEWorldNews，其主站也正在计划进行破产申请。VoxMedia、Insider、ABCNews等媒体都进行了不同程度的裁员。

这些媒体的共同问题在于，并没有通过强化付费墙和订阅业务来积累起用户基底。在大浪来临之时，面对巨额的流量和广告收入，没有人会认为这是一个问题。但当潮水退去，才能发现谁在裸泳。

作为对比，老牌媒体《纽约时报》在BuzzFeed等新贵风头正劲的时候，因对互联网适应迟缓而被业界看衰，甚至被视为要被革命的代表。在BuzzFeed的刺激下，《纽约时报》被迫转型，以适切数字化新闻的大背景。但这种步调并不急促，它把自己的内容置于付费墙之后，通过深耕内容来吸引订阅用户，反而成为能够熬过周期的资本。

在充满泡沫、浮光掠影的流量时代，以核心读者为基底，与读者建立更紧密的连接变得前所未有的重要。越来越多的新闻媒体认识到这一点，并由此催生出三种新趋势：

第一，利用新的媒介形式建立与读者的直接联系。近年来，播客和RSS阅读开始兴起，许多媒体推出自家的RSS订阅服务和播客品牌，旨在更直接有效地与读者建立紧密联系，强化媒体品牌并提升商业价值；

第二，更加专注本地内容，而非全球性的热点话题。例如，传媒集团MvskokeMedia将编辑策略调整为专注本地社区报道，体现对核心读者的关注；

第三，加强报道透明度和公开性，一方面帮助读者理解报道理念，另一方面也反向了解读者更需要怎样的新闻报道。比如檀香山公民报(HonoluluCivilBeat)在所在地区举办类似于快闪活动的“弹出式新闻编辑室”(pop-upnewsrooms)，加强与读者的沟通。

(二)“短视频新闻业”兴起，受众注意力转移，传统新闻理念遭遇冲击

2023年，数据统计机构《新闻公报》(PressGazette)发布了一份千禧年以来成立的25家媒体资讯公司排名榜单，其中Facebook位居榜首，TikTok紧随其后。社交媒体的影响力不言而喻，以TikTok为代表的短视频平台的崛起，对新闻业发展趋势产生了深刻影响。

TikTok正迅速成为这个世界上最大的内容平台和流量基地之一。不仅大量年轻受众在该平台聚集，不同年龄段的受众注意力也逐渐转向短视频，而不再是新闻媒体所擅长的图文内容或严肃新闻报道。与受众注意力同步转移的还有广告收入和风险投资，它们同样流向了年轻用户更为关注的TikTok和Instagram平台。

不仅如此，一种新的新闻业态正在兴起：“TikTok新闻业”。当新冠疫情、俄乌冲突等重大新闻事件发生时，人们发现，主要信息源不再是新闻媒体，而是TikTok。大量即时、一手的视频内容在TikTok迅速传播，后者逐渐从一个娱乐性短视频平台，转型成为包含音视频内容的综合型内容平台，并成为互联网用户获取资讯的重要途径。对许多年轻受众而言，他们不是不看新闻了，只是不在新闻媒体上看新闻了。类似现象在国内也同样显著。

当新闻的主要载体从文字转向视频，这对绝大多数新闻媒体而言都是挑战。部分传统媒体积极求变，尝试融入短视频新闻生态。根据牛津大学路透新闻研究所发布的《2022年数字新闻报告》统计，约有一半(49%)的主流媒体机构会定期在TikTok上发布内容。作为老牌媒体代表，《华盛顿邮报》专门聘请第三方团队为自家TikTok账号制作内容；《洛杉矶时报》则组建了一个名为“404”的内容团队，基于年轻受众偏好进行实验性质的内容生产。

一些原生新闻媒体也从TikTok新闻业中涌现出来。例如，以短视频新闻起家的NowThis，已经拥有850万粉丝；西班牙内容公司Ac2ality以“在一分钟内讲述新闻”为核心理念，自2019年上线以来，在TikTok上已经积累了390万粉丝。

TikTok新闻业的崛起，意味着受众注意力焦点的转变。对新闻业造成的冲击一方面体现在广告收入流失，媒体生存环境恶化，尽管付诸努力融入短视频新闻生态，但传统新闻报道与视频媒介之间固有的不兼容性，使这种转型的成效受限。另一方面，短视频新闻的广泛影响使传统新闻理念遭遇冲击，新闻业奉为圭臬的“客观性”“真实性”等价值观不再被强调，快速、耸动、视觉冲击力成为新的制作标准，点赞和转发等数据成为衡量新闻优劣的新指标。“黄色新闻”获得越来越多的流量与受众，传统新闻的生存空间进一步受到挤压。

从受众角度来看，人们逐渐习惯于通过短视频这样的渠道获取新闻和信息，这在一定程度上也是受日益显著的“新闻疲劳”和“新闻回避”等现象影响。新闻回避由认知和情感两个因素驱动：认知方面表现为人们认为某些主题或事件报道过多，阅读这些新闻会导致疲惫感，且难以获得信息增量，进而产生“新闻过载”；而情感方面则是指人们会主动回避那些会引发负面情绪的新闻，如关于疫情、暴力事件和自然灾害的报道。

根据路透新闻研究所与牛津大学发布的报告，2017年，29%的受访者表示他们会“经常或有时避开新闻”，到2019年，这一数字上升至32%。2020年新冠肺炎疫情爆发后，人们对新闻的需求短暂激增，但新闻回避的现象很快反弹，59%的人表示“有时或总是积极地回避新闻”。受众的信息接收习惯和心态变化，成为新闻业不得不考量的因素，也成为新闻媒体转型路上的阻碍。

(三)关停、裁员成为常态，新闻从业人员积极求变

三年的新冠疫情，对全球经济产生了巨大冲击，新闻业也无法置身事外。

新闻机构关闭成为常态。国外媒体包括BuzzFeed、VICE等一众数字媒体关闭旗下新闻业务，以及《利沃尼亚观察者报》(TheLivoniaObserver)这类纸质刊物实质性停刊。国内的情况也不容乐观。清华大学新闻与传播学院等机构联合发布的《传媒蓝皮书：中国传媒产业发展报告 (2022)》显示，新冠肺炎对传媒产业部分领域的影响仍在延续，传统新闻业广告收入持续下滑，广告主缩减对期刊、报纸等媒体的投放预算。国内报业广告和发行收入大幅下跌，电视广告市场发展疲软且下滑趋势严重。2020-2023年间，包括《城市画报》《东南快报》在内的数十家报纸宣布休刊或停刊。

新闻从业人员收入显著下降。根据《新闻公报》(PressGazette)的统计，经济不确定性影响了约三分之二的新闻工作者的工作。超过80%的受访者是全职新闻工作者，其中大多数 (71%)的年收入未达到10万美元，自由撰稿人的稿费更是平均不足300美元。

裁员成为媒体机构的主要基调。根据不完全统计，自2020年以来，数十家媒体宣布了裁员计划。BuzzFeed因计划采用AI生成测验类内容而裁减一定比例的员工，2023年4月20日，BuzzFeed创始人再度宣布关闭旗下新闻业务，裁退约180名员工，涉及内容、技术、行政等部门，占总数的15%。根据福布斯的统计，自2023年1月至今，三十余家报纸及媒体机构进行了不同程度的裁员，最近一次发生在6月7日，《洛杉矶时报》宣布，由于“经济环境和新闻行业的独特挑战”，将裁减新闻编辑室的74名员工。

全球经济滑坡与技术冲击，正在使新闻业面临双重危机，而新闻记者的生存状况堪忧，也与新闻机构应用新技术密切相关。自动化报道和自动编辑系统的引入，在解放一部分人力的同时，也导致部分从业者成为冗员。媒介技术的迭代并未带来劳动关系的进步，这在内容产业中体现得尤为明显。2023年上半年，一场罢工行动正在好莱坞持续上演，影响到多部在播剧集。罢工事件背后，即是以Netflix为代表的流媒体平台对剧集生产方式和播出形式的改造，挤压着编剧的生存空间。技术机制的替代效应，也同样冲击着新闻业。

面对有限的生存空间，许多新闻机构和新闻工作人员开始将重心转向社交媒体和短视频平台。例如，在TikTok和YouTube上开设频道、发布视频内容，以吸引年轻受众，同时通过广告分成模式增加收入。另一方面，新闻记者通过Twitter、Linkedln等社交平台，分享知识和见解，建立个人品牌和影响力。

涌现：AIGC正掀起一场

新的技术和产业革命

AIGC，即利用AI自动生成内容(AIGeneratedContent)。它并非新兴事物，最早可追溯到1957年莱杰伦·希勒(LejarenHiller)和伦纳德·艾萨克森(LeonardIsaacson)完成的人类历史上第一支由计算机创作的音乐作品，之后几十年也不断有AI生成模型、AI生成作品出现，但2022年才真正算是AIGC的爆发元年。AIGC的意义，并不仅仅是技术生成内容，而是AI具有了像人类一样的生成创造能力。得益于无限的创造潜力和未来应用空间，AIGC正在掀起一场新的技术和产业革命，推动人工智能迎来下一个时代。

(一)大模型是AIGC爆发的基石

随着2010年深度学习问世，人工智能的发展推进了第三次高潮，而大模型将这次高潮带到了新的阶段。2017年谷歌在《AttentionisAllYouNeed》一文中发布了具有里程碑意义的Transformer算法，虽然仍是深度学习的延续，但是它使得深度学习模型参数突破了1亿，Transformer取代RNN、CNN进入大模型时代，这无疑是一个重大的里程碑。

Transformer是一种基于自注意力机制的神经网络模型，最初用来完成不同语言之间的文本翻译任务，主体包含Encoder和Decoder部分，分别负责对源语言文本进行编码和将编码信息转换为目标语言文本。而后基于Encoder和Decoder，大模型的发展大致走上了三条路：第一条是舍弃Decoder部分，仅仅使用Encoder作为编码器的预训练模型，最出名的代表就是Bert家族；第二条是通过舍弃Encoder部分而基于Decoder部分的GPT家族；第三条是Encoder和Decoder都使用的谷歌T5大模型路线。

AI大模型，又称为预训练模型、基础模型(foundationmodel)，即基于大量数据训练的、拥有巨量参数的模型，可以适应广泛的下游任务。这些模型基于迁移学习的思想和深度学习的最新进展，以及大规模应用的计算机系统，展现了令人惊讶的涌现能力，并显著提高各种下游任务的性能。鉴于这种潜力，大模型成为AI技术发展的范式变革，许多跨领域的AI系统或产品服务将直接建立在大模型上。具体到AIGC领域，AI大模型可以实现多任务、多语言、多方式，在各种内容的生成上将扮演关键角色。按照基本类型分类，预训练模型包括自然语言处理 (NLP)预训练模型、计算机视觉(CV)预训练模型、多模态预训练模型。这三类模型在新闻业等领域，均有较为广泛的应用前景。

为什么说大模型是AIGC爆发的基石？是因为大模型引发了AIGC技术能力的质变。虽然过去各类生成模型层出不穷，但是使用门槛高、训练成本高、内容生成简单和质量偏低，远远不能满足真实内容消费场景中的灵活多变、高精度、高质量等需求。大模型解决了以上的诸多落地问题。比如，ChatGPT可以同时为不同国家、不同文化背景、不同专业领域和年龄阶层的人群提供优质的文字内容生成服务，在此之前是难以想像的。ChatGPT也展示了大模型带来的超越文本生成本身的神奇能力。ChatGPT、GPT-4、Bard、PaLM、LLaMA等带来了当下的大模型盛世，也带来了AGI的曙光。

总的来看，AIGC在2022年的爆发得益于大模型技术。拥有通用性、基础性、多模态、参数多、训练数据量大、生成内容高质稳定等特征的AIGC大模型成为了自动化内容生产的“工厂”和“流水线”。

(二)产业生态是AIGC发展的保障

此前AI产业发展缓慢的状况，与没有建立较为成熟的产业体系密切相关。任何成熟的行业都有较为完整的上下游产业生态体系，比如汽车行业，全球的发动机、变速箱等核心零部件厂商只有那么几家，面向消费者的汽车厂商可以有很多家。而此前AI行业，从基础的模型研发到产品服务上线销售，每家企业似乎都要覆盖全产业链的事情，成本投入和利润回报很难平衡，

行业发展陷入艰难困境。此前AI模型缺乏通用性是核心问题，而目前基于大模型，AIGC产业生态体系已经初步形成，呈现为上中下三层架构。

第一层，为上游基础层，也就是由大模型为基础搭建的AIGC技术基础设施层。由于大模型的高成本和技术投入，因此具有较高的进入门槛。以2020年推出的GPT-3模型为例，AlchemyAPI创始人ElliotTurner推测训练GPT-3的成本可能接近1200万美元。因此，目前进入预训练模型的主要机构为头部科技企业、科研机构等。

在AIGC领域，美国的基础设施型公司(处于上游生态位)有OpenAI、Stability.ai等。因为有了基础层的技术支撑，下游行业才能如雨后春笋般发展，形成了目前的AIGC商业流。

第二层，为中间层，即垂直化、场景化、个性化的模型和应用工具。预训练的大模型是基础设施，在此基础上可以快速抽取生成场景化、定制化、个性化的小模型，实现在不用行业、垂直领域、功能场景的工业流水线式部署，同时兼具按需使用、高效经济的优势。以大模型为基础，模型即服务(Model-as-a-Service，MaaS)成为现实，它实现了AI从“手工作坊”到“工厂模式”的转变。AI大模型具有更强的通用性和智能程度，MaaS为下游应用提供安全、高效、低成本的模型使用与开发支持，能够大规模地在产业中落地应用，更广泛地赋能各行业应用，带来全社会的生产效率提升。OpenAI的CEO山姆·奥特曼曾明确指出，中间层是未来AI创业的核心阵地。

比如基于ChatGPT开放的API接口，产生了很多应用于金融领域、医疗领域的大模型或应用工具。JasperAI便是依靠GPT-3自动生成创意营销内容，在18个月里从白手起家化身为独角兽。还有在StableDiffusion开源之后，有很多基于开源模型的二次开发，训练特定风格的垂直领域模型开始流行，比如著名的二次元画风生成的Novel-AI，还有各种风格的角色生成器等。

第三层，为应用层，即面向C端用户的文字、图片、音视频等内容生成服务。在应用层，侧重满足用户的需求，将AIGC模型和用户的需求无缝衔接起来实现产业落地。基于GPT-3大模型的NotionAI便是这样的产品，可以满足用户的专业文本内容生成需求。以StableDiffusion开源为例，它开放的不仅仅是程序，还有已经训练好的模型，后继创业者能更好的借助这一开源工具，以C端消费级显卡的算力门槛，挖掘出更丰富的内容生态，为AIGC在更广泛的C端用户中的普及起到至关重要的作用。现在贴近C端用户的工具越发丰富多样，包括网页、本地安装的程序、移动端小程序、群聊机器人等，甚至还有利用AIGC工具定制代出图的内容消费服务。

目前，从提供大模型的基础设施层公司到专注打造AIGC产品和应用工具的应用层公司，AIGC生长出繁荣的生态，技术创新引发的应用创新浪潮迭起，并且技术赋能千行百业。随着数字经济与实体经济融合程度不断加深，以及互联网平台的数字化场景日趋丰富，人类对数字内容总量和丰富程度的整体需求不断提高。AIGC作为当前新型的内容生产方式，已经率先在新闻传媒、电商、影视、娱乐等数字化程度高、内容需求丰富的行业取得重大创新发展，市场潜力逐渐显现。与此同时，在推进数实融合、加快产业升级的进程中，金融、医疗、工业等各行各业的AIGC应用也都在快速发展。

(三)场景应用创新、具身智能、能力平权是AIGC的未来面向

场景应用创新是AIGC未来的发展路径。任何新兴技术只有在具体的场景中落地应用，产生经济和社会价值，才能获得广泛应用。同时在广泛的应用之中，技术才能不断迭代创新发展。这就形成了“场景应用和技术迭代”的飞轮效应。2022年科技部先后发布《关于支持建设新一代人工智能示范应用场景的通知》、《关于加快场景创新以人工智能高水平应用促进经济高质量发展的指导意见》，首批支持建设智慧农场、智能港口、智能矿山等十个示范应用场景。通过应用牵引推动人工智能技术落地已经成为行业共识。目前，OpenAI的战略也是尝试建立应用生态，将大模型落地到各行各业之中。

场景应用创新也代表着未来AIGC会更加垂直化和轻量化。第一，大模型虽然是通才，但它缺乏行业深度。其未来的发展趋势可能是六个方面的“垂直化”，包括行业深度化、企业个性化、能力专业化、规模小型化、部署分布化以及所有权私有化。第二，未来AI要嵌入到社会生产生活的各个领域，尤其是移动端设备和嵌入式设备上，即要进行本地化部署。而目前，大模型对硬件的算力和内存有很高要求，而移动端设备或者嵌入式设备往往算力有限，因此，模型轻量化会是未来AIGC发展的一个重要方向。

具身智能是AI发展的必然形态。具身智能是指AI不仅仅是数字化或虚拟的，还在物理环境中具有实体形态的存在，例如机器人或其它能够与真实世界互动的装置。真正的智能和学习需要与物理世界的交互，这是因为大多数生物智能的进化都与它们的环境有直接的联系。具身智能可以通过与环境的交互来更好地学习感知和行为。与此类似的观点，便是一些学者认为ChatGPT未来无法实现超人工智能，因为它们缺乏与真实世界的交互能力。因此，具身智能被认为是通往通用人工智能的关键钥匙，“具身智能”机器人更是人工智能的终极形态

2023年7月，AI科学家李飞飞带领的团队发布了具身智能最新成果，他们将大模型接入机器人，把复杂指令转化成具体行动规划，人类可以用自然语言给机器人下达指令。更重要的是，通过将LLM(大语言模型)+VLM(视觉语言模型)结合在一起，机器人与环境进行交互的能力进一步提升，无需额外数据和训练便可完成任务。

能力平权是AIGC发展的必然结果。目前，AIGC的发展已经赋予了用户更多的创作权力和自由。比如普通人就可以借助AIGC创作小说、音乐作品、3D内容等，一切皆可基于输入词按需生成。不仅如此，未来人人都可能像钢铁侠那样拥有自己的“贾维斯”--个人智能助理。2021年，微软在GitHub首次引入了Copilot(副驾驶)的概念。GitHubCopilot是一个辅助开发人员编写代码的AI服务。2023年5月，微软在大模型的加持下，Copilot迎来全面升级，推出Dynamics365Copilot、Microsoft365Copilot和PowerPlatformCopilot等，并提出“Copilot是一种全新的工作方式”的理念。工作如此，生活也同样需要“Copilot”。出门问问创始人李志飞认为大模型的最好工作，是做人类的“Copilot”。AIGC大模型或会成为每个人的智能助理，让每个人都能享受到AIGC技术红利。

“供给侧改革”之外：

AIGC为新闻业带来了什么？

全球经济的整体衰退、新技术的替代效应、短视频的冲击、来自社交媒体的流量缩减等背景，致使新闻业面临困境。在这种情况下，AIGC的出现对新闻生产乃至整个新闻业来说可能是一道曙光。那么，AIGC会给新闻业带来哪些新的可能？它会是困境之中的一种出路吗？

(一)AI辅助新闻生产不是新事物

在探讨AIGC所带来的变革之前，回顾新闻业的发展历史，可以看到AI介入新闻业尤其是新闻生产环节并非没有先例。过去十余年，由人工智能引发的新闻业创新浪潮可以分为三个阶段：自动化报道阶段、增强报道阶段和生成报道阶段。

第一阶段，人工智能自动化报道的阶段。在这个阶段，主要是利用AI的自然语言生成(NLG)能力，进行新闻的自动化报道。美联社、路透社、彭博社、法新社等媒体机构都有代表性的实践。自动化报道利用程序自动化生成文本内容，在报道效率和准确性方面具备优势，但由于缺乏思考能力和共情能力，难以写出与人类记者相媲美的报道，因此仅适用于特定领域，如财经、体育等可模板化生产的新闻类型。

在应用方面，例如路透社开发的名为“AI新闻生产线”的新闻自动生成系统，可以生成股票、体育和天气等类型的新闻；《华盛顿邮报》使用名为Heliograf的自动化写稿机器人，可以生成科学、政治和体育等领域的简单新闻报道；日本NHK电视台上线的自动写稿系统，在2011年3月的东京大地震报道中表现突出。腾讯2015年推出的DreamWriter和新华社的快笔小新等产品，则是国内在自动化报道方面的代表性实践。2018年全国两会期间，新华社推出的“媒体大脑”从5亿网页中梳理出全国两会舆情热词，并生成发布全球首条由机器生产的两会视频新闻，仅耗时15秒。

第二阶段，人工智能增强新闻报道的阶段。这一阶段着重运用机器学习和自然语言处理 (NLP)技术，分析数据并揭示相关趋势。例如阿根廷《国家报》(LaNación)自2019年起开始使用人工智能来支持数据团队，后与数据分析师和开发人员合作，建立AI实验室以进一步强化AI应用。

AI在舆情分析方面的应用，同样是人工智能增强新闻报道的例子。在舆情分析环节，AI可以辅助完成情感分析、主题检测、预测与趋势分析等任务，帮助组织更好地理解公众观点与态度，以应对复杂的舆情环境和市场环境。例如，美联社与NewsWhip合作开发的应用，可以帮助专业人员追踪内容传播情况，分析内容将如何推动会员和客户的社交参与，从而调整内容策略，以更好地满足用户需求。也有媒体利用AI的数据能力进行内容优化，如福布斯于2019年推出AI内容发布平台Bertie，可以生成更具吸引力的标题，并针对报道内容进行自动配图，以优化传播效果；《华盛顿邮报》也持续探索将AI纳入业务的实践，比如推出ForYou推荐系统，以及用AI模型检测订阅倾向和用户流失情况。

第三阶段，生成式人工智能(AIGeneratedContent)以多模态生成能力，参与新闻生产的阶段。ChatGPT、谷歌Bard、微软NewBing等产品的技术基础是能够生成叙事文本的大型语言模型(LLM)，相较仅适用于财经报道、体育报道等领域的自动化报道阶段，AIGC可以进行更长篇幅、质量更高的报道撰写，并可以根据指令模仿特定作品风格。AIGC的多模态生成能力还带来了新闻报道可视化的诸多新可能。目前新闻业尚处于这一阶段，相关实践仍待深化，但可预见的是，AIGC将影响新闻采集、生产和呈现等环节，进而改变整个新闻业的格局。

(二)AIGC将实现新闻业“供给侧改革”

文生文、文生图、文生音视频、文生代码等多模态内容，都属于AIGC，即人工智能生成内容的范畴。传统内容生产模式，如UGC、PGC等等，主要区别在于作者的专业程度和构成属性，但本质上都是人作为主体来产出内容，而AIGC则是由AI来产出不同形式的内容。

AIGC对于新闻业的影响主要集中于新闻生产阶段。随着ChatGPT等AIGC技术能力的提升以及应用程度的加深，它对于新闻业的影响也会日益深化。目前的应用实践表明，AIGC对新闻业的影响，主要包括以下几个方面：

首先，新闻信息的采集与处理，优化生产流程。

借助plugins等插件，ChatGPT可以快速抓取和采集海量数据，并进行自动处理，如快速浏览文本和生成摘要，供记者进一步分析。这种能力提供了一种提升信息获取效率的可能，在资料检索阶段，记者和编辑无需阅读大量全文资料，而可利用ChatGPT的数据分析和语义分析能力生成摘要，快速获取核心信息，以提高工作的效率。ChatGPT的语言生成能力还可用于翻译跨语言文本，方便记者和编辑获取不同语种的资料与信息。同时，AIGC工具能辅助记者进行采访音视频内容识别与整理，提高生产力并优化创作流程。根据我们所做的调研，“进行资料检索”和“翻译内容”是目前媒体从业人员最多使用AIGC的两种用途，分别占54.8%和44%。

利用AIGC增强采集和处理信息的能力，将在新闻报道中发挥越来越关键的作用。英国《金融时报》总编辑RoulaKhalaf指出，新闻编辑室应当建立一支AI技术团队，协助记者完成数据挖掘、内容分析及翻译等任务，《金融时报》已经在部署系列课程，以提高记者利用生成式AI挖掘故事的能力。

其次，新闻内容的生成，提升报道效率。

ChatGPT具有较强的学习能力和文本生成能力，在联网之后，还能迅速采集互联网资料进行新闻内容的生成。通过提示词(prompt)的设置，ChatGPT还可以生成特定风格的新闻报道。除此之外，ChatGPT可以应用于生成访谈提纲、文章框架和标题等内容，还能将新闻报道翻译成多种语言，打破语言边界，将新闻传播给多样化受众。

部分媒体已将AIGC纳入到新闻内容的生产流程中。如BuzzFeed将ChatGPT用于测验类内容的生成；2023年情人节前，《纽约时报》使用ChatGPT创建了一个情人节消息生成器，用户只需要输入几个提示指令，程序就可以自动生成情书；德国出版集团AxelSpringer和英国出版商Reach，近期也在地方新闻网站上发布了由AI撰写的文章。

全球首个完全由人工智能生成新闻报道的平台NewsGPT.com也已经上线。根据声明，该网站没有人工记者，由NewsGPT实时扫描、分析来自世界各地的新闻来源，包括社交媒体、新闻网站等，并创建新闻报道和报告。其创始人声称，NewsGPT“不受广告主、个人观点的影响”，7*24小时提供“可靠的”新闻。

最后，新闻报道的多模态呈现，催生“互动新闻”等新闻类型。

随着技术能力的提升，GPT-4已经具备多模态生成能力，除了文生文、文生图，未来还可能生成更多媒介形式。同时，借助Midjourney等AIGC工具，目前也已经实现文本生成图片、音频、代码、3D内容等多模态内容，这为新闻内容的生成创造了新的可能。新闻业曾经追求的“媒介融合”以及“全媒体记者”，现在因AIGC的出现与应用而见到曙光。《纽约时报》于2012年制作的多媒体报道专题《雪崩》，包含图片、影像、数据、3D内容等形式，耗时6个月时间，动用11人团队花费25万美元才完成，而AIGC的多模态生成能力，将极大降低类似内容的生产成本和门槛。

同时，得益于ChatGPT的即时互动能力，可以用于开发针对于新闻业的对话机器人，将其融入到新闻报道中，即时回答读者的提问并且根据数据资料提供补充信息。这可能拓展出一种“AIGC互动新闻”的内容形式，强调与读者互动性，通过不断的提问与回答，呈现完整的新闻图景。AIGC还可以增强“虚拟主播”等技术形态，优化新闻呈现效果。

在广告营销内容方面，AIGC也表现出强大的生成能力，例如使用ChatGPT编写广告文案或利用Midjourney等产品直接生成广告内容，提升创建效率。此外，ChatGPT还可用于分析数据集，帮助广告主了解消费者的行为模式和市场趋势，以优化广告的投放效果。AIGC有望实现数字营销领域的变革。

(三)客观认识AIGC对新闻业的作用

总体而言，以ChatGPT为代表的AIGC技术在新闻信息采集、内容生成以及多模态呈现方面，具有提升效率甚至实现变革的潜力。未来，随着技术能力的进一步提升以及在新闻业的应用深化，AIGC将替代部分常规的模式化内容生产环节，将记者和编辑从消耗时间与精力的繁琐工作中解放出来，专注于更具创意的工作。然而，在这个过程中，“技术替代”导致的人力缩减问题不可避免，因此新闻从业者在新技术环境下的生存状况值得关注。

AIGC凭借强大的内容生成能力，有望实现一场新闻业的“供给侧改革”。但就现实应用情况来看，“改革”还为时尚早，目前ChatGPT等工具主要用于提升内容生产的效率，是自动化报道的“升级版本。由于其仍不具备共情、思考、常识判断等基础能力，AIGC并不能真正用于深度报道的撰写，而是在特定的领域如体育、股票方面，以及“边角料”如测验内容的生成方面有所应用。正如中国信通院云大所人工智能部副主任曹峰所评价，ChatGPT目前仍然无法代替具有高要求、高限定场景下的写作需求。从业界实践也可以看出，在ChatGPT大火之后，虽然不少媒体机构都进行了相关尝试，但并没有哪家权威媒体真正将ChatGPT应用于新闻报道的生产流程中。包括我们的调研结果也显示，仅有38.1%的新闻媒体机构，正在积极使用类似ChatGPT这样的AIGC工具。

这其中存在几个方面原因，包括：

内容可读性差。ChatGPT虽然能够快速基于提示生成内容，但可读性较差，其生成的内容更像是说明文，不具备思想性和阅读趣味性。新闻是对新近发生事实的报道，读者虽然想快速了解身边环境动态，但相比起枯燥乏味的“说明文”，更愿阅读可读性较强的新闻报道。可读性差的部分原因在于，ChatGPT缺少分析能力和调查能力，也不能进行与人类同样的原创表达，因此无法提供对事件的深入看法，只能堆叠无深度的“片汤话”。2023年4月18日，公众号《每日人物》发布了一篇题为《这是我们第一篇完全由ChatGPT写作的稿件》的文章，由记者输入提示词，内容全部由ChatGPT生成。但无论是从实际文本还是读者反馈来看，这篇文章都不能比拟人类作者的水平，“索然无味”“小学生作文”“套路感”“生硬”“翻译腔”等关键词在评论区频频出现。与ChatGPT合作的人类作者也表达了对于此次合作的感受：“绝对称不上愉快，甚至可以用痛苦形容。”

信息源混乱。AIGC的技术原理是大模型，由海量数据组成的数据集构成了AIGC的模型训练样本。但是，这些数据中往往包含了书籍、媒体报道、学术期刊，也包括了自媒体文章、广告营销文案、社交媒体内容，形式繁杂，甚至可以用“鱼龙混杂”来形容。对于专业媒体来说，其发布的新闻报道既要对读者负责，也要为机构声誉负责，信息源混乱的AIGC显然不是理想的选择。如彭博传媒首席数字官JuliaBeizer所评价的，媒体的定位是为读者提供基于事实的信息，但AI并不足以作为准确的信息源。

胡乱编造信息。“机器的幻觉”这个概念，用以形容AIGC“一本正经地胡说八道”的能力。“幻觉”一词源于心理学上的精神疾病“虚构症”(Confabulation)，指个体会因担心对方失望或避免显得自己愚蠢而编造内容来回答问题。由于程序的设定，ChatGPT等工具必须对用户的提问给出答案，如果遇到训练数据集没有包含这一问题或者数据集有误的情况，ChatGPT就会编造出一个错误的答案。同时，它缺乏基本的常识和判断能力，因而无法意识到给出的这个答案是错的。如果将其应用于新闻报道，需要匹配人工校对和核查，这反而增加了人类的工作量。2023年，美国科技新闻网站CNET.com一度上线了几十篇由AI生成的文章，尽管网站编辑声称文章在发布之前都经过了“核查和编辑”，但是很快读者发现，这些文章中有大量基础性错误，并且其中一半都存在抄袭和剽窃的问题。

因此，我们需要客观认识ChatGPT对于新闻业的作用，AIGC将革新甚至是取代新闻业的说法，其实还为时尚早。作为内容产业，新闻业对于优秀的人才需求始终不会改变，基于一手采访的深度内容将会变得越来越重要。正如《金融时报》人工智能编辑马杜米塔·穆尔贾(MadhumitaMurgia)所言，生成式AI工具虽然能够综合信息、进行编辑，但是并不能输出原创内容，也不具备分析能力，“没有什么能取代有原创能力的人”。

达克摩斯之剑：

AIGC会是新闻业的丧钟吗？

对于新闻业来说，AIGC将在内容生产环节掀起一场供给侧改革。然而，鉴于当前的AIGC技术水准，“改革”还远未到来。AIGC相当有限地被纳入到新闻业的生产实践中，并没有真正开始发挥价值。因此，讨论AIGC对于新闻业的挑战其实也为时尚早。但技术一直在迭代，从技术发展史来看，我们不能轻视任何一种技术引发的变革效应。当未来更加先进的AIGC被纳入到新闻业并得到普遍应用时，将会给新闻业带来何种挑战？这是我们需要思考的问题。

(一)破坏新闻生产的场域效应，冲击“客观性”等新闻理念

AIGC介入到新闻业的内容生产环节，在提升效率的同时，势必带来破坏性的影响。

ChatGPT应用于新闻生产过程中，在新闻事件发生之后，程序将相关信息进行抓取、分析、汇总后，快速产出一篇拼贴的内容，效率被发挥到极致。但是，对于新闻业而言，原本处于新闻场域的多方力量都会对新闻报道内容产生影响，因此一篇报道的诞生，并非仅仅是记者个人的灵感迸发，而是多方力量博弈平衡的产物，也是新闻媒体机构化运作的结果。在这个过程中，记者也接受新闻专业主义的规训，尽可能确保报道的平衡与真实。但是当生成主体变成ChatGPT，这种新闻生产的“场域效应”就逐渐消失。

与之对应，如华南理工大学吴小宁教授在论文《ChatGPT信息“革命”对新闻业的冲击与挑战》所提到的，在这个过程中，新闻事实在历史文本的重要性提高。由于ChatGPT的原理是利用现有内容作为训练数据集，一个现象或事件的影响时间越长，相关内容就越多，就被更容易被抓取和汇集到机器生产的新闻内容中。同理，某些新闻人物和新闻事件，如果具有更高的知名度，也就更容易被人工智能抓取和再次呈现，由此可能会形成“信息极化”效应，并形成由人工智能制造的“信息茧房”。

同时，信息抓取过程本身就涉及到法律和道德问题，比如AIGC抓取网络内容并作为训练数据集是否符合法律要求？被抓取内容的主体(特别是新闻记者等内容创作者)是否应该得到经济补偿？2023年2月，图片供应商Getty就以“侵犯版权”的理由起诉了StabilityAI。这些问题，至少目前尚处于迷雾阶段。

除此之外，ChatGPT式的新闻生成模式，将会冲击既有的新闻理念。新闻专业主义强调真实性、客观性、公共性等维度，这些理念是在新闻实践中逐渐形成的一套操作规范，以确保新闻报道不偏离真相。在以人为生产主体的传统新闻业中，记者会受到专业主义和职业素养的规训，在个人的生产实践中奉行这些观念。但ChatGPT没有主观意识，无法理解这些新闻理念背后代表的含义，而这些理念也无法被作为一串prompt(提示词)被转化为ChatGPT所能理解的“语言”。

有观点认为，ChatGPT摆脱了个人主体的主观性，似乎更能进行客观、公正的报道。如同NewsGPT所标榜的，这家网站将客观真实地呈现新闻。但问题在于，算法本身仍有价值观，算法也会延伸现实世界的歧视现象，这是无法规避并且比人作为主体更难解决的问题。北京大学新闻与传播学院胡泳教授指出，新闻业的“客观性”由人和机构的声誉和口碑来背书，但算法的“客观性”把任何机构刨除，其背后的逻辑认为技术是中性的，不存在人的偏见，因此可以保证客观。但问题是技术从来都不是中性的，也缺乏人的判断，因此它并不是“客观性”的拯救者。

值得注意的是，ChatGPT对新闻生产的影响还体现在从业人员对ChatGPT的不规范使用，容易引发抄袭、信源不清等问题。而根据我们的调研，大部分(81.9%)媒体机构都没有出台ChatGPT等工具的使用规范和指导方针。这是需要重视的现实问题。

ChatGPT对于新闻生产的影响还将体现在新技术所带来的就业替代问题上。由于ChatGPT的内容生产效率更高，在特定报道类型上能够取代人工记者，这种现象正在密集地发生。例如，BuzzFeed在宣布用ChatGPT辅助生成测验类内容之后，紧接着就宣布了裁员计划。同时，在2023年5月发生的“好莱坞大罢工”运动中，如何避免AI取代人类编剧的工作，也成为参与运动者的核心诉求。虽然这两个例子不直接指向新闻业，但这种现象会很快随着ChatGPT更深入地应用于新闻生产中而发生。

(二)“劫持”流量，AIGC改变内容分发格局

当前，AIGC生成的信息比重尚低，但随着AI生成内容的广泛推广以及AIGC技术得到深度应用，内容分发领域将面临重大冲击。

在数字时代，在线新闻媒体的很大一部分流量源于搜索引擎，而生成式人工智能正逐渐成为搜索引擎的主要信息源。微软的Bing浏览器整合了ChatGPT，升级为NewBing；谷歌也宣布在搜索结果中将优先显示人工智能(如旗下的Bard)生成的内容。根据谷歌在2023年3月的测试显示，Bard仅提供基本答案和摘要，但并未附上新闻来源链接。

对搜索引擎来说，这是一众自然而然的“市场行为”，因为它能直接呈现整理过后的搜索结果，极大提升用户检索信息的效率，优化用户体验。然而，一旦形成这样的模式，即搜索引擎将更多流量分配给生成式人工智能的生成结果，更为深度、长篇的新闻报道内容将无人问津。

这不仅会影响流入新闻媒体的流量，还会显著削弱新闻媒体的收入。由于越来越多的用户直接从搜索页面获取所需内容，而不再点击进入新闻媒体的主页，依靠广告收入分成的新闻媒体的生存空间将受到压缩。以广告为核心的收入模式将面临巨大冲击，同时，媒体的订阅收入也将直接受损。

社交媒体同样受到影响。2023年上半年，BuzzFeedNews、VICE等数字媒体的倒塌已经印证了社交媒体的重要性，一旦这样的流量源头被掐断，依赖于此的媒体将会受到重击。诸如《纽约时报》《华尔街日报》等新闻媒体也都在Twitter、Facebook等社交媒体平台开设账号进行内容分发，当AIGC内容涌入到社交媒体上时，类似“新闻bot账号”的出现，也会夺走用户的注意力，用户倾向于选择获取快速、易得的新闻摘要，从而影响新闻媒体内容的曝光。

(三)受众4.0的诞生：从“新闻消费者”成为“新闻制造者”

对于新闻业而言，AIGC不仅将改变内容生产方式，同时也重构生产关系。

原因在于，作为一项底层技术能力，AIGC门槛相对较低，只要解决网络问题和账户问题，不仅新闻从业人员可以使用，普通用户也可以使用。对于前者来说，由于其专业化水平较高，考虑到可读性、生产时间成本等因素，对AIGC技术的接纳程度可能并不深入。而对于后者，即普通受众来说，由于没有类似的“专业包袱”，会更愿意使用相关技术。

在这种情况下，利用AIGC的生成能力，普通人也可以进行新闻信息的生成。例如，针对某一新闻事件，让ChatGPT快速生成一篇交代前因后果的新闻报道，也可以让ChatGPT生成近期发生的系列新闻的摘要，方便快速了解新闻。此外，还可以直接生成新闻评论等内容。

在这个过程中，受众不再仅仅是新闻信息的消费者，而是成为了新闻信息的创作者和生产者，由被动转成主动，从而实现了身份主体的转换。回顾技术发展史，互联网的出现已经实现过一轮转换。Web2.0时代，个人博客(Blog)、社交媒体等媒介形式的应用，使得普通人获得了“发表权”，即可以在网络上发表自己的各类观点。这扭转了前互联网时代传统媒体对发表权的独占局面。由于建立媒体机构、创建一份报纸或一家电视台的成本极高，从而形成了信息发布的高门槛，普通人很难有机会和足够的资本建立自己的渠道，而借助互联网和移动设备，每个人都成为了“新闻记者”，随时随地记录、随时随地发布。

如果说互联网改变了内容分发的格局，那么以ChatGPT为代表的AIGC技术则实现了内容生产的“平民化”，普通人借助AI的力量，跨越专业门槛，成为媲美专业人员的内容生产者，基于自身需求，进行定制化的新闻内容生成。而借助社交媒体，发行的成本同样可以忽略不计。

研究领域对于“受众”进行了分类，作为日常对话主体的受众是“受众1.0”，作为媒体内容读者和注意力商品的受众是“受众2.0”，在“人人都是新闻记者”的社交媒体时代，能够随时记录、随时发表的受众成为“受众3.0”。那么，步入AIGC时代，借助AI，获得媲美专业生产能力的受众，直接迈入了“受众4.0”时代。

这对新闻业的影响是深远的。受众拥有采集和生产内容的能力之后，可以更加独立自主地进行内容消费，对新闻媒体产出的讯息依赖程度降低，进一步降低后者的影响力和“把关人”地位。新闻业的边界将变得越发模糊，如何形成与普通创作者的差异化、强化专业边界，从业人员如何应对职业认同危机，将是新闻业必须直面的挑战。

(四)假新闻盛行引发的新闻业信任危机

AIGC实现了内容生产的平民化，但同时也可能导致谣言和假新闻的泛滥。

新闻记者作为内容生产主体，一方面受到所在媒体机构和生产机制的限制，另一方面受新闻专业主义的约束，在进行新闻生产的过程中，他们会注意遵循各种原则，以确保新闻报道尽量平衡、客观且真实。真实性是对于公开发布的新闻报道最基本要求，包括事实真实、细节真实和信源真实。

然而，在生产主体泛化之后，这些限制将不复存在，AIGC有可能成为生成假新闻和谣言的工具。2023年2月，关于“杭州市政府将取消限行”的“新闻稿”在网络上流传，后被发现是某小区业主利用ChatGPT生成，并被其他业主截图转发，导致错误信息被传播。类似的事件还有2023年4月18日流传的《杭州市政府关于调整楼市政策的通知》，该消息称杭州将于5月实行楼市新政，而后被证实是ChatGPT生成的假消息。这些假消息可能带来极高的政治风险和经济风险，损害相关主体利益，例如2023年5月，一篇由生成式AI撰写的假新闻“科大讯飞出现重大风险的警示文”引起广泛关注，导致科大讯飞公司股价大幅下跌。

在这些事件中，AIGC已成为造谣者的得力助手，它的生成能力使虚假信息传播和生产的成本降低，若不加以控制，由其生成的未经核查的虚假信息将严重污染信息生态系统，造成严重的社会影响。

AIGC在创建网站方面的能力，也可能被用于假新闻的传播。借助ChatGPT，只要具备基础编码能力，任何人都能创建一个虚假新闻网站。这也将污染信息生态，造成极大风险。同时，由于AIGC的特性，假消息流入内容市场后，如果不加筛选，有可能继续构成大模型训练的语料，导致谣言进一步传播和强化，形成更严重且持续的后果。假新闻的传播，将影响受众对于新闻的认可度和信任度，可能压倒事实、制造混乱，甚至将带来新一轮的新闻业信任危机。

AIGC时代

新闻业发展的6种可能

新技术的应用，往往会带来颠覆性的变化。正如媒介学者约书亚·梅洛维茨所言：任何一种媒介的介入，都会创造出全新的环境。尽管目前AIGC尚未在新闻报道中被大规模运用，但面对来势汹汹的AIGC浪潮，新闻业无法置身事外，势必也将被卷入其中，甚至被彻底重塑。

从历史发展角度来看，作为社会发展趋势的观察者和记录者，新闻业并不抵触新技术，反而会将其能力融入到自身发展之中，以实现自我革新。本报告认为，随着AIGC技术能力的提升以及应用的不断深化，新闻业将会出现以下6种可能性方向：

(一)媒体专用大模型将得到开发与应用

目前AIGC在新闻业的应用程度尚浅，关键原因在于其信息来源不明且内容参差不齐，既有权威期刊的文章，也有自媒体、营销号的文章，还有大量假新闻、假消息，这是因为目前大模型多采用通用的训练数据库，因而呈现出来的内容质量良莠不齐。对于注重细节严谨、信息准确、信息源清晰的新闻报道来说，这些都是阻碍应用的难点。

另一方面，新闻报道具有一定的表达规范和话语使用惯习。在这种情况下，开发针对新闻行业的专用大模型可能将成为一种趋势。其训练数据集均来自新闻媒体报道，并且可以追溯来源，以保证信息真实准确、来源清晰、减少偏见，并且在内容呈现方面更加符合新闻专业的表达规范。

目前大模型训练成本逐渐降低，大型媒体机构有可能将拥有自家专属的大模型。这种趋势可能不仅限于新闻业，对于行业边界清晰、对信息来源和内容呈现规范有要求的行业(如法律行业)来说，研发专用大模型而非使用现成的通用大模型将是一种发展方向。在这一方面已经有很多实践例证，比如7月20日上海AI实验室与中央广播电视总台联合发布的“央视听媒体大模型”，集合了媒体的海量视听数据与实验室先进算法和技术基础，提升视听媒体制作的质量与效率。

(二)事实核查与内容校对将成为关键角色

事实核查与内容校对在传统新闻行业具有举足轻重的地位，几乎所有的传统新闻编辑部都会设有专门的校验部门(copydesk)。然而，随着媒体数字化进程加速，核查与校对的重要性逐渐降低。一个很鲜明的例子是，近年来媒体进行大规模裁员时，核查与校对等部门往往是裁撤的重灾区，足以显示数字媒体时代对于核查与校对职能的忽视。

但是，随着AIGC的应用，事实核查与内容校对的角色将越来越关键。类似岗位将继续扮演“把关人”的角色，对AIGC生成的内容和细节进行校对与核查，以避免产生AIGC胡编乱造的情况，从而防止“机器的幻觉”等不可控的现象出现。面对愈加发达的技术，媒体也应加强与学术机构和科技公司的合作，提高识别错误内容的能力。

同时，由于AIGC的运作原理是对训练数据集中的内容进行重新组合拼贴，对于新闻业来说，报道的原创性是必须捍卫的底线。因此，核查与校对的指责也包括对AI生成的内容进行“查重”，对不规范引用的内容予以删除或进行来源标注，避免因“抄袭”引发的舆论风险，损害机构声誉，同时防止媒体伦理失范以及法律与道德等问题。

(三)新闻业的AIGC使用伦理、规范将建立

新闻业作为专业领域，有自身的专业主义和伦理、规范要求。针对AIGC这种新技术形态，相关的使用伦理、规范也应当建立，以在专业内形成统一的原则，便于从业人员遵守。这些伦理规范既包括基础性原则，如“使用ChatGPT生成的内容必须进行标注，确保读者知情”、“使用ChatGPT生成的内容，必须由人工进行核查与校对才可发布”，也包括一些具体性的操作规定，例如在一篇人类与AI共创的报道中，AI创作的内容不得超过一定的比例等等，以尽可能降低AIGC应用所产生的乱象。适用于AIGC时代的《新闻的十大基本原则》呼之欲出。

目前已有媒体开始推动此类实践，如科技媒体《连线》就制定了相关规定，对使用AI的目的及工作流程进行了明确界定，以确保内容质量。规范并非束缚，合理的规范将有助于技术更好地融入并发挥价值。规范确立的主体可能是行业协会，而每一家新闻机构结合实际经营状况，也会形成自身的相关规范与要求。除了伦理规范，帮助从业人员更好地了解与使用AIGC的指导手册和课程也同样重要。如何借助AIGC辅助自己的新闻报道实践，将成为未来新闻记者的关键能力之一。

(四)新闻分层，权威的专业新闻报道将更加重要

在AIGC时代，权威专业新闻报道的重要性将愈发凸显，重塑专业性将成为新闻媒体机构的重要使命和一条出路。AIGC在内容生成方面大大提升了效率，然而，机器生成的文字与人类撰写的内容存在差异，前者虽然快速且框架完整，却无法取代“好”的新闻报道，后者将始终拥有受众市场。这里所说的“好”，包含优秀的文笔、高度的可读性、极强的共情力……这些因素共同构成了触动读者的条件。

AIGC介入新闻生产，新闻事件发生时可以在第一时间迅速生成一篇要素完备的报道，将会满足受众基础的信息需求。然而，对于事件的深入挖掘及背景信息的补充，仍然需要人类记者深入现场，进行一手的采访和调查。因此，未来新闻类型会进一步发生分化，一方面，即时的事件性报道和资讯类报道将由AIGC完成，在这个领域，人类记者的空间将会越来越狭窄，另一方面，权威专业新闻报道和深度报道将变得更为重要，也将获得更多关注。

相应地，媒体机构、新闻记者与读者之间的联系也将愈发关键。AI作为生产主体的一个问题在于，它无法与读者建立起情感联系，大部分情况下，读者往往能清楚地意识到AI就是AI，是没有情感和意识的系统，这会削弱读者对内容的信任度，而这正是人类记者的机会所在。强化与读者的连接，打造机构品牌与记者个人品牌，将成为关键议题。

(五)新闻业会发生“本地化新闻”转向

由于AI大模型的训练原理，通用文本构成训练数据的主体，基于本地内容的文本量较小，即便纳入训练数据集，也容易被其它类型的信息淹没，因而AIGC在本地化内容生成方面表现欠佳。与此同时，受众对本地化报道的关注程度并未减弱，因此，AIGC时代的新闻业可能发生本地化转向的趋势。

数字媒体出现以来，对本地新闻的忽视日益明显。互联网的扁平化和低门槛特性，使得一个网站的潜在受众理论上是全世界的上网用户。对于在线媒体来说，为了提升网站内容流量和曝光度，在内容生产和呈现方面往往会采用全球化策略，尽可能将关注范围扩大，报道全世界范围内发生的重要事件。这种倾向反过来也影响到传统媒体，越来越多的地方性报纸在新闻采编中逐渐扩大全国性报道的比例。

与此同时，本地化新闻的报道逐渐被忽视。这也是受众产生“新闻回避”情绪的重要原因。受众对本地化新闻的需求未被满足，很多时候，受众只想了解自己身边在发生什么，并不想关注太多遥远的新闻事件。许多媒体注意到这一趋势，并将报道重点回归到本地化报道。这种转向趋势在AIGC时代将继续进行，越来越多的新闻媒体将专注于本地化新闻的报道。

(六)AIGC应用深化催生新闻类型创新

新闻业对于新技术的接纳，相对而言比较积极。新闻业擅于将各种新的媒介形态运用到新闻报道中，实现更丰富的呈现效果。例如，借助大数据和算法技术，数据新闻兴起，以客观数据的可视化呈现为特色；再如，借助多媒体技术，《纽约时报》对华盛顿州喀斯喀特山脉隧道溪发生的雪崩进行了全方位报道，上线数字化专题报道《雪崩》(SnowFall)，包含文字、图片、影像、数据内容等多种媒介形式，被认为“重新定义了新闻报道”。

同样，通过吸纳AIGC技术的特点与优势，全新的新闻类型也将会涌现。较有可能性的创新之一是“智能互动新闻”，即报道主体聚焦新闻事件的核心，而读者可以随时通过附着在报道页面的对话框进行互动，了解新闻的背景性信息、事件的前因后果与历史脉络，甚至是最新事件进展等，受众与新闻报道的互动性将得到前所未有的增强。当然，这只是可能性之一，随着AIGC在新闻业应用的不断深化，未来或许会出现更有想象力的新闻类型和业态。

结语：

AIGC会取代新闻业吗？

德国学者斯托伯尔总结了技术进化的三个阶段：首先是“发明”，其次是“创新”，最后是“制度化”，即形成文化。概括而言，“发明”是从无到有的创造，“创新”则是基于发明的利用和改进。就目前的情形，AIGC还处于发明阶段，并正在迈向与各个领域融合的创新阶段。从技术发展史来看，任何技术被社会所接受、采纳并真正发挥作用，都需要一个漫长的过程。我们既不能低估AIGC可能引发的变革，也不能高估变革实现的速度。

AIGC正在推动新闻的采集、生产、呈现等环节实现创新，但是“颠覆”“变革”等还为时尚早。在我们的调研中，多数从业者(50.5%)也认定，对于新闻业来说，ChatGPT等工具更多是一种辅助型角色，只有10.5%认为这些工具是质量改进工具。AIGC对新闻业最根本的影响，是引发了新闻生产方式的变革，从而实现生产关系的重构。具体一点来说，AIGC提高了新闻生产的效率，并且降低了新闻生产的门槛，利用ChatGPT等AIGC技术，受众可以基于自身的信息需求，生成定制化的新闻资讯和评论。由此，传统的受众完成身份转换，由被动的信息消费者，转变成主动的新闻生产者，这将改变新闻业的格局和既有认知。这才是新闻业最应该警惕并需要应对的趋势。

当然，先进的技术或许会改变生产方式，但却改变不了责任所在。尤其对于新闻业来说，即便所有稿件都由AIGC生成，人类也将一直是AI背后的道德行为人和最终把关人。从这个角度出发，人类的责任将更重要。强化主体责任，加强核查，形成AIGC的应用伦理与规范也将越来越重要。

“新闻”一词，不仅仅指代我们能够读到的“新闻报道”，也指代着新闻业及其所承载的新闻传统，包括价值理念、操作规范、伦理原则等等。作为没有意识的主体，AI始终无法传承并遵循这些传统，而这些传统是新闻业得以存在及延续的安身立命之本。

ChatGPT也不会取代新闻记者，只是取代了部分他们的部分工作。经验丰富的新闻记者对新闻事件有高度的敏感性、洞察力和共情能力，能够提炼新闻价值，并以流畅的文字付诸于笔端。这些主观特质，都是ChatGPT难以取代的能力。大浪淘沙之下，优秀的新闻记者与权威的新闻机构，将会越来越重要。工具理性滥觞，势必应该坚守价值理性。对于新闻业来说，强化专业性和权威性，重视调查性报道、解释性报道，将是AIGC时代的一条出路。

很多人觉得，ChatGPT已经出现，那就让GPT写稿，甚至能取代新闻业。但这种观点，显然忽视了新闻业的复杂性及其所存在的意义。真正的新闻业是“船头的瞭望者”，维护公共利益，为民众表达诉求，这是新闻业的责任所在，也是一代代新闻人奋斗的出发点。技术工具无法理解这种激情，我们也不能企图将责任感和专业性转化成一行行prompt传递给ChatGPT。在这一点上，AIGC永远无法取代新闻业。

来源：腾讯研究院（公众号）

链接：https://mp.weixin.qq.com/s/fYidMeGHgl23jMzI99bcYQ

编辑：覃韵琪

刘海明 · 发表于 2023-9-24 22:30:20

【案例】

AI算力70年增长6.8亿倍，3个历史阶段见证AI技术指数级爆发

【新智元导读】

一张图揭示了AI算力70多年发展了6.7亿倍，未来AI各方面能力将全面超越人类，而真正令人期待的是，AI行业才刚刚进入爆发前的萌芽期。

电子计算机于上世纪40年代诞生，而在计算机出现后的10年内，人类历史上的第一个AI应用就出现了。

70多年过去了，AI模型现在不仅能写诗，还能根据文本提示生成图像，甚至是帮助人类发现未知的蛋白质结构。

那么，是什么推动了AI技术在如此短时间内的指数级增长呢？

一张来自「我们数据中的世界」（Our World in Data）的长图，通过用于训练AI模型的算力变化为刻度，对AI发展历史进行了追溯。

高清大图：https://www.visualcapitalist.com/wp-content/uploads/2023/09/01.-CP_AI-Computation-History_Full-Sized.html

图中数据的来源，是源于一篇由MIT等大学研究人员发表的论文。

图片论文地址：https://arxiv.org/pdf/2202.05924.pdf

除了论文之外，还有一个研究团队根据这篇论文数据做了一个可视化的表格，可以随意缩放图标来获取精细的数据

图片表格地址：https://epochai.org/blog/compute-trends#compute-trends-are-slower-than-previously-reported

图表的作者主要通过计算运算次数以及GPU时间来估计训练每个模型的计算量，而对于选择哪一个模型作为重要模型的代表，作者主要通过3个性质来确定：

显著的重要性：某个系统具有重大历史影响，显著提高了SOTA，或者被引用次数超过 1000次。

相关性：作者只收录了包含实验结果和关键机器学习组成部分的论文，并且论文目标是推动现有SOTA发展。

独特性：如果描述同一系统的另一篇论文更具影响力，那么该论文将被从作者的数据集中排除。

AI发展的三个时代

在1950年代，美国数学家Claude Shannon训练了一个名为Theseus的机器老鼠，使其能在迷宫中导航并记住路径—这是第一个人工学习的实例。

Theseus的构建基于40个浮点运算（FLOPs）。FLOPs通常用作衡量计算机硬件计算性能的指标。FLOP数量越高，计算能力越强，系统也越强大。

计算能力、可用的训练数据和算法是AI进步的三大要素。而在AI发展的最初几十年里，所需的计算能力是按照摩尔定律增长的——计算能力也在大约20个月的时间翻一倍。

然而，在2012年由AlexNet（一个图像识别AI）标志着深度学习时代的开始时，这个翻倍时间大大缩短到了六个月，因为研究人员加大了对计算和处理器的投资。

随着2015年AlphaGo的出现——一个击败了人类职业围棋选手的计算机程序——研究人员发现了第三个时代：大规模AI模型时代到来了，它的计算需求比以前所有的AI系统都要大。

未来AI技术的进展

回顾最近的十年，计算能力的增长是如此之快，简直令人难以置信。

例如，用于训练Minerva（一个可以解决复杂数学问题的AI）的计算能力几乎是十年前用于训练AlexNet的600万倍。

这种计算增长，加上大量可用的数据集和更好的算法，令AI在极短的时间内取得了大量进展。如今，AI不仅能达到人的表现水平，甚至在很多领域超过了人类。

AI能力将在方方面面不断超越人类

从上图可以清楚地看出，人工智能在很多领域已经超越了人类的表现，并且在其他方面也将很快超越人类的表现。

下图展示了在常见的人类日常工作和生活会使用到的能力中，AI在哪一年已经达到或者超过了人类水平。

AI技术发展势能充足

难以说计算增长是否会保持相同的速度。大规模模型需要越来越多的算力来训练，如果算力供应不能继续增长，可能会减缓AI技术发展的进度。

同样，耗尽目前可用于训练AI模型的所有数据也可能妨碍新模型的开发和实施。

然而，2023年，大量资本涌入AI行业，尤其是以大语言模型为代表的生成式AI。或许更多的突破即将出现，似乎以上3个促进AI技术发展的元素都将在未来进一步得到优化和发展。

2023年上半年，AI行业的初创公司融资规模达到了140亿美元，甚至比过去4年获得的融资总和还要多。

而大量（78%）的生成式AI初创公司都还处于发展非常早期的阶段，甚至27%的生成式AI初创公司公司还没有进行融资。

360多家生成式人工智能公司，27% 尚未进行融资。超过一半是轮或更早的项目，说明整个生成式AI行业还属于非常早期的阶段。

由于开发大型语言模型的资本密集型性质，自 2022 年第三季度以来，生成式AI基础设施类别已获得超过 70% 的资金，仅占所有生成式AI交易量的10%。大部分资金源于投资者对基础模型和API、MLOps（机器学习操作）以及向量数据库技术等新兴基础设施的兴趣。

参考资料：

https://www.visualcapitalist.com/cp/charted-history-exponential-growth-in-ai-computation/

来源：新智元（公众号）

链接：https://mp.weixin.qq.com/s/EO80wP7DqzEG7OIBo1Dzuw

编辑：覃韵琪

刘海明 · 发表于 2023-9-26 00:47:05

【案例】

APUS谋变：押注大模型，转型人工智能

撰文 | 张宇

编辑 | 杨博丞

题图 | IC Photo

随着国产大模型之战愈演愈烈，全球移动互联网企业APUS正在加速落地大模型应用。

日前，在2023腾讯全球数字生态大会上，APUS与腾讯云达成战略合作，双方将集中各自优势，在ICT基础设施、大模型生态建设等领域开展广泛、深入合作。同时，APUS还在2023百度联盟大会上，与百度联盟凝聚生态共识，获得了前者的信赖与认可。

据悉，APUS成立于2014年6月，致力于为全球智能手机用户提供最好的用户系统，帮助用户实现最佳的手机和移动互联网使用体验，多次被评为“独角兽”企业，同时也是最早提出出海概念的移动互联网企业。成立初期，APUS曾凭借一款基于安卓系统的桌面应用，在上线三个月后拿下了30多个国家Google应用商城的个性化榜单第一名。

2023年初，ChatGPT的月活跃用户数突破1亿，成为历史上增长最快的消费者应用程序，大模型浪潮席卷而来，以千亿级多模态大模型“天燕大模型”的推出与应用为标志，APUS全面转型人工智能企业。现阶段，天燕大模型具备对文本、图像、视频、音频的理解和生成能力，并已通过智能问答大师等七款人工智能应用向C端用户开放使用，同时，并行落地智慧客服、智慧医疗、智慧网信、智慧判案等产业应用场景。

不过，在天燕大模型实际落地过程中，APUS仍面临不少难题，比如市面上大模型数量众多，天燕大模型能够创造出哪些新价值？现阶段，大模型行业的战况激烈且焦灼，新形势下，APUS能否借助大模型浪潮实现换道和突围？APUS能够站上多大模型的风口吗？

1. 出海元老转型人工智能

PUS是最早开始关注并投入人工智能的入局者之一，“我们在2018年就进行了AI技术布局，并在2018年推出了多款基于AI技术的应用如CutCut、PickU 、Vieka等，用户可以体验智能抠图，变老变年轻等功能”。APUS创始人兼CEO李涛表示。

2018年，APUS开始尝试从工具类产品向内容产品转化，这来源于李涛的战略思考：作为一家全球化企业，如何打造差异化能力，与具备内容基因的巨头平台进行竞争。当时李涛的设想是“如何用AI进行内容生产和创作”，因此APUS研发了一系列AI类产品，从让用户变年轻的智能抠图到换发型的人脸融合，再到语义分析和解读等等。

尽管入局较早，但APUS的转型之路始终难言顺利，“可以说，关于AI产品的探索，已经做到快崩溃了。”李涛曾坦言。

2022年11月，OpenAI推出的新型AI聊天机器人工具ChatGPT在一夜之间火爆全球互联网，引来了无数人的关注，截至2023年4月，ChatGPT的全球访问量再创新高，达到17.6亿次，仅次于谷歌、百度等搜索引擎。

ChatGPT的火爆让APUS看到人工智能将全方位改变业态。2023年初，APUS开启新一轮战略转型：从工具到AI，对所有产品和服务进行全面性改造。

4月18日，APUS发布了自研多模态人工智能大模型天燕大模型（AiLMe）。据悉，天燕大模型参数已达千亿规模，具备了对文本、图像、视频、音频的理解和生成能力。针对具体应用场景，APUS从AiLMe内蒸馏出文本模型“异雀八”、图像模型“异雀三”、视频模型“异雀四”、音频模型“异雀六”四个垂直领域精炼模型，并基于此研发出了智能问答大师、简笔成画、墨染、Daily Astro、Star Night、KJV Bible Now、PicPik等七大AI产品。

图源：APUS

值得关注的是，天燕大模型在模型训练时，分为预训练阶段和微调阶段，基于此，天燕大模型已具备了自主学习能力。不同于ChatGPT需要用户手动选择插件，天燕大模型在设计时采用了插件式架构，无需用户干预，就能够使大模型实现目标驱动，进行自我进化。未来，天燕大模型的发展路线图将从两个方面去发力：一是生态建设，二是能力加强。

2. APUS转型迫在眉睫

“今年APUS要全面转型人工智能，这是一个非常明确的目标。”李涛坦言，APUS的2023年目标是全面转型人工智能，希望业绩能实现200%的增长。

PUS是工具类产品出海的头部企业，但急于转型的背后，实际上是APUS正面临着不小的困境。

不容忽视是的是，用户粘性低、可替代性强、市场严重饱和，被认为是工具类产品的通病。更要命的是，由于工具类产品的成长路径太长，在培养用户付费习惯上需要花费大量时间和精力，如何变现成为了悬在工具类产品企业头上的达摩克利斯之剑。

PUS曾两次向中国证监会递交招股书，根据其在2019年初更新的招股书，APUS面临着诸多难题，比如盈利模式单一、客户集中度高等等。

招股书显示，APUS在2018年上半年的总营收为4.4378亿元，净利润为1.7564亿元。而在2015年至2017年，其总营收分别为5516万元、5.85亿元和9.06亿元，同期营业利润分别为-1.9亿元、1.5亿元、2.7亿元；净利润分别为-1.77亿元、1.67亿元、2.42亿元。

虽然经营业绩持续向好，但值得关注的是，APUS的盈利模式主要是通过在自有用户基础上接入第三方广告平台向用户展示广告并向第三方广告平台收取广告服务收入。

与此同时，APUS还存在着客户集中度较高的情况，2015年至2018年上半年，APUS来自前五大客户的营业收入分别为3864.12万元、5.05亿元、8.56亿元和4.39亿元，占总营收的比例分别为70.05%、86.11%、94.44%和98.88%，呈现出持续走高的态势。

截至2017年，APUS产品累计安装用户数突破12亿，覆盖全球200余个国家和地区，然而坐拥12亿用户，却始终无法造福业绩。

需要说明的是，APUS招股书披露的经营业绩停留在2018年，已不具备代表性，并且此后APUS也未向外界披露过相关数据，其现在的真实情况不得而知，不过APUS面临的难题似乎未能得到解决，不然也不会急于在2023年内全面转型成为人工智能企业。

如何摆脱对大客户的高度依赖，以及如何寻找稳定的盈利增长点，或是目前APUS最需要直面的挑战，加速入局AIGC，蓄力大模型，已是迫在眉睫。

3. 大模型难成救命稻草

长远来看，大模型有助于APUS找到新的盈利增长点。

大模型赛道的想象空间巨大。根据市场研究机构MarketsandMarkets的报告数据，全球生成式人工智能市场规模预计将从2023年的113亿美元增长到2028年的518亿美元，预测期内复合年增长率为35.6%。由于云存储的创新使数据易于访问，以及人工智能和深度学习的发展，预计生成式人工智能市场在预测期内将以显著的速度增长。

图源：APUS

不过在现阶段，大模型却难以成为APUS的救命稻草。

硬件是一笔巨额投入，根据美国市场研究机构TrendForce推算，处理ChatGPT的训练数据需要2万枚GPU芯片，而随着OpenAI进一步展开ChatGPT和其他GPT模型的商业应用，其GPU需求量将突破3万张（该报告计算以A100芯片为主）。

此外，训练大模型的成本也不容小觑，根据国盛证券发布的《ChatGPT需要多少算力》估算，GPT-3训练一次的成本约为140万美元，对于一些更大的LLM(大型语言模型)，训练成本介于200万美元至1200万美元之间。以ChatGPT在1月的独立访客平均数1300万计算，其对应芯片需求为3万多片英伟达A100 GPU，初始投入成本约为8亿美元，每日电费在5万美元左右。

以OpenAI为例，有研究报告指出，OpenAI仅运行其人工智能服务ChatGPT每天就要花费约70万美元，OpenAI目前正处于烧钱的状态，若不加速自身商业化进程，很有可能在2024年底不得不申请破产。硅谷权威媒体The Information也在报道中称，OpenAI在2022年总营收为0.28亿美元，净亏损为5.4亿美元。

押注大模型并不能立竿见影，大模型还处于快速进化的阶段，远远没有想象中那样无所不能。综合来看，大模型还很难成为APUS的第二增长曲线：一方面，在推进大模型产业化落地过程中存在多重难题，比如算力面临掣肘、数据质量参差不齐、与行业难以高度融合等等；另一方面，大模型产品还面临着同质化严重的情况，APUS仍需持续挖掘特色与价值。

不过，在李涛看来，大模型的首要目标并非商业化，而是制定行业标准，类似于安卓与iOS之争。对于大部分企业而言，只需要关心小模型和中模型即可。“毕竟未来这个世界最有价值的东西就两个，一个是操作系统，一个是生态就是场景，其他的东西都是过眼云烟。”

链接：https://www.sohu.com/a/723441062 ... 6956536879632ivY8J2
来源：金融界

编辑：秦克峰

刘海明 · 发表于 2023-9-29 00:31:18

【案例】

ChatGPT 终于“联网”了！不再局限于旧数据，新功能即将对所有人开放

来源：AI前线

整理：冬梅、核子可乐
当地时间周三（9 月 27 日），OpenAI 在 X（前身为推特）上宣布，其聊天机器人产品 ChatGPT 可以通过微软的必应搜索引擎进行网络搜索，将不再局限于 2021 年 9 月之前的数据。

OpenAI 称：“现在 ChatGPT Plus 和 Enterprise（企业版）用户可以使用浏览功能，将很快扩展到所有用户。要启用，请在 GPT-4 下的选择器中选择‘使用必应浏览’（ Browse with Bing）。”

需要说明的是，OpenAI 早些时候测试了相关功能，允许 Plus 用户通过必应搜索访问最新信息，但后来因担心用户绕过付费墙，禁用了这项功能。

此外，OpenAI 本周早些时候还宣布了另一项重大更新，将使 ChatGPT 可以通过图片和语音命令交互。
ChatGPT 再迎重大升级：
“能看、能听，也能说”

本周一，OpenAI 宣布对 ChatGPT 进行重大更新，使其 GPT-3.5 和 GPT-4 两大 AI 模型能够分析图像内容，并在文本对话中据此做出反应。OpenAI 方面表示，ChatGPT 移动版应用还将引入语音合成选项，在与现有语音识别功能配合使用时，能够与 AI 助手进行全口语对话。

OpenAI 也强调，语音合成功能目前仅适用于 iOS 和 Android 平台，而图像识别则将登陆 Web 版和移动版应用。

OpenAI 解释称，ChatGPT 中的全新图像识别功能允许用户基于 GPT-3.5 或 GPT-4 模型，根据上传的一张或多张图像开展对话。该公司在其宣传博文中宣称，这项功能能够对接各类日常应用，例如为冰箱和食品储藏室拍摄照片以确定晚餐吃点什么，还有排除烧烤炉出故障的原因。该公司还提到，用户可以使用设备的触控屏圈出自己希望 ChatGPT 重点关注的部分。

OpenAI 宣传视频中的画面，ChatGPT 在分析用户照片以帮助其调整自行车座高。

在官方网站上，OpenAI 发布了一段宣传视频（https://openai.com/blog/chatgpt-can-now-see-hear-and-speak），展示了与 ChatGPT 的交流过程。其中用户询问要如何升高自己的自行车座垫，并上传了车辆、说明手册以及工具箱的照片。ChatGPT 迅速做出反应，并为用户提供了完成调整过程的说明。我们还没有亲自测试过此功能，因此不太清楚实际效果是否真有这么惊艳。

那这一切到底是怎么实现的？OpenAI 尚未发布 GPT-4 或其多模态版本 GPT-4V 的底层运行细节。但根据其他厂商（包括 OpenAI 合作伙伴微软）的已知 AI 研究，多模态 AI 模型往往能够将文本和图像转化为共享编码空间，借此通过同一套神经网络处理多种类型的数据。OpenAI 可以使用 CLIP 来弥合视觉与文本数据间的差异，从而在同一潜在空间（一种表达数据关系的向量化网络）上实现图像和文本表示对齐。正是这项技术，让 ChatGPT 具备了跨文本和图像进行上下文推理的能力——当然，这一切都只是外界的推测。

与此同时，报道还指出 ChatGPT 的全新语音合成功能允许用户与其进行直接对话，而且此功能由 OpenAI 的“新文本转语音模型”驱动。尽管文本转语音技术已经相当成熟，但该公司表示在此功能推出之后，用户可以在应用端的设置中选择语音对话，之后从五种不同的合成语音中做出选择，具体包括“Juniper”、“Sky”、“Cove”、“Ember”和“Breeze”几个选项。OpenAI 称这些声音均是与专业配音演员合作开发而来。

OpenAI 的 Whisper 是一套开源语音识别系统，此次也由它继续负责对用户语音输入的转录。Whisper 于今年 5 月正式与 ChatGPT iOS 版应用集成，随后在 7 月登陆 ChatGPT 的 Android 版应用。
“请注意，ChatGPT 给出的
结果不一定准确”

OpenAI 于今年 3 月公布 GPT-4 时，就曾经展示过该模型的“多模态”功能，据称可以处理文本和图像输入。但在随后的测试阶段，公众一直无缘真正体验其图像功能。期间 OpenAI 与 Be My Eyes 合作开发了一款可以为盲人描述场景照片的应用。今年 7 月，有报道称 OpenAI 的多模态功能之所以迟迟未能发布，主要是受到隐私问题的影响。与此同时，微软则于 7 月匆忙在基于 GPT-4 的 AI 助手 Bing Chat 中启用了图像识别功能。

在最近的 ChatGPT 更新公告中，OpenAI 称其扩展功能仍有一些限制，并承认该模型仍可能出现潜在的视觉混淆（即对某些内容的错误识别）、对非英语语种无法完美识别等问题。该公司表示，他们已经“在极端场景和纯科学验证角度”对新功能进行了风险评估，同时征求了 alpha 版本内测人员的意见，目前的观点仍然是建议谨慎使用，特别是在科学研究等高风险或专业性较强的背景之下。

鉴于在开发 Be My Eyes 应用时遇到的隐私问题，OpenAI 表示已经采取“技术措施来尽量限制 ChatGPT 对人类对象做分析和直接描述的能力。因为 ChatGPT 给出的结果不一定准确，AI 系统应当尊重个人隐私。”

尽管仍有种种缺陷，但 OpenAI 在营销材料中还是强调 ChatGPT 如今已经“能看、能听，也能说”。当然，并不是每个人都能认同这种充满拟人倾向的炒作宣传。Hugging Face 公司 AI 研究员 Sasha Luccioni 博士就在 X 上发推称，“别再像看待人类那样看待 AI 模型了。ChatGPT 根本就没法看、没法听，也没法说。它只能跟各种传感器相集成，以不同于人类的方式接收和发出信息。”

虽然 ChatGPT 及其底层 AI 模型还远远算不上“人”，但如果本次公布的结果不假，那也至少代表着 OpenAI 的这款虚拟助手实现了巨大的功能增强。

此外，OpenAI 也强调了推迟开放有其充分理由：“我们认为应该逐步推出自己的工具，这样我们才能随时间推移不断改进并完善风险缓解措施，同时也让大家能为未来更强大的 AI 系统做好准备。”

参考链接：
https://twitter.com/OpenAI
https://arstechnica.com/informat ... d-speech-synthesis/

来源：人工智能学家
链接：https://mp.weixin.qq.com/s/MDqfSbvhVsFOX9oy2XXVpg

编辑：秦克峰

刘海明 · 发表于 2023-9-29 23:03:15

【案例】

Meta推出基于名人的角色聊天机器人丨具有不同个性

如何留住用户？Meta正试图以最快的速度将AI融入各类产品中。
8月1日，英国《金融时报》援引知情人士消息称，Meta最快将于下月推出一系列AI驱动且具有不同性格特征的聊天机器人。
据三位知情人士透露，Meta CEO扎克伯格一直在设计聊天机器人原型，小扎希望这些具有不同“性格特征”的聊天机器人可以与其近40亿用户开启更像人类的聊天对话：
其中一些聊天机器人被员工称为“人物”他们呈现不同的角色形象。Meta正探索推出一个与亚伯拉罕·林肯表达方式类似的聊天机器人，以及一个与冲浪者类似可以提供旅游建议的聊天机器人。
知情人士称，这些各式各样的聊天机器人最早可能在9月上线。而Meta想要快速将AI融入各类产品的目的也昭然若揭：AI可以让搜索功能更有趣，帮助Meta留住用户。
包括TikTok在内的社交媒体平台正不断抢占Meta的市场，而聊天机器人的引入不仅仅是能够提高用户的娱乐体验价值，提供更多个性化的服务，更重要的是能够增加“人文关怀”，这对于用户体验来说会是全新的，包括用户认同感和忠诚度等情感联结能够给增加用户的粘性以及日活时间.
当前对于Meta而言，如何保持用户粘性成了最关键的问题之一，毕竟Meta面临着用户增长瓶颈的以及短视频用户抢夺大战，一旦月活数量下滑，是很容易失去广告商的青睐。就像上市即巅峰的Threads，用户活跃数量已经开始下滑，后期的广告收入将是个问题。
扎克伯格在Meta2023年一季度财报后电话会上就表示，公司正在探索如何将新的 AI 技术用于可覆盖全球数十亿用户的产品中。
社交平台的聊天机器人“大战”

6月初，移动开发人员及爆料者Alessandro Paluzzi在Twitter在推特上发图称，Instagram可能会开发一个人工智能聊天机器人。
根据图片显示，用户可以从30种不同的AI个性中进行选择来回答问题或提供建议；包括不适当的响应和有限的功能。使用的AI模型和聊天机器人的实际功能尚未讨论。

而深受青少年欢迎的社交平台Snapchat，在今年2月就引入了基于Open AI 最新版 GPT技术的“My AI”，想靠着机器人的加入，让聊天本身更加有趣起来。
当My AI就面向 Snapchat+ 订阅用户开放测试版功能后，一个多月以来，My AI平均每天收到近200万条聊天消息，内容包括电影、体育、宠物等不同话题，正从多个维度改变着他们在Snapchat平台上的社交体验。
在今年4月的全球生态合作伙伴（SPS）大会上，Snap CEO Evan Spiegel宣布，SnapChat的全球月活用户已经达到了7.5 亿，Snapchat+ 订阅用户突破 300 万，随之而来的，是旗下的智能聊天机器人My AI面向所有用户开放——包括群聊。
用户们可以通过My AI可以定制姓名与外形，光是这一点，就能让不少用户真正的与AI开始互动起来。
可以看出，手握大把年轻用户，又是熟人网络平台的Snapchat，面对来自Instagram、TikTok诸多社交平台的挑战，也一直在在积极探索新的商业化形式。

在人工智能技术的不断推动下，社交媒体领域将会迎来更加个性化和智能化的新时代。如何大力布局人工智能聊天机器人，以获取用户的持续性青睐无疑是Meta现在的重心。

来源：华尔街见闻
链接：https://new.qq.com/rain/a/20230801A04LA300

编辑：秦克峰

刘海明 · 发表于 2023-10-2 23:03:44

本周硅谷发生了什么？| GPT升级多模态还可联网；OpenAI开搞AI硬件；Meta发布首款MR头显

本周，OpenAI连放大招，先是上新了ChatGPT的多模态功能，又被爆料将通过员工出售股份获得资金。创始人之一的Altman与iPhone设计师Ive、软银孙正义联系密切，据传OpenAI将要推出AI硬件设备。隔日又官宣ChatGPT支持联网，谁看了不说一句精彩！

OpenAI的劲敌Anthropic也不消停，获得了来自亚马逊的40亿美元投资。特斯拉的人形机器人Optimus也让人刮目相看，不仅能识色分物，还能做瑜伽，距离应用工厂似乎又进了一步。Meta在今年的Connect开发者大会则推出新款Quest 3，相较于前一代实现重磅升级。

面对大模型内部不足这一问题，来自加州伯克利大学分校等机构的学者提出PagedAttention算法，通过切割模型关键信息，实现弹性内存管理，提高了吞吐量。

Key Points：

ChatGPT上新多模态，具备图像和语音功能

OpenAI计划出售900亿股票，允许员工出售股票

OpenAI进军硬件设备领域，与iPhone设计师Ive、软银孙正义联系密切

ChatGPT实现联网，为用户提供实时链接

亚马逊向Anthropic投资40亿美元

Kolena完成1500万美元A轮融资

Kneron完成4900万美元B轮融资

特斯拉人形机器人擎天柱Optimus会做瑜伽了

Meta推出世界上首款MR头显Meta Quest 3

加州大学伯克利分校提出PagedAttention算法，提高模型吞吐量

大事件：

ChatGPT上新多模态，具备图像和语音功能

美国时间9月25日，OpenAI推出ChatGPT多模态模型：GPT-4V(ision)，即在ChatGPT中推出了“基于图片的对话”和“实时语音对话”功能，用户可以在ChatGPT中拍照上传图片，用语音直接ChatGPT进行对话或者讨论。其他功能还包括物体检测、文本识别、人脸识别、验证码解决和地理定位，但也存在空间关系和上下文理解能力不足的缺陷。

OpenAI计划出售900亿股票，允许员工出售股票

美国时间9月26日，据《华尔街日报》消息，OpenAI计划出售现有股份，交易后估值或将达到900亿美元。本轮交易，OpenAI不准备依靠发售新股筹集资金，而允许员工出售持有的股票，目前还未确定具体的交易条件。OpenAI透露，今年营收可达10亿美元，2024年将增长至数十亿美元。

OpenAI进军硬件设备领域，与iPhone设计师Ive、软银孙正义联系密切

9月27日消息，据The Informtion，OpenAI准备推出AI硬件设备。根据知情人士透露，OpenAI CEO Sam Altman一直在与iPhone著名设计师Jony Ive联系，计划推出一种新的AI硬件设备，其中一位还与软银CEO孙正义讨论过这一想法，但并不清楚后续是否会参与其中。

ChatGPT实现联网，为用户提供实时链接

美国时间9月28日，OpenAI宣布ChatGPT实现联网功能，为用户提供信息的来源链接。目前，仅有Plus和企业版用户可以使用该功能，但OpenAI表示该功能将很快拓展至所有用户。如果要使用该功能，可以在GPT-4的模式下选择“使用Bing浏览”。

融资动态：

亚马逊向Anthropic投资40亿美元

9月25日消息，亚马逊宣布向Anthropic投资40亿美元（约合280亿人民币），用于开发业内最可靠、性能最高的基础大模型。本次合作后，Anthropic将有权使用AWS Trainium和Inferentia芯片来构建、训练和部署其未来的基础模型。此外，Anthropic提高了对Amazon Bedrock的支持力度，允许企业在安全范围内对模型进行定制和微调，满足ASW客户对Claude的大量需求。

Kolena完成1500万美元A轮融资

9月27日消息，Kolena完成1500万美元B轮融资。本轮融资由 Lobby Capital 领投，SignalFire 和 Bloomberg Beta 跟投，融资资金将用于研发人员招聘、销售和营销力度的扩大和深化与监管机构之间的合作。

Kolena成立于2021年，总部位于美国加利福尼亚州。公司的使命是建立一个“模型质量监测框架”，允许企业用户对模型进行单元测试或者端到端测试。Kolena提供的平台可以识别AI模型测试数据所覆盖的范围的差异，并结合了风险管理功能，帮助用户更好地评估、管理模型。

Kneron完成4900万美元B轮融资

9月26日消息，AI芯片初创公司Kneron完成4900万美元B轮融资。本轮融资投资方包括Alltek、Horizon Ventures、Liteon Technology Corp.、Adata 和 PalPilot。融资资金将用于市场推广和团队扩展，特别是研发人员的招聘。

Kneron成立于2015年，总部位于美国加利福尼亚州，致力于通过AI芯片，解决包括高延迟、高数据传输成本以及用户隐私和安全保护不足等行业瓶颈问题。

新玩意：

特斯拉人形机器人擎天柱Optimus会做瑜伽了

9月24日消息，特斯拉发布最新视频，展示人形机器人Optimus的惊人进步。视频中，Optimus可以按颜色对物体进行分类，还可以做出瑜伽动作，例如单脚站立等。特斯拉指出，Optimus正在接受端到端的神经网络训练。

Meta推出世界上首款MR头显Meta Quest 3

美国时间9月28日，Meta在Meta Connect开发者大会官宣新一代MR头显Meta Quest 3，将于10月10日起开始交付。Quest 3包含两个版本，基础版配备128GB储存空间，售价499.99美元，升级版配备512GB的内存，售价649美元。新款Quest 3将护目镜的厚度削薄了40%，采用新的 Snapdragon 芯片组。

前沿研究：

加州伯克利分校提出PagedAttention算法，提高模型吞吐量

9月27日，由来自加州大学伯克利分校、斯坦福大学、加州大学圣迭戈分校的研究人员提出了一种名为agedAttention的注意力算法，并在此基础上构建了一个大型语言模型服务系统vLLM。该算法通过将模型的关键信息切分成固定大小的块，实现了弹性内存管理，减少了内存碎片化，提高了吞吐量。相较于当前其他系统，实验中，该系统的吞吐量提高了2-4倍。对于序列较长、吞吐量更大的模型和更复杂的解码算法，该系统的提升效果更加明显。

来源：智能涌现（公众号）

链接：https://mp.weixin.qq.com/s/FJ6XmpQwEhMbxaT_n0m6OQ

编辑：程博

刘海明 · 发表于 2023-10-9 22:06:44

【案例】

《学术出版中AIGC使用边界指南》正式发布

引言
2023年9月20日，为防范学术不端，加强诚信治理，引导相关利益主体就AIGC使用达成共识，中国科学技术信息研究所（简称“中信所”）与爱思唯尔（Elsevier）、施普林格·自然（Springer Nature）、约翰威立国际出版集团（Wiley）三家国际出版集团共同完成的《学术出版中AIGC使用边界指南》（中英文版）（简称《指南》）正式对外发布。
《指南》指出，学术研究和出版中使用AIGC应秉持着透明度和问责制、质量和诚信、隐私和安全、公平、可持续发展等原则。

规范使用AIGC
AIGC可在研究开展及学术出版的各个阶段提供辅助作用（服务）。为了营造良好的科研氛围，防患于未然，避免/减少不当使用AIGC行为的发生，《指南》提供了一个符合道德行为的框架，以帮助作者、研究机构、学术期刊出版单位等就如何合规合理地使用AIGC做出指导。

版权声明
参考文献：
[1]中国科学技术信息研究所.中国科学技术信息研究所携手爱思唯尔、施普林格·自然、约翰威立国际出版集团联合发布《学术出版中AIGC使用边界指南》[EB/OL].(2023-09-22)[2023-10-07].
https://www.istic.ac.cn/html/1/284/338/
1701698014446298352.html.
[2]张茜.学术出版AIGC边界指南发布：使用AIGC需声明，否则将构成学术不端[EB/OL]. (2023-09-20)[2023-10-07].https://baijiahao.baidu.com/s?id ... =spider&for=pc.

来源：学术规范与评价
链接：https://mp.weixin.qq.com/s/1wOpR81wsvHEAoWMLR6Fng

编辑：郑程程

刘海明 · 发表于 2023-10-18 22:34:22

【案例】

百度CTO王海峰：文心大模型4.0，理解、生成、逻辑和记忆能力显著提升

10月17日，以“生成未来”为主题的百度世界2023在北京首钢园举办，百度首席技术官王海峰解读文心大模型4.0背后的关键技术和最新进展。王海峰表示，文心大模型4.0的理解、生成、逻辑、记忆四大能力都有显著提升，9月已开始小流量上线，过去一个多月效果又提升了近30%。8月31日文心一言面向全社会开放至今，用户规模已经达到4500万，开发者5.4万，场景4300个，应用825个，插件超过500个。

文心大模型4.0首发

理解、生成、逻辑和记忆能力显著提升

据了解，百度在3月16日发布知识增强大语言模型文心一言。文心一言从数万亿数据和数千亿知识中融合学习，得到预训练大模型，在此基础上采用有监督精调、人类反馈强化学习、提示等技术，具备知识增强、检索增强和对话增强的技术优势。

文心一言的基础模型5月升级至文心大模型3.5，在基础模型升级、精调技术创新、知识点增强、逻辑推理增强、插件机制等方面创新突破，取得效果和效率的提升。

今天发布的文心大模型4.0，相比3.5版本，理解、生成、逻辑、记忆四大能力都有显著提升。其中理解和生成能力的提升幅度相近，而逻辑和记忆能力的提升则更大，逻辑的提升幅度达到理解的近3倍，记忆的提升幅度也达到了理解的2倍多。百度基于文心大模型研制了智能代码助手 Comate，从内部应用效果来看，整体的代码采纳率达到40%，高频用户的代码采纳率达到60%。

据悉，文心大模型4.0在9月已开始小流量上线，过去一个多月效果又提升了近30%。训练算法效率自3月以来已累计提升3.6倍，周均的训练有效率超过98%。文心大模型4.0基本技术架构与3.0和3.5版本一脉相承，并在多个关键技术方向上进一步创新突破。

在万卡算力上运行飞桨平台，通过集群基础设施和调度系统、飞桨框架的软硬协同优化，支持了大模型的稳定高效训练。建设了多维数据体系，形成了数据挖掘、分析、合成、标注、评估闭环，充分释放数据价值，大幅提升模型效果。基于有监督精调、偏好学习、强化学习等技术进行多阶段对齐，保证模型更好地与人类的判断和选择对齐。可再生训练技术通过增量式的参数调优，有效节省了训练资源和时间，加快了模型迭代速度。

此外，文心大模型4.0在输入和输出阶段都进行知识点增强。一方面，对用户输入的问题进行理解，并拆解出回答问题所需的知识点，然后在搜索引擎、知识图谱、数据库中查找准确知识，最后把这些找到的知识组装进 Prompt 送入大模型，准确率好，效率也高；另一方面，对大模型的输出进行反思，从生成结果中拆解出知识点，然后再利用搜索引擎、知识图谱、数据库，以及大模型本身进行确认，进而对有差错的点进行修正。

在强大的基础大模型的基础上，百度进一步研制了智能体机制，包括理解、规划、反思和进化，能够做到可靠执行、自我进化，并一定程度上将思考过程白盒化，让机器像人一样思考和行动，自主完成复杂任务，在环境中持续学习实现自主进化。

文心一言助力国图馆藏文化资源活化

升级国家跳水队 AI 辅助训练系统

百度已经与中国国家图书馆展开战略合作，发挥各自的资源、技术和服务优势，共同推动文化资源和知识服务智能化，普惠大众。国家图书馆拥有全球最大的古代方志，利用文心大模型学习古代方志与家谱数据，帮助全球华人获取更多寻根线索。王海峰现场分享了海外华人赵佩娟延续祖父乡愁，成功“寻根”的故事。

中国国家跳水队教练、奥运五金王陈若琳和奥运冠军全红婵、陈芋汐、王宗源也来到世界大会现场，与王海峰热切互动，解密梦之队训练“独门绝技”。基于文心一言等百度大模型技术，中国国家跳水队 AI 辅助训练系统全面升级，通过从海量数据和知识中学习，掌握了丰富的跳水知识，理解和执行教练员和运动员的复杂指令，及时提供准确信息，并对动作实时打分、精准量化分析，提供最有价值的指导信息，助力中国国家跳水队高效训练。

现场，陈若琳受中国游泳协会主席周继红委托，授予百度为“中国国家跳水队人工智能合作伙伴”。陈若琳表示，中国国家跳水队与百度从2019年就开展了深入的技术合作，携手走过了东京奥运会、福冈世锦赛、杭州亚运会，目前正在备战明年巴黎奥运会。“感谢百度一直以来提供的技术支持与服务，未来双方将携手持续用人工智能技术帮助跳水队智能训练，通过科学训练提升竞技水平。”

百度人才培养星河计划发布

再培养500万大模型人才

王海峰现场公布了百度人工智能人才培养的最新数据，百度在2020年提出5年为全社会培养500万AI人才，截至目前，百度已经培养了420万 AI 人才。

当下，大模型成为人工智能发展的热点方向，进一步加速产业变革，AI 人才培养也需与时俱进。王海峰发布了百度人才培养星河计划，他表示，“我们将与产学研各界密切合作，深化产教融合，为社会再培养500万大模型人才，让人工智能科技的‘创新之花’，结出更多‘产业之果’，服务国家战略，服务社会发展，服务人民福祉！”

来源：百度AI（公众号）

链接：https://mp.weixin.qq.com/s/PGE-_89A3QK4np9TTZuTyQ

编辑：潘洁

刘海明 · 发表于 2023-10-19 20:17:53

【案例】

编辑：潘洁

帐号		自动登录	找回密码
密码			实名注册