人工智能与新闻业案例集锦

刘海明 · 发表于 2019-2-15 16:47:48

【案例】

智能算法运用于新闻策展的技术逻辑与伦理风险[color=rgba(0, 0, 0, 0.298)]原创： [color=rgba(0, 0, 0, 0.298)]陈昌凤师文 [url=]新闻界[/url] [color=rgba(0, 0, 0, 0.298)]今天

摘要面对新媒体时代新闻生产、分发、互动格局的巨变，专业新闻工作者可以将“新闻策展”作为角色转型的契机。然而由于与科学技术的隔阂，新闻界未能结合自动化新闻策展算法的发展前瞻未来的转型方向。本文通过揭示事实类策展算法和观点类策展算法的技术逻辑、进步性和局限性，将智能时代人机协作策展的角色分工进一步清晰化。除了业务层面的探讨，本研究还从价值层面审视自动化算法策展技术蕴含的价值风险，并发现策展算法在公平性及新闻伦理方面存在隐忧，其难以实现对良善社会价值观的引导，媒体专业从业者用新闻专业性和人文价值完成对算法的规训，通过引领算法价值践行智媒时代的社会责任。

一、研究背景及问题的提出

新媒体技术的广泛应用不仅提升了新闻生产和传播的效率，也使传统的新闻工作者职业角色定位发生剧烈变化。新媒体赋权打破了职业新闻生产者作为新闻生产中心的垄断地位，多元主体的参与式、协作式信息交流成为新的生产模式；社交媒体和新闻聚合平台的社交分发、算法分发颠覆了过去由专业新闻媒体主导的信息分发格局，职业新闻工作者的把关角色弱化；在新的传播形态下，不仅专业媒体机构的业务流程被颠覆，而且技术运用中出现了价值判断问题。新闻工作者的角色，主要不是收集、整理、呈现海量开放式信息，而是对每个新闻事件进行价值判断，用新闻敏感和人文精神去发现重要的议题，引导公众进行深度发掘，在公共议程设置层面扮演指挥者的角色。因此，有人提出“新闻策展”（news curation）或将成为职业新闻从业者的角色转型方向。[1]媒体工作者从传统的把关人身份转型，一方面承担收集素材、事实核查的职责，统筹“目击媒体”的新闻生产[2]，另一方面管理分众化新闻生产中有价值的内容，将碎片化的新闻事实按照逻辑线聚合，形成新闻故事包[3]，扮演“聪明的聚合者”和“论坛组织者”的角色[4]。

然而，由于与科学技术的隔阂，我们在探讨职业新闻从业者的转型策略时，未能全面考量智能化技术对新闻业的潜在影响。目前，新闻学界对于智能化技术对新闻业的影响多集中在传感器新闻、机器人新闻写作对于媒体生产端的冲击，以及个性化推荐技术对于媒体分发端的冲击[5][6][7][8]，而介于生产和分发之间的编辑策划角色被认为是免受智能化技术影响的安全地带，因而，新闻编辑室中的策展功能被期待成为新媒介生态下职业新闻从业者维持公共性、履行社会责任的支撑点[9]，新闻业试图通过设计信息产品的分布、凸显事实和逻辑，谋求公共讨论主持者的合法身份。

事实上，新闻策展并不是免受自动化技术冲击的避风港。目前，计算机科学涌现了大量应用于新闻策展的算法成果，试图通过自动化的手段实现对新闻语义的理解和关系的界定，完成话题整合。一方面，对于事实性信息，依据新闻的主题汇总新闻信息，将涉及到某新闻事件的一系列报道实时识别聚合为统一的新闻话题[10]，涵盖该新闻的背景、历史动态和最新发展[11][12][13]，监测话题的演变和热度[14][15]，甚至预测话题未来的走向[16]。另一方面，对于意见性信息去粗存精，呈现有代表性的意见和观点，实现促进公共意见交流的功能。

自动化新闻策展算法涌现的，新闻界一方面应该洞悉其技术原理，思考其对新闻界产生的影响，据此重新反思职业新闻工作者的转型方向，另一方面，鉴于计算机界对策展算法的评判标准多集中在错检率、漏检率等量化指标，新闻界应当从新闻专业主义和人文价值的角度，评估计算机界提供的策展算法在运用于新闻业方面产生的价值风险和新闻理论缺失，弥补工具实用主义主导下算法的天然缺陷，实现人机协作的效率和伦理最优化。

智能算法运用于新闻策展的逻辑和功能是什么？存在哪些风险和伦理问题？职业新闻工作者如何发挥人和专业的优势进行人机协作？本文从计算机与新闻传播的跨学学科视角，从技术原理入手，分析智能化算法运用于新闻策展的运作逻辑和现实功能，探讨智能技术应用于新闻实践中的进步性与局限性，探讨新闻工作者未来可以担当的职能与使命。本文也将从价值观层面审视新闻策展中智能算法存在的伦理风险。

二、人工新闻策展的实践与局限

在传统媒体时代，新闻媒体凭借专业的新闻生产流程和数字技术，对客观世界的发生的事实进行近乎同步的把关，控制特定内容是否可以到达受众，成为唯一的新闻代言人。然而，社交媒体的兴起挑战了专业媒体在时间和速度上的优势[17],使信息得以通过无影灯般的公民记者被发掘出来，并通过开放的网状平台迅速流通，时间性和遍在性上的优势使公众具备了绕开专业媒体接近事实的能力，专业新闻媒体不再具备“真相代言人”的合法性，丧失了信息流通格局中的新闻把关人（gatekeeper）功能。

面对技术环境变化带来的新闻业角色危机，有学者认为，新闻看门人（gatewatcher）或将取代把关人成为专业媒体机构在公共信息交流中的新身份。由于公民“协同合作”生产信息的模式在消灭传播时距的同时也消灭了完整的文本[18]，大量碎片、片面、局部的信息被生产出来，专业媒体组织可以整合公民生产的碎片化信息，用清晰的逻辑编排事实，呈现新闻事件的完整叙事，同时，以中立客观的姿态为多元意见提供提供交流平台，维持观点交锋的秩序，在组织公共讨论的过程中重构职业权威。[19]

在传统意义上，策展行为由职业新闻编辑人工完成。新闻编辑可以通过策划内容框架，搭建在线新闻专题，对既有报道进行结构化组织，并随时根据用户的反馈将新报道补充其中，如在“东方之星”沉船事故的报道中，澎湃新闻通过刊发实时消息、图片新闻、记者手记、特稿、HTML5等形式的内容对事故的后果、救援的进展进行实时还原，同时，面对“感谢你无数次游过那片忧伤的水域”和“回到母亲怀抱”这两篇引发巨大社会争议的报道，开放地接纳用来自非专业主体的互动反馈，调整后续组织报道的把关策略和设计逻辑，一定程度上革新了传统意义上单向、固定的新闻生产链。[20]

这类新闻策展虽然相比于传统的生产形态有一定进步，但仍具有显而易见的局限，一方面，“新闻策展”所强调的“去组织化、去科层化”价值内核并未实现，策展组织模式和运行逻辑仍未脱离传统媒体思维主导的生产模式。虽然在这个过程中，专业媒体机构愿意将公众对新闻价值的判断作为决策的参考因素，调整内容再生产的逻辑，形成看似开放、动态的内容决策机制，但是事实上刊出的报道仍然以职业新闻人的作品为核心，较少采用多元主体的发现和判断，无法真正将海量、动态的网络信息纳入生产系统之中。所谓的策展与传统意义上的“专题报道策划”并没有本质上的操作性分野，职业新闻生产的专业控制远远凌驾在公众的开放参与之上，相比于“公开”新闻，仍然更接近传统的“刊出”新闻。

另外一方面，这类策展虽然在理念上强调受众的参与，但是在社交平台和聚合平台得到普遍使用、生产主体裂变为亿级用户节点的背景下，新闻策展依托的生产工具并未发生与时俱进的升级。信息处理能力与待处理的信息规模严重失配，自动化程度维持在较低的水平，因而运作周期长、需要较高的人力物力，限制了整合用户生产内容的能力，也束缚了策划模式的可推广性。在媒体的报道资源较为有限的情况下，只有极少数重大的主题有资格被选择设定为专题，获得被策展的资源，这样的少数新闻实践或许可以成为理想中的新闻生产范本，却注定无法推广成为职业新闻工作者角色转型的常态化实践。

三、智能化新闻策展的技术路径

与人工新闻策展日渐凸显的乏力相对，通过智能算法对大规模新闻进行自动化策展取得了大量的成果。智能化算法通过综合新闻话题的整体信息，包括背景、历史、当前进度、不同意见和讨论等，呈现事件在事实层面和意见层面的全貌。虽然自动化新闻策展技术的成果较为繁杂，但是依据策展对象和逻辑的不同，可以将其分为基于事件演化的事实策展和基于意见过滤的观点策展。下文将从技术原理入手，分析这两类自动化策展算法的进步性，以及其留给人类新闻记者编辑的角色空白。

（一）基于事件演化的事实策展

基于事实演化的新闻策展技术依托于计算机科学中“话题检测与追踪”问题（Topic Detection and Tracking）[21]，将发生在特定时间和地点的新闻定义为“事件”，将其背景、后续以及其他与事件相关的活动定义为“话题”。该算法可以通过识别报道边界、锁定新闻话题、追踪话题动态，对同一话题下的海量报道实现碎片化事实的聚合、同质化报道的过滤、将流动的在线新闻数据自动处理为主题组，把非结构化的新闻事实结构化为明确的主题。具体而言，TDT技术包含报道切分、话题跟踪、话题检测、首次报道检测和关联检测五项任务。

在实践中，话题检测和跟踪的具体实现路径存在两种原则性的分野。[22]传统主题追踪算法（Tr-aditional Topic Tracking）看重种子事件在聚合话题过程中的权重，试图基于知识和统计概率构建报道内容之间的语义联系，通过K近邻等算法从动态信息流中挑选出与既有事件关联最紧密的事件，后续报道的相关性判断均以最初的报道为参考标准。

第二种原则认为，随着事件的发展，话题的外延应该是流动、开放的，被称为自适应主题追踪（Adaptive Topic Tracking）。在这种原则的主导下，先验的知识不具有决定性的影响力，最初的新闻事件仅构成了话题原始的轮廓，每当有新的相关事件出现，话题的模型将进行动态修正。即随着外延事件的不断出现，话题的中心逐渐出现漂移。

从新闻编辑来看，上述两种策展算法分别对应着两套策展理念。传统主题追踪算法意味着新闻策展呈现以原始事件为核心的放射状形态，依托核心事件聚合用户生产和上传的碎片化内容，使新闻生产的主体、过程具有去中心化的特征，但生产的内容依然具有中心性。一方面，该策展模式有固定的中心事件，可以将公众的爆料整合在种子事件周围，通过后续的讨论对该事件进行集中深入的阐释，有利于规避公众注意力的迅速转移和记忆的消退，形成了围绕特定事件的公共讨论模式。另一方面，围绕核心事件的延展可以从多个角度全方位展开，只要事件与核心事件存在相关关系，就可以在话题图中拥有一席之地。这种策展模式对多角度延展的包容有助于发挥社交媒体的无影灯效应，基于全面、联系的视角展开话题延展，统筹个别事实与全面情况的关系，促成“宏观真实”的实现。

自适应主题追踪算法更注重话题发展的灵活性，面对事件发展过程中出现的焦点议题变迁，可以迅速地做出响应。如在“东方之星”沉船事故的报道中，就公共讨论的价值而言，澎湃报道风波所引发的关于大众媒体该如何报道灾难的探讨，其新闻价值未必低于“种子事件”。“东方之星”沉船事故，通过将新事件纳入模型考量，可以更真实地顺应话题的发展轨迹，追踪公共事件的外延走向。

因此，从策展的路径取向来看，以上两类算法的逻辑优势呈现出固定与灵活之间的冲突。事实上，在复杂的现实新闻实践中，与其说何种算法更具优势，不如说二者分别适用于不同的新闻情境，但是底层算法设计的分野决定了二者难以在同一套系统中调和兼顾，两种算法范式之间取舍的困境暴露出了机器逻辑的僵化，即使机器可以在语料库训练机的规训下，理解语义、构建事件关系、实现类似于人的理解能力，但是新闻价值的判断并非技术性的数据统计问题，而是价值哲学问题，机器难以通过语义、事件关系等数字化指标作出符合人类社会期许的策展选择，更无法基于这种考量灵活地决定公共讨论的切入点，配置注意力资源。

算法对事件演化的追踪毫无疑问更新了专业新闻机构策展的响应速度和信息处理规模，也会同时产生有待人类编辑发挥作用的价值空缺。参照机器逻辑优势与劣势的坐标系，新闻工作者应该意识到，其在新媒体时代并不是从事传统的收集、整合、理解、呈现海量开放式信息，而是要对每一个新闻事件进行价值判断，践行重要性、显著性、接近性、人情味儿等传统新闻价值，凭借大量的经验构建新闻敏感，锁定话题中值得讨论的议题，对报道的方向进行把关，代替公众行使注意力分配的权力，引导公众进行深度发掘，在公共议程设置层面扮演指挥者的角色。

（二）基于意见过滤的观点策展

意见几乎是所有人类活动的核心，我们的政治态度、对新事物的接受、意见表达、态度的改变，几乎都受到外部意见的影响。因而，意见性内容是新闻媒体传播的重要内容，也会对新闻媒体的社会价值产生重要影响。在互联网上，媒体发布的新闻事件通常会引发内容庞大的用户评论，越来越多的媒体在刊发的内容中选登“网友意见”提供意见交流平台，扮演意见策展人角色。[23]事实上，并非所有的网络评论都是平等的，仅有部分用户可以提供有价值的信息、观点和建议，大量的评论是同质化、情绪化甚至攻击性的低质量内容，具有误导公众的负面社会影响。因而，计算机界设计出自动化观点策展工具[24]，识别过滤低质量评论，发现并突出高质量的意见性信息，提高媒体策展效率和质量。

目前评论策展算法主要基于两种路径实现，一种是基于用户投票的策略，通过用户的标记的信息，如点赞、举报记录来对评论进行质量排序，引导公共讨论的话语实现自我优化。不过，基于用户投票的机制有导致人气偏差的风险，对社交投票机制的研究发现[25]，言论收获的认同数并不是理性、均衡分布的，评论用户的粉丝量、发表评论的时间都会影响评论的受欢迎程度，并在投票机制的作用下形成强者愈强、弱者愈弱的马太效应，甚至促进意见的极化。

另一种观点策展路径是通过自动化语义分析筛选出高质量评论，有学者通过收集《纽约时报》采纳的线上评论作为训练集（the NYT ‘Picks’ co-mments），锁定了高质量评论的若干指标，包括论证质量、批判性、情感性、可读性、个人经验等[26]，算法基于以上标准对评论的语法结构、词汇使用进行分析，锁定低质量和高质量文本的语言特征。相对而言，基于语义分析的机制更加公平地聚焦于文本本身的质量，有助于媒体选择出对受众有参考意义的信息。

以上两种算法路径可以有效地针对互联网中爆炸增长的意见性信息进行观点策展，为用户打捞观点、汇总意见，使用户基于较低的阅读成本，实现高层次的信息交互。但不论是用户投票的策略还是语义分析的策略，都只能做到集成意见，使多元观点呈现在大众传播平台上。与事实型信息的策展类似，算法固然可以高效地搜集、筛选、呈现观点信息，其僵化的机器逻辑却注定无法使对立的观点之间发生“化学反应”，人文价值的缺失导致其无法参透观点背后的诉求和价值观，面对多元的意见争鸣的困境，算法既无法提供问题的解决方案，也无法事实上促进对立观点的和解。

面对智能化技术的冲击，新闻职业工作者可以接受机器对海量内容信息的高效聚合能力，致力于谋求对立观点的和解、为冲突的利益关系和价值观寻求共识性的解决办法。在策展方面，职业新闻工作者的专业价值不应该停留在聚合与呈现观点的初级策展、只是将自己的专业性局限在对意见分布状态的还原上，更应该践行无法被机器取代的高级策展，通过敦促各利益主体之间的协商，引导公共讨论，在真正意义上促进社会整合。

四、算法策展的价值风险与引领

面对智能化算法运用于新闻策展及其对新闻业的参与，新闻界除了从人机协同角度对人类和机器进行扬长避短的分工，还应该意识到，相较于一般的精神产品，新闻产品的特殊属性决定了其在社会生活中扮演着形塑公共价值观的重要角色，机器对新闻策展的介入应该面临新闻界更严格的价值审视和观念引领。除了备受讨论的透明性等[27][28]一般意义上的算法伦理问题，策展算法特有的属性还会诱发一系列独特的风险，职业新闻工作者亟需洞悉算法的缺陷，参与到对算法的价值观引领中。

（一）算法策展的价值风险

1.智能化策展算法存在公平性隐忧。由于智能化算法普遍依赖于大量的训练数据集，其输出结果往往存在明显的输入数据的偏向，即仅能对输入数据中存在的特征进行提取和强化，而输入的数据中不包含的维度不可避免地被选择性无视。对于智能化策展算法来说，其原始数据是网络上的“数字痕迹”（digital trace）[29]。值得注意的是，虽然新媒体技术号称可以带来用户之间的平等，让普通人拥有发言、被关注的机会，但其并不能做到均匀赋权，反而会带来与传统媒体时代“知识沟”相似的媒介使用差异。公众对互联网设备的接近权和利用媒介资源的素养的显著差异会导致不同群体留下的的数字痕迹分布失衡，弱势群体的声音事实上很难具备被算法纳入策展范畴的资格。正如在法哲学中，真正的公平是“矫正的公平”而非“分配的公平”，面对社会群体之间存在数字鸿沟，算法策展对数字痕迹的采集看似是无差别的公平做法，实际上却是对社会结构性不平等的维系和纵容。新闻界应该识破算法貌似“平等无差别”的伪装，意识到算法逻辑内部隐藏的话语霸权，通过专业化的操作矫正群体间的话语权差异，扮演真正意义上的“社会公器”角色，避免媒体在算法驱使下成为少部分优势群体的“扩音筒”。

2.智能化算法无法对策展过程中若干新闻伦理问题进行判断。虽然算法可以通过识别事件之间的语义联系自动构建专题，但是新闻策展并非简单的信息聚合或拼接，新闻产品特性决定了各个微妙的信息片段会加总形成格式塔式的总体框架效果，正如“东方之星”事故中澎湃在“深情”与“煽情”之间的逾矩，新闻事件在切入的角度和尺度上存在巨大的弹性空间。在策展过程中，新闻的不同排列组合、比例分配和版面设置会造成截然不同的传播效果。算法无意识的聚合有可能引发读者在伦理层面的不适，也有可能用隐含的偏见引导公众[30]，引发公众的质疑[31]。因而，新闻工作者在被算法解放生产力之后，应该将更多精力投入到新闻伦理的把关上，审视自动化策展新闻中形成的的预设框架，修正算法对于各方当事人、公众的无意识伤害，维护良好的媒介生态。

3.智能化策展算法缺乏对良善价值观的倡导能力。虽然自然语言处理技术使得策展算法可以通过知识表示等技术建立实体之间的关系网络，但是这并不意味着算法真正理解符号背后的价值内涵，在计算过程中，语言被转换成“去价值化”的向量，善与恶只有语义层面的“距离”，却无价值层面的高低，人类社会通过语言符号建立起来的意义传达、价值倡导体系被虚无化。机器不仅无法像富有经验的人工编辑一样拿捏新闻价值，也无法对善良、美好等公共价值进行识别和倡导。由于价值并非可计算的对象，而是复杂的伦理学哲学问题，面对来势汹涌的算法策展，职业新闻工作者需要意识到，尽管机器可以在处理海量信息方面拥有无法企及的效率，却无法具备人类才有的基本价值判断能力，新闻和信息工作者需要在使用算法的过程中，发挥人文关怀和人本精神，将人类的价值观注入新闻产品，完成对算法的价值引领。

（二）算法策展的价值引领

因此，媒体界需要意识到，与媒介生态变化相随的是深刻的技术革新和理念升级，新闻策展并不是躲避智能化技术浪潮的避风港。在媒介生态巨变的时代，完全由记者、编辑进行的人工新闻策展无法承担起公共信息服务、组织公共讨论的责任，更无法助力专业媒体机构的职业合法性重塑。专业媒体机构需要突破传统意义上的职业意识形态，一方面，借助计算机界关于自动化策展技术的前沿成果丰富自身职业内涵，另一方面，在反思自动化策展技术的伦理风险和媒体理论缺陷的基础上实现对算法价值观的引领。

面对策展算法对事实信息的追踪能力，媒体工作者应该将职业角色定位在对新闻价值的敏察上，用人文精神和职业素养发掘话题内涵和外延中具有关注价值的着力点，主导公共注意力配置。而对于算法对于海量意见信息的去粗存精的能力，媒体应该在呈现多元意见的基础上，深入意见争鸣背后的诉求冲突和价值分歧，提供突破困境的解决方案，促进社会协商与整合。只有借助自动化技术和人文精神的合力，媒体界才能化解专业危机，在促进理性、开放、平等、多元的新型公共空间形成的过程中实现新媒介生态下的角色定位。此外，抛开算法和人类在新闻策展业务层面的分工问题，我们也要意识到算法运作逻辑使算法策展存在公平性和新闻伦理层面的隐忧，并且无法实现对良善社会价值的引导。新闻和信息产品的特殊性要求职业从业者用规范的新闻专业性完成对算法的规训，实现对公平、平衡等专业价值观的坚守，在人机协作的模式下继续发挥其社会功能，通过价值引领践行智媒时代的社会责任。

https://mp.weixin.qq.com/s/KRbH8to44AMTuxh-pnhGbw

刘海明 · 发表于 2019-2-15 18:59:37

【案例】美国人工智能计划关注的几个重点领域

2月11日，美国特朗普总统签署了一项行政命令，正式启动“美国人工智能计划” ，以刺激推动美国的在人工智能(AI)领域的投入和发展。

特朗普政府出招了——签署启动”美国AI计划“。

目前，美国在人工智能方面具有一定的领导地位，但其地位一点也不稳定。

虽然世界各国已经启动了刺激人工智能发展的计划，但特朗普政府却几乎忽视了这一话题。

而就在昨天，特朗普签署了一项行政命令，创建“美国AI计划”，这是一项指导美国人工智能发展的高层战略。根据白宫科技政策办公室披露的信息，美国人工智能计划包含五个重点领域，分别是投资人工智能研发、释放人工智能资源、制定人工智能治理标准、构建人工智能劳动力、国际参与及保护美国的人工智能优势。

“美国AI计划”包括五个关键领域：

研究和开发。联邦机构将被要求在其研发预算中“优先考虑人工智能投资”，并报告这些资金如何用于创建一个更全面的政府人工智能投资概述。

释放资源。联邦数据、算法和处理能力将提供给研究人员，为交通和医疗保健等领域的发展提供助力。

道德标准。像白宫科技政策办公室(OSTP)和美国国家标准与技术研究院(NIST)这样的政府机构将被要求制定标准，指导“可靠、稳健、可信、安全、可移植和可互操作的人工智能系统”的开发。

自动化。各机构将被要求通过设立奖学金和学徒制，让工人为新技术带来的就业市场变化做好准备。

国际推广。 政府希望与其他国家合作开展人工智能开发，但这样做的方式是保留美国人的“价值观和利益”。

五项原则分别是：

1、美国必须在整个联邦政府、工业界和学术界推动人工智能的技术突破，以促进科学发现、经济竞争力和国家安全。

2、美国必须推动制定适当的技术标准，减少对人工智能技术进行安全测试和部署的障碍，以便创造新的人工智能相关产业，并使当前的产业应用人工智能技术。

3、美国必须培养当代和未来的美国工人，使他们具备开发和应用人工智能技术的技能，为今天的经济和未来的工作做好准备。

4、美国必须培养公众对人工智能技术的信任和信心，并在应用人工智能技术时保护公民自由、隐私和美国价值观，为美国人民充分发挥人工智能技术的潜力。

5、美国必须促进一个支持美国人工智能研究和创新的国际环境，为美国人工智能产业开放市场，同时保护美国在人工智能领域的技术优势，保护美国的关键人工智能技术不被战略竞争对手和敌对国家收购。

白宫(The White House)发文称：

美国人从成为人工智能的早期开发者和国际领导者中获益匪浅。然而，随着全球人工智能创新步伐的加快，我们不能坐视不管。我们必须确保人工智能的发展继续受到美国人的聪明才智的推动，反映美国的价值观，并为美国人民的利益服务。

而其它媒体对此计划的评价却侧重于对细节的担忧：

纽约大学(New York University)研究小组AI Now的联席主任凯特•克劳福德(Kate Crawford)对Science表示，该行政命令“正确地将人工智能作为美国决策的主要优先事项”，但缺乏学术界和民间领袖的参与。

参议院情报特别委员会副主席，美国参议员马克·华纳对CNET表示，他支持这个计划的某些条款，但他也担心人工智能对就业市场的影响。华纳表示，政策制定者应谨慎行事。 “如果我们从过去两年中学到了什么，那就是在考虑新兴技术时，美国的政策制定应该更加周到。特别是涉及到可能被滥用的技术时。”

专家称：方向是正确的，但关键看特朗普政府能否以积极方式贯彻执行

人工智能已有60年历史，旨在让机器能够完成被视为是人类或动物智能象征的脑力或体力工作。在过去7年里，一种称为机器学习的技术——算法通过处理示例数据获得技能——使计算机在理解世界方面得到显著提高。这种技术催生了能够读取医学扫描结果的软件，催生了能够回答琐碎问题的虚拟助理，并成为每家大型科技公司产品战略的核心。

特朗普政府计划的一个要素是，向从事AI研究的学者和公司开放一些政府数据。像谷歌母公司Alphabet这样的科技公司，它们有大量数据记录着存储在数据中心的消费者习惯；但在医疗保健等其他领域，它们很难积累推动AI项目所需的数据。

该计划将把联邦资金和资源转向人工智能研究，呼吁在人工智能领域建立以美国为首的国际标准，并对美国工人的再培训进行新的研究。

但该计划不包括人工智能开发的新资金，而且细节内容上也不够清晰。政府没有公布实现既定目标的时间表，而是承诺在未来6个月的某个时候拿出一个更详细的计划。

“美国AI计划”涉及了人工智能发展中一些关键关注领域的问题，但缺乏新的资金是一个重要的问题。迄今为止，已有18个国家启动了国家人工智能战略，其中一半包括新的资金来源。这些数字从澳大利亚和丹麦的约2,000万美元到韩国的近20亿美元不等。

值得注意的是，新计划未能解决移民问题。美国在人工智能领域的领先地位，在一定程度上是由于其吸引外国人才的能力，但专家警告称，研究人员正日益被特朗普政府的反移民言论及其限制签证自由的承诺所阻碍。根据美国国家科学基金会(National Science Foundation)的数据，2016年至2017年间，美国的海外研究生人数下降了5.5%。

哈佛教授Jason Furman表示：

该计划是朝着正确方向迈出的一步，但为了实现既定目标，所需要的不仅仅是承诺。关键的考验是看特朗普政府是否能以积极的方式贯彻执行。这个计划很有抱负，却没有任何细节。

一些AI项目可能会受益于1月份宣布的H-1B技术签证计划的变更。该计划现在将略微偏向于拥有美国高等院校学位的人，这被认为有利于从事先进技术工作的科技公司。

白宫正在起草一份备忘录，将在6个月内公布新计划的实施细节。

中美欧AI产业政策对比：中国全面务实、美国侧重国防、欧盟强调合作

中国：所有国家中最全面、最切实

中国在2017年7月宣布了《新一代人工智能发展计划》，这份规划也是所有国家人工智能战略中最全面的，包括了研发、工业化、人才发展、教育和技能获取、标准制定和法规、道德规范和安全方面的举措和目标。根据规划的三步走目标：

第一，到2020年人工智能总体技术和应用与世界先进水平同步；

第二，到2025年人工智能基础理论实现重大突破，部分技术与应用达到世界领先水平；

第三，到2030年人工智能理论、技术与应用总体达到世界领先水平，成为世界主要人工智能创新中心。

到2030年，政府计划发展人工智能产业达到1万亿人民币规模，相关产业10万亿元人民币规模。这份计划还表明政府有意招募世界上最优秀的人才，加强对国内AI劳动力的培训，并在促进AI发展在法律、法规和道德规范方面引领世界。

自《新一代人工智能计划》发布以来，中国政府又出台了《促进新一代人工智能产业发展的三年行动计划》，为到2020年人工智能总体技术和应用与世界先进水平同步制定了规划。

具体说，“三年行动计划”推进四项主要任务：（1）专注于开发智能和网络化产品，如车辆、服务机器人和识别系统；（2）强调开发支持AI的系统，包括智能传感器和神经网络芯片；（3）鼓励智能制造的发展；（4）构建行业训练资源库、标准测试及知识产权服务平台、智能化网络基础设施等，完善AI的发展环境。此外，政府还与国家科技公司合作，在特定AI领域展开合作，致力于在研究和产业上取得领导地位。北京还建立了一个价值21亿美元的人工智能研究技术园区。

近年来，我国不断出台人工智能相关政策，大力促进人工智能技术和产业的发展。

2017年“两会”，人工智能首次出现在《政府工作报告》。该年《政府工作报告》中提到：“一方面要加快培育新材料、人工智能、集成电路、生物制药、第五代移动通信等新兴产业，另一方面要应用大数据、云计算、物联网等技术加快改造提升传统产业，把发展智能制造作为主攻方向。”

美国：更侧重军事AI发展

与其他国家不同，美国政府没有一个协调统一的国家战略来增加人工智能投资或应对人工智能带来的社会挑战。不过，美国国防部发起了一项统筹AI各部门的计划，可见美国目前AI发展更侧重于军事方面。

在奥巴马总统任期的最后几个月，白宫分别在三份报告中为美国的战略奠定了基础。

第一份报告为《为人工智能的未来做好准备》，提出了与人工智能法规、公共研发、自动化、伦理和公平以及安全相关的具体建议。其配套报告《美国国家人工智能研究与发展策略规划》概述了计划公开资助的人工智能研发战略计划。

而最后一份《人工智能、自动化与经济报告》则进一步详细研究了自动化的影响以及需要什么样的政策能够增强AI带来的益处并降低其成本。

特朗普总统领导的白宫对人工智能采取了一种截然不同的、以自由市场为导向的方式。

2017年8月，特朗普邀请科技巨头进白宫参加峰会，图为苹果CEO库克与特朗普。

2018年5月，白宫邀请业界、学术界和政府代表参加人工智能峰会。在会议的讲话中，白宫科技政策办公室副首席技术官Michael Kratsios概述了总统对人工智能的态度。他宣布政府有四个目标：

（1）保持美国在人工智能领域的领导地位。

（2）支持美国工人。

（3）促进公共研发。

（4）消除创新障碍。

为了实现这些目标，Michael Kratsios宣布成立一个新的人工智能特别委员会，就人工智能研发的跨部门重点事项向白宫提供建议，并考虑与工业界和学术界建立联邦伙伴关系。他还明确指出，政府将致力于消除对创新的监管障碍，以使美国企业具有创新和发展的灵活性。

2018年11月19日，美国商务部工业安全署（BIS）出台了一份针对关键技术和相关产品的出口管制框架，同时将开始对这些新兴技术的出口管制面向公众征询意见。

在这份清单中，AI和深度学习被列为一大类。其中包括：

（1）神经网络和深度学习（例如：脑建模、时间序列预测、分类）；

（2）进化和遗传计算（例如：遗传算法、遗传算法）；

（3）强化学习；

（4）计算机视觉（例如：物体识别、图像理解）；

（5）专家系统（例如：决策支持系统，教学系统）；

（6）语音和音频处理（例如：语音识别和制作）；

（7）自然语言处理（例如：机器翻译）；

（8）规划（例如：调度、博弈）；

（9）音频和视频处理技术（例如：语音克隆、deepfakes）；

（10）AI云技术；

（11）AI芯片组。

此外，被纳入出口管制的技术还包括与AI关系密切的微处理器、先进计算、机器人、脑机接口技术等。从很大程度上讲，这份框架是美国全面收紧AI相关技术共享的重要标志。

今年1月11日，该意见征询意见期结束，正式进入实施阶段。

欧盟：强调内部合作，成立欧洲AI联盟

2018年4月，欧盟委员会通过了一份20页的有关人工智能的文件，列出了欧盟对人工智能的方法。欧盟委员会的目标是：

(1)增加欧盟的技术和工业能力，增加公共和私营部门对人工智能的吸收；

(2)为人工智能带来的社会经济变化做好准备；

(3)确保适当的道德和法律框架准备就绪。关键举措包括承诺增加欧盟在AI的投资将在2020年年底，从2017年的5亿欧元增加到15亿欧元；创建欧洲AI联盟（民众现在即可加入）；针对公平性、安全性和透明度的AI道德指导方案。

一个新的人工智能高级小组将作为欧洲人工智能联盟的指导，并将起草一份伦理准则草案供成员国考虑。

该委员会目前正与成员国合作，将在2018年底前制定一项关于人工智能的协调计划。即将出台的计划的目标是“最大化欧盟和国家层面的投资影响，鼓励欧盟内部的协同和合作，交流实践，共同确定未来的道路，确保欧盟作为一个整体在全球的竞争能力。”

除了美国，日本、中国、英国、欧盟、德国等也有国家或区域层面的人工智能发展计划。

2016年7月，日本发布《日本下一代人工智能促进战略》，在工作层面明确了由总务省、文部科学省和经济产业省在技术研发方面的三省合作体制。2017年3月日本召开“人工智能技术战略会议”，并确立了发展“路线图”，主要分三个阶段，以期通过人工智能的运用，实现生产、流通、医疗与护理等领域效率的大幅提高。

2017年7月，中国颁布《新一代人工智能发展规划》，设立了三步走的战略目标，计划到2020年人工智能总体技术和应用与世界先进水平同步；到2025年人工智能基础理论实现重大突破，部分技术与应用达到世界领先水平；到2030年人工智能理论、技术与应用总体达到世界领先水平，成为世界主要人工智能创新中心。2017年12月，中华人民共和国工业和信息化部还发布了《促进新一代人工智能产业发展三年行动计划（2018-2020年）》。

2017年，英国政府发布《现代工业化战略》报告，直言英国政府将把英国置于人工智能和数据革命的最前沿，并使英国成为世界人工智能和数字驱动型创新的世界中心。英国政府围绕人工智能发布的政策还有《机器人与自动系统2020》、《现代工业化战略》、《发展英国人工智能产业》、《机器人与人工智能：政府对委员会2016-17年会议第五次报告回应》等。

2018年3月，有欧盟智库之称的欧洲政治战略中心发布题为《人工智能时代：确立以人为本的欧洲战略》的报告，建议欧盟鼓励发展人工智能，并努力建立起人与机器的共生关系。它还建议欧盟确立以人为本的战略，把政策目标设定为使人们感到被人工智能赋能，而非被其威胁。

2018年7月，德国出台《联邦政府人工智能战略要点》，希望将AI研发和应用水平提升到全球领先水平。该文件指出，德国应当成为全球领先的人工智能科研场，并将研究成果广泛而迅速地转化为应用；德国同法国合作建设的人工智能竞争力中心要尽快完成并实现互联互通。（本期编稿：熠婧）

资料来源：工业智能化、装备参考。

编辑：冉玲琳

链接：https://mp.weixin.qq.com/s/UT_2k93tzlH3Ahn9a5rarQ

刘海明 · 发表于 2019-3-28 12:42:09

【案例】20190828 NYT

• 三名人工智能领域的先驱科学家获得今年的图灵奖。Geoffrey Hinton、Yann LeCun和Yoshua Bengio三位科学家因在神经网络方面的研究获奖。过去十年来，他们的研究所孕育出的概念彻底改变了技术的构建方式，加速了人脸识别、自动驾驶汽车等人工智能技术的发展。

• 谷歌机器人项目2.0版：2013年，谷歌曾开启了一个雄心勃勃的机器人项目，由公司高管安迪·罗宾领导。罗宾于2014年遭到性侵指控后离职，该项目陷入困境。现在，谷歌机器人2.0版卷土重来，比之前低调，但技术却更加先进。

刘海明 · 发表于 2019-5-11 20:58:51

【案例】

人工智能：网络广告世界的神话与现实

Xaxis与IAB Europe联合发布了“人工智能——网络广告世界的神话与现实”，强调了人工智能是如何成为所有利益相关者的一个有价值的工具，并带来具体的业务成果的。

调查的主要结果：

80%的受访者认为人工智能是下一个工业革命。

近80%的受访者对人工智能有很好的理解。中介对人工智能的理解最自信，91的受访者非常或有些了解人工智能。80%的广告代理商表示他们在了解人工智能方面非常自信。

人工智能被认为对业务目标产生了积极的影响。近50%的受访者认为人工智能提高了生产率和竞争优势。

人工智能被认为能够促进目标受众和网络广告的针对性，在正确的地点和正确的时间向正确的人提供广告。事实上，61%的广告代理商、43%的出版商和53%的中介机构都提到了更好的定向。

此外，30%的广告客户、55%的广告代理商、40%的出版商和42%的中介都提到了更好地识别合格的用户和受众。

受访者强调了人工智能未来的担忧主要是对人类控制的依赖程度越来越低（47%），以及获得值得信赖的见解（55%）。

从整体业务成果来看，人工智能已经改善了生产力、加速创新和增长。53%的广告代理商认为人工智能能更快地交付更深入的营销分析。很多受访者也认为人工智能在改变网络广告行业方面有很大潜力。

但是，还有一些挑战，例如可靠性和信任度方面。

完整PPT详见：https://mp.weixin.qq.com/s/RRjBScs96VoAay7C4qTVxQ

编辑：王豪

刘海明 · 发表于 2019-5-15 21:51:34

【案例】
AI 生成虚拟模特全身照，形象高度逼真

文章来源： DeepTech深科技

原创：旭文

这是哪个明星？

最近，有网友发现日本一家科技公司正在用 AI 生成虚拟模特，图片中明眸善睐、身材曼妙的可爱少女，成熟火辣、目光灼人的性感女神，竟然都是用 AI 生成的虚拟人物，完全看不出来是假的。

（来源：DataGrid官网）

这些高质量、全高清、毫无虚假痕迹，真人大小的平面模特照片，丝毫不逊于专业模特在摄影棚中拍摄的时尚大片。

与之前的 AI 换脸不同，这次图片中的模特全身上下都是 AI “无中生有”，不会涉及到侵害他人的肖像权等，如果你看到觉得脸熟，可能真的是 “如有雷同，纯属巧合。”

网友们纷纷惊呼，模特真的要失业了？！

（来源：DataGrid官网）

据报道，这是日本京都的一家科技公司 DataGrid 开发的算法，可以从头到脚生成高度逼真的人物图像，包括面部、发型、服装等等。

岂止是模特职业生涯遭到红灯预警，恐怕连发型师、服装设计师、造型师都要跟着遭殃了!

在一个技术展示的视频中，AI 在塑造的模特身上变幻出不同的服装造型，夹克变成冬季外套，连衣裙秒变 T 恤，服装搭配无缝切换，图像放大后，衔接之处非常自然。

短短几秒钟的视频展示，展现了很有想象空间的市场潜力。假设在现实中，如果 AI 产生的模特「不存在」，那么时尚品牌或广告代理商就无需对这些模特支付拍摄费用、拍摄期间的生活起居费用、经纪人费用等等，可能就会放弃使用真人时装模特。

这对模特行业真的是致命性打击！

GAN 的又一次完美应用

简而言之，这种新算法是基于 GAN（生成式对抗网络）的一次新尝试。

读者可以将上面的模特生成过程想象成图片之间生成模型和判别模型之间的博弈过程，博弈的方式很简单：生成模型生成一些图片→判别模型学习区分生成的图片和真实图片→生成模型根据判别模型改进自己，生成新的图片→判别模型再学习区分生成的图片和真实图片......

上面的博弈过程会一直继续下去，直到生成模型和判别模型无法提升自己，也就是生成模型生成的图片，判别模型分辨不出真假，这个模型就达到了完美。

过去尝试用 GAN 制作逼真的人物形象大多集中在面孔生成，比如 AI 换脸。有些面孔虽然接近于人脸，但表现力不够，背景中流出的颜色斑点还会干扰头像的生成。

DataGrid 公司基于 GAN 深度学习开发的名为“自动全身模特生成”AI 系统，消除了所有可能混淆算法的无关信息，在一个纯白色背景前面构建 AI 模型，加上逼真的光线感，生成的模特类似于在摄影棚拍摄的感觉。

这种通过学习大量的全身模特图像，然后生成不存在的具有高分辨率（1024 x 1024）和高质量的全身模特图像，在以前是非常难的。

大家怎么看？

Reddit 上有网友对 AI 系统生成的模特图片全都是“不存在”的持怀疑态度。“除非这个 AI 系统用最先进的面部识别功能，否则训练图片集和输出图片集之间会有很多重合。神经网络非常容易过拟合，因此它们可能只是“记住”图片，而不是“学习”生成新的图片。

也要网友认为 AI 取代模特还为时尚早。模特还有一个功能，需要在时装秀上走秀。时装秀在时装界占有非常重要的地位，在那里看到的几乎所有服装都不会出售，只是为了展现设计师的创造力以及签约合作。

还有网友从算法开发公司的角度来看待这个问题，如果 AI 接管了模特行业，那么想象一下两个看起来太相似的 AI 模特公司的版权问题怎么解决，他们必须制作整个 AI 系统，AI 模特的外观要注册，防止其他公司利用。

一个比较讽刺的场景是，假如一家公司仍然使用真人模特，但他的模特和另一家公司的 AI 模特太相似，结果导致法律纠纷，这种情况怎么办？

总的来说，模特行业肯定会受到 AI 技术的影响，同时也会面对许多新生的问题，需要 AI 企业“摸着石头过河”去探索解决问题的办法。

每当科学家构建一种新算法，可以生成与真实照片无法区分的逼真图像或深度伪造时，似乎也是一种新的警告，AI 也可能被滥用制作虚假或违法的照片和视频，甚至是进行虚构的政治演说来操纵性宣传，破坏公众对数字媒体的信任。但愿这个算法仅局限应用在广告和服装领域吧。

原文链接：

https://mp.weixin.qq.com/s?__biz=MzA3NTIyODUzNA==&mid=2649568906&idx=4&sn=8a0c200b330ed94c04f58960e3ddfcb0&chksm=876a2293b01dab859d3036f7c1420bb729fe51f87ff0d7ba4d9e5400e36dd11d81a38666fc75&mpshare=1&scene=1&srcid=&from=singlemessage&ascene=1&devicetype=android-26&version=2700043a&nettype=cmnet&abtest_cookie=BAABAAoACwASABMABQAjlx4Ax5keANyZHgD4mR4AAZoeAAAA&lang=zh_CN&pass_ticket=N026eiTT9TxwOYC0pHfsjp91DXISksYPzdCVpuqFjAIg4UXcPqsxw36YPhois%2BmC&wx_header=1

编辑：高杰

刘海明 · 发表于 2019-5-20 22:47:44

【案例】AI写作时代：财经、体育类记者或将率先被淘汰

文章来源：中国科技新闻

原文链接：https://mp.weixin.qq.com/s/7DOsrMYY3ybvOWqdVE425Q

机器新闻写作是人工智能技术在新闻传播领域一个现象级的发展。

2014年3月，美国加州地区发生地震，《洛杉矶时报》通过Quakebot这一地震新闻生成系统，在三分钟内就率先发布了地震相关报道。在这条新闻中，人类要做的是对机器人所写内容的审查和把关，前期完全由机器人自动化选择数据进行处理完成。技术的进步带来了新闻生产的变革，“技术为王”的口号也越来越响亮。

2015年9月，腾讯财经发表的一篇题为《8月CPI同比上涨2.0%创12个月新高》的消息就由自动新闻写作软件Dreamwriter完成，在一分钟内将重要信息进行解读并送达客户。

2015年11月，新华社宣布“快笔小新”投入使用，这台机器可以快速完成体育财经类的新闻自动写作。

……

“在技术和内容的结合下，传统新闻生产模式势必会受到冲击。”这是许多人对机器人写作时代到来的担忧。实际上，“工作需要融入想象力和创造力的不容易被智能写作淘汰。人如果能够定义出自己做的事情的时候是不容易被淘汰的，并不是像危言耸听的那样（会造成大面积失业）。在我看来，那些工作重复不变的，就容易被淘汰。”近日，智搜联合创始人、首席科学家郑海涛博士在接受《华云网》专访时表示。

郑海涛认为：“像一些财经、体育类，重新复述事件的记者，机器在经过不断学习后也能够做到，他们就容易被淘汰。”

据介绍，智捜作为第一家在智能写作领域成功商业化落地的公司，去年营收已过千万。目前智捜正在进行B轮融资，完成后公司估值将达到5亿元左右。

以下为专访实录：

内容生产再变革

华云网：智能写作的核心技术之一是智能语义。那么，我们如何理解“智能语义”技术？

郑海涛: 智能语义技术是智能写作的核心技术，定义为机器如何理解文本和生成文本的能力，即自然语言理解和自然语言生成技术。自然语言理解技术，比如我们说的一句话，机器能够识别出这句话中什么人发生了什么事情；自然语言生成技术就像给他一段话或者几个关键词，他能够基于对一段话或者几个关键词的理解重新写出自己的文字。

华云网：在具体应用中，智能语义的精准度如何？

郑海涛: 对自然语言理解技术的评估，评估过程一般是给机器一段文字，让机器去做阅读理解，然后去问他一些比较间接的问题，看是否能够理解语义。写作机器人只有理解了人写的文本，才能模仿人去重新写作。智搜的精准度中文最高可以达到92.67%，普遍高于同行10% ，英文领域的精准度也逼近90%。在中文领域我们是公认的领先于同行（同行不仅仅是谷歌、BAT、科大讯飞等科技公司，还有高校的研究等），其他同行的精准度普遍在百分之七十多，因为不同的垂直领域，考虑到不同的文本，智搜精准度普遍高5--10%。

华云网：据了解，智搜在写作方面有智媒、智书和智讯三大解决方案，这三个方案都各具什么特点？

郑海涛：我们公司现在主要是面向市场化的商业落地，跟一些高校的研究不一样，我们不仅仅是智能语义的研发，还要进行商业化的落地。而商业化落地三要素是产品、数据来源、技术，智媒、智书和智讯是我们面向商业化的三大场景推出的三大解决方案。

智媒：面向于传媒领域，像传统报业、自媒体，他们比较偏向于新闻资讯类的写作，对于写作的选题、决策，热点的抓取，写作发布后的跟踪特别重视。需求是你要给他们提供素材、抓取选题，辅助写作决策。

智书：面向内容营销行业，基于素材加上很多联想类的原创写作，比如我们现在主要做的汽车内容营销，给定一个车型，每个人可能会从不同的侧重点去写，比如汽车的外观、颜色、发动机、整体性能等，汽车领域的营销内容题材、风格和新闻媒体领域是完全不同的。

智讯：主要面向B端技术团队，为他们赋能，他们可以将智搜的技术整合到自己的产品中，使他们可以开发自己的定制化产品，我们提供api，给到各个合作伙伴接口服务。

华云网：与微软、腾讯等企业相比，智搜的核心优势体现在哪些地方？

郑海涛：腾讯也好、微软也好，他们主要从事的不仅仅是智能写作，还有很多其他方面的工作，我们公司虽然还比较小，但我们的投入度远高于他们。

1、和B端写作产品的落地，我们是和b端深度融合，经过多年摸索我们充分知道他们的需要；

2、对于BAT来说，他们受限于产出投入比，不会去和B端深入合作；

3、数据，素材的积累，精准到每段话甚至每一句话的标签数据我们是经过很多年沉淀下来的，就算是BAT再有人力、物力也不是一下子能够积累起来的；

4、就是机器模型、机器学习的技术。经过我们的不断打磨，可以让机器能够写出一篇逻辑连贯比较通畅的文章，而且这种写作文章不是基于模板的，而是机器学习后读懂了文本内容后重新生成的，目前我们还没有看到有同类技术出现，大部分都是基于模板化的写作。在技术领域方面，我们自动化的生成一篇2000字的文章、或者生成概要、进行机器查重、个性化的改写以及最后发布，经过多年打磨我们已经形成了多个技术专利及相应的软件著作权。

华云网：我可以理解为腾讯微软他们提供的是标准化产品，智捜提供的是定制化的产品吗？

郑海涛：不完全是，很多企业需求是可以做成标准化的。但大企业不愿意放下身段去和小企业深度合作，对他们来说是一个成本问题，他们要算投入产出比的，对于我们来说，是使命，我们前期大量的投入，到现在才把企业的需求做成一个标准化的产品。

人机合作是王道

华云网：机器如何判定一个消息的新闻价值？

郑海涛：这是一个写作决策的问题，是如何决定选题保证所做选题是新的好的真实的。我们是通过每天对热点新闻、大量报道、权威媒体、重点人物、点击率等多个维度进行统计，经过大数据计算分析，给到编辑多个结果备选，编辑可以根据需要去做决策，而不是说只给一个。

华云网：也就是说，机器人的工作就是搜集素材、把类似素材归结，交给编辑去审核、编辑、写作？

郑海涛：我们是相当于做一个写作助手工作，帮你把所有素材集结，热点挖掘，提供给你做决策，你做出决策后还可以帮你智能写作，写成初稿，你再加上自己的一些想象力、自己的观点类的一些东西，这样就把人机协同做起来了，人主要提供想象力和创意类的，机器负责素材的搜集整理，让人更方便分析。就像一个编辑助理，而且还可以不断学习编辑的写作习惯和新闻报道的习惯，经过不断学习，我们可以更知道编辑的偏好风格，在智能写作时会加入一些编辑的惯用词语。

华云网：传统媒体要想和智捜合作，需要具备哪些条件（生产条件、相关配套）？

郑海涛：我觉得和我们合作的一个先决条件就是要敞开心态。

硬件条件之外最核心的就是认知，因为最难的是人机配合度的问题，人对AI的接受度不一样，有的会比较惧怕AI，会担心使用这个产品带来的不是提高生产力而是带来更繁重的劳动，这是一个过程。如果不敞开心态接受AI，就会产生抵触情绪。

生产条件方面，就需要拥抱云服务，对于服务过程来说，你有云最好，如果没有，我们也会提供给您云服务。因为对于一些远程数据的使用，云端数据的上传让机器去学习。

云计算的时代已经到来，但对于有些企业的先决条件和生产条件，要把很多东西放到云端还需要一个过程。

机器是在不断的学习，是可以越做越好的。在这个过程，人需要不断的对数据进行使用、打标签。比如我们的账号，要登陆以后才能使用。不登录就希望机器永远懂我，这个是对机器产生了过高的期望，机器是做不到的。

华云网：与普通记者编辑相比，智能写作的成本优势在哪儿？

郑海涛：说成本优势的话，要看具体的应用环节，因为成本包含生产成本和运营成本。就媒体行业而言，有专门生产内容的记者，有负责运营的编辑，据我们客观的统计分析，可以提高2-3倍的生产效率，高的可以提高3-4倍。记者行业的痛点不是说完全为了省钱，而是要在固定的预算或成本不变的情况下，把生产效率提高上去。目前我们主要是通过提高效率来降低生产成本。在运营方面，可以运用AI技术做个性化推荐，做可控化推荐，做各种数据分析，让编辑朋友更高效地观察读者的习惯、哪些内容更容易得到读者的认可，在这方面可以帮他们提升2-3倍的效率。我们是把决策权交给编辑的，著作权还是记者/编辑的。

华云网: 你认为智能写作时代，传统媒体的哪类记者编辑最可能率先被淘汰？

郑海涛：人如果能够定义出自己做的事情的时候是不容易被淘汰的，并不是像危言耸听的那样（会造成大面积失业）。在我看来，那些工作重复不变的，就容易被淘汰。工作需要融入想象力和创造力的不容易被智能写作淘汰。像一些财经、体育、重新复述事件的记者，机器在经过不断学习后也能够做到，他们就容易被淘汰；但如果加入了自己的想象、创造性的点评分析、或者体育记者对某个球员现状的了解、对未来状态的更新等进行更深入的思考分析，机器还是做不到的，还是需要人才能做到。

我们现在就已经有机器人辅助人工对体育赛事的报道，赛事一结束，马上就可以自动生成新闻报道，速度比人不知道要快多少倍。但机器主要还是描述客观事实，对于一些需要想象力的、需要深入思考的只有人才能做到了。

华云网：如何保障用户的数据安全？

郑海涛：在技术层面，我们对标的是阿里，他们需要做什么安全测试我们也一样要做；另外我们也会和您签一个安全协议，对客户资料、数据和隐私我们是要绝对保密的，我们的技术也完全能够做到的。为了打消客户的安全顾虑，我们很多情况下也做成混合云模式，有需要外部数据就用我们这边的SaaS服务，如果不需要或者顾虑太多，我们就不提供到客户那边。

比如，我们会用区块链技术等一些加密技术。我们也在不断地进化，不断地用技术进步打消客户的顾虑。

华云网：与传统媒体合作，有几种合作模式，具体如何合作？

郑海涛：1、标准化云服务模式，需要什么样的内容热点写作也好、远程的联想式写作也好，支付年费后就可以直接拿来用，不用担心后期的维护问题。

2、定制化加标准化，即混合云模式。这种的客户有顾虑，很多数据需要留存在本地，部分的定制化数据功能处理，部分数据放我们这端，统一的客户端还是由我们开发。

3、接口服务模式，B端客户他们有自己的技术服务团队，由他们开发产品，我们只提供相应的技术接口，供他们采购，采购完就可以把我们的技术融合到他们的开发产品中。

或引爆千亿商机

华云网: 公司目前的人员结构如何？在技术团队实力上，有哪些特点？

郑海涛：目前，智叟研发人员占到大约60%，研发人员包括算法人才，比如像我；工程人才：把算法工程化，开发产品；架构人才：云服务需要大量的计算，云服务维护。

智搜从一开始就是以清华为班底的，集结了全球知名高校如香港大学、北京大学、国防科技大学等以及大型研发机构如国家863人工智能研究小组等的博士与研究生等优秀人才。

我们专注钻研这个领域很多年，在中文领域的积累是国内领先的。在算法领域一个高端算法人才可以顶很多人的，虽然我们公司还比较小但在算法领域我们也是比较领先的。

华云网：智捜团队取得过哪些成绩？

郑海涛：公司目前累计发明专利申请12项，软件著作权数19个。获得19th高交会“最具投资潜力奖”和“优秀产品奖”（天机智讯APP）；获得2017年度CEO峰会暨猎云网创投颁奖盛典“最佳人工智能创业公司奖”等。但我们更关注我们的商业化落地。

华云网：据了解，智搜创立伊始就获得天使轮投资，并在2015年8月获得了金沙江创投500万美元pre-A轮投资。现在公司市场估值是多少？下一轮融资准备在什么时候进行？

郑海涛：我们的技术是国内领先的，人才储备也是领先的，是第一家在智能写作领域能够成功商业化落地并且营收的（去年已经收入过千万），在人工智能企业中还是比较少的。这些都能说明我们公司是有实力的，目前我们正在进行B轮融资，完成后公司估值将达到5亿元左右。

华云网：下一步，公司的发展方向是？

郑海涛：我们从事智能写作行业这么久之后，踩了很多的坑，然后找到我们的定位。第一，把B端的写作需求，包括内容营销和传媒行业需要的人机协同的一些功能先满足，这是我们第一步要做的，通过第一步就可以做到盈亏平衡；

第二、因为我们要做的是智能写作平台，现在我们只是卖系统，未来将更进一步，要打通产业链上下游。（写作是需求方，素材的供给方，包括个人、企业、像图片提供方）。形成内容上的交易，解决版权问题，辅助客户生长，让客户的内容生产更高效，同时让客户的内容产生更多附加值，这样我们也可以从中收取一定的手续费。未来这至少是一个千亿级市场。

华云网：目前，公司的需求及面临的困难有哪些？

郑海涛：当前面对的最大困难是B端企业的认可度，因为有的记者、编辑会担心引入机器后对自己的生产造成影响从而产生抵触情绪。我们需要和更多的B端企业合作，让更多的编辑记者认可我们的产品，同时我们也能够积累更多数据素材，让我们的机器更聪明。

再有就是对数据的采集，在AI行业里对数据的依赖度很高的，只有把数据不断地积累起来，我们的壁垒层才会越来越高，这样未来就算巨头们投入巨资也是改变不了的，最多是把我们收购。

华云网：除了安全，客户的抵触心理还体现在哪些方面？

郑海涛：安全是一点，另一点用户写作的时候会担心内容侵权问题。我们是通过查重技术帮他们说明这个内容在别的平台是否有相似，如果有限制客户可以做决策删掉；还有就是通过技术对文章内容改写，基于同样的语义使用不同文字；如果涉及版权图片的引用，可以通过购买使用；

最核心的是刚开始写出的初稿难以达到用户的满意，很多人一开始就期望机器能够写出她想要的稿件，这是不太现实的。因为人的知识是在脑海里，机器是不知道的，这个过程中人需要抱着开放的心态，需要不断去修改，这是一个打标签的过程。这个过程会让机器学习得越来越聪明。

来源：吴悠

刘海明 · 发表于 2019-5-22 22:25:13

【案例】每日一词｜Sisyphean：Facebook的“西西弗斯式”任务

在未能及时阻止新西兰大规模枪杀案死亡视频的传播而备受批评后，Facebook开始使用人工智能技术来识别并清除社交媒体上的暴恐内容和虚假信息。但其首席技术官认为，这是一项“西西弗斯式”(Sisyphean)的任务。

上周，时报科技栏目发表了有关Facebook如何开展这项工作的长篇报道，向读者详细呈现了这家巨头公司的痛苦与无奈。文中提到，每当Facebook工程师标记出一个有害素材，新型的可疑帖子又会不断涌现。标记、出现新内容、再标记、再出现新内容——这一过程似乎永无止尽。

据剑桥词典，Sisyphean一般“用来形容一项任务永远不可能被完成”。该词最早出现于16世纪晚期，源自希腊神话人物西西弗斯(Sisyphus)的名字。西西弗斯因触怒众神，被罚将一块巨石推上山顶，但那巨石太重了，每每在快成功时又滚下山去，西西弗斯的生命就这样消耗在无止尽地推石头当中。

编辑：吴悠

刘海明 · 发表于 2019-5-22 22:41:41

【案例】人工智能产业寻找商业化“落地”之路

文章来源：FT中文网

原文链接：http://www.ftchinese.com/story/001082834?adchannelID=&full=y

技术生态如何转化出更多的商业场景和应用，并被市场验证，形成可持续的发展与生存链条？行业中人仍在求解答案。

人工智能技术如何实现商业化“落地”？关于这一问题的追问正变得日渐迫切。

在不久前于伦敦闭幕的“人工智能与大数据博览会”（AI & Big Data Expo）上，“场景”、“应用”之类的词语，取代了诸多理想主义式的叙事，成了人工智能领域的从业者们谈论最多的话题。

历经两年的蓬勃兴起，这个产业已经在热钱和数据的哺育下，发展成一副布局蔚为壮观的图景。然而在今天的互联网时代，“方生方死”几乎是每个行业的命运主题，如今的人工智能产业，也正在面对类似的拷问。

其中那个最核心的问题，答案仍不清晰：一个由超强算力、海量数据和精英从业者构成的技术生态，能否从产业的基底层向垂直领域延伸，转化出更多的商业场景和爆款应用，并进而被市场验证，形成可持续的发展与生存链条？求解这个疑问，既意味着抱负，也意味着生死。

交流之中不难发现，从大型银行到初创企业，行业对于人工智能技术的预期，正趋于理性和具象。他们的观察和思考，也更加聚焦于对技术边界的界定、和对基本商业逻辑的回归。

靠金矿赚钱？还是靠淘金者赚钱？

“企业需要思考一个问题：究竟是想通过金矿赚钱，还是想通过淘金者赚钱？”

世界领先的企业管理软件服务商SAP的全球副总裁Marc Teerlink，将今天AI技术的产业化进程，比作1848年开始的美国加州淘金热。他强调，在那场人类史上最大规模的淘金浪潮中，只有少数人真正靠挖掘黄金而致富。最终产生经济效益的，反而来自于那些向淘金者们提供餐饮食宿、贩卖镐头铁锨，甚至研发牛仔裤的生意。

这对今天有什么启示？Marc Teerlink认为，在眼下这场以“智能”之名发起的数据淘金热潮中，多数企业并不需要从零做起研发AI技术的底层模型和算法，而是应该思考如何利用AI技术。

“数据是一种资产，AI是开发资产的引擎。但（今天）只有5%的企业承认他们在数据化转型中取得了成功”，在接受FT中文网的采访时，Marc Teerlink表示，“直到今天，很多AI领域的企业还在研发自己的生产工具和生产流程。但是随着AI淘金者越来越多，人们更应该注重增强自己所擅长的专业领域，而不是埋头于底层基础架构。”

这同时也意味着，认为人工智能必然颠覆传统产业的观念，同样需要得到反思。在Marc Teerlink看来，AI技术更为实际的角色，是成为传统产业优化资源配置、重构产业链条和数字化升级的助力性工具。其中蕴含的商机包括诸如数据训练、软件工具、咨询和整合服务等业务。

“AI并不是全新的事物，人们想做的仍然是他们业已熟悉和了解的事情，只是希望能做的更快、成本更低、并且通过更数据化的方式来完成。因此即便是对那些以数据为核心的企业而言，最好的商业化之路，还是去寻求能够运用好数据的技术和模式”，Marc Teerlink说。

关键要素是数据

即使是在AI时代，传统企业在各自的细分产业、细分区域市场仍将具有不可替代的竞争优势，这一观点正在被更多人所认同。但这并不代表，初创型的AI企业没有做大做强的机会。

“今天AI创业的最大机会在垂直应用领域”，来自中国AI创业公司乂学教育的崔炜对FT中文网表示。

崔炜是乂学教育旗下产品“松鼠AI”的首席科学家。在他看来，在今天的中国市场中，AI技术的商业版图已经十分明晰：为整个产业提供算力的“基础层”，与提供通用技术能力的“技术层”，均已被巨头公司或者技术成熟的企业牢牢占据。而崔炜和他的团队之所以押注垂直应用，理由是“巨头企业无法触及到这么细分的领域中来”。

据崔炜介绍，“松鼠AI”是一款针对K12教育领域的在线平台，致力于通过人工智能，为从学前教育到高中年龄层的学生提供个性化、系统性的学习内容和服务。按崔炜话讲，产品的定位就是做教育领域的“今日头条”。

“在教育和医疗这样的传统领域，有很多‘根深蒂固’的行业模式，不是随便一个科学技术就能改变的。否则早在移动互联网时代，这些领域的变革就已经发生了”。

然而在AI时代，这正好成了创业者的机会。在崔炜看来，在技术的商业化过程中，AI的四大要素：算法、算力、数据、场景，缺一不可。这其中最难获得的就是数据：“差异化的数据是需要一个产品来解决、梳理的。而且做成什么样的产品，就要采集什么数据”。

数据的转化，是商业化过程中的另一个关键要素。崔炜介绍：“AI实质上是模拟人脑的思维过程，模拟人的行为。其中需要科学家构建算法和模型；同时还要有了解行业的专家，负责把行业的经验解释给科学家，帮助后者思考模型需要模拟什么；接下来就是产品化的开发；积累的用户数据又能反过来不断强化、训练模型，让产品更完善。”

崔炜表示，对垂直应用领域的AI创业公司来说，建立壁垒的方式就是更精细的用户建模和更个性化的产品设计。在教育行业，就是“如何对用户进行画像，如何分析学生的学习状态，如何根据学生的学习情况，从海量学习资源中匹配学习内容和模型。”

商业化落地的挑战在哪里？

致力于将AI学术成果向商业转化的英国公司Faculty的首席商务官Richard Sargeant认为，在垂直应用场景中实现商业化落地，是小型AI初创企业的优势所在。

他对FT中文网表示：“在实际的垂直市场应用层面，大型科技企业实际上很难提供精准的客户服务。他们更擅长研发通用算法和技术，让尽可能多的用户都能够适用。但是现实的经济是一个非常多样化的世界，需求是非常不同的，这反而是小企业的优势。”

那么深入垂直领域的挑战在哪里？

“我们是第一个吃螃蟹的人，面临的难点是要做市场普及”，专注AI教育技术的崔炜表示：“就像第一代苹果手机已经带来了颠覆，但直到第四代iPhone，产品才能成为市场主流。对教育行业而言，大部分家长还是更信赖老师，因为老师有个人信誉在那里。而一个机器，它的教育水平还没有形成口碑。”

然而与智能手机等硬件产品不同，AI技术所提供的是更为抽象的服务和体验，这似乎也意味着消费者教育的周期与方式，存在更多不确定性。

对此崔炜表示，这是人工智能产品面对的另一个难题：“手机产品能开一个发布会，但是一个教育产品的体验，需要更长的周期。教育只有一个关键点，就是口碑。而（在中国）好的教育口碑的形成，最直接的还是中考和高考成绩。”

对于如何迈出AI商业化的第一步，传统企业也同样谨慎。英国Lloyd 银行集团商业整合与应用科学主管Abhijit Akerkar表示，AI技术在企业层面的应用，需要考虑如下因素：回报有多大？是否掌握了正确的数据？能否被监管机构批准？应用模式是否已有先例验证？以及，人们的预期有多大？应用落地后会不会在短期显现影响？

Abhijit Akerkar说：“这些因素的可以帮助确定行动的优先级，企业对AI的心态更像是一个风险投资人。可以先采用小规模尝试，如果结果是积极的，那么加倍投入”。

编辑：吴悠

刘海明 · 发表于 2019-5-24 19:04:40

【案例】人脸识别技术在英国被起诉

文章来源：数据法律资讯

原文链接：https://mp.weixin.qq.com/s/5ynSxX1VRzJNxYouOvj4ng

英国首例警用人脸识别案于近日开庭。

案件当事人Ed Bridges以众筹的方式提起诉讼，其诉称南威尔士地区警局使用人脸识别技术侵犯了他的隐私。他同时主张，在加的夫民事审判与家事中心的持续三天的审讯违反了数据保护与平等法。人脸识别技术能够将人群的个体面部图像与“监视清单”中的图像进行比对（监视清单中包含了嫌疑人、失踪人员以及相关人员的图像）。警务人员希望通过此项技术减少犯罪，然而公益组织则主张人脸识别技术侵犯了个人隐私和公民权利。

2017年在欧冠总决赛时期，威尔士警局首次使用了人脸识别技术。Bridges声称他至少被扫描了两次——第一次是在一项平和的反枪支抗议活动中，另一次是在圣诞节购物中。

代表Bridges的公益组织“自由”，声称南威尔士警局在大约50种场合使用了人脸识别技术。该组织同时声称，公开的信息显示在人脸识别技术被投入使用的第一年，其精确度不足9%。警局回应道，在司法审查结束前，他们将不发表意见。

大都会警局也在伦敦适用了若干次人脸识别技术。流传于网络的一个视频显示，某男子因为在镜头前遮挡面部，而被施以90英镑的罚款。此项惩罚广受批评，虽然直到现在也没有弄清该男子究竟是因为遮挡面部还是因为与公务人员发生争执而被罚款。

此项技术在美国也饱受争议。乔治城大学的一向研究报告显示：当涉及到什么样的照片可以由警察呈递给人脸识别算法以生成调查指引时，无规则可循。结果便是，当纽约州警局发现他们没有某个嫌疑人的可供匹配的照片时，竟然尝试将演员伍迪哈里森的照片放入，因为他们认为这两人长得很像。

本月初，旧金山投票已禁止使用人脸识别技术，这项技术被一些活动家称为“老大哥技术”。

人脸识别技术是如何工作的？

由伦敦大都会警局所试用的该项技术（该项系统被称为“NeoFace”，由日本NEC公司制造），首先利用独特的相机来扫描人群中的人体面部结构，生成数字图片，然后与“监视清单”中的图像进行对比，“监视清单”由被纳入警方监管的目标人群的图像组成。

并不是所有被纳入警方监视清单中的人都是通缉要犯，因为清单中也包含了那些失踪人员和其他相关人员。如果匹配成功，那么相机旁边的公务人员就会被警醒。

为什么此项技术备受争论？

公益组织的活动人士认为，人脸识别技术侵犯公民权利。此次诉讼的推动者—公益组织“自由”声称，扫描并储存我们的生物信息，是对隐私的粗野的侵犯。

“老大哥监察者”，这个关注个人隐私与公民权利的组织说道，“直播式的人脸识别技术使得个体成为了行走的身份证，这实在是令人寒心！”

编辑：吴悠

刘海明 · 发表于 2019-5-26 21:51:19

【案例】如何确保人工智能不作恶？微软提出透明、负责等6个道德准则

文章来源：澎湃新闻

原文链接：https://mp.weixin.qq.com/s/SCOIty14lsv2gejTOE0ADw

人工智能浪潮以迅猛之势席卷全球，一方面给经济社会的可持续发展带来了巨大的机遇，另一方面，安全、隐私、偏见、垄断等问题也随之而来。

7月9日，由中国发展研究基金会与微软公司联合撰写的《未来基石——人工智能的社会角色与伦理》报告在北京发布。

报告称：“如果我们决心要利用人工智能带来的无限机遇，最好在冲进未知之门之前给这辆汽车装上刹车，让它真正能行稳致远。这个刹车就是伦理规范和公共政策准则。”

在深度学习、云计算以及芯片、传感器技术的帮助下，人工智能成为马力惊人的社会发展加速器，带着全球向充满不确定性的未来疾驰。但在高速发展的过程中，一些担心也随之而来。

例如，人工智能技术是否会扩大贫富差距；如何确保人工智能技术不会武器化，如何防止某些公司对技术的滥用等。

在国家层面，人工智能的伦理问题已经引起了越来越多的关注，出台了一系列的政策指引和准则。日本的一个跨专业团体曾发布《下一代机器人安全问题指导方针(草案)》，韩国政府早在2007年就着手拟订《机器人道德宪章》，美国信息技术产业委员会（ITI）也于2017年颁布了人工职能的14条政策准则。最近，欧盟出台了史上最严格的史上最严格数据保护条例——《通用数据保护条例》(General Data Protection Regulation,简称GDPR)，旨在加强对数据的保护。

在公司层面上，硅谷的一些巨头科技公司深有感触。此前，由于和美国国防部有军方合作项目，亚马逊、微软、谷歌等公司遭到外界的诟病。有媒体指出这些公司正利用人工智能技术助纣为虐，是在作恶。尤其是谷歌的Maven项目（编注：该项目主要指谷歌利用机器学习技术帮助美国国防部分析无人机视频，识别物体），这个人工智能项目受到公司内部和外部的指责，谷歌内部甚至出现了离职潮。

在内外舆论的压力之下，谷歌公司已经申明，在人工智能开发应用中，坚持包括公平、安全、透明、隐私保护在内的7个准则，并明确列出了谷歌“不会追求的AI应用”。

微软也给出了自己的答案，提出要设计出可信赖的人工智能，必须采取体现道德原则的解决方案，因此提出6个道德基本准则，包括公平、包容、透明、负责、可靠与安全、隐私与保密。其中，透明和负责是其他四项原则的基石。

微软提出的6个道德基本准则

具体原则为：

公平：人工智能系统应当以公正、一致持平的态度对待每一个人，而不能对情况类似的群体施以不同的影响。

可靠：人工智能系统应确保运行可靠、安全，避免人工智能系统可能会在不可预见的情况下造成伤害，或者被人恶意操纵，实施有害行为。

隐私与保密：人工智能系统应当有保障且尊重隐私，这是赢得公众必要信任的条件，而公众信任又是充分利用人工智能的前提。

包容：人工智能系统应确保人人赋能、人人参与。要确保人工智能技术造福、赋能每一个人，这些技术必须考虑并解决广泛的人类需求和经验。

透明：人工智能系统应易于理解。一旦人工智能系统被用于做出影响人们生活的决策，人们就有必要了解人工智能是如何做出这些决策的。

负责：与其他技术和产品一样，设计和部署人工智能系统的人员必须对其系统的运行负责。

除了提及人工智能在伦理道德方面的发展约束外，这份报告中，也对中美两国人工智能发展情况进行了描述。

报告认为，美国和中国在人工智能领居于全球前列。目前，全球人工智能领域最有影响力的大学和企业主要分布在美国，在核心人才的培养上也是如此。从累计的专利数量和研究论文数量看，美国遥遥领先于世界其他国家，中国则在数量增长上后来居上，但质量上与美国还有较大的距离。

在产业层面，美国和中国也居世界前两位。截止2017年6月，全球2542家人工智能企业中，美国有1078家，占42%，中国592家，占23%，其余872家企业分布在瑞典、新加坡、日本、英国、澳大利亚、以色列、印度等。基础层企业美国有33家，中国有14家；技术层企业数量，美国有586家，中国273家；应用层企业美国有488家，中国有304家。

编辑：吴悠

帐号		自动登录	找回密码
密码			实名注册

人工智能与新闻业案例集锦

浏览过的版块