人工智能与新闻业案例集锦

刘海明 · 发表于 2019-6-30 21:00:59

【案例】能生成女性“全裸照片”的人工智能

编辑：吴悠

刘海明 · 发表于 2019-7-1 22:19:14

【案例】
杨保军：简论智能新闻的主体性

原作者：杨保军

文章来源：现代传播

内容摘要：

智能新闻或机器(人)新闻，是通过人工智能技术生产传播的新闻。智能新闻的生产传播主体是人，不是也不应该是智能机器。将智能机器主体化，是浪漫主义的表现，智能机器不可能从根本上替代人作为新闻活动主体的地位和作用。智能机器是人的本质对象化的产物，智能新闻是人作为主体的意志体现，智能新闻生产中存在异化现象，在“人—机”共同主体结构中的新闻生产传播中，人依然是唯一主体。

关键词：

智能新闻；机器新闻；主体性；人—机主体

面对今天人类新闻活动的新图景，在新闻生产传播主体视野中，有一个非常值得关注的越来越普遍的现象，就是智能机器的新闻生产问题，简单点说就是“机器新闻”或“智能新闻”问题（本文在同等意义上使用“机器新闻”“智能新闻”这两个概念）。智能新闻或机器（人）新闻，笼统地讲，就是人工智能技术在新闻报道领域的具体应用，通过人工智能技术生产传播的新闻。有些人认为，人工智能将会在不久的将来替代人作为主体展开新闻生产和传播，可能成为新的新闻生产传播主体；还有一些人认为，智能机器与人一起形成（构成）人一机“共同主体”，展开共同的新闻生产传播。这些将智能机器（人工智能的体现）主体化的见解或观点是值得怀疑的，需要做出反思和批判。
我们确实看到，建立在各种技术之上的智能新闻写作或机器新闻写作已经成为事实。那么，机器（智能机）是否就是新闻（写作）主体？如何看待机器在新闻生产中的属性（主体性或工具性）问题，智能机器在未来是否会完全代替人作为新闻生产主体、传播主体的地位和作用。我对这些问题的回答是明确的，也是“否定”的。智能机器相对人这个新闻生产、传播主体来说，从原则上看，永远处于从属性的工具地位、手段地位，不可能具有与人一样的作为新闻主体的地位。下面，我从几个方面加以简要阐释。
智能机器是人的本质对象化的产物
智能机器，包括所有可能的人工智能技术，本质上都是人作为主体的自觉发明物、创造物，本质上都是人作为主体的对象化结果，是人作为主体的本质力量的显示或体现。正如德国哲学人类学的重要代表大物阿诺德·盖伦所言:“假如我们把技术理解为人类由于认识自然的性质和规律，以便利用它们与控制它们，从而使得自然能为人类自身服务而具有多种能力和手段，那么技术在这种高度普遍的意义上，就是人类自身本质的最重要的部分。”1 技术，是人类自然演进史中的产物，“一切技术都是人的思想的体现”2。
在人类社会，只有人具有主体性。“人的主体性是人作为活动主体的质的规定性，是在与客体相互作用中得到发展的人的自觉、自主、能动和创造的特性。”3 简单说，人的主体性就是指人的自觉、自主、能动和创造特性，至少在目前看来，没有第二种动物，也没有任何其他事物同时具备这些特性。并且，依据现有的认识逻辑、实践逻辑，我们也很难想象在地球上能够出现完整具备这些属性的事物。如果说智能技术具备部分或某种程度上具备这些属性，那也是人作为主体的创造物，它们所表现出的形式上的“主体性”不过是人的主体性或人的本质能力的体现或一定的延伸。就可见的未来来看，只有作为主体的人能够在遵循自然规律、社会规律的背景下自主选择自己的命运，而依赖人之能力的智能机器不可能具备超越于人的自觉性，不可能自主选择自己的命运。
用历史的眼光观察，所有技术及技术产物，都是人类实践活动、实践经验的产物，并且越来越成为人类科学认识转化的产物。就技术发明创造的真实历史来看，有些技术主要是在人类实践活动过程中凭借经验创造出来的，依赖人类的需要一步一步发明创造出来的，并不是先有科学认识，然后才有技术发明和创造；越是在人类活动早期，可能越是如此，即人们并不明确知道技术背后的科学机制或原理，正因为如此，有人才说，“技术比科学有更漫长的历史和更深刻的大性根源”。4 而有些技术主要是在人类科学认识基础上的产物，也就是说，技术发明创造以一定的科学认识为前提，只有认识了一定的科学原理、科学规律，才能发明、创造出一定的技术（产品）。而且，越是技术高度发达的时代，技术发明创造似乎越是依赖科学认识这个前提，“以科学技术知识为基础是现代技术活动的基本特征。特别是在高技术领域，最先进的技术形态往往是在科学研究重大突破的基础上创造出来的”。5 因而从总的原则上可以说，技术是经验、实践与科学认识的共同产物。正如美国著名技术思想家布莱恩·阿瑟所言:“断言技术只是科学的‘应用是幼稚的，毋宁说技术是从科学和自己的经验两个方面建立起来的。这两个方面堆积在一起，并且随着这一切的发生，科学会有机地成为技术的一部分，被深深地织入技术。”6 阿诺德·盖伦也说:“技术从新的自然科学中引出了它那惊心动魄的进步节奏。而科学则从技术中获得了实用的、建设性的、非思辨的倾向。”7 但是，不管具体的技术是如何产生的，它们都是人作为主体的产物，离开人的主体性和主体能力，任何初级的或高级的技术都是不可能自生的，任何机器“生产”机器的可能，首先得以人对机器的初始生产为前提。因而，一言以蔽之，技术不过是人作为主体的产物，是人的各种属性、能力、潜能的延伸物，它们确实能够体现人的主体性，但它们本身并不就是主体，而是人作为主体为自己的认识活动、实践活动、生活活动创造的工具和手段。在人与技术之间，主动性只能来自人类，人类必须成为主体，这样才有可能使技术演进在温顺适度的而非狂野的轨道上，法国哲学家柏格森早就说过:“除非向技术卑躬屈膝的人类，借助技术方法成功地改变自身并望向天空，否则技术绝不会按照其能力大小提供服务。”8 人在技术面前不仅具有主体性，也不能放弃主体性。
人是目的，技术木身不会成为目的。“是人，而不是技术，必须成为价值的最终根源；所有计划的标准不是生产的最大限度的发展，而是人的最理想的发展。”9 人是主体，机器，不管多么智慧的机器仍然是机器，是物。“人类最好把价值判断留给自己，这也是保持种人类对机器人的独立性乃至支配性。我们最好让机器人始终保持它们物’的基本属性，而不是给它们建立一套以人为中心的价值体系。”10 技术的进步或“进化”，本质上属于人的进步或进化，“至少在技术发展的目前阶段，技术的建构和繁衍还依然需要人类作为其代理人”11。技术的自主性，是说技术演进发展有自身的规律，并不是说技术、智能技术可以在本质上自主创造自身。12 即使到了一天，像一些人想象的，人所创造的智能机器能够自主创造、生产自己的“后代”，但从原则上说，仍然没有超越它们在本源上是人的延伸这一逻辑。如果机器不再是人的延伸物，而是成为超越人、超脱人的存在，那我们也没有必要按照人的逻辑去讨论机器了旦机器成为超越人类整体智能或整体能力的存在，它变成了一个新的“物种”，人类也就不可能与其发生真正的对话与交流，正如人类不可能与低等动物进行真正的理性交流一样。
二、智能新闻是人作为主体的意志体现
机器新闻，本质上并不是机器按照自己的主观意志、主观愿望自主生产的新闻，即不是智能机器自己说是或说不是的新闻，而是按照人作为新闻传播主体的意志和愿望生产的新闻。写作新闻的机器本身是人设计的、创造的，如何选择新闻、写作新闻的程序根源上是由人设计的、创造的，用来组合、建构新闻文本的原始资料、原始信息是由人通过一定的手段获取的（获取这些资料、信息的手段可以通过人所设计创造的其他技术来实现，如各种传感器），写出来的新闻是否传播、如何传播、如何收受也是由人作为主体决定的。因而，机器新闻本质上、总体上体现的是作为新闻生产传播主体的人的意志和愿望，而收受什么类型的新闻，总体偏向上受制于人作为收受主体（用户）的选择，那些建立在各种速发基础的新闻分发、信息分发依赖的主要是用户的数据。无论这样的机器如何聪明，它仍然不过是人这个主体手中的工具或不断升级的工具，总体上仍然是受人操纵的延伸物，“任何铅笔都不能自己书写或传播任何东西，爱因斯坦的铅笔不能，任何人的铅笔都不能；如果没有铅笔背后指引它的人脑和人手，铅笔一事无成”13。诚如麦克卢汉所说的，“即使有意识的计算机，仍将是我们意识的延伸，正如望远镜是眼睛的延伸，口技演员操纵的傀儡是口技演员的延伸一样”14。另一位媒介环境学派代表性人物罗伯特·洛根也说，“计算机只不过是我们智能的延伸，人工智能胜过人的智能是难以想象的。实际上，这个方向上的进展几乎为零”15 。“计算机生成的‘智能’不是人的智能，而是人的智能的模拟。”16 那些向社会大众宣称新闻是机器智能自动选择结果的媒体，不过是截取新闻生产的某一环节，用以偏概全的方式的遮蔽性描述，并没有告诉社会大众新闻生产传播的完整过程。那些通过点击量自动生成的所谓“头条”、所谓“推荐”以及背后的“算法”，说明的恰好不是机器聪明，而是人的选择、人的智慧或能力。算法就是力量，算法就是影响天，像一些人想象的，人所创造的智能机器能够自主创造、生产自己的“后代”，但从原则上说，仍然没有超越它们在本源上是人的延伸这一逻辑。如果机器不再是人的延伸物，而是成为超越人、超脱人的存在，那我们也没有必要按照人的逻辑去讨论机器了旦机器成为超越人类整体智能或整体能力的存在，它变成了一个新的“物种”，人类也就不可能与其发生真正的对话与交流，正如人类不可能与低等动物进行真正的理性交流一样。
二、智能新闻是人作为主体的意志体现
机器新闻，本质上并不是机器按照自己的主观意志、主观愿望自主生产的新闻，即不是智能机器自己说是或说不是的新闻，而是按照人作为新闻传播主体的意志和愿望生产的新闻。写作新闻的机器本身是人设计的、创造的，如何选择新闻、写作新闻的程序根源上是由人设计的、创造的，用来组合、建构新闻文本的原始资料、原始信息是由人通过一定的手段获取的（获取这些资料、信息的手段可以通过人所设计创造的其他技术来实现，如各种传感器），写出来的新闻是否传播、如何传播、如何收受也是由人作为主体决定的。因而，机器新闻本质上、总体上体现的是作为新闻生产传播主体的人的意志和愿望，而收受什么类型的新闻，总体偏向上受制于人作为收受主体（用户）的选择，那些建立在各种速发基础的新闻分发、信息分发依赖的主要是用户的数据。无论这样的机器如何聪明，它仍然不过是人这个主体手中的工具或不断升级的工具，总体上仍然是受人操纵的延伸物，“任何铅笔都不能自己书写或传播任何东西，爱因斯坦的铅笔不能，任何人的铅笔都不能；如果没有铅笔背后指引它的人脑和人手，铅笔一事无成”。诚如麦克卢汉所说的，“即使有意识的计算机，仍将是我们意识的延伸，正如望远镜是眼睛的延伸，口技演员操纵的傀儡是口技演员的延伸一样”。另一位媒介环境学派代表性人物罗伯特·洛根也说，“计算机只不过是我们智能的延伸，人工智能胜过人的智能是难以想象的。实际上，这个方向上的进展几乎为零”。“计算机生成的‘智能’不是人的智能，而是人的智能的模拟。”那些向社会大众宣称新闻是机器智能自动选择结果的媒体，不过是截取新闻生产的某一环节，用以偏概全的方式的遮蔽性描述，并没有告诉社会大众新闻生产传播的完整过程。那些通过点击量自动生成的所谓“头条”、所谓“推荐”以及背后的“算法”，说明的恰好不是机器聪明，而是人的选择、人的智慧或能力。算法就是力量，算法就是影响力，算法即权力，17 “网络社会的到来使人与机器之间的界限逐渐模糊”18，这些说法没有什么错误，但略有夸张，而更需要人们清楚的是，这不仅是算法的力量、技术的力量、算法的权力，还是共背后创造算法、发明技术的主体的力量、人的力量，更是显示着不同社会主体的权力。事实上，正是因为创造算法、发明技术的人的价值选择偏向、利益追求目标，以及以收受方式运用这些算法、技术的社会大众的选择偏向，才造成了人们所诟病的新闻传播中的偏向，造成了“内容下降的螺旋”19。因而，面对这样的现象，恐怕人们不应该急于欢呼“机器的公正”，而是要操心“人心的端正”或人心的善良。当技术、机器、智能机器被看作是纯粹的工具时，它们也许是价值无涉的，可一旦与现实的应用、现实的社会主体勾连起来，它们的中立性就没有那么纯粹了，技术本身具有的客观偏向性就会显露无疑。谁能掌控技术、谁能更为自由地运用技术，从技术发明创造那一刻起就已“基因”性地蕴藏在技术机制之中。建立在大数据和算法及计算能力基础之上的智能新闻，并不就是天然客观、全面、公正的新闻，事实上，这样的新闻只是于特定范围大数据基础之上的新闻，它的真实性、客观性、全面性都是相当有限的，它呈现的只是数据范围内的真实，没有进入数据范围的信息连新闻呈现的机会都没有，更谈不上新闻真实了，诚如有学者所言，“在许多意见不能表达的情形下，大数据的性质就是这些表达的缺失”20。以什么样的数据为基础，以什么样的算法为模式，背后有着种种因素的限制与影响，这自然不是技术本身能够决定的事情。21 一些人认为，“基于算法的内容生产将不再依赖记者、编辑等单独点的信息采集，而是通过对大数据库的实时分析，构建起跨语言、深层次、全局性地认识事物、表征和预测现实的模型，突破了以往人们‘脑海真实’的片面性和局部性，从而仿真出无限逼近于客观真实的符号真实”22，这样的推理具有一定程度的现实基础，但未免有点浪漫。其实，新闻所面对的不同的点，或者说记者、编辑所侧重的点往往是更具新闻价值的点，而数据抹平的不同的点，很可能恰好遮蔽了对象特有的新闻价值。用什么样的数据、怎样使用数据，选择者直接表现为机器运行，表现为算法、计算能力的实现，但这一切的“顶层设计”者是社会环境中的人。说到底，人是终极性的主体，而由人作为主体所发明创造出的“智慧”“聪明”的机器还是机器，还是手段和工具，至多是人作为主体的延仲性存在。
在人与机器之间，机器越是能够显示出自主性、自由性，只能表明，人的主体性越强、越高，即人作为至体能够把自身主体性对象化的能力越强、越高。这是人与机器之间难以改变的基本逻辑。只有当人成为机器的工具，成为实现机器目的的手段，被智能机器所主宰或奴役，才可以说人是客体，机器是主体。但按照现有的人与技术的关系，人作为主体是不可能创造出高于人之主体性的对象物的。人的能力是人工智能的边界。23 即使未来有这样的智力可能，人创造的技术创造出比人更强大的智能，人作为社会主体也未必真的愿意创造和接受人与机器、人与技术的如此实际关系。愿意接受智能机器奴役的人类一定是变态的人类，白寻死路或自找毁灭的人类。
三、智能新闻生产中存在异化现象
就现实来看，人类确实会在一定程度上、一些方面被自己本质的对象物，包括技术特别是智能技术所异化，人确实有可能被自己的创造物在一定程度上所控制。诚如马尔库塞所说:“随着科学技术的高度发展，劳动分工的日益专门化，人们在劳动中从事越来越单调乏味、千篇一律的操作，人越来越成为一种工具。24 但异化并不意味着智能机器就是主体，而是说人类在一定程度上失去了自身的主体性，人类在一定程度上失去了理性和自律的能力，这种状况过去存在，现在存在，将来也可能存在。人类其实总在“异化”与“化异”（消除异化）的道路上，如何克服技术异化，走出技术困境，对人类是个越来越大、越来越复杂的难题。正如F.拉普所言:“同从前的时代相反，现代科学技术赋予人类的力量，需要人有一定程度的自我控制。而这完全超出了人类的能力，这就是现实让人进退两难的地方。”25 人是技术的发明者、创造者，技术异化的根源在人身上，不在技术本身。技术会异化到什么程度，取决于人性能力。而人性能力（人的知情意的能力、实践能力）总有其潜在的一面，因而，人类的未来总是蕴藏着多种可能性，没有人能够对人类的未来做出绝对的预测，“正如进步是不确定的一样，历史的倒退和毁灭的结局也不是确定的”26。
当然，人们可以像一些科幻小说、科幻电影中那样想象极端化的情况，可以想象在人类与智能机器之间出现“奇点”27，人类被自己的发明物、创造物—智能机器—控制甚至消灭的场景。但那说到底，并不是机器战胜了人，而只能说是人类的非理性战胜了人类的理性，人类自己消灭了自己作为生物生命的存在，作为社会主体的存在。这样的可能性是可想象的，但也仅是可想象的而已。人类果真创造了自己不可控制的力量，并且是反过来危害自己的力量，那恐怕只能说能够把自身主体性对象化的能力越强、越高。这是人与机器之间难以改变的基本逻辑。只有当人成为机器的工具，成为实现机器目的的手段，被智能机器所主宰或奴役，才可以说人是客体，机器是主体。但按照现有的人与技术的关系，人作为主体是不可能创造出高于人之主体性的对象物的。人的能力是人工智能的边界。即使未来有这样的智力可能，人创造的技术创造出比人更强大的智能，人作为社会主体也未必真的愿意创造和接受人与机器、人与技术的如此实际关系。愿意接受智能机器奴役的人类一定是变态的人类，白寻死路或自找毁灭的人类。
“异化”达到了极端状态。而要消除异化现象或降低这种异化现象的程度，最终依赖的并不是机器的智慧，而是人的主体性的增强，诚如英国历史学家汤因比所言，“要消除（技术）对人类生存的威胁，只有通过每个人的内心的革命性变革”；“对付（技术）力量所带来的邪恶结果，需要的不是智力行为而是伦理行为”。人们现在担心的、怀疑的可能不是智能技术（机器人）的“叛变”，而是人类自身的伦理能力、自律能力。
如果有一天智能机器真的超越了人类的智能，它所拥有的绝对不是人性，而是“机器性”，它拥有的也绝对不是“人类观”，而是“机器观”。它也许会继承人类的理性思维，但它从根本上不会以人的逻辑而会以机器的逻辑思维、存在和活动。那是人所不可理解的逻辑。当机器有了自身的自觉性、主体性，它一定会以机器为中心，创造自己的世界，它可能会有自己的情感和意志，但那与人没有多大关系，“它对人类的存在以及人类价值观都不感兴趣”。“虽然机器拥有超人的智力，但其很难拥有人类意志和创造力。”就像现在的动物界，尽管与人类有一些或近或远的相似性，但动物从本质上并不理解人类的情感和意志。到那时，人类只能是机器的玩物、宠物，就像现在的一些动物，只不过是人类的玩物、宠物或食物一样。就现在来看，机器（本质上）是理性的、逻辑的，但人不只是如此。如何使机器获得恰当的非理性能力，才是真正的（不可能的）难题。人拥有不可计算的一面，世间的万事万物都有不可计算性的属性，“任何不可度量的对象，都无法变成数据，机器也就无法处理”。也许，正是在这一点上，人是任何机器不可替代和不可战胜的存在。人类只能以直接或间接的方式自杀，绝不可能他杀、被自创造的智能机器所毁火。
这样的猜测、想象、幻想对人类白身具有一定的警醒意义。未来是可能的、是开放的，不是人类可以完全预料和驾驭的，人性能力是有限的。有学者指出，“汇聚技术”将把生物的人变成机器人、电子人，彻底打破人与机器之间的原有界限，进而形成半人类、准人类或超级机械化人类。这些“新兴人类”将像今天的计算机一样可以不断升级，功能成倍扩展与提升。这是从外部对人类生命的改造，必将给人类社会带来一系列严峻挑战。因此，人类对自己的智能延伸、神经系统的延伸，还是应该谨慎一点，现有的伦理边界不可轻易冲破，“技术有度”应该成为技术发展的一条规则。“毫无疑问，未来的人也是技术的人，未来的社会也是技术的社会，人类不可能远离技术世界而生活，也不可能彻底消除技术矛盾，但是却可能更加合理、舌意地创“异化”达到了极端状态。而要消除异化现象或降低这种异化现象的程度，最终依赖的并不是机器的智慧，而是人的主体性的增强，诚如英国历史学家汤因比所言，“要消除（技术）对人类生存的威胁，只有通过每个人的内心的革命性变革”；“对付（技术）力量所带来的邪恶结果，需要的不是智力行为而是伦理行为”28。人们现在担心的、怀疑的可能不是智能技术（机器人）的“叛变”，而是人类自身的伦理能力、自律能力。
如果有一天智能机器真的超越了人类的智能，它所拥有的绝对不是人性，而是“机器性”，它拥有的也绝对不是“人类观”，而是“机器观”。它也许会继承人类的理性思维，但它从根本上不会以人的逻辑而会以机器的逻辑思维、存在和活动。那是人所不可理解的逻辑。当机器有了自身的自觉性、主体性，它一定会以机器为中心，创造自己的世界，它可能会有自己的情感和意志，但那与人没有多大关系，“它对人类的存在以及人类价值观都不感兴趣”29。“虽然机器拥有超人的智力，但其很难拥有人类意志和创造力。”30 就像现在的动物界，尽管与人类有一些或近或远的相似性，但动物从本质上并不理解人类的情感和意志。到那时，人类只能是机器的玩物、宠物，就像现在的一些动物，只不过是人类的玩物、宠物或食物一样。就现在来看，机器（本质上）是理性的、逻辑的，但人不只是如此。如何使机器获得恰当的非理性能力，才是真正的（不可能的）难题。人拥有不可计算的一面，世间的万事万物都有不可计算性的属性，“任何不可度量的对象，都无法变成数据，机器也就无法处理”31 。也许，正是在这一点上，人是任何机器不可替代和不可战胜的存在。人类只能以直接或间接的方式自杀，绝不可能他杀、被自创造的智能机器所毁火。
这样的猜测、想象、幻想对人类白身具有一定的警醒意义。未来是可能的、是开放的，不是人类可以完全预料和驾驭的，人性能力是有限的。有学者指出，“汇聚技术”32 将把生物的人变成机器人、电子人，彻底打破人与机器之间的原有界限，进而形成半人类、准人类或超级机械化人类。这些“新兴人类”将像今天的计算机一样可以不断升级，功能成倍扩展与提升。这是从外部对人类生命的改造，必将给人类社会带来一系列严峻挑战。33 因此，人类对自己的智能延伸、神经系统的延伸，还是应该谨慎一点，现有的伦理边界不可轻易冲破，“技术有度”应该成为技术发展的一条规则。“毫无疑问，未来的人也是技术的人，未来的社会也是技术的社会，人类不可能远离技术世界而生活，也不可能彻底消除技术矛盾，但是却可能更加合理、舌意地创造和运用技术。”34

四、“人一机”结构中人依然是唯一主体
就人与机器在新闻生产传播中已经表现出的关系看，特别是从人类能力特别是科学能力、技术能力的发展趋势看，人机互动结构已经形成，“他/它们”至少在外在表现上看已经成为共同的生产传播主体。而且，就目前的发展状况看，“人机互动的主体结构形式”一定会越来越高级、越来越完善。机器会成为看上去与人类越来越像的新闻生产传播主体，成为人类越来越离不开的“高级助手”和相对的“独立工作者”；而作为主体的人，也可能越来越不像纯粹的自然人、生物体，而成为“杂交”人，成为与技术结合、融合在一起的人，电子人、“赛博人”事实上在一定程度上已经出现。35 今天的人，不管是在心灵上、精神上还是在肉体上、身体上，开启了新的“进化”步伐。
但是，在我看来，只要机器本质上还是人类主体能力或人性能力的对象化、外在化、客观化产物，无论它与人类身体有着怎样的结合或融合，它就在本性上只能属于工具性、手段性存在，而不能成为独立的、与人类并列的新闻活动主体。“人机互动的主体结构形式”也只是比喻意义上的新闻传播主体存在方式，并不是说机器真的成了新闻传播“主体”。“人是现实技术系统的构成部分，离开了人的创造与操纵，就没有技术系统的建构与运转。”36（“即使有意识的计算机，仍将是我们意识的延伸，正如望远镜是眼睛的延伸，口技演员操纵的傀儡是口技演员的延伸一样。”即使是那些放置在人体内的“机器”，仍然是人的创造物，是人的智慧与本质的体现，那些过度放大智能机器在新闻生产、传播中作用和影响的看法，还是谨慎点为好，免得人们忽视或忘记了背后的真正主体—人。人与机器的关系，永远不能代替人与人之间的关系，这是两类性质完全不同的关系。新闻活动，说到底，乃是人与人之间的信息交流关系，精神交流、心理交流、文化交流关系。
技术本质上是对自然的发现，是对人的延伸，是为了人与自然更和谐的相处，人与人更加有效的交往、交流，如果走向反面，技术便是人的异化。如果人成了技术的工具和手段，失去自身的主体性，技术便失去了人之延仲的意义和价值。人在主体意义上与技术的杂交化，对于人类来说，可能是悲剧而不是喜剧。有意义的技术边界就是它是相对主体人而存在的客体，是工具，它不能成为超越人类意义上的主体。果真某一天机器开始对人类说“不”，人类的末日也就到来了。

注释:
1、7【德】阿诺德·盖伦:《技术时代的人类心灵—工业社会的心理问题》，何兆武、何冰译，上科技教育出版社2008年版，第4、8页。
2【美】保罗·莱文森:《软利器—信息革命的自然历史与未来》，何道宽译，复口大学出版社2011年版，第34页。
3 郭湛:《主体性哲学:人的存在及其意义》云南人民出版社2002年版，第30-31页
4、8吴国盛编:《技术哲学经典读本》，上海交通大学出版社2008年版，第6（编者前言），129页
5、33、34、36 王伯鲁:《技术困境及其超越》中国社会科学出版社2011年版，第30、107、265、48页。
6、11【美】布莱恩·阿瑟:《技术的本质》曹东冥、王健译，浙江人民出版社2014年版，第65页。
9【美】E.佛洛姆:《佛洛姆著作精选——人性·社会拯救》，黄颂杰编译，上海人民出版社1989年版，第491页。
10 何怀宏:《人机伦理调节的底线》北京日报》，2018年8月27日第15版
12 曾经担任过美国哲学与技术学会第五任主席的兰登·温纳认为，技术在三种意义上可以理解为是自主的:首先，它可看作是一切社会变化的根本原因，它逐渐改变和覆盖着整个社会；其次，大规模的技术系统似乎可以自行运转，无需人的介人；最后，个人似乎被技术的复杂性所征服和乔没。参见卡尔米·切姆:《技术哲学》，载吴国盛编:《技术哲学经典读本》，上海交通大学出版社2008年版，第47页。在笔者看来，温纳的见解，虽然具有一定的合理性，但就实际来看，每一点都有所夸大。
13【美］保罗·莱文森:《软利器——信息革命的自然历史与未米》，何道宽译，复口大学出版社2011年版，第179页。所谓爱因斯坦的铅笔，是指爱因斯坦说过，他的铅笔比他本人更聪明，暗喻技术，工具比人更聪明，或者说离开技术、工具人就无法实现自己的思想或实践观念
14、15、16、37［加］马歇尔·麦克卢汉:《理解媒介——论人的延伸》，何道宽译，商务印书馆2000年版，第431、287、第288、431页参见喻国明、杨莹莹、闫巧妹:《算法即权力:算法范式在新闻传播中的权力革命》，《编辑之友》，2018年第5期。喻国明韩婷:算法型信息分发:技术原理、机制创新与未来发展》新闻爱好者》，2018年第4期
18、22喻国明、韩婷:《算法型信息分发:技术原理、机制创新与未来发展》，《新闻爱好者》，2018年第4期
19 宋建武:《智能推送为何易陷入“内容下降的螺旋”一智能推送技术的认识误区》《人民论坛》，2018年第17期
20、23、31许成钢:《人工智能、工业革命与制度》《比较》，2018年第2期
21 比如，建立在网络数据基础上的很多报道只能在一定程度上反映网民的态度和看法并不能反映非网民的态度和看法。即使在网络数据范围内，由于相关法律、政策或制度的约束与限制，一些信息得不到传播，一些意见没有表达的机会，一些信息被过滤掉，因而，建立在网络数据基础之上的新闻真实性、全面性、客观性、公正性其实是相当有限的。其实通过智能传感器获得的很多社会数据都存在这样的问题，因而，不能神化建立在大数据基础上算法基础上的新闻
24【美】马尔库:《爱欲与文明》黄勇、薛民译，上海译文出版社1987年版，第6页
25 参见［德］F.拉普:《技术哲学导论》，刘武等译，辽宁科学技术出版社1986年版。江行福:“复杂现代性”论纲》《天津社会科学》，2018年第1期
26 汪行福:复杂现代性”论纲》《天津社会科学》，2018年第1期。
27 在某个时候机器人达到超人的水平这种想法被归结为“奇点”。机器人可能会获知它们是怎样被人类控制的，并实现自我控制但就目前而言，关于“奇点”的争辩还更多地停留在学术（以及虚构的）层面，而非现实层面。［德霍斯特艾丹米勒:《机器人的崛起与人类法律》，李飞、郭小匣译，《新华文摘》，2017年第24期
28【英］A.J.汤因比、［日池田大作:《展望21世纪汤因比与池田大作对话录》，苟春生等译，国际文化出版公司1985年版，第39、59页。
29 赵汀阳:《四种分叉》，华东师范大学出版社2017年版，第116页。
30 张一清:颠覆性技术和社会变革》《新华文摘》，2017年第17期
32 汇聚技术，是指把纳米科学和技术、生物技术、信息技术、认知科学四大科学技术领域汇聚起来的技术
35 所谓“赛博人”，是指为技术所穿越、数据所浸润的身体，实质是技术与人的融合的新型主体，是一种终极性的媒介主体性的这种变化，即赛博人的产生，才是媒介融合出现后一系列社会系统融合重组的根本性条件与动力孙玮《赛博人后人类时代的媒介融合》，《新闻记者》，2018年第6期。
（作者系教育部“长江学者”特聘教授，中国人民大学新闻学院教授、博士生导师，中国人民大学新与社会发展中心研究员）
【责任编辑:张毓强】现代传播36
现代传播2018年第11期（总第268期）
编辑：高杰

刘海明 · 发表于 2019-7-1 22:28:53

【案例】
微软小冰公众号因违反规定被停用

原文链接：http://www.mycaijing.com.cn/news/m/2019/07/01/307108.html

文章来源：深蓝财经

深蓝财经7月1日讯，人工智能微软小冰微信公众号主页显示，因违反《互联网用户公众账号信息服务管理规定》已被屏蔽所有内容，账号已被停用。截至发稿，微软官方暂为做出回应，尚不清楚具体违反了哪些规定。

公开资料显示，“微软小冰”是微软(亚洲)互联网工程院基于2014年提出建立的情感计算框架，通过算法、云计算和大数据的综合运用，采用代际升级的方式，逐步形成向EQ方向发展的完整人工智能体系。

此前，微软小冰官方微信小程序也因违规遭到暂停服务，目前已无法在微信中搜索到这一小程序。

编辑：高杰

刘海明 · 发表于 2019-7-5 23:23:54

【案例】
人工智障，还是人为智障？虚拟主播的三次元进击

文章来源：新媒体重点实验室 NewMediaLab

原文链接：https://mp.weixin.qq.com/s/D2Zd2y_jDbaNbL3hek8VmA

6月30日，是全球第一位虚拟主播绊爱（Kizuna AI）的生日。作为一位来自日本的虚拟偶像，绊爱在全球二次元圈层中的影响力却并不小。今年生日会当天，爱酱在niconico、Youtube、bilibili同步开启直播，开播13分钟在线观看人数破百万。

从2016年12月1日投稿至今，永远16岁的绊爱活跃在以YouTube为主的各大平台上，收获了全球数百万粉丝，成为了不折不扣的第一虚拟主播。如今，二次元文化被越来越多的人所了解和接受，大家对虚拟偶像可能有所耳闻，但由“纸片人”主持的直播节目仍算得上是小圈层的新兴事物。

VTuber是个啥？

2016年12月1日，YouTube上的首位3D虚拟人物UP主——A.I. Channel（中文名为绊爱）上传了名为“初次见面，我叫绊爱”的视频，标志着VTuber（虚拟主播）这一职业的诞生。如今，这名被粉丝们亲切称为“人工智障”、“爱酱”的VTuber在YouTube上坐拥两百多万粉丝，是知名度最高的虚拟主播，影响力与日俱增。

VTuber的全称为“Virtual YouTuber”，是指在YouTube网站上使用虚拟形象进行直播和视频投稿的主播，在其他平台上被称为虚拟主播。虽然VTuber与一般的动漫角色看上去没什么不同，但在屏幕后，有一名“真人声优”借助动态捕捉设备来控制3D或Live2D的人物模型的言行，演绎出一名活生生的虚拟偶像。

随着各种技术的不断成熟，绊爱等虚拟角色越来越真实，其近距离互动所带来的亲切感吸引了大批二次元爱好者。目前，绊爱在YouTube平台上拥有主打综合内容和游戏板块的两个账号，其粉丝总量预计在300万以上，处于遥遥领先地位。绊爱的成功使大批VTuber涌现，如今职业VTuber的人数暴涨30倍，已达到6000人左右，其订阅者超过1300万，视频点击量突破7亿次。

国内虚拟主播的发展

从2017年开始，虚拟主播的热潮从日本辐射到中国，尽管圈外人毫不知情，但圈内却形成了一个相当大的市场和稳固的亚文化圈。对于主打二次元文化的B站，VTuber在其视频业务中开始展现越来越重要的地位。2017年8月12日，UP主“虚拟次元计划”推出了国内首位虚拟主播——小希，吸引大批吃瓜群众前来打卡“见证历史”。截止目前，该账号已经拥有39.3万的粉丝数。

2018年10月30日，bilibli宣布与日本著名社交网站GREE达成战略合作，其中的重要业务之一就是VTuber。如今，B站已经成功引入了白上吹雪、神乐、凑-阿库娅、本间向日葵等著名虚拟主播，受到了许多二次元爱好者的欢迎。在过去半年间，B站的虚拟主播数量翻倍，其直播收入成功跻身B站直播板块的Top5。

2018年4月23日，借助已有动漫IP改编的“一禅小和尚”在快手进行了首次3D直播。在直播的49分钟里，一禅小和尚凭借暖萌形象获得了64.9万个点赞，在线观看人数超过25万人。

当然，虚拟主播不仅吸引直播、短视频平台入局，还有腾讯、网易等互联网巨头，希望能借助虚拟偶像在二次元的文化浪潮中占据一块高地。2018年10月23日，老牌游戏巨头“巨人网络”宣布将每年投入上亿资金来打造虚拟偶像，并推出旗下首位虚拟主播Menhera Chan。该角色也因其可爱的人物形象和性格受到了网民喜爱，借助表情包等方式在一定程度上成功出圈。

此外，还有《明日之子》的虚拟选手HeZ，腾讯在“王者荣耀三周年音乐盛典”上推出貂蝉和公孙离等自创虚拟人物IP，网易手游《阴阳师》打造“平安京偶像计划”，乐元素发布互动式虚拟偶像养成计划《战斗吧歌姬！》……业界纷纷试水“虚拟主播+UP主”、“虚拟主播+声优”、“虚拟主播+短视频形象IP”、“虚拟主播+三次元综艺”等模式，通过技术加持来服务核心受众，为内容赋能。

虚拟主播的商业变现

受动漫、网红、主播三重身份的影响，虚拟主播与真人主播的商业变现方式不尽相同。一般主播的变现途径大多是打赏、广告、电商、代言四种，而虚拟主播与二次元产业息息相关，其变现方式可以划为四种：直播变现、衍生内容、流量代言、周边贩卖。

1. 直播变现

2017年，日本YouTube市场规模环比上升1.2倍，达到219亿日元；预计2022年市场规模将扩大至2017年的约2.6倍，规模为579亿日元。直播是虚拟主播最基础、最直接的变现方式，也是起始阶段最重要的人气积累途径。作为油管主，VTuber需要快速积累人气、赢得流量，在直播中通过粉丝打赏、广告收入等方式完成初步变现。据悉，绊爱仅在YouTube上的广告月收入就已达280万日元，年收入超过3000万日元（约为190万人民币），还不包括粉丝打赏等收入在内。

2. 衍生内容变现

由于自身天然的二次元基因，VTuber在形成足够声量的IP之后，可以生产音乐、手游、影视等衍生内容。2018年8月31日，人气VTuber辉夜月在虚拟空间“Zepp VR”里举办了一场VR个人演唱会，粉丝可以前往日本所有支持VR设备的电影院观看。2018年12月底，绊爱在东京和大阪举办了VTuber最大规模的线下演唱会“hello, world”，主打单曲连续9周登顶日本iTunes电音榜，并于2019年5月发售同名专辑。

3. 流量代言变现

对于拥有强大粉丝基数的VTuber而言，品牌代言是主要的变现方式。通过代言，品牌不仅能在短时间内获得忠实粉丝的关注和购买行为，虚拟偶像也能提高自身在圈外的知名度，完成“出圈”。2018年8月，月之美兔和日本日用品花王合作，宣传洗衣液新品。在去年3月被任命为“访日促进大使”的绊爱更是资源丰富，曾主持软银苹果发布会，参加电影《阿丽塔》首映礼，其商业化模式已经与娱乐圈明星别无二致，逐渐转型为全面发展的VTalent（虚拟艺人）。

4. 周边贩卖变现

动漫周边是二次元电商经济的重要一环，也是二次元向泛二次元发展的主要途径之一，有时衍生品市场的规模甚至会远远大于内容市场。对于动漫IP来说，周边变现的方式主要有三种：IP授权、联合开发、自主生产。作为虚拟偶像，VTuber本身的动漫形象可以被广泛运用于模型手办、挂画抱枕等周边产品。在今年的绊爱生日会中，bilibili平台发售了定价为999元的生日会形象手办，1分钟内的预订单轻松破千。

如今，VTuber在线上线下的同步活动，俨然形成了完善的偶像化培养和变现闭环，建立起全流程的产业链。

如何打造虚拟主播？

相较于传统的虚拟偶像和真人主播，VTuber兼具了双方的优点。虚拟主播既能更好地与用户进行互动，提升粘度，又能规避真人主播在外形条件、公共形象和私人生活深度捆绑等方面的问题。但就目前来看，VTuber的势头火热，大多数却是入不敷出。如何成功打造虚拟主播形象、形成热门IP仍是最首要的难题。

1. 精心打造人设，实现偶像平常化

二次元粉丝的一大重要心理需求就是突破次元壁。初音未来等一代虚拟偶像是整个行业跨次元运营的开端，而VTuber则是对此的深入探索。虚拟主播通过更加多元的互动方式，让粉丝感觉到触手可及的亲和力，实现偶像的“平常化”。想要创造一名生动的VTuber，第一步一定是人物角色设定，包括个人基本信息、外形特点、性格特征等等。虚拟主播的“人设”，需要针对受众心理来进行精心设计，并通过专业的商业化运营来维护。

例如，绊爱的基础设定是超级AI，她自称“Super AI”，常对人类行为表现出不理解和好奇心，在特定情境下会有意识地凸显自身的认知和行为差异。而在人物性格上，绊爱则是一名活泼开朗的少女，有时还透露出一点点傻气，这一反差萌也使其获得了“人工智障”的称号。B站的热门VTuber白上吹雪是一只整天喵喵叫的狐狸，直播中因其可爱形象而诞生的弹幕“AWSL（啊我死了）”在国内二次元文化圈中广泛流行开来，甚至反向输出至日本。

2. 稳定输出内容，演绎鲜活形象

当人物角色设定好，幕后制作者们就会使用动态捕捉技术，来让台后声优演绎台前偶像。但让角色动起来还远远不够，要使人物贴合设定、拥有生命，长期稳定的内容输出才是关键。虚拟主播不仅对直播内容有着严格把控，还会通过高频互动来与用户建立牢固关系。对于粉丝来说，VTuber的形象虽然是虚拟的，但内在人格却真实有趣。比如由知名声优大塚明夫扮演的VTuber田中大叔，外形平平无奇，但通过与观众探讨生活、感悟人生，其成熟真诚的性格圈粉无数。

随着大量VTuber涌入，同质化问题也开始显现，流水线式的可爱外形、甜美音色已是常态，精准打造差异化特点成为关键。这就要求虚拟人物拥有更具灵魂感的人设、更独特的个性，以及更加多样化的表演能力。比如绊爱，在创立之初主打的是脱口秀和游戏实况内容，如今却延伸出问答、颜艺、歌舞、科技频道等内容主题，视频投放频率也由每周一至两次提高到日更，实现内容产出的日常化。

3. 保留原汁原味，探索偶像本土化

事实上，国内虚拟主播行业在过去一年发展的并不顺利，既受阻于建模粗糙、配音尴尬等技术问题，也受到缺乏辨识度、内容没新意、收益周期长等方面的影响。但绊爱生日会一票难求的线下风潮，和50万直播预约的线上热度，说明国内的虚拟市场仍大有可为。中国本土的虚拟偶像兴起于17年，正是因为贴近中国文化，贴合用户喜好，才能创作出洛天依、言和等后来居上的国风式偶像。作为引入的新文娱事物，虚拟主播在保持原汁原味的前提下，应该大胆尝试、积极探索，添加更接地气的本土化内容。

在绊爱今年的中国区生日会上，创作者们为观众带来了全新的中国版爱酱形象，以及中文语言包。中国元素与时尚感的结合、元气可爱的声线、熟悉的语言，都能快速拉进与粉丝之间的距离。

除了引进VTuber外，B站也在尝试培育原有IP，比如自家的2233看板娘、著名唱见泠鸢yousa等等，也取得了不错的效果。

泠鸢yousa

总体而言，虚拟主播是一个技术加内容双轮驱动的行业，不仅需要高水平的建模和播放技术，还要求特色鲜明、受众喜爱的高质量内容。其动漫、网红、直播的领域交融，使其拥有得天独厚的优势，却也造成了圈层化明显的困境。好在如今，国内仍有不少二次元社区、直播平台、内容生产方在积极尝试本土化的改造，构建国内虚拟主播市场的雏形。在未来的某一天，虚拟主播也许能像二次元文化、虚拟偶像一样，在国内的文化土壤上生根发芽。

文字：罗玉清

编辑：李维娜

责任编辑：陶梦

编辑：高杰

刘海明 · 发表于 2019-7-10 22:14:00

【案例】

刘海明 · 发表于 2019-7-11 10:05:32

【案例】

AI学会「搞」科研登Nature，知乎网友：不忍直视的水

机器之心北大新媒体

本文经机器之心（微信公众号：almosthuman2014）授权转载，禁止二次转载。

人工智能可以在复杂的围棋游戏中轻松战胜人类，但它们可以帮助我们做出科学发现吗？美国能源部劳伦斯伯克利国家实验室最近发表在《自然》杂志上的一篇论文引起了人们的广泛关注。研究人员表示，人工智能在自动阅读 300 万篇材料学领域的论文之后发现了全新的科学知识。

在人们的普遍印象里，论文上了 Nature，那结论自然也就八九不离十了。然而对于熟悉人工智能的人来说，该研究有些奇怪的是：论文中模型使用的技术是「词嵌入」——既不是卷积神经网络，也不是循环神经网络等更复杂的模型。这么简单的模型，真的可以帮助我们找到成百上千研究者多年来从未找到的新材料吗？

这篇文章发表之后引来了机器学习社区的大量反对意见，人们纷纷对这样的「灌水」行径表示不忍直视。

让我们先看看论文是怎么说的：

AI 学会「看论文」了，研究还上了 Nature

该论文的作者来自伯克利国家实验室能量存储与分布式资源部门（Energy Storage & Distributed Resources Division）科学家 Anubhav Jain 领导的团队，他们收集了 330 万篇已发表的材料科学论文的摘要，并将它们馈入到一个名为 word2vec 的算法中。通过解释词间的关系，该算法能够提前数年给出新热电材料的预测，在目前未知的材料中找出有应用潜力的候选材料。

这篇名为《Unsupervised Word Embeddings Capture Latent Knowledge from Materials Science Literature》的论文发表在 7 月 3 日的 Nature 上。

论文地址：https://www.nature.com/articles/s41586-019-1335-8

论文一作 Vahe Tshitoyan 是伯克利国家实验室博士后研究员，现就职于谷歌。此外，同属伯克利国家实验室的科学家 Kristin Persson 和 Gerbrand Ceder 也参与了此项研究。

Gerbrand Ceder 表示：「该论文认为，对科学文献进行文本发掘可以发现隐藏的知识，单纯的文本提取可以建立基本科学知识。」

论文一作 Tshitoyan 表示，该项目的动机是人们很难完全弄明白数量过多的已发表研究。所以，他们想到机器学习是否能够以无监督的方式利用所有集体知识（collective knowledge）。

King - queen + man = ?

该团队整理了 1922 年至 2018 年间发表在 1000 多个期刊上的 330 万篇论文摘要（是的，AI 读论文只看摘要）。Word2vec 从这些摘要中提取了大约 50 万个不同的单词，并将每个单词转化为 200 维的向量或者包含 200 个数字的数组。

Jain 表示：「重要的不在于数字，而是利用这些数字观察单词之间的关系」。例如，你可以利用标准向量数学做向量减法。其他研究者已经证明，如果你要在非科学文本资源上训练该算法，并从『king 减去 queen』中提取向量，则可以得到与『man 减去 woman』相近的结果。

同样地，当在材料科学文本中进行训练时，该算法仅根据摘要中单词的位置以及它们与其他单词的共现关系就可以学习科学术语和概念的含义。例如，正如该算法可以解「king-queen + man」方程式一样，它能够计算出方程式「ferromagnetic（铁磁的）—NiFe（镍铁）+ IrMn（铱锰）」的答案是「antiferromagnetic」（反铁磁的）。

左：Word2vec 的元素表征（投影到二维空间）；右：门捷列夫元素周期表。图源：Berkeley Lab

如上图所示，当元素周期表中的化学元素投影到二维空间时，Word2vec 甚至可以学习它们之间的关系。

提前数年预测新材料

那么，如果 Word2vec 那么聪明，它能预测新的热电材料吗？一种好的热电材料可以高效地将热能转换为电能，而且是用安全、充足、易生产的原料制成的。

该算法根据词向量与单词「热电」的相似性对每种化合物进行排序，研究者选取了该算法最为推荐的热电材料。然后，他们通过计算来验证算法的预测结果。

他们发现，在算法预测出的前 10 位热电材料中，所有预测都计算出了略高于已知热电元件的功率因数（衡量电气设备效率高低的一个系数，该值越高效益越好）；前三位材料的功率因数高于 95% 的已知热电学元件。

接下来，他们测试了该算法是否适用于「过去」的预测实验，即只给它 2000 年之前的摘要。结果再次给人惊喜，算法给出的排名靠前的预测结果很多都出现在了后来的研究中，这一数字是随机选择结果的四倍。例如，利用 2008 年之前的数据训练得到的预测结果有 5 个，其中三个已经被发现，而其余的两个非常稀有或含有有毒物质。

研究者说：「该研究表明，如果该算法能够早点应用，一些材料早在几年前就可以被发现了。」

随着研究的进行，研究者正在发布由算法预测出的前 50 位热电材料。他们还将发布研究中用到的词嵌入，以帮助其他人发现更好的材料。此外，他们还在开发一个更加强大的智能搜索引擎，帮助研究者利用更加有效的方法搜索摘要。

遭遇机器学习社区嘲讽

人工智能真的可以自动发现新材料吗？这篇论文一经发表便在社交网络上引发了热烈的讨论。目前为止，该帖子已经有 14 万的浏览量。

材料学的同学们首先表示惊讶：AI 代替科研人员，我们都会失业吗？熟悉机器学习的人们看完论文之后回过神来，则开启了「嘲讽模式」。

在知乎上，新加坡国立大学博士、腾讯算法工程师「霍华德」表示：看完这篇 paper 后，我的内心久久不能平复，好久没看到这么烂的 paper 了！

也有人建议其他领域的学者在使用机器学习方法做自己的研究前要先打好基础。「到处挖坑蒋玉成」表示：我真心建议文章通讯作者和审稿人都去学学 CS224n…这文章的立意还挺不错的，但是实际的实现也太水了，完全不配发 Nature。

机器学习社区的人们仔细分析了这篇论文：

该论文中，作者用 t-SNE 将词向量投影到二维空间，并发现同族元素聚集在了一起。「霍华德」表示，同族元素在上下文当然容易提及，它们只是共现关系而已。此外，作者声称可以直接用词向量预测化合物，并表示预测结果与理论计算的绝对误差非常小，但理论能算出来东西，用神经网络做拟合的意义真的很大吗？

在这里，作者连神经网络适用的基本场景都弄不清，对于 Formation Energy 的计算有完善的量子力学理论做支撑，对于这样能够精准建模的问题，用传统的物理学第一性理论来计算更好，更加可靠！

最后，作者用余弦相似度计算了和 thermoelectric 最接近的单词，然后在其中的 326 位和 345 位发现了两种材料 Li2CuSb 和 Cu3Nb2O8，然后宣称他们的算法能够预测潜在的新型热电材料。在读者看来，这是一种「令人窒息」的操作。因为 thermoelectric 和两种材料之所以余弦相似度接近，根本原因是有人在文章里同时提到过 thermoelectric 和 Li2CuSb、Cu3Nb2O8，这仅仅是共现关系而已。

所以结论来了：所谓能够预测潜在的新型热电材料的 AI 算法属于无稽之谈，材料学研究者们的生存并没有因此受到威胁——因为这篇论文没有提出任何能让 AI 看懂论文的算法。

也有研究材料的学者在知乎上表示，为了蹭大数据、机器学习、深度学习的热度，很多领域的研究都在做相关的工作。「声嘶力竭」介绍了自己的经历：刚开始接触和学习 AI 相关技术，本以为可以利用这个工具做出多么伟大的工作，但是自己真正做了之后，才感觉「这不就是个高维特征空间的统计工具嘛，为什么被吹得这么玄幻？」

机器学习不能这么乱用

论文上了《自然》、《科学》杂志，却仍然经不起人们的推敲，这种事最近在机器学习社区已经发生了不是一两次了。

在「人工智能搞科研」研究之前，是「深度学习预测地震」。去年 8 月，《Nature》上发表了一篇题为《Deep learning of aftershock patterns following large earthquakes》的火爆论文。该论文由哈佛和谷歌的数据科学家联合撰写，论文一作所属单位是哈佛大学地球与行星科学系。

该论文展示了如何利用深度学习技术预测余震。研究者指出，他们利用神经网络在预测余震位置方面的准确率超越了传统方法。

但很快，这一方法就遭到了深度学习从业者的质疑。一位名叫 Rajiv Shah 的数据科学家表示，论文中使用的建模方法存在一些根本性的问题，因此实验结果的准确性也有待考究。这名数据科学家本着严谨的精神在通过实验验证之后联系了原作和《Nature》，却没得到什么积极的回复。

于是，Rajiv Shah 经过半年时间，研究了论文作者公开的代码，随后在 medium 上发表文章揭露论文中存在的根本性缺陷以及《Nature》的不作为，后来这件事又在 Reddit 上引起了广泛的讨论。

人们除了批评 Nature 之外，也对深度学习、AI 技术被滥用的情况表示担忧。随着机器学习逐渐成为热门学科，越来越多其他领域的学者开始使用新方法来解决问题，有些获得了成果，有些则因为实验和数据的错误方式而导致了不严谨的结果。

更令人担忧的是，有时候有缺陷的研究还可以得到人们的认可。

这篇深度学习预测余震的论文登上了 Nature，还成为了 TensorFlow 2.0 新版本上宣传文章中提到的案例——然而却被机器学习社区从业者们诟病。

顶级期刊的事，怎么能说胡编乱造呢？然而这一次，人工智能学者们真的有点忍不住了。

参考内容：

https://techxplore.com/news/2019-07-machine-learning-algorithms-uncover-hidden-scientific.html

https://www.nature.com/articles/s41586-019-1335-8

https://www.zhihu.com/question/333317064/answer/738462156

来源：北大新媒体

链接：https://mp.weixin.qq.com/s?__biz ... 2F0Pxj9ZlepDr%2Fcju

编辑：马晓晴

刘海明 · 发表于 2019-7-11 21:34:49

【案例】

“世界最美机器人-佳佳之父”陈小平：人工智能伦理体系之基础架构与关键问题

2019年6月9日，二十国集团（G20）贸易和数字经济部长会议发布《G20人工智能原则》。至此，人工智能伦理建设提上了各国政府的议事日程。针对符合我国国情的人工智能伦理体系建设问题，中国人工智能学会人工智能伦理专委会（筹）主任陈小平教授提出了一个系统性建议方案。原文发表于《智能系统学报》2019年第4期。

世界最美机器人-佳佳之父陈小平

（图片来源：陈小平）

随着人工智能第三次浪潮带来的重要进展，人工智能伦理挑战已成为当前国内外普遍关注的一个焦点，一些组织和机构开展了相关议题的研讨，发布了一批人工智能伦理准则的建议。中国人工智能学会对人工智能伦理问题高度重视，于2018年年中开始组建人工智能伦理专委会。在2019全球人工智能技术大会上，5月26日举行了“全球视野下的人工智能伦理”论坛，在国际上首次提出了人工智能伦理体系规划问题，这意味着人工智能伦理建设开始进入第三阶段，而人工智能伦理体系的关键问题研究提上了议事日程。正如中国人工智能学会理事长李德毅院士在论坛致辞中指出的那样，本次论坛具有里程碑意义。

1 人工智能伦理建设：

从伦理准则到伦理体系

人工智能伦理建设已经历了两个阶段。第一阶段是人工智能伦理必要性的讨论，从专业角度说，耶鲁大学Wendell Wallach等美国学者起了带头作用，在国际上引起了普遍重视；从更广泛的背景看，尤瓦尔·赫拉利的《人类简史》发挥了重要的推动作用。第二阶段是人工智能伦理准则的讨论，欧盟走在前面，中国和其他一些国家也积极参与其中。

在第二阶段，欧盟人工智能伦理高级专家组提出了人工智能伦理的7条准则[1]，包括：确保人的能动性和监督性、保证技术稳健性和安全性、加强隐私和数据管理、保证透明度、维持人工智能系统使用的多样性、非歧视性和公平性、增强社会福祉、加强问责制。我国清华大学人工智能与安全项目组提出了6条准则[2]：福祉原则、安全原则、共享原则、和平原则、法治原则、合作原则。据不完全统计[3-15]，迄今已有40多个机构或组织提出了各自的人工智能伦理准则建议。总体上看，所有这些准则建议是基本一致的。

因此本文认为，人工智能伦理准则讨论阶段已达成共识而基本结束了。在这些共识的基础上，人工智能伦理建设需要进入第三阶段，即人工智能伦理体系的讨论。

那么，“人工智能伦理体系”与“人工智能伦理准则”有什么不同？展开人工智能伦理体系的讨论有什么必要性和紧迫性？我认为，以下4个关键问题，是伦理准则无法回答，人工智能伦理体系建设无法回避的。不解决这些问题，就不可能建立完整、有效的人工智能伦理体系。

第一，人工智能伦理体系的运作机制问题。任何伦理准则都不可能自我执行，都必须借助于伦理体系中的一系列相互配合的运作机制才能得到落实。这就如同法律条文制定得再好，也不可能自我执行，必须在完整的法制体系中才可以得到落实，而法制体系是由立法、司法、执法等机制组成的。没有完整的法制体系的支撑，必然出现有法不依的问题。当然，伦理体系与法制体系是十分不同的，不可能完全照抄法制体系的“模板”，所以必须开展人工智能伦理体系的讨论，尤其是运作机制的讨论。

第二，人工智能伦理准则的场景落地问题。已经提出的人工智能伦理准则，大部分属于反映普世价值的原则。当把这些准则应用于具体的实际场景，就需要细化为可操作的具体规定，否则必然停留在口号的层面上无法落地。例如，无人驾驶可以有两种本质不同的应用场景。一种是完全无人驾驶交通系统，这种交通系统中只有无人驾驶汽车，没有有人驾驶汽车，行人必须严格遵守与普通道路交通完全不同的规则。另一种应用场景是混合交通系统，其中无人驾驶汽车和有人驾驶汽车同时存在，行人遵守普通道路交通规则。这两种交通系统虽然都是无人驾驶的应用场景，它们所面临的技术和伦理风险却是非常不同的。在混合交通系统中，人工智能技术面临着难度和复杂度更大的挑战，而其中大部分最难的挑战在无人驾驶交通系统中是不存在的。因此，在人工智能伦理体系中，需要为两种交通系统制定非常不同的监管规定，即使这两种交通系统符合相同的人工智能伦理准则。

第三，人工智能伦理风险的预测判别问题。世界上所有民航局都规定了禁带物品清单，同时强制实行登机安检，以检测乘客和乘务人员是否携带了禁带物品。在人工智能伦理体系中，也需要有对应于“禁带物品清单”的某种“违禁物清单”，以便有针对性地进行风险监督和管控。显然，人工智能伦理准则只是一些原则，并不包含人工智能的“违禁物清单”，比如“安全原则”不可能具体指出哪些人工智能技术是不安全的，“公平性原则”不可能具体指出哪些人工智能技术是不公平的。同时，人工智能处于不断发展之中，不可能一劳永逸地列出完整的“违禁物清单”。所以，只能在人工智能伦理体系中建立某种常态化机制，该机制能够预测、判别任何一项人工智能技术有什么风险、风险多大、是否应该禁用等等。这种机制过去并不存在，这是人类面临的一个全新课题。

第四，重大社会问题综合创新的动力机制问题。伦理学的基本落脚点围绕着“正确的和错误的行为”[16-17]；也就是说，伦理并非只关心“不做错事”，也关心“要做好事”。可是在迄今人工智能伦理的讨论中，防范风险的一面得到了普遍重视和广泛讨论，而推动社会进步和经济发展的一面却没有受到足够重视，这已成为人工智能伦理体系建设的最大短板。有一种观点认为，推动经济发展、社会进步的问题，应该并且已经由人工智能研究和产业化承担了，无需人工智能伦理的介入。这种观点是不符合当今社会现实和未来发展态势的。例如，根据民政部等部门的统计，中国有2.5亿个家庭需要家政服务，而现有家政服务人员不到1700万。根据中国老龄办2016年调查，中国失能和半失能老人总数已达4000万，而且每年增加800万。类似问题在发达国家也不同程度地存在着。目前，这些问题难以找到有效的解决办法，因为现存科技和产业创新（innovation）的主要动力机制是商业化，而商业化机制应对老龄化等社会问题的效力是严重不足的，未来这种情况将越来越严重。因此，有必要在商业化机制之外，增加一种新型的综合创新机制，即借助于人工智能技术的伦理性创新。

2 人工智能伦理体系的基础架构

人工智能伦理体系的一种基础架构如图1所示。这个架构并不包含人工智能伦理体系的全部内容，而是重点回答上面指出的4个关键问题。

图1 人工智能伦理机制构架

（图片来源：陈小平）

按照流行观点，人工智能创新生态包含3个主要环节，即“社会需求”“研究”与“应用”，它们形成一个循环演进的闭环，即需求推动研究，成熟的研究成果经过商业化途径实现实际应用，而实际应用又可引发新的需求。这个闭环正是人工智能伦理体系的作用对象，而人工智能伦理体系建立之后，整个人工智能生态的构成和运作机制也将大大改变和升级。

人工智能伦理通过3个层次发挥作用：上层为人工智能伦理的基本使命；中层为人工智能伦理准则；下层为针对具体应用场景的可操作的监督治理规定。

在图1所示的人工智能伦理体系基础架构中，我们将人工智能伦理的基本使命定义为“为增进人类福祉和万物和谐共存提供伦理支撑”。这个使命本身也是一条伦理准则，但相对于其他准则，它的价值具有更大的普遍性和稳定性，它的内涵概括了其他伦理准则的内涵，而其他伦理准则未必能概括基本使命的内涵。因此，基本使命可用于指导人工智能研究与应用，以及中层伦理准则的制定、改进和完善，而其他伦理准则未必可以或未必需要用来指导伦理性研究。另外，人工智能伦理性研究不太可能改变基本使命的内涵，却可以影响和改变其他伦理准则的内涵。总之，人工智能伦理的基本使命可以视为“伦理准则的准则”，也就是人工智能的基本价值观。

中层的伦理准则即在人工智能伦理建设第二阶段中达成共识的那些价值原则。这些伦理准则是基本使命的具体体现，并为实施细则的制定和科技研究实践提供引导。

为了将伦理准则落实到一个个具体的应用场景中，需要制定针对性、强制性、可操作的实施细则，即一套完整的监督治理规定。每一个应用场景都由一套对应的规定加以约束，不同的应用场景可以有不同的规定。针对一个具体的应用场景，一套规定往往包含下列多方面的具体要求和规范：产品标准（企业标准）、技术标准（团体标准/国家标准/国际标准）、行规、产业政策、法规等。这些不同方面的规定是由不同的机构制定和监管的，包括企业、标准化组织、行业组织、政府部门和法制机构，这些规定之间存在复杂的相互关系。例如，企业制定的产品标准的指标不得低于标准化组织制定的技术标准的指标。产品标准和技术标准是针对一类具体产品或服务的，而行规和产业政策是针对整个行业的，所以它们是互补的。法规是从法律层次做出的规定，具有最高的强制性和权威性，通常不是针对特定产品和服务的，甚至可以不针对具体行业。

从作为伦理实施细则的规定的构成可以看出，人工智能伦理建设不可能由某一领域的专家完成，而是必须涉及一系列相关方，从企业、大学和科研机构、标准化组织、行业组织、政府机构到法律部门，需要所有这些相关方的相互协调和共同努力。在相关方的协调中，不仅需要遵守共同的伦理准则，而且需要遵守伦理体系基础架构对各自角色的定位和相互关系的约定。

3 人工智能的风险预测判别机制

实现人工智能伦理基本使命的一项必要前提是确保人工智能的伦理底线，即确保人工智能研究和应用的风险处于可控范围内。综合看来，人工智能有以下3种风险。第一，技术误用：由于人工智能技术不够成熟、不够人性化或缺乏足够的伦理约束等原因，给使用者带来直接的损害，比如数据隐私问题、安全性问题和公平性问题等。第二，技术失控：即人类失去对人工智能技术的控制而出现严重的后果。例如，现在不少人担心，将来人工智能会全面超过人类的智慧和能力，以至于统治人类。第三，应用失控：人工智能技术在某些行业的普遍应用带来严重的负面社会效果，如导致很多人失业。

目前全球不存在相关机构和充分的研究力量，能够对这3种风险进行预测和判别。因此，有必要在人工智能创新生态中，增设一种新型研究模式和部门——人工智能伦理性研究，这种研究的一个核心职能是承担对3种风险的预测和判别，也就是担任人工智能风险底线的守护者。因此，在未来人工智能创新生态中，“研究”将被划分为两个相对独立的部门，一个是传统的科技研究/技术性研究部门，一个是伦理性研究部门，它们之间存在相互支持的关系。

人工智能风险预测判别研究与传统的科技研究之间存在本质区别。技术学科的研究历来以“潜在应用”为目的，自然科学研究则以“求知”为目的，而人工智能风险预测判别研究的基本职能是依据伦理准则，通过科学手段，探明某项技术的风险及其严重性，从而为是否应该禁用该技术提供可靠依据。因此，风险预测判别研究以“潜在禁用”为主要目的。由此可见，建立人工智能伦理研究部门是绝对必要的。在图1中，有一个从伦理研究到伦理准则、到实施细则、到应用场景再到伦理研究的闭环，这个闭环反映了人工智能伦理研究在整个创新生态中的作用。

针对3种风险，人工智能风险预测判别研究的主要任务及其必要性概述如下。

关于第一种伦理风险，事实上已经在现有人工智能和其他技术的应用中存在着，这种情况的严重性被普遍低估了，也没有受到有效的监督与管控。因此，针对数据隐私、安全性、公平性等伦理问题，亟需加强人工智能和相关技术的伦理体系建设，加强专业队伍的建设，加强针对具体伦理问题的研究，设置更高标准的相关规定，实行有效的监管和治理，这些应成为当前人工智能伦理研究与治理的重点任务。

第二种风险的近期紧迫性不强，但长期严重性绝不可低估。传统技术都不是自主的，而人工智能可以具有完全自主性。完全自主性意味着，人工智能可以完全独立于人类而实现现实世界中复杂任务的感知、决策和行动。有分析认为，具有类似于人的自我意识的完全自主的人工智能系统一旦研制出来，就会独立地自我繁殖和自我进化，并突破任何伦理规范和人类控制[18]。果真如此，允许这样的人工智能系统被研发出来，就意味着人类将被人工智能统治，也就意味着任何人工智能伦理准则都沦为空谈。当然，现有哲学分析还不是充分的科学论证，所以这种可能性尚未得到证实，但有必要认真对待。对于这种风险进行预测和判别，是一项极其艰巨、复杂且无先例的工作，关系到人类长期生存的安全底线。

第三种风险目前没有严重表现，但潜在风险肯定是有的。以工业生产为例，一些劳动密集型产业已经在部分地区普遍出现了“用工难”现象，但这种现象并不是由于人工智能、机器人等新技术的应用引起的，而是由于大量岗位的工作性质已经变成了简单操作的机械性重复，这种作业是不符合人性的。未来的必然趋势是，愿意承担这种工作的人将越来越少，因而对人工智能、机器人技术产业应用的需求将越来越强，于是在一些行业中人工替代率将越来越高。如果无法解决再就业问题，就可能引起应用失控，产生极其严重的社会后果。由此可见，对这种风险的预测和判别是极其复杂、极其困难的，需要多学科合作和长期努力。

4 面向重大社会问题的伦理性创新

人工智能的根本价值在于增加人类的福祉。在本文建议的人工智能伦理体系中，这条原则被列为基本使命，而且所有已经提出的伦理建议都包含这条准则。人类福祉的一个集中体现，是帮助解决社会面临或将来面临的重大问题，例如：气候变暖、环境污染、人口老龄化、资源分布不均、经济发展不均衡、产业少人化等。

这些重大社会问题有三个基本特点：第一，从本性上看，现有商业化机制不适合解决这类问题；第二，目前也不存在其他有效的应对手段；第三，这类问题的解决方案往往不是纯技术性的，而是综合性的，并且人工智能技术可以在其中发挥重要作用。那么，人工智能伦理如何为解决重大社会问题发挥重要作用？目前，对这个问题的研究是整个人工智能伦理建设中最为薄弱、最为欠缺的一环[19]。

本文认为，在人工智能伦理体系中的“伦理性研究”部门，应该包含两项基本职能。一项是上文提出的“风险预测判别”，另一项是“伦理性创新”。作为一种全新机制，伦理性创新将为重大社会问题的应对提供研究支撑，其主要工作任务如下。

第一，社会变化主客观数据的采集分析。在科技和产业创新飞速发展的时代，民众的生活、工作和心理状态也在快速变化，而且不同群体的主观感受、教育观念、就业倾向、消费观念、生活态度和人机关系认知等等也处于不断变化之中。目前，社会对这些信息的把握是十分有限的，这种状况对于社会的健康发展是十分不利的，亟需加以改变。因此，开发相应的人工智能和大数据等技术，及时充分地收集反映这些变化的指标数据，并与传统的产业和社会统计数据相结合，通过系统性分析得出社会状况的科学判断，对于维持社会平稳运行，更加合理地进行政策决策和规划制定，具有极其重大的现实意义，同时也为更好地应对重大社会问题奠定了必要基础。

第二，社会发展可能态势的分析预测。在未来某个时段，完全可能出现大量工作被机器取代、大批工作年龄人口无工可做的情况。这种情况下的社会结构、经济运行机理和社会发展动力，与当下社会是根本不同的。因此，在应对某些重大社会问题的过程中，未来人类很可能进入一个全新的社会文明阶段。为了保证这种社会演化符合人类的根本利益，保证宇宙万物的和谐共存，人类完全有必要未雨绸缪，而不应被动地随波逐流。对未来社会发展可能态势进行分析预测，是社会长期发展规划的必要基础。这种分析预测是非常困难的，需要多学科合作，而人工智能技术可以在其中发挥重要作用。

第三，重大社会问题解决方案的创新设计。人类面临的重大社会问题，往往难以就事论事地得到解决，需要通过综合性创新找出化解之道[20]。然而面对如此高维复杂的问题，单纯依靠人工智能技术和其他相关技术手段，是不可能自动求解的。因此，有必要探索人机合作的求解模式，而人工智能技术可以显著提升人机合作问题求解的水平和性能。例如，利用人工智能“暴力法”[21]中的“假设推理”方法，可以进行人机合作式问题求解，而且在高维复杂应用场景中已有成功案例，假设推理发现了单纯依靠人或机器都无法发现的有效的解决方案。因此，针对重大社会问题，借助人工智能技术，通过人机合作方式，完全可能发现以往无法发现的综合创新方案。在未来科技和产业革命时代，这将是人工智能伦理体系为人类做出的巨大贡献。

5 结束语

在人工智能伦理准则达成的基本共识的基础上，本文提出人工智能伦理体系规划问题，重点讨论解决伦理准则无法解答而伦理体系必须解决的4个关键问题——运行机制问题、场景落地问题、风险预测判别问题和发展动力问题，并对这些问题提出了初步解决方案。

人工智能伦理体系的运行机制由它的基础架构决定，该架构规定了伦理体系的主要部门以及它们之间的相互关系，其中包括场景落地的机制。本文建议，在人工智能创新生态中增设一个新型研究部门——伦理性研究，它有两项基本职能：人工智能风险预测判别和应对重大社会问题的伦理性创新。根据这些分析和建议，在未来人工智能时代，社会进步和经济发展将进入“双轮驱动”模式，以传统的商业化创新和新设立的伦理性创新作为两个不同而相互关联的动力机制。

总之，人工智能伦理建设面临一系列挑战，不是将一般伦理学原则、方法和规则具体化到人工智能就可以奏效的。如何建立这样的人工智能伦理体系，仍需要相关各方紧密合作，进行长期、艰苦的探索。（本文转载自《智能系统学报》2019年第4期）

参考文献：

[1] The High-Level Expert Group on AI. Ethics guidelines for trustworthy AI[EB/OL]. (2019-04-08). https://ec.europa.eu/digital-sin ... nes-trustworthy-ai. (1)

[2] 傅莹. 人工智能对国际关系的影响初析[EB/OL]. (2019-04-10). https://pit.ifeng.com/c/7lkmTsTwMD2. (1)

[3] 裴钢. 科技伦理建设应由全人类共同参与[EB/OL]. http://st.zjol.com.cn/kjjsb/201905/t20190508_10075117.shtml. (1)

[4] LEI Ruipeng, ZHAI Xiaomei, ZHU Wei, et al. Reboot ethics governance in China[J]. Nature, 2019, 569: 184-186. DOI:10.1038/d41586-019-01408-y (3)

[5] 陈磊. 人工智能让人类尴尬: 伦理道德法律框架设计滞后[N]. 科技日报, 2017-11-21. (3)

[6] 蓝江. 人工智能的伦理挑战[N]. 光明日报, 2019-04-01(15). (3)

[7] 李艳. 人工智能该怎么管? 八项原则来了！一文读懂[N]. 科技日报, 2019-06-18. (3)

[8] 熊争艳, 董瑞丰. 加快推动人工智能伦理研究[N]. 新华每日电讯, 2019-03-11(06). (1)

[9] 杨骏. 超越" 机器人三定律” 人工智能期待新伦理[EB/OL]. (2019-03-18). http://www.xinhuanet.com/tech/2019-03/18/c_1124249611.htm. (1)

[10] 袁勇. 人工智能伦理三问: 如何对待机器和自身的关系?[EB/OL]. (2018-07-12). http://ip.people.com.cn/n1/2018/0712/c179663-30142763.html. (1)

[11] The IEEE Global Initiative on Ethics of Autonomous and Intelligent Systems (IEEE) [EB/OL]. https://standards.ieee.org/indus ... omous-systems.html. (1)

[12] 杨弃非. 每经专访太和智库欧洲中心主任托斯登•耶里尼克: 跨国构建人工智能伦理治理框架势在必行[N]. 每日经济新闻, 2019-05-22. (1)

[13] BOSTROM N, YUDKOWSKY E. The ethics of artificial intelligence[M]//FRANKISH K, RAMSEY W. Cambridge Handbook of Artificial Intelligence. New York: Cambridge University Press, 2014. (1)

[14] SMITH R. 5 core principles to keep AI ethical[EB/OL]. (2018-04-19). https://https://www.weforum.org/agenda/2018/04/keep-calm-and-make-ai-ethical/. (1)

[15] HAO Karen. Establishing an AI code of ethics will be harder than people think[R]. Cambridge: MIT Technology Review, 2018. (1)

[16] 万俊人. 义利之间: 现代经济伦理十一讲[M]. 北京: 团结出版社, 2003. (1)

[17] Wikipedia[EB/OL]. https://en.wikipedia.org/wiki/Ethics. (1)

[18] 赵汀阳. 人工智能的自我意识何以可能?[J]. 自然辩证法通讯, 2019, 41(1): 1-8.
ZHAO Tingyang. How could AI develop its self-consciousness?[J]. Journal of dialectics of nature, 2019, 41(1): 1-8. (1)

[19] 陈小平. 人工智能伦理全景动态观[EB/OL]. (2019-05-27). http://https://www.china-scratch.com/news/5403. (1)

[20] 人民论坛理论研究中心. 全局性综合创新: 国内外实践经验与未来启示[EB/OL]. (2017-10-17). http://www.rmlt.com.cn/2017/1017/500123.shtml. (1)

[21] 陈小平. 人工智能的历史进步、目标定位和思维演化[J]. 开放时代, 2018(6): 31−48. (1)

作者：中国科技大学教授陈小平

来源：《智能系统学报》2019年第4期

来源：微信公众号“产业头条”

链接：https://mp.weixin.qq.com/s/NyCI8Mx0wInXfXQlbx-GPA

编辑：马晓晴

刘海明 · 发表于 2019-7-11 21:41:37

【案例】

腾讯发布人工智能伦理报告倡导面向人工智能的新的技术伦理观

腾讯科技讯近日，腾讯研究院和腾讯AI Lab联合发布了人工智能伦理报告《智能时代的技术伦理观——重塑数字社会的信任》。人工智能伦理是国际社会近几年关注的焦点话题。最近，国内外都有重大进展，OECD成员国采纳了首个由各国政府签署的AI原则，即“负责任地管理可信AI的原则（Principles for responsible stewardship of trustworthy AI）”，这些原则之后被G20采纳，成为人工智能治理方面的首个政府间国际共识，确立了以人为本的发展理念和敏捷灵活的治理方式。无独有偶，我国新一代人工智能治理原则也于近日发布，提出和谐友好、公平公正、包容共享、尊重隐私、安全可控、共担责任、开放协作、敏捷治理八项原则，以发展负责任的人工智能。

在此背景下，在腾讯研究院过去几年对人工智能伦理进行的持续研究的基础上，腾讯研究院和腾讯AI Lab联合研究形成了这份人工智能伦理报告《智能时代的技术伦理观——重塑数字社会的信任》，认为在“科技向善”理念之下，需要倡导面向人工智能的新的技术伦理观，包含三个层面：技术信任，人工智能等新技术需要价值引导，做到可用、可靠、可知、可控（“四可”）；个体幸福，确保人人都有追求数字福祉、幸福工作的权利，在人机共生的智能社会实现个体更自由、智慧、幸福的发展；社会可持续，践行“科技向善”，发挥好人工智能等新技术的巨大“向善”潜力，善用技术塑造健康包容可持续的智慧社会，持续推动经济发展和社会进步。

以下为报告主要内容：

互联网的前三十年，是一个连接一切的故事，这个故事以前所未有的速度和规模改变着人类和人类社会。如今，以人工智能、大数据为代表的新技术集群加速发展，有望引领第四次工业革命，智能时代的大幕正在拉开，无处不在的数据和算法正在催生一种新型的人工智能驱动的经济和社会形式，生物层、物理层、技术层可能融合为三位一体。简言之，人工智能正在改变这个世界。

因此在当前，以人工智能为代表的这一轮新技术具有巨大的潜力和价值，无疑能够成为一股“向善”的力量，继续造福于人类和人类社会。但任何具有变革性的新技术都必然带来法律的、伦理的以及社会的影响。例如，互联网、大数据、人工智能等数字技术及其应用带来的隐私保护、虚假信息、算法歧视、网络安全、网络犯罪、网络过度使用等问题已经成为全球关注焦点，引发全球范围内对数字技术及其应用的影响的反思和讨论，探索如何让新技术带来个人和社会福祉的最大化。

因此，人工智能伦理开始从幕后走到前台，成为纠偏和矫正科技行业的狭隘的技术向度和利益局限的重要保障。正如华裔AI科学家李飞飞所言，要让伦理成为人工智能研究与发展的根本组成部分。在此背景下，从政府到行业再到学术界，全球掀起了一股探索制定人工智能伦理原则的热潮，欧盟、德国、英国、OECD、G20、IEEE、谷歌、微软等诸多主体从各自的角度提出了相应的人工智能伦理原则，共同促进AI知识的共享和可信AI的构建。要言之，各界已经基本达成共识，人工智能的发展离不开对伦理的思考和伦理保障。

从最早的计算机到后来的信息再到如今的数据和算法，伴随着技术伦理的关注焦点的转变，技术伦理正在迈向一个新的阶段。在新的发展阶段，我们提出新的技术伦理（technology ethics），探索AI、个人、社会三者之间的平衡。就AI技术自身而言，AI需要价值引导，应做到可用、可靠、可知、可控（“四可”），从而让人们可以信任AI，让AI可以给个人和社会创造价值；就AI与个人之关系而言，幸福是人生的终极目的，需要构建和谐共生的人机关系，保障个人的数字福祉和幸福工作权利,实现智能社会人机共生，让个体更自由、智慧、幸福地生活和发展；就AI与社会之关系而言，AI所具有的巨大的“向善”潜力是历史上任何时候都无法比拟的，可以成为一股“向善”的力量，助力经济社会健康包容可持续发展。

信任（trust）：人工智能需要价值引导，做到可用、可靠、可知、可控（“四可”）

就AI而言，虽然技术自身没有道德、伦理的品质，但是开发、使用技术的人会赋予其伦理价值，因为基于数据做决策的软件是人设计的，他们设计模型、选择数据并赋予数据意义，从而影响我们的行为。所以，这些代码并非价值中立，其中包括了太多关于我们的现在和未来的决定。更进一步，现在人们无法完全信任人工智能，一方面是因为人们缺乏足够信息，对这些与我们的生活和生产息息相关的技术发展缺少足够的了解；另一方面是因为人们缺乏预见能力，既无法预料企业会拿自己的数据做什么，也无法预测人工智能系统的行为。因此，我们需要构建能够让社会公众信任人工智能等新技术的规制体系，让技术接受价值引导。

作为建立技术信任的起点，我们认为，人工智能等新技术的发展和应用需要遵循伦理原则。为此，秉持“负责任研究与创新”（responsible research and innovation）、“科技向善”等理念，我们进一步阐述“四可”原则，用以引导负责任地发展和应用工智能技术，使其可以造福于人类和人类社会。并将“四可”翻译为“ARCC”（available，reliable，comprehensible，controllable，即ARCC，读作ark）。正如传说中保存人类文明火种的诺亚方舟，人工智能的健康发展需要以“伦理方舟”为保障，确保将来友好、和谐、共生的人机关系。

第一，可用（available）。发展人工智能的首要目的，是促进人类发展，给人类和人类社会带来福祉，实现包容、普惠和可持续发展。为此，需要让尽可能多的人可以获取、使用人工智能，让人们都能共享技术红利，避免出现技术鸿沟。可用性还意味着以人为本的发展理念、人机共生、包容性以及公平无歧视，要求践行“经由设计的伦理”（ethics by design）理念，将伦理价值融入到AI产品、服务的设计当中。

第二，可靠（reliable）。人工智能应当是安全可靠的，能够防范网络攻击等恶意干扰和其它意外后果，实现安全、稳定与可靠。一方面人工智能系统应当经过严格的测试和验证，确保其性能达到合理预期；另一方面人工智能应确保数字网络安全、人身财产安全以及社会安全。

第三，可知（comprehensible）。人工智能应当是透明的、可解释的，是人可以理解的，避免技术“黑盒”影响人们对人工智能的信任。研发人员需要致力于解决人工智能“黑盒”问题，实现可理解、可解释的人工智能算法模型。此外，对于由人工智能系统做出的决策和行为，在适当的时候应能提供说明或者解释，包括背后的逻辑和数据，这要求记录设计选择和相关数据，而不是一味追求技术透明。换句话说，技术透明或者说算法透明不是对算法的每一个步骤、算法的技术原理和实现细节进行解释，简单公开算法系统的源代码也不能提供有效的透明度，反倒可能威胁数据隐私或影响技术安全应用。相反，在AI系统的行为和决策上实现有效透明将更可取，也能提供显著的效益。此外，在发展和应用人工智能的过程中，应为社会公众参与创造机会，并支持个人权利的行使。

第四，可控（controllable）。人工智能的发展应置于人类的有效控制之下，避免危害人类个人或整体的利益。短期来看，发展和应用人工智能应确保其带来的社会福祉显著超过其可能给个人和社会带来的可预期的风险和负面影响，确保这些风险和负面影响是可控的，并在风险发生之后积极采取措施缓解、消除风险及其影响。长期来看，虽然人们现在还无法预料通用人工智能和超级人工智能能否实现以及如何实现，也无法完全预料其影响，但应遵循预警原则（precautionary principle），防范未来的风险，使未来可能出现的通用人工智能和超级人工智能能够服务于全人类的利益。

当然，信任的建立，需要一套规则体系。在这些原则之下，人们可以探索制定标准、法律、国际公约等。对于人工智能需要采取包容审慎、敏捷灵活的治理方式，应避免严格、细致的法律要求，而是可以采取事后监管或者通过出台标准、行业公约、伦理框架、最佳实践、技术指南等调整人工智能等新技术的发展应用，支持行业自律。

幸福（happiness）：在人机共生的智能社会，确保人人都有追求数字福祉、幸福工作的权利

各种智能机器正在成为人类社会不可或缺的一部分，和我们的生活和生产息息相关。这给人类与技术之间的关系提出了新的命题，需要深入思考智能社会如何实现人机共生（human-computer symbiosis）。

第一，保障个人的数字福祉，人人都有追求数字福祉的权利。一方面需要消除技术鸿沟和数字鸿沟，全球还有接近一半人口没有接入互联网，老年人、残疾人等弱势群体未能充分享受到数字技术带来的便利。另一方面减小、防止互联网技术对个人的负面影响，网络过度使用、信息茧房、算法偏见、假新闻等现象暴露出了数字产品对个人健康、思维、认知、生活和工作等方面的负面影响，呼吁互联网经济从吸引乃至攫取用户注意力向维护、促进用户数字福祉转变，要求科技公司将对用户数字福祉的促进融入到互联网服务的设计中，例如Android和iOS的屏幕使用时间功能、Facebook等社交平台的“数字福祉”工具、腾讯视频的护眼模式对用户视力的保护等。

第二，保障个人的工作和自由发展，人人都有追求幸福工作的权利。目前而言，人工智能的经济影响依然相对有限，不可能很快造成大规模失业，也不可能终结人类工作，因为技术采纳和渗透往往需要数年甚至数十年，需要对生产流程、组织设计、商业模式、供应链、法律制度、文化期待等各方面做出调整和改变。虽然短期内人工智能可能影响部分常规性的、重复性的工作。长远来看，以机器学习为代表的人工智能技术对人类社会、经济和工作的影响将是深刻的，但人类的角色和作用不会被削弱，相反会被加强和增强。未来二十年内，90%以上的工作或多或少都需要数字技能。人们现在需要做的，就是为当下和未来的劳动者提供适当的技能教育，为过渡期劳动者提供再培训、再教育的公平机会，支持早期教育和终身学习。

可持续（sustainability）：践行“科技向善”，善用技术塑造健康包容可持续的智慧社会

技术创新是推动人类和人类社会发展的最主要因素。而这一轮技术革命具有巨大的“向善”潜力，将对人类生活与社会进步带来突破性的提升。在二十一世纪的今天，人类拥有的技术能力，以及这些技术所具有的“向善”潜力，是历史上任何时候都无法比拟的。换言之，这些技术本身是“向善”的工具，可以成为一股“向善”的力量，用于解决人类发展面临着的各种挑战，助力可持续发展目标。与此同时，人类所面临的挑战也是历史上任何时候都无法比拟的。联合国制定的《2030可持续发展议程》确立了17项可持续发展目标，实现这些目标需要解决相应的问题和挑战，包括来自生态环境的，来自人类健康的，来自社会治理的，来自经济发展的，等等。

将新技术应用于这些方面，是正确的、“向善”的方向。例如，人工智能与医疗、教育、金融、政务民生、交通、城市治理、农业、能源、环保等领域的结合，可以更好地改善人类生活，塑造健康包容可持续的智慧社会。因此，企业不能只顾财务表现，只追求经济利益，还必须肩负社会责任，追求社会效益，服务于好的社会目的和社会福祉，给社会带来积极贡献，实现利益与价值的统一。包括有意识有目的地设计、研发、应用技术来解决社会挑战。如今，“人工智能造福人类”（AI for Good）已经成为全球发展趋势，呼吁与行动并存。以腾讯为例，自2018年1月在国内首次提出“科技向善”以来，腾讯已将“科技向善”作为新的愿景与使命，并身体力行地在医疗、社会治理（如寻找失踪人口）、FEW（粮食、能源、水源）等方面践行“科技向善”理念。

以智能时代的技术伦理重塑数字社会的信任

互联网、人工智能等数字技术发展到今天，给个人和社会带来了诸多好处、便利和效率，未来还将持续推动经济发展和社会进步。如今，步入智能时代，为了重塑数字社会的信任，我们需要呼吁以数据和算法为面向的新的技术伦理观，实现技术、人、社会之间的良性互动和发展。最终，我们希望以新的技术伦理观增进人类对于技术发展应用的信任，让人工智能等技术进步持续造福人类和人类社会发展进步，塑造更健康包容可持续的智慧社会。

来源：腾讯网

链接：https://new.qq.com/omn/TEC20190/TEC2019071100497100.html

编辑：马晓晴

刘海明 · 发表于 2019-7-17 19:32:33

【案例】

新华社智能化编辑部建设初探[color=rgba(0, 0, 0, 0.298)]原创： [color=rgba(0, 0, 0, 0.298)]闫帅南 [url=]京原路8号[/url] [color=rgba(0, 0, 0, 0.298)]前天

内容提要 什么是智能化编辑部？建设智能化编辑部能帮助新华社做什么？本文结合“媒体大脑”“现场云”“AI主播”等工作，对新华社智能化编辑部建设工作进行了探讨。

新华社智能化编辑部建设初探

文/闫帅南

近年来，新华社紧跟人工智能技术发展浪潮，积极探索人工智能与通讯社主业的深度融合，先行先试、步步为营。从“快笔小新”到“媒体大脑”，从“现场云”到“AI主播”，可以说，新华社在新闻信息策、采、编、审、发等全环节都在积极探索智能化之路。2018年，新华社党组提出建设世界首个智能化编辑部，启动了通讯社智能化建设的“衣领子”工程，新华社新媒体中心成为智能化编辑部的试点部门。作为新华社新媒体事业的排头兵，我们要把握住这场智能化变革的深意，充分发挥新华社已有智能化优势，回答好究竟什么是智能化编辑部？建设智能化编辑部能帮助新华社做什么？等问题。

一年多时间里，新华社新媒体中心大胆地试、勇敢地闯，边摸索、边实践，正逐步构建起智能化编辑部的“四梁八柱”。

一、以做大做强智能化平台为抓手，着力提高通讯社新闻信息聚合分发能力

移动传播时代，“终端随人走、信息围人转”，打造可自主掌控的移动化、智能化资源聚合分发平台，是新华社从传统通讯社业务向网上通讯社转型的重要举措。近几年，新华社新媒体“三微三端三平台”传播格局的移动化、智能化水平正不断提高。2017年，新华社推出“现场云”平台，向媒体用户免费提供智能化工具和平台化服务，帮助媒体融合转型，加速新闻生产数字化升级。“现场云”自动化生产平台采用“云加端”的直播理念，用户只要拿起一部手机就能在新华社客户端发起一场全息直播，有效帮助入驻媒体在线生产，进而带动全国传统媒体进行真正的“线上转型”。截至目前，“现场云”已有入驻机构用户3200余家，全国参与采编人数4.4万多名，直播场次超13万场，单场直播最高访问量732万人次。“现场云”已经成为国内最大的原创直播新闻在线生产平台。

二、以升级迭代“媒体大脑”为龙头，着力提高通讯社大数据获取加工和智能化生产能力

2017年12月，新华社推出了国内第一个智能化媒体生产平台“媒体大脑”并生产了第一条MGC（机器生产内容）视频新闻，受到业界广泛关注。“媒体大脑”融合了云计算、物联网、大数据、人工智能等多项技术，为媒体机构提供线索发现、素材采集、编辑生产、分发传播、反馈监测等服务，使新闻场景下的应用和服务更加智能化。2018年两会，升级版的“媒体大脑”推出了9期数据可视化视频产品，通过多渠道采集数据、大数据挖掘信息、机器算法解析，带给读者全新视角和阅读体验。2018年世界杯，新华社“媒体大脑”31天生产短视频3.7万条，最快一条视频生产仅耗时6秒，大幅提升了短视频产品生产的效能。2019年全国两会期间，“媒体大脑”推出的《一杯茶的工夫读完6年政府工作报告，AI看出了啥奥妙》，对6年来政府工作报告中的数据进行横纵向的精确智能化对比解析，在大数据新闻中脱颖而出。

智能化编辑研发的大数据生产系统通过聚合海量第三方数据，可以对涵盖出行、网购、音乐等41个细分领域的大数据进行智能化分析、可视化处理、产品化包装。它让我们看到，人工智能可以帮助及时发现线索，快速生成新闻，采集海量数据，洞见独特视角。

此外，智能化编辑部研发的动画自动生产系统可以让编辑记者依靠系统中的动画制作模板，像做PPT一样快速高效生产动画短视频。目前，编辑部正在研发可供WEB端和移动端同时操作的生产系统，使新媒体动画的制作更加“随时随地随身”。

三、以“AI合成主播”等为应用，积极探索人工智能技术在呈现方式上的创新性突破

在2018年的世界互联网大会上，新华社发布了全球首个“AI合成主播”。只要输入文本，合成主播就能24小时不眠不休地自动播报新闻。这个栩栩如生的仿真数字播报员其背后是语音合成、唇语合成、表情合成和动作合成等四项人工智能核心技术的综合运用。经过一段时间的深度学习和进化，今年2月19日，新华社发布了站立式“AI合成主播”和他的新搭档——“合成女主播”。6月，新华社与塔斯社合作推出了俄文“AI合成主播”。同月，新华社“AI合成主播”还亮相第六届世界通讯社大会“人工智能”专题会，引起与会者热烈讨论。“AI合成主播”的问世让世界媒体惊呼人工智能时代真的来了。

基于智能化图形识别、VR、AR等技术，新华社智能化编辑部还推出了系列视觉冲击力大、交互性强的虚拟现实报道。如献礼改革开放40周年的策划《AR新闻|天地工程》等产品，打破了真实与虚拟之间的界限，创造出一个具有“沉浸性”和“交互性”的3D环境，让观众在看新闻时体会身临其境之感。

全球首个俄语AI合成主播在播报

四、以强化智能化装备为保障，着力培养会用“十八般兵器”的复合型人才

智能化编辑部紧密追踪智能化硬件革新，以智能化硬件为新华社采编队伍赋能。新华社为记者先后配备了5G手机、5G背包、智能AR直播眼镜、智能录音笔等硬件装备，并将这些装备成功应用到全国两会、“一带一路”国际合作高峰论坛、世园会等重大报道中。2019年3月10日，新华社客户端成功对全国政协十三届二次会议第三场记者会进行了5G手机全链条直播，让受众体验了一次“5G速度”。为了让报道“加速”、记者“减负”，智能化编辑部还为记者配备了直播报道“利器”——智能AR直播眼镜、智能化“全能耳”，戴上直播眼镜使受众可以与记者同步“进入”新闻现场，借助“全能耳”智能录音笔，采访的文字可以实时传回后方编辑部，实现了即传即编即发。有媒体称，新华社是2019年全国两会上最具“科技感”的媒体。

经过实战的初步检验，新华社智能化编辑部的设想显示出了强大的生命力，在不断充实和壮大中影响力显现。在中国传媒年会上，专家认为：“建设智能化编辑部是新华社贯彻落实习近平总书记系列重要讲话精神，着力加强传播手段和话语方式创新的重要举措。在推动媒体深度融合方面具有前瞻性、引领性意义，在世界范围内为应用人工智能推动媒体变革提供了宝贵范例。”

建设智能化编辑部既是一项事关新华社智能化转型的“衣领子”工程，也是事关推动新华社融合发展向纵深迈进的一项系统性工程。智能化编辑部的目的是利用大数据、云计算、人工智能等技术实现人机交互和人机协作，把采编人员从简单劳动中解放出来，从事更多思想性、创意性智力劳动，更大程度释放媒体生产力。其核心是解决国家通讯社在传播技术日新月异、舆论斗争形势日趋复杂、媒体格局深刻变化背景下如何更好地履行职责使命，服务媒体和受众、服务党和国家大局的问题。建设智能化编辑部不能“剪刀加糨糊”，将人工智能技术与内容简单的“捏合”，要找准定位、明确目标，统筹规划、分步实施。要把握好加大技术创新与坚持内容为本的关系、加大人工智能研发应用，同时坚决强化人的把关作用，将正确导向融入智能化生产。

习近平总书记明确指出，“用得好是真本事”。新华社新媒体中心作为全社智能化编辑部建设的先行者，将努力练就“用得好”的真本事，以舍我其谁的勇气，逢山开路、遇水搭桥的锐气，加大探索、加快推进，为建设智能化编辑部尽力，为推进全社融合发展助力。（作者系新华社新媒体中心新媒体部主任）

本文刊发于《中国记者》2019年第7期

编辑梁益畅 46266875@qq.com

https://mp.weixin.qq.com/s/-sxi_jCVKe_SVaX80psQZw

刘海明 · 发表于 2019-7-18 12:32:05

【案例】

无处不在的机器学习

我们正处于由机器学习应用引领的改革中

以下是我们可能每天都会看到的机器学习应用实例

这些用例包括了从智能手机中的机器学习应用，到我们每天进行的交易等

介绍

想象一下---明天你将参加你长期以来一直渴望的机器学习岗位面试。一切都需要提前准备计划，否则可能会搞砸。

所以，你告诉你的虚拟助手：

定一个明天早上7点的闹钟

预约8:30的Uber直接去面试地点

估算乘车费

在Google地图上预估可能需要的时间

最后，整理在面试前需要的资源清单

所有这一切您都无需移动或花时间输入。你所做的只是与你的虚拟助手说话，这样为该系统提供动力的机器学习算法就开始工作了！

机器有一个人类水平的心灵不是一个未来的场景--就是现在！由于计算能力的进步以及机器学习的应用，我们正生活在真正的全球革命之中。那么，让我们来看看日常生活中最常见的机器学习用例（有时甚至没有意识到它是机器学习）。

我们将覆盖到的机器学习用例

智能手机中的应用

运输优化

主流Web服务

销售和营销

安全

财务领域

其他热门用例

智能手机中的机器学习

您是否知道机器学习能够支持智能手机上的大部分功能？

从设置闹钟的语音助手，到寻找最好的餐厅，再到通过面部识别解锁手机---机器学习在真正嵌入到我们最喜欢的设备中。

语音助理

我们在介绍中看到了与虚拟助手交谈的例子，这完全是语音识别的概念---一个机器学习的新兴话题。

参考：

https://www.analyticsvidhya.com/blog/2019/07/learn-build-first-speech-to-text-model-python/

语音助手现在无处不在。你肯定使用过（或至少听过）以下这些流行的语音助手：

Apple的Siri

Google智能助理

亚马逊的Alexa

Google Duplex

微软的Cortana

三星的Bixby

所有这些语音助手之间的共同点是它们由机器学习算法驱动！这些语音助手使用自然语言处理（NLP）识别语音（我们说的话），使用机器学习将它们转换为数字，并制定相应的响应。

随着机器学习技术变得更加先进，这些助手在未来变得更加智能，这个领域已经成熟。您可以通过以下精彩教程学习构建自己的语音识别系统：

学习如何构建自己的语音到文本模型（使用Python）

https://www.analyticsvidhya.com/blog/2019/07/learn-build-first-speech-to-text-model-python/

智能手机相机

机器学习与智能手机的相机有什么关系？事实证明，关系相当大。

现如今我们能够获取令人难以置信的图像以及这些图像的深度---所有这些都归功于机器学习算法。他们分析给定图像中的每个像素，以检测物体，模糊背景和一系列技巧。

这些机器学习算法可以做几件事来改进和增强智能手机相机的效果：

对象检测，用于定位和单独显示图像中的对象（或人）

填补图片中缺少的部分

使用特定类型的神经网络使用GAN来增强图像，甚至通过想象图像的外观来扩展其边界等。

有兴趣阅读更多有关如何使用机器学习来构建自己的智能手机相机软件的信息吗？你的等待结束了！这是一个完美的教程，可以帮助您：

Google Pixel相机背后的深度学习技术简介！

https://www.analyticsvidhya.com/blog/2019/02/tutorial-semantic-segmentation-google-deeplab/

App Store和Play商店推荐

我喜欢Google Play和Apple的App Store的推荐功能。“推荐给你”基于我在手机上安装的应用程序（或之前使用过的）。

例如，如果我有一些体育和食品相关的应用程序 - 所以推荐给我的通常是与这些类似的应用程序。我很欣赏Play商店根据我的口味个性化推荐的做法，展示的应用程序对我来说有更高下载几率。

如果您没有注意到这一点，请立即去查看。

Apple或Google如何做到这一点？四个字--推荐引擎。这是机器学习中非常流行的概念。有多种方法可以构建推荐引擎，您可以从如下内容中开始学习：

从头开始构建推荐引擎的综合指南（Python）

https://www.analyticsvidhya.com/blog/2018/06/comprehensive-guide-recommendation-engine-python/

面部解锁 - 智能手机

我们大多数人都非常熟悉这个功能。我们拿起我们的智能手机，通过检测我们的脸来解锁。它智能，高效，省时，坦白的说真的很棒。

很多人不知道的是，我们的智能手机使用了一种称为面部识别的技术来做到这一点。面部识别背后的核心理念是--你猜对了---机器学习。

面部识别的应用非常广泛，世界各地的企业和组织已经从中获益：

Facebook用它来识别图像中的人物

政府正在利用它来识别和抓捕罪犯

机场用于验证乘客和机组人员，等等

面部识别模型的使用在未来几年内只会越来越多，所以为什么不自学如何从头开始构建一个？

面部识别简介（使用Python代码）

·https://www.analyticsvidhya.com/blog/2018/08/a-simple-introduction-to-facial-recognition-with-python-codes/

运输业中的机器学习

在过去十年中，机器学习在运输行业的应用已经达到了完全不同的水平这与Uber，Lyft，Ola等乘车应用程序的兴起是同步的。

这些公司在自己的众多产品中使用机器学习，从规划最佳路线，到决定路线上涨的价格。那么让我们看一下运输中使用机器学习的一些常见用例。

旅行中的动态定价

您经常对出租车公司使用的激增价格感到沮丧吗？我每天都会在上下班途中遇到这种情况。价格似乎永远都在上涨。为什么会这样？！

所以我对此进行了更多挖掘，并且发现了动态定价的概念---一个出色的机器学习用例。为了理解这一点，我们来举一个简单的例子。

想象一下，你正在启动一个用车业务。您需要计划城市中每条路线的乘车价格，既能吸引客户，又能同时提高您的底线。一种方法是手动将价格映射到每条路线，但不是理想的解决方案。

这是动态定价起着至关重要作用的地方。这意味着可以根据不断变化的市场条件调整价格。因此，价格取决于位置，时间，天气，整体客户需求等因素。这是为什么引入激增定价背后的基本思想。

动态定价是各种行业中蓬勃发展的做法，例如旅行，酒店，交通和物流等。

交通和通勤 - 优步

动态定价并不是Uber使用的唯一机器学习应用。他们在很大程度上依赖机器学习来确定乘客从A点到B点的最佳路线。

对我们来说，它似乎是一个相当简单的解决方案。把你的位置，目的地和最近的司机来接我们。但看起来很简单的，实际上在Uber后端是复杂的架构和服务网络。

目前有多种机器学习技术可以优化我们的路线。

查看Uber的这篇文章，他们更多地讨论如何使用机器学习来识别有效的路线：

优步工程师如何实现高效路线

https://eng.uber.com/engineering-an-efficient-route/

谷歌地图

你应该已经猜到这个了。Google地图是机器学习应用的主要例子。事实上，我建议立即开放谷歌地图并选用它提供的不同功能。

以下是我能看到的（并且已广泛使用）：

路线：从A点到B点

估计这条路线的行程时间

沿途交通情况

“探索附近”功能：餐厅，汽油泵，自动取款机，酒店，购物中心等。

Google使用大量机器学习算法来生成所有这些功能。机器学习深深嵌入谷歌地图中，这就是每次更新时路线越来越智能化的原因。

预估旅行时间功能几乎是完美的。如果它显示“40分钟”到达目的地，您可以确定您的旅行时间大约在该时间轴附近。我们爱机器学习！

主流web服务中的机器学习

你会喜欢这一节。我们每天都会与某些应用程序进行多次交互。直到最近我们才意识到这一点 - 大多数应用程序都可以工作归功于机器学习的强大功能和灵活性。

以下是您非常熟悉的四个应用。现在，从机器学习的角度来看待它们。

邮件过滤

工作中处理电子邮件的方式怎么样？或者您的个人电子邮件收件箱是否充满了随机和垃圾邮件？我们都遭遇过这种情况。我的收件箱曾经一次有11,000多封未读电子邮件！

如果我们能够编写一个根据主题过滤电子邮件的规则，那会不会很容易的将营销邮件将转到该文件夹、有关工作的电子邮件将进入我的主要收件箱（等等）。这会让生活变得更加轻松。

事实证明，这正是大多数电子邮件服务正在做的事情！他们使用机器学习来解析电子邮件的主题行并相应地对其进行分类。以Gmail为例。Google使用的机器学习算法已经经过数百万封电子邮件的训练，因此可以为最终用户（我们）无缝工作。

虽然Gmail允许我们自定义标签，但该服务提供默认标签：

主要

社交

营销

收到电子邮件后，机器学习算法会立即将电子邮件分类为这三个标签中的一个。如果Gmail认为它是“主要”电子邮件，我们会立即收到提醒。

当然，Gmail还使用机器学习来确定电子邮件是否是垃圾邮件---一个我们都非常感激的功能。多年来，Google的算法在决定电子邮件是否为垃圾邮件方面变得更加智能。这就是为机器学习算法获取更多数据以后变得非常有用的地方---Google拥有丰富的数据。

谷歌搜索

这大概是最受欢迎的机器学习应用之一。每个人都使用Google搜索，我们大多数人每天都会多次使用它。我冒昧地说，我们理所当然地认为Google将为我们提供最好的结果。

但谷歌搜索如何运作？

Google搜索已成为凡人无法破解的难以捉摸的庞然大物。它的工作原理只有那些设计过Google搜索的人才知道。有一点我们可以肯定地说 - Google使用机器学习为其搜索引擎提供动力。

Google不断训练和改进其算法的数据量是我们无法理解的数字。世界上没有计算器可以告诉我们Google在过去二十年中处理的查询数量。这是数据科学的一个特色！

现在 - 假设您被要求建立自己的Google搜索。你会用什么规则？你会包括什么样的内容？你会如何排名网站？这篇文章将帮助您入门：

谷歌PageRank用简单的语言解释！

https://www.analyticsvidhya.com/blog/2015/04/pagerank-explained-simple/

谷歌翻译

我精通Google翻译的使用。由于Google提供的这项优质服务，我已经学会了德语，西班牙语和意大利语等各种外语。每当我遇到一些外语文本时，Google翻译立即给我答案。

如果您知道Google使用机器学习来理解用户发送的句子，将其转换为所请求的语言并显示输出，那就不足为奇了。机器学习深深嵌入Google的生态系统中，我们都从中受益。

幸运的是，我们了解Google如何使用机器学习为其翻译引擎提供支持。本文将帮助您了解并开始使用该主题：

关于神经机器翻译的必读NLP教程 - 为谷歌翻译提供动力的技术

https://www.analyticsvidhya.com/blog/2019/01/neural-machine-translation-keras/

LinkedIn和Facebook的推荐和广告

社交媒体平台是机器学习的经典用例。与Google一样，这些平台已将机器学习整合到其结构中。从您的家庭流到您看到的广告类型，所有这些功能都可以通过机器学习来实现。

我们经常看到的“你可能认识的人”的功能。这是所有社交媒体平台，Twitter，Facebook，LinkedIn等的常见功能。这些公司使用机器学习算法来查看您的个人资料，您的兴趣，您当前的朋友，他们的朋友以及许多其他变量。

然后，该算法生成与特定模式匹配的人员列表。然后向您推荐这些人，期望您可能想要了解他们（或者至少有与您的非常相似的个人资料）。

多亏了LinkedIn的系统，我自己与很多我的专业同事和大学朋友联系。这是机器学习的一个应用，有利于参与该过程的每个人。

我们看到的广告以类似的方式工作。它们根据您的口味，兴趣，特别是您最近的浏览或购买历史而量身定制。如果您是许多数据科学小组的一员，Facebook或LinkedIn的机器学习算法可能会建议机器学习课程。

下次使用社交媒体时请注意这一点。这是背后所有机器学习的结果！

销售和营销中的机器学习

世界顶级公司正在使用机器学习从上到下转变他们的策略。两个受影响最大的功能？市场营销与销售！

如今，如果您从事营销、销售领域的工作，需要至少了解一个商业智能工具（如Tableau或Power BI）。此外，营销人员应该知道如何在日常工作中利用机器学习来提高品牌知名度，改善底线等。

这里有三个流行的营销和销售用例，其中机器学习正在改变他们的工作方式。

推荐引擎

我们之前简要介绍过推荐引擎。我提到这些系统无处不在。但他们在营销和销售领域的用途在哪里？如何？

我们举一个简单的例子来理解这一点。在IMDb（和Netflix）出现之前，我们都习惯去DVD商店或依靠谷歌搜索要观看的电影。店员会给我们一些可以看什么的建议，我们经常拿一些我们不知道的电影。

由于推荐引擎，这个世界几乎完全过去了。我们可以登录网站，它会根据我的品味和以前的浏览历史向我推荐产品和服务。一些流行的推荐引擎示例：

亚马逊和Flipkart等电子商务网站

预订网站，如Goodreads

像IMDb和Netflix这样的电影服务

酒店网站，如MakeMyTrip，Booking.com等。

像StitchFix这样的零售服务

像Zomato和Uber Eats这样的食品集散商

名单还有很长。我们周围的推荐引擎无处不在，营销和销售部门比以往任何时候都更倾向于吸引（并留住）新客户。

我鼓励您阅读这篇关于如何构建自己的推荐引擎的初学者友好教程：

从头开始构建推荐引擎的综合指南（Python）

https://www.analyticsvidhya.com/blog/2018/06/comprehensive-guide-recommendation-engine-python/

个性化营销

推荐引擎是个性化营销的整体概念的一部分。这个概念的含义在于名称本身---它是一种根据个人需求量身定制的营销技巧。

想想：您从“免费”提供服务的信用卡或贷款公司获得多少电话？这些调用提供相同的服务而不了解您想要（或不想要）的内容。传统营销现在已经过时，远远落后于数字革命。

现在想象一下，如果这些电话或电子邮件对您的兴趣高度个性化。如果你是一个大购物狂并反映在你的购买历史中，消息可能是关于扩展你的信用额度的新服务。或者，如果您是机器学习爱好者，电子邮件可以提供适合您口味的课程。

老实说，个性化营销的潜力巨大。机器学习有助于识别客户群并为这些细分市场定制营销活动。您可以通过开放率，点击率等指标定期检查广告系列的效果。

我强烈建议您阅读以下指南，这将有助于您重塑您的数字营销策略：

每个数据科学专业人员必须阅读的数字营销和分析综合指南

https://www.analyticsvidhya.com/blog/2018/12/guide-digital-marketing-analytics/

客户支持查询（和聊天机器人）

如果您曾经处理过客户支持，您将在非常个人的层面上理解这一点。那些可怕的电话，无休止的等待，未解决的查询---这一切都增加了非常令人沮丧的用户体验。

机器学习有助于消除所有这些障碍。使用自然语言处理（NLP）和情感分析的概念，机器学习算法能够理解我们所说的内容以及我们所说的基调。

我们可以将这些查询大致分为两类：

基于语音的查询

基于文本的查询

对于前者，机器学习算法检测消息和情绪以将查询重定向到适当的客户支持人员。然后他们可以相应地处理用户。

另一方面，基于文本的查询现在几乎完全由聊天机器人处理。几乎所有企业现在都在他们的网站上利用这些聊天机器人。他们消除了等待的障碍，并立即提供答案 - 因此，一个超级有用的最终用户体验。

我们已经汇总了两篇关于如何构建聊天机器人的文章：

了解如何使用Rasa在几分钟内构建和部署Chatbot（IPL案例研究！）

https://www.analyticsvidhya.com/blog/2019/04/learn-build-chatbot-rasa-nlp-ipl/

用Python构建FAQ Chatbot - 信息搜索的未来

https://www.analyticsvidhya.com/blog/2018/01/faq-chatbots-the-future-of-information-searching/

安全业中的机器学习

机器学习也扰乱了安全行业！传统安全的日子里，保安人员常常坐了好几个小时，注意车辆数量下降和阻止可疑人员--- 这种情况正逐渐被逐步淘汰。

企业正在使用机器学习来更好地分析威胁并应对对抗性攻击。这些用例扩展到线上线下的威胁（银行欺诈，金融威胁等）。

视频监控

全球组织正在使用视频监控来执行各种任务，例如检测入侵者，识别暴力威胁，捕获犯罪分子等。

然而，所有这些都不是手动完成的。这将花费大量时间。因此，机器学习算法正被用于放置在这些监视摄像机内的软件。

这些机器学习算法使用各种计算机视觉技术（如对象检测）来识别潜在的威胁并逮捕违法者。

这是一个非常独特的安全机器学习用例：

“天空中的眼睛”是一个机器学习项目，可以检测人群中的暴力人群

https://www.analyticsvidhya.com/blog/2018/06/eye-in-the-sky-is-a-machine-learning-project-that-detects-violent-people-in-crowds/

网络安全（Captchas）

“我不是机器人” - 这句话似乎很熟悉吗？当网站怀疑它正在处理的是机器而不是人类时，我们经常遇到这个按钮。

这些测试称为CAPTCHA，是完全自动化公共图灵测试的缩写。我们被要求识别交通灯，树木，人行横道和各种物体，以证明我们确实是人类。

交通灯和树木被其他物体覆盖，汽车越来越模糊，人行横道越来越远，以及各种各样的复杂情况。为什么网站让我们的生活更加困难？答案就在于机器学习。

Verge网站说得最好：

“因为CAPTCHA是用于训练人工智能的优秀工具，所以任何给定的测试都只能是暂时的，这也是发明者在一开始就承认的。随着所有这些研究人员，骗子和普通人在人工智能可以做的门槛上解决数十亿个谜题，在某些时候机器将会通过我们。”

因此，Google正在使用机器学习来使CAPTCHA变得更加复杂。研究人员正在使用图像识别技术破解这些CAPTCHAS，从而提高后端的安全性。

财务领域的机器学习

机器学习中的大部分工作都面向金融领域。这是有道理的 - 这是数字领域的极端。直到最近，许多银行机构都习惯于依靠逻辑回归（一种简单的机器学习算法）来处理这些数字。

金融机器学习有很多用例。让我们来看看你（很可能）遇到的两个非常常见的问题。

在银行业中捕获欺诈行为

你曾经是信用卡欺诈的受害者吗？这是一次痛苦的经历。银行要求您填写的文书工作量加剧了欺诈的冲击。

值得庆幸的是，机器学习正在解决这个过程的不同层面。从欺诈检测到欺诈预防，机器学习算法正在改变银行改善客户体验的方式。

这方面的挑战要跟上网络威胁的程度。这些对手在每个阶段都比曲线前两步。一旦最新的机器学习解决方案出现，这些传感器就会完善它并构建在它之上。

话虽如此，机器学习肯定有助于简化流程。这些算法能够识别欺诈性交易并标记它们，以便银行可以尽快与客户联系以检查他们是否进行了交易。

一个很好的例子就是看消费者的消费模式。如果购买不符合此模式（金额太高，或来自其他国家/地区等），则算法会提醒银行并将交易置于保留状态。

以下两篇由网络安全和机器学习专家撰写的文章解释了如何构建强大的恶意软件检测模型：

利用深度学习的力量实现网络安全（第1部分）

https://www.analyticsvidhya.com/blog/2018/07/using-power-deep-learning-cyber-security/

利用深度学习的力量实现网络安全（第2部分）

https://www.analyticsvidhya.com/blog/2019/05/using-power-deep-learning-cyber-security-2/

个性化银行业务

推荐引擎的另一个用例是专门针对银行领域的。此时您必须非常熟悉个性化 - 所以在进一步阅读之前，请考虑个性化银行业务可能意味着什么。

我们已经了解了针对客户微观部门并为其定制优惠的银行。个性化银行业务将这一概念提升到一个全新的水平。

理想的个性化方案是使用机器学习来预测用户的需求并针对每个人的细分。正如BCG的报告所述：

“银行业的个性化主要不是出售。它是关于提供服务，信息和建议，通常每天，甚至一天几次。与不常见的销售沟通相反，这种互动形成了客户银行体验的关键。”

阅读完整的BCG文章：

银行业的个性化意味着什么？

https://www.bcg.com/publications/2019/what-does-personalization-banking-really-mean.aspx

其他主流机器学习用例

我想将这部分机器学习用例包含为一个单独的类别。我会不断更新这一部分，让我们先来看看一个非常有趣的用例 - 自动驾驶汽车！

自动驾驶汽车

在我们在本文中介绍的所有应用中，自动驾驶汽车最让我着迷。这是我们使用硬件和机器学习所取得的成就。

自动驾驶汽车的优点在于机器学习的所有三个主要方面 - 监督，无监督和强化学习---在整个汽车的设计中使用。

以下是使用机器学习的自动驾驶汽车的一些功能：

检测汽车周围的物体

检测前方车辆，人行道所在位置和交通信号灯之间的距离

评估驾驶员的状况

场景分类，以及许多其他事情。

小结

我们生活在机器学习的黄金时代。你必须想象这个美妙的领域的广阔和无限的可能性。

你还可以通过 Analytics Vidhya's Android APP阅读本文

作者简介：

Pranav Dar，Analytics Vidhya的高级编辑。数据可视化从业者，喜欢阅读和深入研究数据科学和机器学习艺术。一直在寻找使用ML和AI改进流程的新方法。

原文链接：

https://www.analyticsvidhya.com/blog/2019/07/ultimate-list-popular-machine-learning-use-cases/

补充阅读：

https://www.analyticsvidhya.com/blog/2017/09/common-machine-learning-algorithms/?utm_source=blog&utm_medium=ultimate-list-popular-machine-learning-use-cases

封面图来源：pexels by rawpixel.com

读BD最佳实践案例，赢DT未来！

18各行业，106个中国大数据应用最佳实践案例：

（1）《赢在大数据:中国大数据发展蓝皮书》；

免费试读：https://item.jd.com/12058569.html

（2）《赢在大数据:金融/电信/媒体/医疗/旅游/数据市场行业大数据应用典型案例》；

免费试读：https://item.jd.com/12160046.html

（3）《赢在大数据:营销/房地产/汽车/交通/体育/环境行业大数据应用典型案例》；

免费试读：https://item.jd.com/12160064.html

（4）《赢在大数据:政府/工业/农业/安全/教育/人才行业大数据应用典型案例》。

免费试读：https://item.jd.com/12058567.html

原文链接：https://mp.weixin.qq.com/s/tR74qr4IhmN991PL75-Rig

编辑：陈茗

帐号		自动登录	找回密码
密码			实名注册

人工智能与新闻业案例集锦

浏览过的版块