阿什比论文集集锦

刘海明 · 发表于 2026-2-2 22:12:23

【案例】

智能的机制——阿什比论文集

大家好，今天开始，由我来为大家翻译控制论先驱阿什比的论文集《智能的机制》。全书共有8个专题40多篇论文，基本把阿什比（除了名著《大脑设计》《控制论导论》之外）主要代表作都囊括了。除了个别零散论文（比如《智力放大器设计》）外，大多没有被翻译为中文。我想尝试翻译出来，与群友共享。也许在今天AI浪潮几乎让人疯狂的背景下，聆听一下这位控制论先驱对智能的思考对我们有帮助，能让我们冷静下来，对AI如实观照。今天作者介绍、论文集结构与序言部分。

作者介绍

W·罗斯·阿什比教授被国际公认为控制论的先驱和权威。他受过医学和精神病学训练，曾任研究病理学家、格洛斯特巴恩伍德医院研究主任、布里斯托尔伯登神经研究所所长、伊利诺伊大学生物计算机实验室教授，退休后任威尔士大学荣誉教授研究员。

在巴恩伍德医院（一所精神病院）工作的十二年间，他制作了他著名的"同态调节器"（用英国皇家空军旧零件在阿什比夫人厨房的桌子上组装而成），并撰写了两部著作：《大脑设计》（1952年）和《控制论导论》（1956年）。这两部著作均完成于阿什比博士私人的软垫隔间，此后被译成多种语言。在美国度过的十年间，他发表了大量著作，据他自己估计，这是他职业生涯中成果最丰硕的时期。

阿什比博士的核心兴趣在于用机械论解释类脑活动。基于大脑按机械原理运作的信念，他热衷于揭穿关于大脑神奇力量的各种神话（"两千年来，心理学不过是对人类最高级能力的简单讨论——而大多数能力他根本不具备"），并设计行为的机械模型，其中最著名的是同态调节器。该装置故意用不可靠的部件构成，以强调智能不在于精巧、高质量的部件，而在于整体结构。尽管他不断寻找行为的简单解释，却全心全意地拥抱复杂性，主要兴趣在于非线性、高度互联的系统，其中复杂关系构成主要研究对象。

作为他对关系兴趣的象征，他随身携带一条由三条较简单链条平行互锁构成的链子；他喜欢观察微观生态系统（用鱼竿和瓶子从厄巴纳的博尼雅德溪捕获），欣赏它们展示的丰富相互作用；他还建造了一个半随机电子装置，装有100个双三极管，观察了两年，最终因其难以理解的复杂行为而认输。或许是这个三极管网络激发了他对信息论的兴趣，将其作为处理复杂性和测量变量间相互作用强度的工具；他随后提出的"必要多样性定律"和多变量信息论的发展，是对理解复杂系统的重要贡献。

阿什比教授有一种非凡的天赋，能使看似复杂的思想变得简单，并用朴实的例子说明抽象概念（"某只蜈蚣……"）。他善于在别人只看到琐碎之处发现意义，在别人只看到事实之处发现原理。他始终充满热情和创造力；即使退休后，他先掌握了单簧管，继而着手重新设计其人机界面，以改善信息传递。他严肃而略显令人生畏的举止，在参与对话或讲座时，会转变为生动的风格——他独特的敏锐机智和从不寻常视角看待寻常事物的能力，很快会使谈话变成一连串令人惊讶的思想洪流。他的热情会完全克服他平常的矜持，比如他曾有一次假装发射一把六响手枪，"后坐力"——令所有人惊讶，包括他自己——使他踉跄着穿过房间，摔倒在地。

除了是一位诚实、一丝不苟的学者，他还是一位热心、体贴、慷慨的人，热切地将自己萌发的想法的功劳归于学生；此外，他为人谦逊，当被问及希望如何处理他大量未发表的研究笔记时，他典型的回答是"全部销毁"（为了给下一代重新发现的机会）。

那些亲自认识罗斯·阿什比的人，会记住他是一个善良而难忘的人；那些通过著作认识他的人，会记住他是系统科学的天才和巨人。

——罗杰·科南特（Roger Conant）（阿什比的博士生，也是本书的编辑之一）

本书编辑说明

（罗杰.科南特）

美国控制论学会于1980年春季的一次会议上决定，推动出版一套丛书，收录控制论和系统理论领域关键人物的开创性著作。本书，以及另一本以海因茨·冯·福斯特为中心的著作，是首批问世的两部作品。

我有幸于20世纪60年代那个非凡的黄金时代，在冯·福斯特位于伊利诺伊大学的生物计算机实验室工作，当时W·罗斯·阿什比也在那里。作为阿什比门下的博士生，我对他的创造力和精力惊叹不已，并深受其广阔视野以及他摆脱常人思维定式之自由的启发。这种自由常表现为以令人震惊的新颖方式看待事物的能力——仅举一例，他曾随口说道，在股市中亏损与获利同样困难。我感谢美国控制论学会和出版商给予的动力和机会，使我能通过编纂本书，部分地回报我对罗斯·阿什比的感激之情。

阿什比的两部著作《大脑设计》和《控制论导论》是控制论和系统理论文献中的经典，已被多种语言再版，想必为读者所熟知。然而，阿什比的许多工作散见于各处期刊、会议文集和不易获取的书籍中，有些文章仅以他在厄巴纳给学生发放的手稿形式出现。本书的目的即是将其中许多文章汇集于一册，从而使这位杰出人物的著作更易于获取。

指导本文选编的原则如下：

1. 若某部作品已实质性纳入阿什比早期的两部著作，则本书不予收录。

唯一例外是"必要多样性及其意涵……"一文，因其对"必要多样性定律"——阿什比最著名的成果之一——的清晰阐述而收录于此。

2. 以最少的篇数最大限度地涵盖所有著作中的思想。

阿什比的论文之间存在相当程度的重叠，他的一些钟爱主题在多篇独立作品中均有提及。我试图同时最小化这种重叠、本书的篇幅以及"损失"——即未收录于此的论文中的思想。这一任务不可能令任何人完全满意，包括我自己，一些优秀论文因此因这一精简原则而被舍弃。然而，我相信本集反映了阿什比除两部著作之外对控制论的几乎全部智识贡献。

我未能发现阿什比出版物的任何权威目录。因此，书末所列其著作目录是根据生物计算机实验室的文件、阿什比出版物中的参考文献以及与其学生和朋友的通信整理而成。尽管如此，某些方面可能仍不完整，不能视为最终版本。

我要感谢美国控制论学会主席斯图尔特·昂普利比，他为本项目提供了动力并奠定了良好开端；海因茨·冯·福斯特为此项工作提供了实质性帮助；伊利诺伊大学芝加哥校区图书馆的工作人员为我查找了许多阿什比的晦涩文章；亨利埃塔·科克斯承担了打字工作；乔治·克里尔对阿什比的工作进行了概述并就收录论文提出建议；我的贤妻雪莉，她欣然容忍甚至支持我对本项目的专注；最后是罗斯的遗孀罗斯巴德·阿什比，她寄来了照片以及下面这段她在其遗稿中发现的引语。

"我算得上是一位艺术家，不是在铅笔或颜料方面——我在那里毫无技艺——而是对完美有着深刻的鉴赏力。我的品味很广泛，因为我能欣赏任何精湛之作，无论是丘吉尔的一章文字、爱泼斯坦的一尊雕像，甚至马克斯·米勒的一个建议。我有一个抱负，希望有一天能创造出毫无瑕疵的作品。"

"笔记中记录的那种关于大脑的工作，对我来说仅仅是一种令人愉悦的消遣，一个我可以退隐其中的爱好，一个我可以编织纯粹思想的复杂而美妙图案的世界，不受社交、财务及其他纷扰的干扰……"

——W·罗斯·阿什比

前言：阿什比的思想财富

乔治.科里尔（本书另一个主编）

我想借此机会表达我对W·罗斯·阿什比晚期著作的个人感受。首先，我希望他描述其思想发展的书籍和论文能够得到恰当的理解、欣赏和发展。他的一些最重要的思想仍未受到应有的关注，目前正在被分析和进一步发展。他留下的大量未开发的思想，代表着未来研究的丰富智力资源。

对大多数人来说，阿什比是通过他的第二本书《控制论导论》（1956年）[b2]为人所知的，该书在多次再版和十四种不同语言的翻译之后，至今仍在印刷。他的第一本书《大脑设计》（1952年）[b1]知名度较低，而他1930年至1972年间撰写的众多论文则最不为人所知。这些论文散见于各种出版物中，许多被隐藏在会议论文集或论文集的编辑版本中。

我一直对阿什比那部杰作《控制论导论》深感惊叹。这本书写得如此精湛，作为入门教材与任何著作相比都毫不逊色。它至今仍是我灵感的巨大源泉。1970年，我在罗马与阿什比相处时，曾称赞他写了这样一部优秀的导论。令我惊讶的是，他回答说写这本书对他来说很容易。"不，"他回复道，"我毫不费力。"我后来才得知，在撰写该书期间的某个时候，他对自己的英语知识失去了信心，于是放下几乎完成的手稿，开始从头学习英语。一年多后，当他重新自信地掌握这门语言时，他才回到这本书的工作上。他没有使用旧稿，而是在几个月内从头完成了整本书。因此，这部杰作的诞生——难怪它如此精湛！

阿什比对系统研究各个方面的兴趣可以追溯到1940年代。这一十年的特点是系统研究、控制理论、信息与通信理论、自动机理论以及系统工程等新兴和初步领域的出现。这些新颖而有前景的思想与阿什比关于适应性和自组织概念的发展相吻合。他在这一十年的贡献极为重要。自1960年代以来，他一直日益成为系统研究领域公认的领导者，直至1972年去世。

自20世纪50年代初我开始熟悉阿什比的一些著作以来，我一直感受到他对我在系统研究方面工作的巨大影响。我清楚地知道，许多从事系统研究的人也有同样的感受。例如，罗杰·卡瓦洛[109]最近为阿什比进行的一项调查显示，作为20世纪下半叶第二位最有影响力的人物，他对系统研究者的影响几乎是卢德维希·冯·贝塔朗菲的两倍——而冯·贝塔朗菲通常被认为是该领域最有影响力的人物。

阿什比最伟大的思想之一是他对"对象"与"基于该对象定义的'系统'"之间区别的清晰认识。他写道[b2,p.39]：

"在这一点上，我们必须明确'系统'是如何定义的。我们的第一反应是指着钟摆说'这就是系统'，但这种说法隐藏了它可能产生的巨大困难。每一个物质对象都包含无限多的变量，因此可以产生无限多个可能的系统。真实的钟摆，例如，不仅有长度和位置；对于电导率，它有晶体结构、化学杂质、内应力；对于温度，它有熔点、比热、导热性；对于光学吸收，它有表面水分、细菌污染、光学吸收、弹性、形状、比重的薄膜，等等。任何暗示这些变量中某一个可以忽略的说法，都是从未被提出的。所必要的是，我们应该挑选出我们感兴趣的变量，并研究这些变量之间的关系。系统现在意味着，不是一个事物，而是一个变量集。"

在我看来相当令人惊讶且不幸的是，这两个概念之间的根本区别对当前场景上的许多系统研究者来说仍然是陌生的。然而，它至关重要，因为许多系统研究中的混淆正是由于未能认识到它而产生的，正如一些批评者所暗示的，系统研究不过是研究一切（每个对象），因此逻辑上是空洞的。

阿什比明确区分对象和基于对象定义的系统，使他能够认识到同一对象可以以不同方式被看待（建模），每种方式都基于不同的属性和相关的响应函数。这使他能够将系统识别与正在研究的对象分离开来，也使他能够将自己限制在晚期论文[99,p.1]所描述的对象的"简化、可管理的子集"中，并拒绝所有其他部分。让我们引用他晚期论文[99,p.1]中的一段话：

"……虽然所有人都会同意大脑是复杂的，自行车是简单的，但人们也会记得，屠夫对羊脑的看法是简单的，而自行车，如果被详尽研究，作为理解人类大脑的唯一线索，就会变得非常复杂。因此，在我看来，用'复杂'来测量复杂性是一种完全错误的方式。"

阿什比工作的独特特征之一在于，他所发展的各种系统概念和原理具有高度的一般性，即它们并不局限于基于具有某种特定数学结构的变量所构成的系统。他就此问题表达了如下观点[95,p.103]：

"受过一定数学训练的工作者很容易养成（或陷入）一种思维习惯，认为'变量'必须是指具有可加性度量的数值尺度。这种限制是完全不必要的，有时甚至会导致致命后果。气象学家长期以来使用五种'云型'，兽医研究猪的各种寄生虫，血液学家使用四种基本的'血型'。现代数学运用集合论的方法，完全能够处理这类变量，而这类变量在行为科学中往往是不可避免的。"

阿什比的许多思想不依赖于所涉及变量的尺度，这使得这些思想非常适用于所谓的软科学。具有讽刺意味的是，变量必须是"定量的"这一神话——至今仍严重主导着软科学——似乎正是这方面的主要障碍。

可以公平地说，系统的认识论层级[107,109,115,116]日益被认可为任何有意义的系统问题解决框架所必需的"骨架"，而这一层级在阿什比的著作中是隐含的。尽管他没有明确表述这样的层级，但他的著作至少涵盖了我所提出的层级[109]中的四个认识论层次。

最低的认识论层次（源系统或0层），在我的层级表述中定义为一套变量（划分为基本变量和辅助变量）以及为每个变量定义的分辨率水平[109]，显然只是对阿什比将系统定义为一套变量这一概念的更精确、更完整的阐述。他关于所选变量的方案（或活动）概念，则直接对应于我认识论层级中的数据系统（1层）。

就我认识论层级中的2层（生成系统或行为系统）而言，它在阿什比的早期著作中由状态决定系统（机器）[81]的概念所代表，但也由他更为一般的变换概念[b2]所代表。在20世纪50年代初，这些是相当新颖的思想，由此发展出一些系统理论，如有限状态机（自动机）理论，以及后来的动力系统理论。

结构系统（定义为耦合子系统的集合），代表我层级中的3层，在阿什比的著作中有相当广泛的论述。他的主要兴趣似乎在于研究部分（子系统）的各种性质与整体（结构系统）相应性质之间的关系。例如，对于这样一种性质——平衡状态——他推导出了整体与部分之间一个简单但重要的关系："整体处于平衡状态，当且仅当每个部分在其他部分所提供的条件下处于平衡状态。"[b2,p.83] 他自己设计并著名的同态调节器，也是源于他对整体-部分关系研究的浓厚兴趣。

虽然大多数系统研究者只关注涉及一个或最多两个认识论层次的问题，但阿什比可能是新兴系统研究领域中第一位成功将更广泛范围的认识论层次整合到一个概念框架中的贡献者。从他的著作中可以清楚地看出，与许多当前的系统研究者不同，他认为认识论谱系的实验端与认知端同等重要。此外，他的工作出色地展示了对系统研究的发现（归纳）方法和公设（演绎）方法的平衡运用。

阿什比最伟大的贡献之一——必要多样性定律，也是他最早期思想之一[82,43]。其最简单但最一般的表述"只有多样性才能摧毁多样性"——开辟了多个可能的发展方向，具有潜在的深远意义。尽管对必要多样性定律的兴趣近来日益增加，但令人惊讶的是，某些相关领域，最值得注意的是控制理论，仍然完全不了解这一思想。这种令人遗憾的状况，被布莱恩·波特——少数具有更广阔视野的控制理论家之一——在几年前发表的一篇论文[113,p.227]中很好地刻画出来：

"……颇具讽刺意味的是，例如，最优控制理论虽然已被详尽发展到了几乎令人厌倦的地步，但控制科学家们似乎对阿什比著作的存在及其重要性 largely 一无所知。这种情况在阿什比的必要多样性定律方面尤为突出——该定律对于调节和控制的重要性，犹如热力学第二定律对于物理学的重要性。因此，必要多样性定律——顺便一提，它可以通过基本推理非常简单地得到证明——对调节器可实现的行为施加了严格的界限，无论其结构或设计如何：因为阿什比的定律相当可靠地指出，任何物理装置作为调节器的能力不能超过其作为通信通道的能力。该定律所表达的控制与通信之间的密切联系，无疑表明这一领域可能是系统科学家和控制科学家未来研究中最令人兴奋、最有价值且最重要的领域之一。当然，阿什比自己感到，在他漫长而多产的科学生涯结束时，他在这个领域的工作才刚刚开始。……阿什比的必要多样性定律表明，系统科学和控制科学中有许多非平凡的问题等待解决，而且——拟人化地应用该定律——解决这些问题的最佳方法，很可能是通过最大化系统科学家和控制科学家作为多样性通道的能力来实现的。"

调节是阿什比在其著作中高度关注的一个概念。他研究了反馈和前馈调节，并发展了分析和设计调节器的一般原理。他的大多数结果都用集合论术语描述，适用于任何尺度的变量。这可能是他的调节工作尚未在控制理论中得到利用的原因之一。控制理论主要是为连续变量或连续变量的离散表示而发展的。将微分方程或差分方程——它们一直是控制理论中的基本数学工具——与阿什比提供的一般集合论表述相整合，可能是困难的。然而，这样的整合将极大地增强控制理论的能力，特别是其对"软科学"的相关性。

"整体大于部分之和"这一表述——它刻画了系统研究的核心问题——常被一些人认为神秘，被另一些人认为平凡；很少有人理解其全部意涵。对于罗斯·阿什比来说，这一表述既不神秘也不平凡；他很好地理解了它，并试图发展方法论工具，以严格分析整体-部分关系。

在20世纪60年代初，阿什比发表了一种算法，用以确定一个n维关系是否可以从其所有(n-k)维投影中重建（k=1,2,…,n-1）[67]。他表明，一个关系可以从适当的投影中重建，当且仅当各投影的柱面扩展的集合交集与给定关系相同。尽管该算法只涉及整体-部分关系问题的一小部分，但作为澄清这一问题的首次尝试，它具有重要意义。然而，它几乎未被专业界注意到。即使在其发表十五年多后的现在，情况也没有多大改善。事实上，最近在诸多不同领域发展的系统模型几乎无一例外地由子系统构建而成。虽然每个子系统与总体系统变量集的一个子集相关联，且通常是对所涉及现象的经过良好验证的模型，但从给定子系统重建总体系统的能力问题几乎从未被提出。似乎许多系统建模者有一种将重建能力视为理所当然的倾向。显然，如果没有通过分析来确定系统模型的重建能力，该模型很可能是根本错误的，并可能具有极大的误导性。

1964年当我读到阿什比的论文[67]时，我对他关于重建问题的洞见印象深刻，但我花了十多年时间才充分理解其意义，并有足够的动力去继续阿什比开创的方向进行研究。我第一篇涉及重建问题的论文发表于1975年[106]。在该论文发表后，许多研究人员加入到进一步研究该问题各个方面的努力中，并发展了一个被称为重建分析[103,117]的新方法论领域。

重建分析的一些贡献者，最值得注意的是格里特·布鲁克斯特拉、罗杰·科南特和克劳斯·克里彭多夫，已经用信息论概念研究了重建问题的各个方面[117]。这也是阿什比在20世纪60年代中期开创的一个方向[71]，这显然是他1972年去世前不久的主要兴趣之一[92,96]。可以公平地说，他证明了信息论与系统研究的相关性，这是阿什比的主要贡献之一。

阿什比对系统重建性质的强烈兴趣，只是他更大兴趣的一个方面——对简化方法的永恒追求。以下引自他1964年一次专题讨论会上的发言[69,pp.166,168,169]，很好地描述了他在这一方面的观点：

"……系统理论（是）试图发展科学原理，以帮助我们应对具有高度相互作用部分的动态系统，其规模可能超过10¹⁰。面对远超此规模的问题和过程，他该怎么办？在我看来，此时他必须下定决心，是否接受这一限制。如果不接受，就让他去攻击它，试图找到战胜它的方法。如果接受，就让他全心全意地、一贯地接受。我个人的观点是，这一限制比能量守恒定律更不可能被突破。能量定律本质上是经验性的，可能在一夜之间消失，正如质量守恒定律那样，但阻止一个拥有10¹⁰资源的人执行一个真正需要超过此数量级过程的限制，基于我们关于因果的基本思维方式，且完全独立于其所依附的特定物质。如果这一观点正确，系统理论必须建立在简化方法的基础上，并将本质上以简化科学为基础。……我建议，未来的系统理论家必须是简化的专家。"

尽管阿什比并非计算机科学家，但他具有运用计算机的非凡才能。他证明了将计算机视为系统科学家的实验室、将计算机仿真视为其最重要的实验室工具之一，是完全有意义的。他开展了系统科学中最具典范性的基于计算机的实验研究之一；其目标是确定系统规模（所涉及变量的数量）及其连接度（变量间依赖关系的百分比）对特定类别系统稳定性的影响[90]。该研究仅限于线性动态系统。除其他结果外，它导致了连接度临界值（13%）的发现；该值具有临界性，因为对于足够大量的变量（10个或更多），几乎所有连接度小于临界值的系统都是稳定的，而几乎所有连接度大于临界值的系统都是不稳定的。在另一项研究中，通过计算机实验研究了由功能相同的有限状态机构成的系统类别。该研究的目标是确定循环长度及其他行为特征对各种类型有限状态机的系统规模的依赖性[75]。这些以及阿什比参与的一些其他基于计算机的系统实验研究，清楚地展示了计算机作为系统科学实验室的作用。

阿什比的独特贡献之一，是他将能量系统中已被充分理解的功率放大原理扩展到信息系统领域的思想。这一信息放大的思想在他的两部著作和许多论文中，在多种不同语境下被讨论，如调节放大、适应放大或设计放大。其最一般的形式嵌入在智能放大器的概念中[41]。在这一语境下，阿什比认为智能意味着解决问题的能力，而解决问题又意味着从全部可能性中做出恰当选择的能力。因此，他将智能放大器基本上视为选择放大器。当问题是调节时，选择放大器将采取调节放大器的特殊形式；当问题是设计具有给定性质的系统时，它将采取设计放大器的形式，等等。

各种形式的信息放大器思想具有深刻的哲学意义和实践意义。如果这样的放大器是可能的，那么至少在原则上，也有可能构建能够解决超出其设计者智力范围问题的人造系统。尽管具有如此巨大的理论和实践潜力，信息放大器的思想尚未在阿什比本人所发展的概念水平之外得到进一步阐述。这显然是他的伟大思想之一，但仍被低估，因而未得到充分发展。

系统设计的各个方面，特别是元设计问题，经常在阿什比的著作中被讨论，尤其是在他的晚期论文[96,98]中。他将系统设计视为一个调节过程，并运用信息论的一些概念来发展若干元设计原理，这些原理对于极其复杂系统的设计尤为重要。将这些原理纳入每一本系统设计教科书中，已是久拖未决之事。

我只能讨论阿什比的一些思想，特别是那些对我自己研究工作有所影响的思想。他的著作中还有许多关于适应性系统、自组织系统、自复制系统、系统建模、归纳、预测、超稳定性、生物计算机等主题的更多思想。他的一些思想影响了当前的科学观点并得到了进一步发展（例如，状态决定机器的概念或信息论在系统研究中的作用），一些只是最近才成为相当关注的研究对象（例如，重建分析），但他的著作中仍有许多丰富的思想在很大程度上被忽视，或至少没有在阿什比本人的阐述之外得到发展（例如，基于信息的放大或他的元设计思想）。可以合理预期，本书收录阿什比主要论文的出版，将重新激发人们对这一智力宝库的兴趣，并将导致其中所包含的许多思想的进一步发展。

来源：宋胖说事儿（公众号）

原网址链接：https://mp.weixin.qq.com/s/W3FmgxL895PSnYSbh1wOtg?scene=1&click_id=19

编辑：张家乐

刘海明 · 发表于 2026-2-4 20:09:22

【案例】

智能的机制——阿什比论文集（2）

大家好，接着由我来为大家翻译控制论先驱阿什比的论文集《智能的机制》。全书共有8个专题40多篇论文，基本把阿什比（除了名著《大脑设计》《控制论导论》之外）主要代表作都囊括了。除了个别零散论文（比如《智力放大器设计》）外，大多没有被翻译为中文。我想尝试翻译出来，与群友共享。也许在今天AI浪潮几乎让人疯狂的背景下，聆听一下这位控制论先驱对智能的思考对我们有帮助，能让我们冷静下来，对AI如实观照。我们接着翻译机制定律的专题。接下来我们翻译的是本专题第一篇论文《控制措施对稳定性的影响》控制措施对稳定性的影响

战争期间，政府管制措施的引入导致许多事务通过行政命令确定某些数量、价格或其他变量，而在自由放任体制下，这些本应由市场自行调节至均衡水平。汇率、工资和价格都是这方面的例子。这种管制不仅在战争期间多次出现，而且和平时期管制或计划经济的进一步扩展，可能会导致更多变量以这种方式被固定下来。

本文旨在指出：在任何一个动态系统中，固定某一变量可能会导致其余变量变得不稳定；同时，本文将论证有一类变量尤其容易引发这种结果。（在社会或经济系统中，向不稳定状态的转变将表现为各种奇特且不良的"恶性循环"随后不断滋生。

该理论可表述如下：一个包含n个变量的动态系统，其方程一般具有以下形式：

在平衡点（该点处各变量的变化率为零）附近，方程可在不失一般性的前提下视为线性的：

系统要在平衡点处保持稳定，其必要且充分条件是：该方程所有根的实部均为负数。

（由于我们讨论的是实际系统，所有系数 aij 均为实数。）进一步地，由于我们讨论的是在自由条件下已存在一段时间且保持稳定的平衡点，故可假设该系统原本处于稳定状态。

现假设我们将 xn 固定。其余部分的稳定性将取决于以下方程根的实部：

第一个系统的稳定性绝不意味着第二个系统也稳定。因此，固定某一变量确实可能导致系统其余部分变得不稳定。

数值示例如下：系统导出方程

λ3+3λ2 +26λ+60=0；

该方程的根为 -2.44，-0.28，±4.95i（其中 i = -11/2）。由于所有根的实部均为负数，系统保持稳定。但若固定 x3，则得到行列式为

该方程的根现为 +1 和 +2 ，故系统变得不稳定。

然而，我们还可以进一步分析。由于所有根之和等于主对角线元素之和 ∑aii ，任何使该和变得不那么负的变化都将趋向于降低系统的稳定性——在其他条件不变的情况下（此处论证诚然不够严谨）。因此，若 ann 为绝对值较大的负数，则固定 xn 尤其可能导致失稳。这类变量不难识别，因其行为遵循方程：

其中 ϵ 独立于 x ，但随时间变化，而a 为绝对值较大的负数。此类变量（x ）具有以下特性：（1）始终趋向于 −ϵ/a ；（2）快速趋向于 −ϵ/a ；（3）由于 −ϵ/a 以 a 为分母，其值较小，故 x 的波动幅度亦较小。

因此，本文结论如下：（1）通过行政命令固定某一社会或经济变量，存在导致系统或其部分失稳的风险（后者表现为各种"恶性循环"的相继出现）；（2）从这一角度看，尤其危险的变量类型是：在自由条件下变化迅速，且通过其快速变化影响其他变量，自身却仅在狭窄范围内波动的变量。

本人并非经济学家，无法提供具体实例，但相信此类实例不难找到。

来源：宋胖说事儿（公众号）

原网址链接：https://mp.weixin.qq.com/s/6jvKV8ksCfQ6ttxpQXIpwA

编辑：张家乐

刘海明 · 发表于 2026-2-4 20:17:37

【案例】

智能的机制——阿什比论文集（3）

大家好，接着由我来为大家翻译控制论先驱阿什比的论文集《智能的机制》。全书共有8个专题40多篇论文，基本把阿什比（除了名著《大脑设计》《控制论导论》之外）主要代表作都囊括了。除了个别零散论文（比如《智力放大器设计》）外，大多没有被翻译为中文。我想尝试翻译出来，与群友共享。也许在今天AI浪潮几乎让人疯狂的背景下，聆听一下这位控制论先驱对智能的思考对我们有帮助，能让我们冷静下来，对AI如实观照。

我们接着翻译机制定律的专题。接下来我们翻译的是本专题第二篇论文《大脑在自然世界中的地位》。

大脑在自然世界中的地位

（此论文为《大脑设计》一书的最初构思，发表于1967年1月15日）

关于大脑，人们已经了解甚多，但我们的大部分知识仍以实验和观察事实的形式存在。然而，随着人们对大脑更一般特性的兴趣日益增长——例如各种形式的"人工智能"——现在亟需对"大脑"的本质进行抽象表述，一种可直接转化为计算机或硬件的表述形式。本文基于集合论和状态决定系统的概念，给出了这样一种表述。

1.一种新机制理论。

我们当然可以这样描述大脑：它是一个物理化学部件的集合体，每个部件作用于许多其他部件，且每个部件都受物理化学定律的支配（在神经生理学家已证实的范围内）。但大脑的部件如此之多，以至于我们处理多部件协同作用的常规方法实际上已无法适用，我们必须停下来重新审视这一状况。

在神经细胞的特性被确定之后，还剩下将这些特性与大量神经细胞组织所呈现的特性联系起来的任务。所涌现的特性是有机体的行为特性，重要的是必须立即认识到：有机器的行为特性绝不能直接从单个神经细胞的特性推导出来，因为有机体的大多数行为特性源于神经细胞之间的相互作用——它们是物理学家所谓的"协同"现象。因此，任何关于神经细胞与行为之间关系的研究，都必须高度重视相互作用的问题。这一主题往往十分复杂，过去曾被认为是令人望而生畏的；但在过去二十年间，我们对复杂机制的理解取得了巨大进展，现在这一主题已可以较为清晰地加以论述。

在1940年前后，试图处理神经细胞与行为之间关系的努力受到很大阻碍，原因在于：有志于科学的机械论者手头只有钟表、车床和打字机这类简单机器作为例子。因此他显然认为，任何"机器"都不可能纠正自身错误、不可能进行预测、不可能具有主动性，等等。这些概括对于1940年前的机器类型而言大体正确，但随着机器此后发展出全新的能力，许多旧有的概括如今已完全错误。

新机器（以及我们可以称之为"新机械论者"的思想）的本质，可以通过简要提及历史事件来最简单地阐明。1940年以前，机械装置（以及思考它们的"经典"物理学）属于"因果"类型，其典型特征是一个原因导致一个结果，然后过程就结束了；上紧发条的钟表走24小时，然后停下；车床接通电源后，循环运转不止；打字机按下按键，打出字母，然后停止。面对这些机器，心理学家也类似地进行理论建构：刺激引发反应，停止；狗经受一系列闪光和强化，形成条件反射，停止。更复杂的行为理论无法形成，因为没人知道如何思考复杂行为。

随后，霍华德·H·艾肯建造了马克一号。查尔斯·巴贝奇在一个世纪前就已理解顺序机械的原理，但未能解决纯机械问题。但马克一号运转了。这是一个通过构造给出的证明："机械装置"可以包括那种将因果串联成无限长链条的类型，每个原因引发其结果，每个结果本身又成为下一步的原因。走走停停变成了走走走走走……，一种全新的计算行为财富被证明是可能的。

第二个重要贡献出现了（事实上稍早一些），当时无线电工程师驯服了"反馈"。人们很早就发现，给无线电接收机增加"再生"是提升其性能的有力方法，但代价是使接收机几乎疯狂般地难以控制。这场战斗持续了30年，但到1940年工程师们获胜了——他们理解了反馈，并能将其作为有用工具加以运用。这一理解是对行为新科学的第二个重要贡献，因为大多数生物系统富含循环作用。1940年以前，缺乏理解使任何现实性的处理成为不可能；甚至只是提及循环作用的存在，也往往使讨论陷入震惊的沉默，因为每个人都在反思自己无法清晰思考此类问题。然而，今天我们不再畏惧这一主题，因为我们知道它可以被理解，且有其自身的逻辑、定理和方法。我们也可以看到，这一进展在于理解长因果链条的特性，在这种情况下是围绕同一物理回路循环往复（而非像马克一号的过程那样线性向前）。

有了无线电接收机和马克一号作为先例，数学家和工程师得以将他们的方法扩展到同一领域。在这里，他们得到一股数学思潮的大力帮助，这一思潮源于怀特海和罗素的著作（1925），试图使数学思维摆脱其对连续性、线性和解析性的过度沉迷。他们的工作由以N·布尔巴基为集体笔名的法国学派充分发展，该学派详细展示了所有数学过程如何可视为对"元素集合"的某些基本运算的特例。对"元素"的全部要求只是它们可被明确识别。它们可以是数字1,2,3,……或直线上的点，但同样可以是气象学家区分的五种云型，或某种鸟类发出的三种叫声，或马的四种行进模式。因此，如果生物学家或心理学家的观念足够明确，可以作为基础，他就拥有了现代数理逻辑可以应用的必要材料。于是，一门完全严谨的行为科学的可能性由此产生。它从观察者的数据出发，将这些数据作为现代集合论中的元素，从而进入数学和逻辑的严谨世界（如Ashby, 1952, 1966）。

行为的新数学或逻辑，不应与本世纪初的"数学生物学"相混淆。当时唯一可用的数学方法是解析的、连续的和线性的形式，最初为解决牛顿问题而发展；在生物数据或概念被修改以适应僵化的数学框架后，它们往往只是生物现实的漫画。然而，新数学完全无需扭曲。它的最初步骤更多地是由机械计算的需求和外在形式引导的，但生物学家不应被这种呈现方式所误导。"有限状态机"（Gill, 1962）、"无噪声转换器"（Shannon and Weaver, 1949）、"状态决定系统"（Ashby, 1952）以及"时序电路"的理论现已充分发展，本质上是同源的。它们基本上都处理这样一种情况：系统的下一状态由紧邻的前一状态决定，这种情况在自然系统中如此普遍，以至于被许多人视为绝对普遍。所有理论都表明，这一（表面上）简单的限制实际上蕴含着深刻而广泛的推论。

状态决定系统这一基本性质的表述可以采取多种形式，行为理论的学习者必须准备在它们出现的任何形式中识别它们。最简单的形式明确陈述下一状态（x'）作为较早状态（x）的函数是什么：

因此，如果 x′=x+0.7 ，那么状态 x=0.2 之后，x 将变为 0.9 ，然后是 1.6 、2.3 ，依此类推。如果将 x 视为在步骤 1,2,3,... 时取一系列值 (x1,x2,x3,...,xn) ，那么同样的方程将表现为：

有时 x 被视为时间 t 的函数，并记作 x(t) ；如果时间以步长 Δt 推进，那么方程将表现为：

一种等价的方法是，不指定 x 的新值，而是指定它相对于先前值的变化量 Δx 。于是 Δx=x′−x=x(t+Δt)−x(t) ，方程将具有如下形式：

其中 g 是函数：f(x)−v 。如果步长变为无穷小，在时间间隔 dt 内，Δx 变为 dx ，方程则变为常一阶微分方程的形式：

上面假设代表一组值中某一个值的符号 x ，可能是一个向量，例如具有 n 个分量。如果这些分量变量为 x1,x2,...,xn （其中下标用于区分不同变量，而非如方程 (2) 中表示不同步骤），则方程可具有以下扩展形式：

如果步长为无穷小，方程则变为一组联立常一阶微分方程：

有时下标本身是连续的，且 g 函数可能表现出某种特殊关系。热传导（热量或溶质的扩散）就属于这种情况，此时温度或浓度 x 随时间的变化方式取决于沿线性距离 y 的相邻温度；于是方程变为（例如）：

这里重要的是，所有具有上述任何类型可规定行为方式的系统，都受制于一种新的机制逻辑。通过这种方式，许多独立发展起来的知识分支可以被整合在一起，获得统一的行为理论。读者必须认识到，尽管这一理论包含了数学物理学的许多结果（如上面的方程 (8)），但它并不受其限制。其基本概念是"映射"（mapping）。它总是从一个集合（其"定义域"）到一个集合（其"值域"），是一种规则（或过程、转换、变化或任何其他对应关系），对于定义域中的每个元素，给出值域中一个且仅有一个元素。正是"一个且仅有一个"这一特性刻画了"映射"，而非某种物理作用；因此，如果两个集合是母亲和女儿，映射是从女儿到母亲：因为每个女儿有且仅有一个母亲，而每个母亲可能有多个女儿。下面，如果映射 μ 将元素 x （在定义域中）转换为 y （在值域中），我们将写作：

定义域和值域有时可能是同一个集合；例如，"平方"运算将整数集映射到整数集。当这种情况成立时，映射可以重复进行，从元素生成：

将此方程与前面的方程 (2) 相比较，我们可以看到，映射的数学概念为我们提供了表示状态决定系统（state-determined system）所需的形式。如果不涉及此处不适宜的技术细节，这个主题就很难进一步深入。但我希望已经说得足够清楚，以表明以下命题是可以辩护的：1）现代机制理论建立在映射概念之上，包含了过去获得的科学知识；2）现代机制理论通过大量考虑因果关系（既包括长序列中的，也包括带有反馈的），为生物学和心理学的复杂事实提供了充分的技术和逻辑；3）机制的现代逻辑根本上是一种行为的逻辑（而非物质或能量的逻辑）。因此，新机制论者（New Mechanist）感到自己有能力尝试弥合神经元与行为之间的鸿沟，但他也或许格外意识到，要弥合的鸿沟有多么巨大！五十年前，这似乎很简单：刺激进入，反应出来——还需要什么？当时人们假设，所需要的只是大量的反射，加上一点整合把它们焊接在一起即可。不幸的是，随着对机制的理解不断深入，人们也越来越认识到神经元活动与整个有机体行为之间的概念距离有多么遥远。今天的处境与物理学中的情况不无相似：当一位钢桥设计者反思其技艺建立在量子物理之上时。今天没有桥梁设计者会直接诉诸量子物理定律：这种联系必须经过几个阶段，通过原子运动、晶体结构、金属强度、实用冶金学、梁的强度，最终到达整体结构。从神经元到行为的鸿沟似乎同样将必须分阶段来弥合。接下来的章节将概述这样一种尝试

来源：宋胖说事儿（公众号）

原网址链接：https://mp.weixin.qq.com/s/ROc8JN1COsLGp5cRWQd0aA

编辑：张家乐

刘海明 · 发表于 2026-2-5 21:35:30

【案例】

智能的机制——阿什比论文集（4）

大家好，接着由我来为大家翻译控制论先驱阿什比的论文集《智能的机制》。全书共有8个专题40多篇论文，基本把阿什比（除了名著《大脑设计》《控制论导论》之外）主要代表作都囊括了。除了个别零散论文（比如《智力放大器设计》）外，大多没有被翻译为中文。我想尝试翻译出来，与群友共享。也许在今天AI浪潮几乎让人疯狂的背景下，聆听一下这位控制论先驱对智能的思考对我们有帮助，能让我们冷静下来，对AI如实观照。

我们现在翻译的翻译机制定律这一专题。今天接着翻译的是本专题第二篇论文《大脑在自然世界中的地位》后续部门。

2演化与平衡

" behaving organism "（具有行为的有机体）可以从三种截然不同的观点来讨论。

第一种观点讨论其内在意识、其觉知。我将从这个角度无话可说，因为我无话可说；这个问题涉及极为困难的哲学和科学方法问题。

第二种观点考虑其创造性方面，如一个人发明新的音乐和谐系统或创作出乔伊斯式的散文。对此我也无话可说，因为我没有客观标准来区分这类产物与鹅卵石的吱吱声，或由词典和随机数表生成的一系列词语。当"什么都可以"时，科学就没什么可说的了。

第三种观点将具有行为的有机体视为为生存而塑造的：作为一个高度适应其环境的系统，由演化和自然选择塑造而成，并且能够（特别是在人属物种中）产生极其复杂的行为模式，这些模式显示出（对机制论者而言）对环境惊人复杂的适应。在这里，大脑被视为仅仅是一种促进生存的器官。这第三种观点如今已取得了一定的完整性，因为已不再存在完全神秘的大型鸿沟。我们今天所见的将在下面概述。

我们的出发点是这样一个确立已久的事实：地球约在五十亿年前凝固，自那时以来，影响其表面的条件要么相当恒定——如能量定律、引力定律、碳和水的性质等——要么变化缓慢——如其温度、到达地面的阳光质量、海洋的组成。

机制的逻辑现在变得适用。地球表面在每一时刻都将具有一个明确定义的状态——每粒沙的位置、每点的温度、每个物种的分布等等。自然定律在每一点上作用，决定该状态将如何变化。由于每个状态都转向某个状态，且从不转向两个状态，自然定律规定了可能状态集合到同一集合的映射。（这种表述是否完全真实尚不清楚；它在很大程度上肯定是真实的，而且它也是指导科学家日常工作的普遍假设。在本文中，我们将假设它是完全真实的；原子不确定性造成的复杂性会使我们反复说"统计上确定的"或"平均而言"，但这种修正不会使以下概述产生重大改变，因此我们将忽略这种复杂性。）

让我们将由自然定律及其基本力引起的映射称为L，因此，如果它作用于状态 s，它将 s 改变为 L(s)。现在，说地球表面的定律和条件基本未变，意味着映射（或算子）L 随时间未变，因此作用的操作符序列一直是重复序列：L, L, L, ...而非，比如说，L,M,N,... 这样的序列。

如果定律或条件发生了显著变化，就会出现这种情况。这一（看似微不足道的）观察实际上将为我们严格处理生命和智能的起源提供一个可靠的出发点。

我们从这样一个事实出发：第一个序列显示出高度的冗余性（按香农和韦弗1949年定义的意义），从而显示出约束；因为较大的集合（由 J,K,L,M,N,... 按某种顺序组成的所有序列）被限制为一个子集（仅由元素 L 组成的那些序列）。布尔巴基学派已经证明，特别是在"集合的层次与结构"一节中，对子集的限制始终是产生性质、关系、模式、结构（这些词在普通语言中使用，或在数学中具有特殊精确性）的根本操作。因此，从映射理论来看，我们可以预期由单一算子重复生成的状态序列会显示出特殊特征。这种特殊特征出现的一种方式是处于平衡态——即满足以下关系的状态：

L(s)=s （11）

这类状态在将大脑作为生存器官的研究中具有最高的重要性。

应该注意到，大多数"经典"的平衡例子——静止悬挂的摆、停走的手表、所有反应耗尽的化学混合物——都极其简单，并且完全依赖于有限量的能量。另一方面，"开放"系统仍然可以是一台"机器"（正如计算机通过状态决定而成为机器），但可能显示出这富有层次和魅力的的平衡态（有时区分为"稳态"）。这种丰富性来自于这样一个事实：从某一研究层次上被视为"状态"的东西（因此未被分析），在更仔细检查下，可能被发现具有丰富的内部结构。因此，罗马帝国在数百年间保持为可识别的同一实体，尽管遭受许多扰动，而更仔细的考察表明，实际上大量的个人活动和变化促成了帝国整体的稳定性。在这种情况下，严格的处理仍然是可能的：如果（按定义）满足

L(S)=S (12)

即，如果 L 作用于S 不产生新的状态（即 L(S)=S ）。

因此，尽管 L 可能将状态 s1 改变为 s2 ，它的作用只是引起集合 S 内部的变化；而且如果 S 具有某种特征性质，当 L 作用时这一性质不会丧失。（"位移后的稳定性"是一个特例，其中 L 是复合映射 λn∘Δ ，这里Δ 是实现某种位移的算子，使得 Δ(s)=s ，而 A 是其重复操作最终使状态从 Δ(s) 回到 s 的映射。）

"所有系统都趋向平衡"这一陈述包含了许多经验，但对于严格的行为理论来说过于模糊。然而，它不成立的情况似乎都是高度特殊的，并且需要精确的构造。即使一个系统没有平衡态（或循环），它也会趋向某些"优选的"区域或状态集合；只有当——如果该系统由以下条件规定时——才没有偏好（在相空间中轨迹没有收敛或发散）：

g ‘s函数具有这样的特殊性质：处处（都满足某种条件）

同样，如果系统是随机的且马尔可夫的，它也会趋向某些"优选的"状态，除非转移概率矩阵不仅其行相加为1，其列也相加为1。因此，"系统趋向平衡"这一陈述确实有一定的合理性。在任何特定情况下，数学上可接受的形式都必须根据具体情况来发展以适应其细节。

因此我们可以说，具有不变定律的大多数系统（即处于不变条件下的系统）会趋向它们滞留的状态（或状态集合）；通过显示出向这类状态的收敛性，它们在定律与系统状态之间（以及在其组成部分之间）产生了关系。所产生的这种关系就是"适应于生存"。在初级层次上，这种关系是重言式的；在复杂系统的后果中，它发展出无限的复杂性。

在平衡态，各部分之间的关系必然是整体性的，且是一种协调关系。下面将给出一个例子来说明其含义。设矩阵为：

作为算子，或定律，或驱动力，它通过模12乘法改变状态（如向量

变为状态或向量

在这种情况下，状态已被改变。然而，向量

却被算子保持不变：

这些结果分别超过12的倍数2、5和3，因此状态被再生，且是平衡的。这里重要的是，三个分量值——2、5和3——协同作用以相互保存。例如，5依赖于2，因为5是由

3×2+1×5+2×3

得到的。如果2是1，结果就会

3×1+2×5+2×3

即14或2（如第一个例子中）。

这种协同作用是相当普遍的。在任何平衡态（无论简单还是具有复杂内部结构），各部分总是相互作用，使得所有部分的作用是再生每一个部分的状态。因此，如果我们仅仅观察一次再生行为，我们完全可以这样说：这组部分正在（在这些自然定律范围内）行动，以保持其条件不变。

那么，给定一个动态系统是孤立的，今天已存在一个完全严格的理论，说明它为什么应该趋向于以行为上"自我保护"为特征的状态或形式。但"状态或形式"必须等同于"有机体加环境"这一系统。例如，在绿洲，水井使村民存活，而村民维修水井。两者之所以能够持续存在，是由于它们之间恰当的相互作用。生物体所显示的"适应"总是针对其环境的某种性质：让环境改变，曾经适应的行为方式可能变得完全不合适。

（确保生存的）关系在那些稳定状态集合呈"柱形"的情况下，在概念上变得更简单，也就是说，其中某些变量保持在明确标记的界限之内。这些变量随后被识别为适应系统的"本质变量"——如果整体要生存，这些变量必须保持在"生理"限度之内：如食物的供应、循环血液的体积、威胁骨骼和皮肤连续性的压力、温血动物的体温等。

因此，严格的行为理论与生理学家不谋而合，都将内稳态视为所有适应性行为的核心。在研究行为时，“本质变量很容易被忽视。它们几乎保持恒定，而非本质变量则在很大范围内波动，变化迅速，通常会吸引观察者的注意。然而，非本质变量的戏剧性活动是次要的：它们之所以有意义和关联，仅仅是因为它们剧烈的变化起到了将本质变量保持在限度内的作用。如果它们产生了其他效果，这些效果对研究基本原理的学者而言，仅仅是副产品。

“内稳态”这个词最初由沃尔特·B·坎农（1932年）创造，用来描述这些过程，只要它们发生在生物体的自主、植物性和内部过程中。然而，严格的行为理论强调，这里内部与外部的任何界限最终都是武断的，许多过程同时利用内部和外部因素，并且共同的原则支配着两者。出于这些原因，如果不想失去行为理论的基本统一性，观察者能够将非本质变量（有机体行为）的自由活动与其最终实现的内稳态联系起来，并且是这种内稳态赋予了它们最终的意义，这一点至关重要。只有这样，有目的的自由活动才能与那些仅仅是力量在行动中表现的活动区分开来。当然，本质上两者并无区别：它们仅在对于某种已被理解的内稳态的关联性上有所不同。

从这个观点来看，人只不过是一个物种，它专门发展出了极其复杂的自由活动，并且设法获得了其中一些优势，同时避免了大部分危险。他可以熔化钢铁而不烧伤自己，可以制造和运行发动机而不被撕成碎片，可以跨大陆输送电力而不被电死。通过这种方式来看待人类的活动，我们可以从地球长期隔离这一基本事实，推演出一个连续的线索，直至那些总是倾向于内稳态行为的极其复杂系统的出现。

现在让我们更详细地考察这些自由活动，这些行为，以便了解人类那些众所周知的行为如何与其背后的机制联系起来。我们将首先考察称为“反射”的非常简单的行为片段，然后是更复杂类型的称为“本能”的行为，最后是那些很大程度上依赖于“学习”的行为。所有这一切都将被视为是支配（并驱动）所有物理化学事件的基本映射的表现形式，这些形式通过自然选择塑造为内稳态形式。

来源：宋胖说事儿（公众号）

原网址链接：https://mp.weixin.qq.com/s/ncKN6E5qT3guFAeh8A3YYA

编辑：张家乐

刘海明 · 发表于 2026-2-6 19:47:41

【案例】

智能的机制——阿什比论文集（5）

大家好，接着由我来为大家翻译控制论先驱阿什比的论文集《智能的机制》。全书共有8个专题40多篇论文，基本把阿什比（除了名著《大脑设计》《控制论导论》之外）主要代表作都囊括了。除了个别零散论文（比如《智力放大器设计》）外，大多没有被翻译为中文。我想尝试翻译出来，与群友共享。也许在今天AI浪潮几乎让人疯狂的背景下，聆听一下这位控制论先驱对智能的思考对我们有帮助，能让我们冷静下来，对AI如实观照。

我们现在翻译的翻译机制定律这一专题。今天接着翻译的是本专题第二篇论文《大脑在自然世界中的地位》后续部分。

3反射有机体

反射，以其多种形式，在一般理论中呈现不出什么困难，因为现在已知，并且已在多种方式中得到证明，如果各部件具有某些最小性质，那么由它们组成的足够大和复杂的网络可以产生任何明确定义的行为。因此，那个老问题：机器能做吗？答案总是肯定的；只要所要求的活动能够以操作上有意义的术语进行明确的描述。生理学的所有反射都很有能力，而"反射问题"本质上就是发现每个特定反射的特定细节。

其中许多是调节性的，即稳态的，这在今天并不提供什么异常困难，因为现在众所周知，这种调节只需要（由基因模式）提供一个反馈（从主要效果返回原始原因的任何因果链），安排成"负"的，即返回的效果从原始扰动中减去，从而倾向于抵消它。在复杂情况下，"减法"操作可能必须以技术上复杂的方式理解，但基本思想保持不变。这种反馈的理论现在已广泛发展，部分在伺服机制理论中。希望使用这种反馈的本质上稳态方面的生理学家，不应剥夺自己从反馈机制理论中可以获得的大幅增加的知识和技术辅助。

然而，生物学主题的研究者会注意到，这种理论往往过于专门化于反馈是线性和连续的那些情况。生物调节器往往严重地是非线性的（反应与刺激不成比例）和非连续的。在反射水平研究这种调节不需要新原理，只需要新技术。这种非线性和非连续的调节在其最复杂的形式中出现在学习反应中（后面提到）。

4本能有机体

虽然反射有机体在机械论表述中几乎没有什么困难，但这种困难只有在反射保持简单时才很小。然而，现代机制理论设想的是复杂性无限的机制，既在其工作部件的数量方面，也在支配其内部活动的复杂条件性方面。

今天被识别和列出的"本能"，每一个都有一个目标，但这一事实并不使它们脱离机制的类别，因为任何具有某种持久性和某种结局的可描述行为片段都必须有一个界限，因此在某种意义上具有稳定性——纯粹短暂的和容易转移的既不被注意也不被命名。因此，任何具有许多平衡状态的系统都可以被描述为具有同样多的目标和"本能"。日常生活中的机器似乎缺乏它们，仅仅是因为这些机器在行为方式和复杂稳态方面太过贫乏。让一台机器具有现代的活动和丰富的可能性，观察者很快就能命名其行为中的许多趋势，如果在生物有机体中，这些趋势会要求被识别为"本能"。

曾经有一段时间，本能被认为与反射根本不同，因为本能往往是由某种无法与任何特定物理或化学事件相识别的情况或事件引发的。因此，狗往往在"某种奇怪的东西"出现时会吠叫，而"某种奇怪的东西"无法与任何特定的声音或视网膜的任何特定刺激相识别。然而，现在已知，这种对刺激之间组合和关系的反应特性，如果机制以阶段或层次工作，使得第一层次"计算"初级刺激的各种函数，然后后续层次计算这些函数的函数，最后阶段只有在这些"计算"过程在倒数第二阶段产生了某种实际物理事件时才起作用，那么这种特性就很容易从机制中获得。这样，对初级刺激的任何定义函数，无论它可能多么复杂或微妙，都可以以纯粹的机械方式转化为适合作为本能行动物理原因的物理事件。反射和本能之间的明显区别之所以产生，部分是因为较早的理论大多无意识地基于一个单层次模型：刺激到反应，没有中间处理。

通过进化发展的有机体，因此发展出越来越复杂的机制，提高其以越来越复杂的方式对环境的扰动和威胁进行稳态反应的能力。这种进展有多么有序？在这里，机制的逻辑是坚定不移的：一般来说，每一个新的添加，每一个扩展，都会导致一个本质上全新的总体系统，其性质也是新的。只有当存在特殊的简单性时，新的扩展才能给出仅仅添加到已有行为集合中的新行为。一般来说，无论机器有多大，对其做出的改变有多小，如果机器不受限制，我们就无法对其行为中可能发生的变化的大小设定任何限制。数学家知道相应的事实，即如果

那么当参数 a 具有特定值 a1 时，这个系统的行为并不以任何方式限制 a 被改变为 a1+Δa 的系统的行为。

这一事实，尽管对那些寻找简单性的人来说是不愉快的，但在机制理论和行为分析中是基本的。正如少数化学元素（C、H、N、O）可以以许多组合放在一起形成有机化学的许多化合物一样，许多其他单元（晶体管、神经元、分子）也可以放入组合中，其行为多样性不受单元统一性的限制，而可以像其组合数量一样多样。这种丰富性正是来自单元之间积极相互作用存在的丰富性，简单性只在相互作用很小时发生（单元很多时）。

应该注意的是，整个系统的行为不能通过我们将整个系统视为由各种反馈环组成，找到每个单独环固有的行为，然后以任何方式添加或组合单独行为来预测。例如，已经构建了这样的系统，其中每一个可能的环都具有负反馈（因此每个环本身将是稳定的），但整体上却显示出不断增加的不稳定性发散（例如，Ashby，1952）。同样，机制的逻辑表明，我们没有权利期望本能（作为行为中观察到的复杂趋势）将是简单的、整洁的或整齐可分类的。在这里，实地工作者或临床医生有最后的发言权，因为只有他能说什么本能值得区分、定义和命名。

5学习有机体

学习和记忆的本质，曾经如此神秘，在过去二十年中已完全阐明，现在可以将它们视为与物质中发生的其他过程完全同源的整个过程。基于所有物质中的过程（原子水平以上）都是状态决定的这一基本假设（得到两个世纪科学工作的强烈支持），当观察者无法观察系统的每一个变量，因而发现它不可预测时，通过考虑他在可观察事物中的较早事件来恢复可预测性，"记忆"的概念就变得适用了。因此，如果三个变量——x 、y 和 z 的系统——只能在 x 处被观察，观察者很可能会发现，t+1 时刻的 x 值是可以预测的，只要他知道 t 、t−1 和 t−2 时刻的 x 值。从信息论的角度来看，这种变化非常简单：变量 y(t) 和 z(t) 被变量 x(t−1) 和 x(t−2) 所取代，正如它们可能被 x 、y 和 z 的任何两个函数所取代一样。

这种类比是精确的。如果检验（用香农的记号）

H(x)+H(y)−H(x,y)≠0

表明在他的意义上"传输"正在 x 和 y 之间发生，我们就有了两个空间分离变量之间的普通传输，比如说，神经系统中的两个点之间。如果检验

H[x(t)]+H[x(t−k)]−H[x(t),x(t−k)]≠0

成立，那么"传输"（以完全相同的方式定义）正在 t 时刻 x 的事件与 k 个时间单位之前在 x 发生的事件之间发生。当如此时，我们就有了允许我们将"记忆"视为时间上传输的基本性质，这与我们充分理解的空间上的传输完全同源。

两个时间之间的传输在物理上应该是可能的，这需要某种特殊的物理机制，正如两个地点之间的传输一样。所使用的机制，虽然在某些方面差异很大，但总会使用某种形式的平衡，因为试图将某种状态从一个时间携带到另一个时间，而不被破坏和不丢失信息，要求某种东西在该间隔内是不变的，而"不变性"是"平衡"的核心。

用什么物理或化学"状态"来保持不变，来携带"记忆"，在行为的更大问题中并不重要：所必要的是该状态应该具有某些性质：如何实现这些性质可以由纯粹局部意义的事项决定。显然，正如没有人期望一种方法被用于大脑和身体中所有从一处到另一处的许多传输一样，同样没有理由期望只有一种方法被用作从较早到较晚传输的"记忆基础"。更有可能的是，有机体将使用多种方法，每一种都适应于其特定目的的需要。

因此，记忆痕迹的细节在行为的更大问题中几乎没有什么意义。更有意义的是首先用于制作记录的方法，以及后来有利地使用它的方法。目前，我们的科学思维往往被大型数字计算机的例子严重误导。它有一个大的记忆存储，远离工作部件，工作部件将可记录的事实发送到特殊地方，然后后来回到完全相同的地方重新获得信息。这种方法，需要大量精确连接的线路，在生物机械中几乎无法实现，尤其是因为这种机械必须使用易受损伤、饥饿、感染和类似扰动的部件。更有可能的是，大脑的大多数记忆痕迹发生在其作用部位，并在那里保留。因此，似乎有助于特定反应（例如，回答"你叫什么名字？"）的痕迹将是广泛分散的，每一种只有很小的效果，但在它们的总效果中累积成对行为的决定性决定。"记忆"的概念将不得不变成"诸记忆"，就像中世纪的"动物热"作为一个统一体，变成了今天所知的关于代谢和氧化的一切。在记忆类型的一端是那些对行为留下永久印记的简单事件，那些常被称为"痛苦的"或"可怕的"。这些学习往往使用自然选择发展的先天机制，准备学习和记录什么是痛苦的，但需要由儿童的特定环境提供细节。训练机制（产生"被烧伤的孩子"的行为）显然是稳态的，[它是一种稳态机制，其设计的最终细节被推迟，直到必要的信息由环境提供。这种发展稳态机制的方法在本质上显示了学习过程的所有必要特征；"更高"的形式本质上是相似的，被发展到复杂得多的程度。

3.6复杂性

机制的逻辑，定量地使用，表明任何像人脑一样复杂的机制，如果它及其环境是丰富连接的（内部和两者之间）——可能性将如此巨大，以至于所有地质时间都不足以将未组织的网络发展到适应的形式（Ashby, 1952），那么它永远不可能通过进化或个人学习被带到充分自我保存的形式。大多数儿童达到相当适应的成人状态之所以可能，只是因为适应可以分阶段发展。因此，我们的地球环境允许儿童学习如何将水倒入杯子，而与他刚刚学习的英语无关，这些又与他学习捏狗时狗会做什么无关。有时必须学习的东西不是完全可分离的，但允许学习分阶段发生，每个阶段只能参照先前建立的东西来建立。因此，算术可以按加法、减法、乘法、除法的顺序学习，但不能按相反顺序。而要想学撑杆跳，必须先学会站立、行走、奔跑和操纵长物体。因为我们的地球环境允许成人的充分适应主要分小阶段发展，这个过程比完全泛化的情况要简单得多。

然而，一旦对观察者如果要充分理解人类有机体中在他面前的东西必须获得多少信息做出定量估计，我们就会发现信息量可能超出一切可能的界限（例如，Bremermann, 1965），即使是最慷慨的允许。似乎很清楚，当我们离开关于大脑的旧思维方法，及其严重的过度简化，转向现代方法时，我们将不得不认真对待信息量的问题，以免浪费时间尝试不可能的事情。

"复杂性"的问题必须在我们试图理解大脑（无论是自然的还是人工的）的尝试中发挥主导作用，因为一旦我们离开1940年之前我们知道的机制，我们就到达复杂性以压倒性速度增加的形式。它们中的大多数性质增加，不是作为体积或质量，而是以组合速度，因此它们增加的阶数要么是 e^n 或 n!，或者更快（例如 Ashby, 1966）。因此，在任何合理时间内发生适应的可能性根本上依赖于简单性的存在。相互作用不完全或微弱的情况，事实上，在我们的地球环境中非常常见，而所知的情况表明，大脑已被进化深刻地塑造以利用这一事实。因此，通过实现一系列子目标来致力于主要目标的极其常见的方法是这种适应的一种表达。目前几乎不能说更多，因为与复杂环境反应的复杂动态系统的一般研究才刚刚开始。

然而，今天，关于机制的逻辑已足够了解，表明神经元单位的性质可以与整个有机体的较大行为相关联的一般原则，可以被追溯，其严格性仅受我们时间和耐心的资源限制。

3.7致谢

本文所基于的工作得到美国空军科学研究办公室 Grant AF-OSR 7-63 和美国公共卫生部 Grant GM 10718-01 的支持。参考文献略

来源：宋胖说事儿（公众号）

原网址链接：https://mp.weixin.qq.com/s/UaQ7ew97jH8v2FWAHhsGGQ

编辑：张家乐

刘海明 · 发表于 2026-2-7 21:04:17

【案例】

智能的机制——阿什比论文集（6）

大家好，接着由我来为大家翻译控制论先驱阿什比的论文集《智能的机制》。全书共有8个专题40多篇论文，基本把阿什比（除了名著《大脑设计》《控制论导论》之外）主要代表作都囊括了。除了个别零散论文（比如《智力放大器设计》）外，大多没有被翻译为中文。我想尝试翻译出来，与群友共享。也许在今天AI浪潮几乎让人疯狂的背景下，聆听一下这位控制论先驱对智能的思考对我们有帮助，能让我们冷静下来，对AI如实观照。我们现在翻译的翻译机制定律这一专题。今天我这给大家刊登第三篇文章的摘要，因为这篇集合论的内容非常多，且枯燥。

机制与稳态的集合论

（这是 W. Ross Ashby（控制论与系统论的先驱学者）发表于 1964 年的经典论文，载于《General Systems》第 IX 卷第 83-97 页。这篇论文将集合论方法引入生物学和复杂系统研究，强调了同胚映射在简化复杂系统分析中的作用。）

该文的展开就是《控制论导论》

摘要

过去二十年见证了科学向此前避而不谈的疆域进军——那就是本质上复杂的动态系统世界。一百年来，像大脑、社会、经济、原生质、胶体这样的动态系统，主要都是用古典科学方法来处理的；试图将整个系统还原为许多简单单元的组合，单元间仅存在无穷小的相互作用。然而，统计方法和矩阵方法的出现，开始使科学家能够更成功地处理中等复杂的系统。随后是大型通用计算机的出现；尽管它向科学家提出了又一个极其复杂的系统，但其清晰的行为逻辑极大地启发了他，以至于今天处理高度复杂系统的整体逻辑和策略已变得无比清晰；再加上信息论的规范，他得以获得一种全新的清晰度和严谨性。

对生物学家而言，这种新的严谨性的需求可能并非一目了然。然而，如果生物学要研究并真正理解复杂的系统，它所使用的方法必须是恰当的。其中首要的是"简化"方法：不是依靠迄今为止常用的直觉性经验法则，而是使用同胚映射的更为发达的方法。这种方法前景广阔，但其运用需要严谨性和技术；这些从何而来？

本文所述的方法之所以被提出，是因为作者在过去二十年中发现它是无价的指南。由于其概念最初完全不涉及连续性、顺序、度量或线性（尽管并不排斥这些因素），这种方法可以应用于生物学事实，而无需仅仅为了数学上的缘故而扭曲事实。

本文描述的方法基于以 N. 布尔巴基（N. Bourbaki）为笔名写作的法国学派的工作。正如他们的巨著所表明的，所有数学，以及因此所有精确思维的产物，都可以建立在集合论的基础上，因此将本文的方法与他们的方法完全保持一致具有相当大的优势；这样我们就可以确保这种方法与所有数学之间能够随时安全地互换。因此，他们的《结果集》（"Fascicule de résultats"）被作为本文方法的基础。（在我看来，他们完整的三卷本《集合论》（"Théorie des ensembles"）对面向生物学的工作者几乎没有增添什么价值。）我还大量借鉴了 J. 里格（J. Riguet）的工作，他将布尔巴基的工作扩展到了代数化并为其提供了一套演算体系的方向。特别归功于他的定理在正文中均有注明。

这种方法的最后一个优势在于，它在每个阶段都随时容纳对"信息量"的各种度量，例如香农（Shannon）以及麦克吉尔和加纳（McGill and Garner）的度量。对真正庞大而复杂系统的研究，处处都受到信息量大小的支配，以及它是否超过研究者信息处理资源的限制。该方法几乎直观地表明了信息量将如何被测量，这并非其最微不足道的优点。

来源：宋胖说事儿（公众号）

原网址链接：https://mp.weixin.qq.com/s/_1eyWjSWDvlUpkLQ5keQrg

编辑：张家乐

刘海明 · 发表于 2026-2-8 21:25:11

【案例】

智能的机制——阿什比论文集（7）

大家好，接着由我来为大家翻译控制论先驱阿什比的论文集《智能的机制》。全书共有8个专题40多篇论文，基本把阿什比（除了名著《大脑设计》《控制论导论》之外）主要代表作都囊括了。除了个别零散论文（比如《智力放大器设计》）外，大多没有被翻译为中文。我想尝试翻译出来，与群友共享。也许在今天AI浪潮几乎让人疯狂的背景下，聆听一下这位控制论先驱对智能的思考对我们有帮助，能让我们冷静下来，对AI如实观照。

我们现在翻译的翻译机制定律这一专题。今天我这给大家本主题的第四篇文章《自组织系统的原理》。

自组织系统的原理

（本文讨论了组织理论的核心概念，特别是"条件性"（conditionality）与"通信"（communication）之间的关系，以及如何使用不确定性分析（Uncertainty Analysis）来量化组织程度。）

原则性问题有时被认为过于不切实际而不重要，但我认为在我们的学科中绝非如此。我们必须处理的现象范围如此广泛，如果完全在技术或实践层面上处理，我们将被其巨大的数量和复杂性所击败。整个范围只能分块处理；在这些分块中，有些是复杂整体的同态映射，我们称之为"抽象理论"或"一般原理"。只有它们才能提供鸟瞰视角，使我们能够在这个广阔领域中活动而不会迷失方向。因此，我提议尝试这样一种鸟瞰式概览。

1.什么是"组织"？

我们工作的核心在于"组织"这一基本概念。我们指的是什么？正如它在生物学中的用法，这是一个有些复杂的概念，由几个更原始的概念构建而成。由于这种丰富性，它不容易被定义，有趣的是注意到，虽然 March 和 Simon（1958）使用"组织"一词作为他们书的标题，但他们并没有给出正式定义。在这里我认为他们是对的，因为这个词涵盖了多种含义。我认为将来我们会较少听到这个词，尽管它所对应的操作，在计算机和类脑机制的世界中，将变得越来越重要。

在我看来，这个概念的核心是"条件性"。一旦两个实体 A 和 B 之间的关系以 C 的值或状态为条件，那么"组织"的一个必要组成部分就存在了。因此，组织理论部分地与多变量函数理论是共同延伸的。

我们可以通过问"它的反面是什么？"来从另一个角度看待这个问题。"以……为条件"的反面是"不以……为条件"，因此"组织"的反面因此必须是，正如数学理论清楚地表明的，"可还原性"概念。（它也被称为"可分离性"。）这在数学形式中发生，当看起来像是多个变量（可能非常多）的函数在仔细检查时被证明具有那些行动不以其他部分的值为条件的部分。它在机械形式中、在硬件中发生，当看起来像一个机器被证明由两个（或更多）子机器组成，每个子机器都独立于其他机器而行动。

"条件性"及其反面"可还原性"的问题当然可以用多种数学和逻辑方法来处理。我稍后会说一些关于这种方法的内容。然而，在这里我想表达这样的观点：Garner 和 McGill（1956）引入的不确定性分析方法为我们提供了一种处理条件性的方法，它不仅完全严格，而且具有极高的普遍性。它的巨大普遍性和适用于复杂行为的特点在于，它适用于任何任意定义的状态集合。它的应用既不需要线性，也不需要连续性，不需要度量，甚至不需要排序关系。通过这种计算，条件性的程度可以被测量、分析，并以完全类似于 Fisher 的方差分析方法的方式分配给因素和相互作用；然而它不需要变量中的度量，只需要各种状态组合发生的频率。在我看来，正如 Fisher 的方差分析概念为理解度量上变异之间可能存在的复杂关系带来了大量光明，McGill 和 Garner 的不确定性分析概念可能为我们提供一种更好的理解，即如何处理变量为非度量时的关系复杂性。在心理学和生物学中，这种变量非常普遍；毫无疑问，它们也将在计算机中发展的类脑过程中普遍出现。我期待 McGill 和 Garner 的方法成为处理此类问题的通用语言，以便用定量方式思考和处理这些问题的时候到来。

对"条件性"的处理，无论是通过多变量函数、相关分析、不确定性分析还是其他方式，都使我们意识到基本思想是：首先存在一个乘积空间——即可能性空间——在其中相关或约束诱导了现实。这种看待"条件性"的方式使我们意识到它与"通信"有关，当然，当部分之间存在"通信"（在某种广义上）时，我们应该将部分定义为"组织"的，这是相当合理的。（同样，自然的反面是独立性，它代表非通信。）

现在，从 A 到 B 的"通信"必然意味着某种约束，A 发生的事件与 B 发生的事件之间存在某种相关：如果在 A 给定事件的情况下，B 可能发生所有可能的事件，那么从 A 到 B 就没有通信，对可能发生的（A，B）对也没有约束。因此，变量之间"组织"的存在等同于变量之间"通信"的存在。

我强调这一点，因为在过去，生物学家倾向于将组织视为某种额外的东西，某种添加到基本变量上的东西，而基于通信逻辑的现代理论则将组织视为一种限制或约束。这两种观点因此是截然相反的；不存在哪一种绝对正确的问题，因为每种在其上下文中都可能是适当的。但由于存在这种对立，我们必须格外小心行事，特别是在与他人讨论时，以免陷入完全的混乱。这个类比可能看起来有些复杂，但我确信它是可接受的，因为我们必须认识到，组织理论的讨论具有在物理学和化学等更客观的科学中未发现的特点。这种特点就在于我刚才提到的这个乘积空间。这个乘积空间从何而来？它的主要特点是它包含的比真实物理世界中实际存在的更多，因为正是后者给了我们实际的、受约束的子集。

现实世界呈现的是"现有之物"的子集；而乘积空间则代表观察者的认知不确定性。因此，当观察者改变时，乘积空间也可能随之改变；面对同一实际事物中的同一组实际事件，两个观察者完全可以合理地采用不同的乘积空间进行记录。由此可见，"约束"乃是观察者与事物之间的一种关系；任何特定约束的性质都同时取决于真实事物与观察者双方。由此推论，该理论的相当一部分将涉及那些并非事物内在固有、而是存在于观察者与事物之间的关系的属性。我们稍后将会看到一些有关这一事实的引人注目的例子。

2.整体与部分

如果说"条件性"是组织概念中的一个基本组成部分，那么同样基本的假设是：我们所谈论的是一个由部分构成的整体。这一假设值得我们稍加审视，因为当前的研究正在发展一种组织理论，这种理论并不观察部分及其相互作用，而是将系统视为一个未经分析的整体（Ashby, 1958, a）。当然，在物理学中，我们通常这样开始描述一个系统："设变量为 x₁, x₂,..., xₙ"，从而一开始就将整体视为由 n 个功能部分构成。然而，另一种方法处理的是整体未经分析的状态 S₁, S₂,...，而不明确提及可能产生这些状态的任何部分。这样一种系统的动力学随后可以被定义并用数学方法处理，正如我在其他著作中所示（Ashby, 1960, a）这种方法如何被运用。我在这里想要指出的是，我们可以拥有一种复杂的动力学，它无论多么复杂、交叉连接程度多高都可以，却不提及部分，因此也不使用组织的概念。由此可见，动力学概念与组织概念本质上是相互独立的，因为它们的存在与缺席可以有全部四种组合方式。

这一事实例证了我所说的，即"组织"部分地存在于观察者的眼中。两个观察者研究同一个系统，比如说一个蜂群，可能会发现其中一个观察者将蜂群视为五万个蜜蜂组成部分的相互作用，因而发现蜜蜂是"有组织"的；而另一个观察者，在观察整体状态——诸如活动、休眠、分群等状态时——可能看不到任何组织，只看到这些（未经分析的）状态的轨迹。

"组织"与"动力学"相互独立的另一个例证是：一个真实系统是否是有组织的或可还原的，部分地取决于观察者所采取的视角。例如，众所周知，一个有组织的（即相互作用的）由 n 个部分组成的线性系统，比如一个摆和弹簧的网络，可以从另一个视角（即所谓"正则"坐标的视角）来看，在其中所有（新识别出的）部分是完全分离的，因而整体是可还原的。因此，我坚持组织的相对性这一观点并无任何乖谬之处，因为人们常规性地利用这一事实的优势来研究相当普通的动态系统。

最后，为了强调系统中所见的组织在多大程度上依赖于观察它的观察者，我将陈述如下命题：给定一个行为被任意给定的整体，可以在其中看到各种各样任意的"部分"；因为当提出任意部分时，所需要的全部条件就是，我们假设给定的部分与另一个适当相关的部分相耦合，使得两者一起形成一个与原先给定的整体同构的整体。例如，假设给定的整体 W 有 10 个状态，其行为遵循变换……

它的运动学图是：

并且假设我们希望将其"看作"包含部分 P，该部分具有内部状态 E 和输入状态 A：

稍加巧思，我们便能发现，若将部分 P 与部分 Q（其状态为 (F, G)，输入为 B）通过变换 Q 相耦合：

令 A = F 且 B = E，则新的整体 W' 具有变换：

在一一对应关系下，它与 W 同构。

因此，只要满足某些特定要求（例如平衡态映射到平衡态），任何动态系统都可以通过简单地改变观察者的视角，而展现出各种各样任意指定的"部分"。

来源：宋胖说事儿（公众号）

原网址链接：https://mp.weixin.qq.com/s?__biz=MzI5OTY0MjQ3Nw==&mid=2247485122&idx=1&sn=ccdbb4e665fb842bb8b29e8f9d5d2a85&chksm=ed73ab9591299f681cf90414e48c39e2f47ebf1a162e61559d6aa88d8ca93bbcbed2f9b94ed6&mpshare=1&scene=1&srcid=02088mwwF4aCJHnvERjoiZF9&sharer_shareinfo=

编辑：张家乐

刘海明 · 发表于 2026-2-28 20:33:47

【案例】

智能的机制——阿什比论文集（8）

大家好，接着由我来为大家翻译控制论先驱阿什比的论文集《智能的机制》。全书共有8个专题40多篇论文，基本把阿什比（除了名著《大脑设计》《控制论导论》之外）主要代表作都囊括了。除了个别零散论文（比如《智力放大器设计》）外，大多没有被翻译为中文。我想尝试翻译出来，与群友共享。也许在今天AI浪潮几乎让人疯狂的背景下，聆听一下这位控制论先驱对智能的思考对我们有帮助，能让我们冷静下来，对AI如实观照。

我们现在翻译的翻译机制定律这一专题。今天我这给大家本主题的第四篇文章《自组织系统的原理》后续部分。

自组织系统的原理

（本文讨论了组织理论的核心概念，特别是"条件性"（conditionality）与"通信"（communication）之间的关系，以及如何使用不确定性分析（Uncertainty Analysis）来量化组织程度。）

3.机器通论

我刚才使用了一种方法来表示两个"部分"通过"耦合"形成一个"整体"，这引出了一个问题：我们一般所说的"机器"是什么意思？

在这里，我们显然侵入了所谓的"一般系统论"领域，但这后一门学科在我看来总是不确定它是在处理物理系统（因而受制于现实世界所提供的任何东西），还是在处理数学系统（其中唯一的要求是研究本身没有内部矛盾）。我认为，过去十年的一项重大进步是我们终于识别出了"一般机器"的本质。

在看到本质之前，我们必须认识到有两个因素必须被排除为无关的。第一个是"物质性"——即机器必须由实际物质、由一百多种现有元素构成的观点。这是错误的，因为可以轻易举出例子（例如 Ashby, 1958, a）表明，本质在于系统（如果你愿意，可以是天使和灵质构成的系统）是否以守法的、机器般的方式运作。同样应被排除为无关的是任何对能量的提及，因为任何计算机器都表明，重要的是行为的规律性——能量是获得还是损失，甚至是被创造，都是完全无关紧要的。

"机器"的基本概念被证明具有一种至少在一个世纪前就被表述过的形式，但据我所知，这一概念从未被充分使用和大力开发。"机器"就是那种以机器般方式运作的东西，也就是说，它的内部状态及其周围环境的状态唯一地决定了它将要进入的下一个状态。

这个定义在十五年前被正式提出（Ashby, 1945），经受住了时间的考验，现在正被广泛接受（例如 Jeffrey, 1959）。它以多种形式出现。当变量是连续的时，它对应于通过给出以时间为自变量的一组常微分方程来描述动态系统。这种表示的根本性本质（与仅仅是方便的表示相对照）已被许多早期研究者所认识，如庞加莱、洛特卡（1925）和冯·贝塔朗菲（1950及更早）。

然而，这种微分方程的表示对于一门包括生物系统和计算机器的科学来说过于受限，因为在这些领域中不连续性是普遍存在的。于是产生了现代定义，它能够同时包括连续的、不连续的乃至离散的，而丝毫不损失严密性。"带输入的机器"（Ashby, 1958, a）或"有限自动机"（Jeffrey, 1959）如今被定义为：一组内部状态S，一组输入或环境状态I，以及一个从乘积集I × S到S的映射（设为f）。在我看来，这里包含了"机器"的真正本质；所有已知的机器类型都可以在这里找到；所有与这一概念有趣的偏离都可以通过相应偏离定义来找到。

我们现在能够毫不含糊或回避地说出我们所说的机器的"组织"是什么意思。首先，我们通过指定其状态S及其条件I来指明我们谈论的是哪个系统。如果S是一个乘积集，比如说S = ΠᵢTᵢ，那么各个部分i分别由其状态集Tᵢ来指定。这些部分之间的"组织"随后由映射f来指定。改变f，组织就改变。换句话说，部分之间可能的组织可以与从I × S到S的可能映射集建立一一对应关系。因此，"组织"和"映射"是看待同一事物的两种方式——组织被实际系统的观察者所注意到，而映射被用数学或其他符号表示行为的人所记录下来。

4.好的组织

此刻你们中的一些人，特别是生物学家，可能会感到不安；因为这个组织的定义没有提及组织的任何有用性。它只要求部分之间存在条件性，且行为具有规律性。在这一点上我认为定义是正确的，因为一个给定组织是"好"还是"坏"的问题，与先前检验它是否是一个组织的问题是完全独立的。

我很想强调这一点，因为在这方面工程师和生物学家很可能思路迥异。工程师组装了一些电子硬件后，发现组装好的网络因寄生振荡而轰鸣，他很习惯"坏"组织的概念；并且他知道必须去寻找"好"的组织。然而，生物学家研究的主要是那些经历了漫长自然选择过程而存活下来的动物物种：因此他看到的几乎所有组织都已经被选择为好的，他倾向于认为"组织"是必然好的。这种观点在生物界可能常常是对的，但在我们这些人工作的世界中却绝非如此。我们必须接受：（1）大多数组织都是坏的；（2）好的组织必须去寻找；（3）"好"的含义必须在每种情况下都清楚地定义，如有必要须明确界定。

那么，在我们关于类脑机制和计算机的语境中，"好"是什么意思？我们必须谨慎进行，因为这个词暗示着某种评价，而其来源尚未被考虑。

在某些情况下，"好"组织与"坏"组织之间的区分是明显的，在这种意义上，既然所有人在这些情况下都会倾向于使用相同的标准，就不需要明确提及。例如，如果一个生物体的大脑组织（无论是天生的还是习得的）能够增进该生物体的生存，那么它通常被判定为具有"好"的组织。这一考虑很容易推广到所有那些情况：组织（无论是猫的还是自动驾驶仪的还是炼油厂的）被判定为"好"，当且仅当它能够把一组指定的变量，即"本质"变量，保持在指定范围内。这就是所有内稳态机制，无论是坎农原义上的还是广义上的。由这一标准引出相关标准：如果组织使系统围绕指定平衡态稳定，那么它就是"好"的。特别是 Sommerhoff（1950）给出了大量例子，取自广泛的生物和机械现象，表明在所有情况下，"好组织"的观念其本质就是多个部分相互作用以达到某个给定的"焦点条件"的观念。我想在这里说，我认为 Sommerhoff 对我们学科的贡献尚未得到充分认识。他对协调与整合的确切含义的精确识别，在我看来，堪与柯西对收敛的确切含义的精确识别相媲美。柯西的发现是一个真正的发现，为后来的工作者提供了巨大帮助，因为他提供了一个严格定义的概念，可以在广阔的语境中反复使用，且含义始终完全相同。我相信，Sommerhoff 对如何精确表示协调、整合和好组织的发现，最终将在我们的工作中发挥类似的基础性作用。

他的工作阐明并强调了我想在这里说的——不存在任何绝对意义上的"好组织"。它总是相对的；在一个语境或标准下是好的组织，在另一个标准下可能是坏的。

有时这一陈述显而易见，不会引起反对。例如，如果我们有六个透镜，可以这样组装成望远镜，也可以那样组装成显微镜，那么组装的好坏显然取决于一个人是想看月亮还是看奶酪螨。

但这个主题比这更有争议！这一论点意味着，不存在任何绝对意义上好的大脑（自然的或人工的）——这完全取决于环境和想要什么。大脑能展示的每一种能力只有在特定条件下才是"好"的，因为至少存在一种环境，在这种环境中，大脑因拥有这种能力而处于不利地位。Sommerhoff 的公式使我们能够立即表明这一点：无论这种能力或组织取得了什么成就，让它不在"焦点条件"之内。

当然，我们知道很多例子，其中这一论点以某种琐碎的方式成立。好奇心往往是好的，但许多羚羊因为停下来看猎人的帽子而丧命。羚羊大脑的组织应该属于那种会导致暂时不动的类型，还是不会导致暂时不动的类型，显然取决于其所在世界中持步枪的猎人是否 abundant。

从另一个角度，我们可以注意到 Pribram 的结果（1957），他发现脑部手术过的猴子在某项测试中得分高于正常猴子。（手术过的猴子行动迟缓而有耐心，而正常的猴子则焦躁不安、容易分心。）尽管如此，在决定想要哪种气质之前，无法说出哪个大脑（正常的或手术过的）具有"好"组织。

你仍然觉得这没有争议吗？那么我准备断言，归因于人类的没有哪一种心理能力是绝对意义上好的。如果某种特定能力通常是好的，这完全是因为我们的陆地环境如此缺乏多样性，以至于其通常的形式使那种能力通常表现为好的。但是改变环境，去到真正不同的条件下，拥有那种能力可能是有害的。而"坏"的，不言而喻，就是产生它的大脑组织。

我相信，大脑的每一种通常被认为可取的能力或属性，在某种类型的环境中都不会变得不可取。以下是一些例证。

第一个是记忆。大脑拥有记忆难道不好吗？一点也不，我回答——只有当环境属于那种未来常常复制过去的类型时才好；如果未来常常是过去的反面，记忆实际上是不利的。一个著名的例子是当下水道老鼠面对被称为"预诱饵"的环境系统时。 naive 的老鼠非常警惕，只吃少量奇怪的食物。然而，如果有益食物连续三天出现在某个地方，下水道老鼠就会学会，并在第四天吃到饱，然后死亡。然而，没有记忆的老鼠在第四天和第一天一样警惕，并活了下来。因此，在这种环境中，记忆确实是不利的。长期接触这种环境将导致进化方向是降低记忆能力。

作为第二个例子，考虑组织本身在连通性意义上的问题。大脑的各部分具有丰富的功能连接难道不好吗？我说，不——并非普遍如此；只有当环境本身 richly connected 时才好。当环境的部分不是 richly connected（换句话说，当它是高度可还原的）时，如果大脑也是高度可还原的，即如果它的连通性很小，适应会进行得更快（Ashby, 1960, d）。因此，组织的程度可以过高也可以过低；我们人类拥有的程度可能是被调整到接近通常陆地环境的最优值。如果大脑是机械的，工作在某种严重非陆地的环境中——比如只存在于一台大型计算机内部——这绝不意味着该程度将是最优的或好的。

再举一个例子，生物学家总是自豪地指出的那种"组织"——专门器官（如大脑、肠子、心脏和血管）在进化中的发展。这难道不好吗？不管好不好，这肯定是一种只有在地球有大气层的情况下才可能的专业化；没有大气层，我们会不断被微小陨石轰炸，其中任何一颗穿过我们的胸腔，都可能击中大血管并杀死我们。在这种条件下，更好的生存形式将是黏菌，它专门能够在树枝缠绕中流动而不丧失功能。因此，器官的发展并非无条件地好，而是对没有飞行粒子的世界的一种专业化。

在这些实际例子之后，我们可以回到理论。正是在这里，Sommerhoff 的公式提供了如此有用的澄清。他表明，在所有情况下，首先必须给定并指定一组扰动（他的"同生变量"值），其次是一个目标（他的"焦点条件"）；扰动威胁要将结果驱离焦点条件。"好"组织然后就是扰动集和目标之间关系的性质。改变扰动集，组织本身不变，却被评价为"坏"而非"好"。

正如我所说，组织的任何属性在绝对意义上都不是好的；都是相对于某个给定环境，或某个给定的威胁和扰动集，或某个给定的问题集。

来源：宋胖说事儿

链接：https://mp.weixin.qq.com/s/vtwxmsr9YEGXG8cvEMjr0Q

编辑：何璇祺

刘海明 · 发表于 2026-2-28 20:34:55

【案例】

智能的机制——阿什比论文集（9）

大家好，接着由我来为大家翻译控制论先驱阿什比的论文集《智能的机制》。全书共有8个专题40多篇论文，基本把阿什比（除了名著《大脑设计》《控制论导论》之外）主要代表作都囊括了。除了个别零散论文（比如《智力放大器设计》）外，大多没有被翻译为中文。我想尝试翻译出来，与群友共享。也许在今天AI浪潮几乎让人疯狂的背景下，聆听一下这位控制论先驱对智能的思考对我们有帮助，能让我们冷静下来，对AI如实观照。

我们现在翻译的翻译机制定律这一专题。今天我这给大家本主题的第四篇文章《自组织系统的原理》后续部分。

自组织系统的原理

（本文讨论了组织理论的核心概念，特别是"条件性"（conditionality）与"通信"（communication）之间的关系，以及如何使用不确定性分析（Uncertainty Analysis）来量化组织程度。）

5.自组织系统

希望我没有因过分强调这种相对性而使你们感到厌倦，但它是根本性的，而且在人们着手处理那些要么源于生物要么模仿此类系统的组织时，它太容易被遗忘了。考虑到这一点，我们现在可以开始考虑所谓的"自组织"系统了。如果我们不想陷入混乱，就必须在这里谨慎行事，因为这个形容词如果使用松散是含混的，如果使用精确则是自相矛盾的。

说一个系统是"自组织"的，留下了两种截然不同的含义。

第一种含义简单且无可非议。它指的是这样一种系统：开始时其部分是分离的（因此每个部分的行为独立于其他部分的状态），然后这些部分行动起来，朝着形成某种类型的连接而变化。这样的系统是"自组织"的，在这个意义上它从"部分分离"变为"部分连接"。一个例子是胚胎神经系统，它开始时细胞之间几乎没有或完全没有相互影响，然后通过树突的生长和突触的形成，变为每个部分的行为都受到其他部分很大影响的状态。另一个例子是帕斯克（Pask）的电解中心系统，其中从一个电极长出的丝状物起初几乎不受其他电极上生长物的影响；然后这些生长物变得相互关联，连接建立起来。

第二种含义（及对其的批判）：在回答这个问题之前，我们必须注意，如果我们不想永远处于混乱的危险中，那就是没有机器能在这种意义上是自组织的。推理很简单。定义状态集 S 以指明我们谈论的是哪台机器。那么"组织"必须如我在上面所说，与 f 等同，即 S 到 S 的映射，这是机器的基本驱动力（无论它可能施加什么力）。现在这里的逻辑关系是 f 决定 S 的变化：S:—f 被定义为有序对 (si, sj) 的集合，使得系统的内部驱动力将迫使状态si 变为sj。允许 f 成为状态的函数，将使整个概念变得毫无意义。

由于这一论证在自组织系统理论中是根本性的，我可以用一个平行的例子来帮助解释。牛顿的万有引力定律说 F = M1M2/d2，特别是，力与距离的平方成反比。如果是立方就是不同的定律了。但假设有人建议，不是力 F 而是定律随距离变化，所以指数不是 2 而是距离的某个函数 φ(d)。这个建议是不合逻辑的；因为那样我们就得到 F = M1M2/dφ(d)，这代表的不是随距离变化的定律，而是一个涵盖所有距离的定律；也就是说，如果真是这种情况，我们会重新定义该定律。类似地，如果机器中的 f 是状态 S 的某个函数，我们就必须重新定义我们的机器。让我用一个例子明确说明。假设 S 有三个状态：a、b、c。如果 f 依赖于 S，就会有三个 f’s： fa、fb、fc。那么如果它们是

那么a 的变换必然由fa决定，因此为b，于是整个 f’s 的集合就相当于单一的变换：

把 f 说成是 S 的函数显然是不合逻辑的，因为这样说会指涉一些操作，比如 fa(b)，而这些操作实际上是不可能发生的。

如果这样，那么没有机器可以恰当地被称为是自组织的，我们又该如何看待，比如说，那个重新排列自身线路的内稳态装置（Homeostat）；或者那个编写自身程序的计算机呢？

机制的新逻辑使我们能够严谨地处理这个问题。我们从状态集 S 出发，并假设 f 发生变化，比如说变为 g。于是我们实际上有了一个变量，比如说 x(t)，它是时间的函数，起初取值为 f，后来取值为 g。正如我们刚才所见，这种变化不能归因于集合 S 中的任何原因；因此它必然来自某个外部作用者，作为输入作用于系统 S。如果系统要在某种意义上是"自组织"的，那么"自我"必须被扩展以包含这个变量 α，并且，为了使整体保持有界，α 变化的原因必须在 S（或 α）之中。

因此，"自组织"的表象只能由机器 S 与另一台机器（单一部分的）耦合而产生：

那么部分 S 可以在整体 S + α 内部是"自组织"的。

只有在这种局部的、严格限定的意义上，我们才能理解一个系统是"自组织"的，而不陷入自相矛盾。

既然没有任何系统可以被正确地称为是自组织的，而且"自组织"这个短语的使用往往会延续一种根本上混乱且不一致的看待该主题的方式，这个短语或许最好让它消亡（不再使用）。

6.自组织的自发产生

当我说有任何系统可以被恰当地称为是自组织的时，听者可能不会满意。他可能会问：十亿年前发生的那些变化呢？那些变化使得大量碳原子分散在二氧化碳、甲烷、碳酸盐等小分子中，最终聚集在一起形成蛋白质，然后继续形成我们今天称之为"动物"的大型活跃团块？在孤立的行星上，这个过程难道不正是"自组织"吗？如果它发生在行星表面，难道就不能在计算机中重现吗？当然，我现在讨论的是生命的起源。现代系统理论对此有何说法呢？

它有很多话要说，其中一些与自进化思想首次被考虑以来所说的观点截然相反。在过去，当一位作者讨论这个话题时，他通常假设生命的产生是罕见而特殊的，然后他试图展示某种方式，使这种罕见而特殊的事件得以发生。于是他试图展示存在某条路径，比如从二氧化碳到氨基酸，再到蛋白质，然后通过自然选择和进化，到达智慧生命。我说这种寻找特殊条件的做法是完全错误的。真相恰恰相反——每一个动态系统都会产生其自身形式的智慧生命，在这个意义上是自组织的。（我将在片刻后证明这一事实。）我们未能认识到这一事实的原因是，直到最近，我们都没有中等复杂度系统的经验；要么它们像手表和摆钟，我们发现它们的性质稀少而琐碎，要么它们像狗和人，我们发现它们的性质如此丰富而惊人，以至于我们认为它们是超自然的。只有在过去几年，通用计算机才给了我们一个足够丰富而有趣、又足够简单可理解的系统。以这台机器为导师，我们现在可以开始思考那些简单到可以详细理解、同时又丰富到具有启发性的系统。在它们的帮助下，我们可以看到这一论断的真实性：每一个孤立的确定性动态系统，遵循不变的定律，都将发展出适应其"环境"的"有机体"。

这一论证在原则上足够简单。我们从系统一般会趋向平衡的事实出发。现在，系统的大多数状态都是非平衡的（如果我们排除系统处于中性平衡的极端情况）。因此，在从任何状态走向某个平衡态的过程中，系统是从较大量的状态走向较小量的状态。以这种方式，它在进行一种选择，纯粹客观意义上它排斥某些状态（通过离开它们）而保留某些其他状态（通过坚持它们）。因此，正如每一个确定性系统趋向平衡一样，它也在进行选择。我们已经听厌了"机器不能选择"这一陈词滥调；真相恰恰相反：每一个机器，当它趋向平衡时，都在执行相应的选择行为。

然而，简单系统中的平衡通常是琐碎而乏味的；它是垂直悬挂的摆钟；是发条走完的手表；是平放在一个面上的立方体。然而今天我们知道，当系统更加复杂和动态时，平衡及其周围的稳定性可以有趣得多。在这里，我们有自动驾驶仪成功对抗涡流；有严重出血后重新分配血液流动的人；有消费突然增加后重新进货的商行；有粮食作物突然遭到破坏后恢复供应分配的经济系统；还有在困苦和失业的一生中每天至少成功获得一餐的人。

使这种变化从琐碎到有趣的，仅仅是事件的尺度。"趋向平衡"在简单摆钟中是琐碎的，因为平衡态不过是一个单点。但当系统更加复杂时；比如，当一个国家的经济从战时状态恢复到正常状态时，稳定区域是巨大的，其中可以发生大量有趣的活动。计算机在此语境中是天赐之物，因为它使我们能够跨越从简单可理解到复杂有趣之间的巨大概念鸿沟。因此，通过观察一个稍简化的版本如何在计算机中出现，我们可以对所谓的生命自发产生获得相当深刻的洞察。

7.竞争

这里有一个简化版本的例子。物种间的竞争通常被视为本质上是生物性的；实际上，它是一个具有更广泛普遍性的过程的表现。假设我们有一台计算机，其存储器被随机填入数字0到9。假设其动力学定律是数字连续成对相乘，乘积的右位数字取代被取的第一个数字。启动机器，让它"进化"；会发生什么？在这个特定世界的定律下，偶数乘偶数得偶数，奇数乘奇数得奇数。但偶数乘奇数得偶数；所以在一次混合遭遇后，偶数有更好的生存机会。因此随着这个系统进化，我们将看到偶数在斗争中被青睐，稳步取代存储器中的奇数，最终消灭它们。

但偶数并非同质，其中零最适合在这个特定世界中生存；而且，正如我们所观察，我们将看到零消灭它们的偶数同伴，直到最终它们继承这个特定的世界。

我们这里有一个关于极端普遍性论题的例子。从一个角度看，我们仅仅有一个定义明确的算子（乘法和置换定律），它驱动系统趋向平衡。在这样做的过程中，它自动选择那些对其造成变化的趋势具有特别抵抗力的操作数（因为零对乘法造成的变化具有独特的抵抗力）。这种向特别抵抗形式演进的过程具有极端的普遍性，只要求算子（或任何物理系统的物理定律）是确定且不变的。这是一般的或抽象的观点。生物学家在看到进化、适者生存以及最高级生物功能和智慧必然出现时，看到了它的一个特例。因此，当我们问：生命和智慧的出现需要什么条件？答案不是碳、氨基酸或任何其他特殊特征，而仅仅是该过程的动力学定律应该是不变的，即系统应该是孤立的。在任何孤立系统中，生命和智慧不可避免地会发展（在退化情况下，它们可能只发展到零度）。

因此，"我们如何合成地产生智慧？"这个问题的答案如下。取一个动力学定律不变且单值的动态系统，其规模如此之大，以至于当它达到一个只涉及其总状态一小部分的平衡时，这一小部分仍然大到足以允许大量变化和行为的空间。让它运行足够长的时间以达到这样的平衡。然后详细检查该平衡。你会发现现存的状态或形式特别能够抵抗定律所引起的变化。将平衡一分为二，称一部分为"有机体"，另一部分为"环境"：你会发现这个"有机体"特别能够抵抗来自这个"环境"的扰动。这个有机体能够发展的适应程度和复杂性，仅受整个动态系统的规模和允许其向平衡演进的时间的限制。因此，正如我所说，每一个孤立的确定性动态系统都将发展出适应其环境的有机体。因此，原则上，发展出如我们所愿的复杂或智慧的合成有机体并无困难。

那么，在这种意义上，每台机器都可以被认为是"自组织"的，因为它将发展出某种功能结构——在其规模和复杂性允许的程度上——与"适应的有机体"同源。但这能给我们这次会议所寻求的东西吗？只是部分地；因为到目前为止所说的一切都没有暗示组织是好是坏；做出区分的标准尚未引入。当然，确实如此，发展出来的有机体，由于是稳定的，将拥有它自己的本质变量，它将通过强烈的反应来显示其稳定性，这些反应倾向于保存它自身的存在。对它自己而言，它自己的组织按定义永远是好的。黄蜂发现蜇刺反射是件好事，水蛭发现吸血反射是件好事。但这些标准是在生存组织之后出现的；看到什么存活下来后，我们才看到对该形式什么是"好"的。出现的东西仅仅取决于系统的定律是什么以及它从什么状态开始；并不意味着发展起来的组织在任何绝对意义上是"好"的，或者按照我们这样的外部主体的标准是"好"的。

简要总结：原则上，发展出如我们所愿的复杂和智慧的合成有机体并无困难。但我们必须注意两个基本限定条件；第一，它们的智慧将是对其特定环境的适应和特化，对任何其他环境（如我们的环境）的有效性并无暗示；第二，它们的智慧将指向保持其自身本质变量在限界之内。它们在根本上将是自私的。因此我们现在必须问：鉴于这些限定条件，我们还能将这些过程转而用于我们的利益吗？

来源：宋胖说事儿

链接：https://mp.weixin.qq.com/s/YrKrNvyqsNdlkg4Gn1imCA

编辑：何璇祺

刘海明 · 发表于 2026-2-28 20:35:28

【案例】

智能的机制——阿什比论文集（10）

大家好，接着由我来为大家翻译控制论先驱阿什比的论文集《智能的机制》。全书共有8个专题40多篇论文，基本把阿什比（除了名著《大脑设计》《控制论导论》之外）主要代表作都囊括了。除了个别零散论文（比如《智力放大器设计》）外，大多没有被翻译为中文。我想尝试翻译出来，与群友共享。也许在今天AI浪潮几乎让人疯狂的背景下，聆听一下这位控制论先驱对智能的思考对我们有帮助，能让我们冷静下来，对AI如实观照。

我们现在翻译的翻译机制定律这一专题。今天我这给大家本主题的第四篇文章《自组织系统的原理》后续部分。

自组织系统的原理

（本文讨论了组织理论的核心概念，特别是"条件性"（conditionality）与"通信"（communication）之间的关系，以及如何使用不确定性分析（Uncertainty Analysis）来量化组织程度。）

8.必要多样性

在这一问题上，我认为人们对香农第十定理（1949）或更简单的"必要多样性定律"尚未给予足够重视，我曾用后者表达了相同的基本思想（Ashby, 1958, a）。香农定理指出，如果校正通道的容量为 H，那么大小为 H 的疑义度可以被消除，但不能更多。香农是在电话或类似通信的背景下陈述其定理的，但这一表述对于试图实施某种校正控制的生物调节通道同样成立。他考虑的是消息量大而错误量小的情况；而生物学家面临的情况则是"消息"量小但扰动错误量大且多。该定理随后可应用于大脑（或任何其他调节和选择装置），它指出大脑能够实现的调节或选择作用的量绝对受其作为通道的容量的限制（Ashby, 1958, b）。表达同一思想的另一种方式是：任何数量 K 的适当选择都需要传输或处理数量 K 的信息（Ashby, 1960, b）。没有不劳而获的选择。

我认为我们在这里掌握了一个将来会频繁听到的原理，因为它支配着所有复杂系统的工作。它进入这一学科的方式 somewhat 类似于能量守恒定律进入动力工程学的方式。当该定律大约一百年前首次出现时，许多工程师认为它是一种令人失望的东西，因为它破灭了所有永动机的希望。然而，它实际上确实导致了十九世纪伟大的工程实践成就，因为它使动力工程学更加脚踏实地。

我认为，当人们充分领会香农第十定理的全部含义时，我们首先会清醒过来，然后会得到帮助，因为届时我们将能够把我们的活动集中在那些真正符合实际且确实可解的问题上。

9.未来

我在这里完成了对支配自组织系统的原理的鸟瞰式概览。我希望我已经为我的信念提供了充分的理由，即这些基于机制逻辑和信息论的原理，现在基本上是完备的，在这个意义上，现在已经没有领域是严重神秘的了。

然而，在结束之前，我想非常简要地指出未来研究最有可能取得成果的方向。

我认为有一个方向可以很容易地发现大量新事物，那就是发现新型动态过程。我们今天所知的大多数机器过程都非常专门化，取决于具体使用了哪些部分以及它们如何连接在一起。但是存在更具网络状结构的系统，其中发生的事情只能用统计学方法来处理。这里有一些过程，例如流行病的传播、动物种群在某一地域的波动、波状现象在神经网络上的传播。这些过程本身既不好也不坏，但它们确实存在，具有所有其奇妙的特性，毫无疑问，如果它们有利，大脑会利用它们。我想在这里强调的是，它们经常表现出非常令人惊讶和奇特的特性；比如在流行病中，爆发往往呈现波浪式发生的趋势。这种奇特的新特性可能正是某些机器设计者想要的，而且否则他们可能不知道如何实现。

这类系统的研究本质上必须是统计性的，但这并不意味着每个系统本身必须是随机的。相反，最近已经证明（Ashby, 1960, c），当作为调节器作用时，任何系统都不可能比确定性系统具有更高的效率；因此，由于调节是唯一在生物学上重要的功能，我们可以预期自然选择将使大脑尽可能确定。因此，我们可以将我们的兴趣限制在样本空间涵盖一组各自确定的机制的较小范围内。

作为一个特例，一类更值得深入研究的系统是由具有多种平衡状态的部分构成的大型系统。这类系统在陆地世界中极其常见；它们存在于我们周围，事实上，正如我们所知的智慧，没有它们几乎是不可能的（Ashby, 1960, d）。这是指那些变量主要表现为部分功能的系统的另一种说法。我在其他地方已经证明（Ashby, 1960, a），这类系统往往表现出习惯化（消退）并能够逐步适应（Ashby, 1960, d）。有理由相信，一些众所周知但模糊的生物现象，如条件反射、联想以及詹宁斯（1906）关于生理状态消解的定律，可能或多或少是多重平衡状态的简单直接表现。目前我正在研究这种可能性：当输入到达具有多重平衡的系统时，"结构"（如三维空间结构）向动态系统的转移——这种皮亚杰特别考虑过的学习类型——可能是一个自动过程。无论如何，毫无疑问，对这类系统的研究可能会揭示各种新的动态过程，为我们提供目前尚不具备的动态资源。

具有多重平衡的系统的一种特殊类型是其部分具有高"阈值"的系统——那些倾向于保持在某种"基本"状态，除非输入的某种函数超过某个值。这类系统的一般性质仍然很大程度上未知，尽管伯勒（Beurle, 1956）已经做出了一个非常有趣的开端。它们值得广泛研究；因为，由于它们发展出雪崩状活动波的基本倾向，它们的动态性质可能被证明是令人兴奋甚至戏剧性的。哺乳动物大脑广泛使用这一特性的事实表明，它可能具有某种特殊的、有用的性质，而这种性质很难用其他方式获得。

提及具有多重平衡的系统使我想到第二条在我看来极具前景的研究路线——我指的是发现生物体的记忆存储：识别其物理本质。

目前，我们对活体大脑的认识严重失衡。关于从一毫秒到下一毫秒发生的事情，我们知道很多，许多实验室正在努力增加更多细节。但当我们问大脑中从一小时到下一小时，或从一年到下一年发生了什么时，实际上一无所知。然而，正是这些较长期的变化才是人类行为中真正重要的变化。

因此，在我看来，如果有一件事迫切需要研究，那就是大脑记忆存储的物理基础。曾经有一段时间，"记忆"是一个非常模糊和形而上学的主题；但那些日子已经过去了。"记忆"，作为对过去和现在事件的约束，以及它们之间的关系，今天已经被机制逻辑牢牢掌握。我们从行为学和操作论角度确切地知道它的含义。我们现在需要的是为其研究提供充足的资源。世界肯定已经到了能够找到资源让一个团队深入研究这个问题的时候了吧？

10. 总结

今天，自组织系统的原理已在某种程度上为人所知，在这个意义上，该主题的没有一个主要部分是完全神秘的。

我们有了稳固的基础。今天我们确切地知道"机器"、"组织"、"整合"和"自组织"的含义。我们对这些概念的理解就像数学家理解"连续性"或"收敛"一样彻底和严密。

用这些术语，我们今天可以看到，具有"生命"和"智慧"的动态系统的人工产生不仅仅是简单的——如果仅满足基本要求，它就是不可避免的。这些要求不是碳、水或任何其他物质实体，而是任何既不变又单值的算子的作用的长期持续。每一个这样的算子都会强制发展出它自己形式的生命和智慧。

但是，发展出来的形式会对我们有用处吗？这里的情况受必要多样性基本定律（以及香农第十定理）支配，该定律说，实现适当的选择（达到优于随机程度）绝对依赖于处理至少该数量的信息。未来的工作必须尊重这一定律，否则甚至在开始之前就会被标记为徒劳。

最后，我提议将识别大脑记忆存储的物理基础作为一项研究计划。我们今天对大脑功能的知识严重失衡。关于大脑如何以大约毫秒间隔从一个状态转变到另一个状态，已知的量很大；但当我们考虑我们对重要长期变化的了解时，我们发现它实际上几乎等于零。我认为是时候对这一难题做出某些明确的尝试了。世界肯定是时候该有一个团队朝这个方向积极行动了吧？

参考文献

1.W. Ross Ashby, The physical origin of adaptation by trial and error, *J. Gen. Psychol.* 32, pp. 13-25 (1945).

2.2. W. Ross Ashby, Principles of the self-organizing dynamic system. *J. Gen. Psychol.* 37, pp. 125-8 (1947).

3.3. W. Ross Ashby, *An Introduction to Cybernetics*, Wiley, New York, 3rd imp. (1958, a).

来源：宋胖说事儿

链接：https://mp.weixin.qq.com/s/sQM1Zj5QO9__SnfPjE7_Yw

编辑：何璇祺

帐号		自动登录	找回密码
密码			实名注册

阿什比论文集集锦

浏览过的版块