传媒教育网

 找回密码
 实名注册

QQ登录

只需一步,快速开始

搜索
做个试验
查看: 28|回复: 6
打印 上一主题 下一主题

阿什比论文集集锦

[复制链接]
跳转到指定楼层
楼主
发表于 2026-2-2 22:12:23 | 只看该作者 |只看大图 回帖奖励 |倒序浏览 |阅读模式
【案例】

智能的机制——阿什比论文集

大家好,今天开始,由我来为大家翻译控制论先驱阿什比的论文集《智能的机制》。全书共有8个专题40多篇论文,基本把阿什比(除了名著《大脑设计》《控制论导论》之外)主要代表作都囊括了。除了个别零散论文(比如《智力放大器设计》)外,大多没有被翻译为中文。我想尝试翻译出来,与群友共享。也许在今天AI浪潮几乎让人疯狂的背景下,聆听一下这位控制论先驱对智能的思考对我们有帮助,能让我们冷静下来,对AI如实观照。今天作者介绍、论文集结构与序言部分。
作者介绍


W·罗斯·阿什比教授被国际公认为控制论的先驱和权威。他受过医学和精神病学训练,曾任研究病理学家、格洛斯特巴恩伍德医院研究主任、布里斯托尔伯登神经研究所所长、伊利诺伊大学生物计算机实验室教授,退休后任威尔士大学荣誉教授研究员。
在巴恩伍德医院(一所精神病院)工作的十二年间,他制作了他著名的"同态调节器"(用英国皇家空军旧零件在阿什比夫人厨房的桌子上组装而成),并撰写了两部著作:《大脑设计》(1952年)和《控制论导论》(1956年)。这两部著作均完成于阿什比博士私人的软垫隔间,此后被译成多种语言。在美国度过的十年间,他发表了大量著作,据他自己估计,这是他职业生涯中成果最丰硕的时期。
阿什比博士的核心兴趣在于用机械论解释类脑活动。基于大脑按机械原理运作的信念,他热衷于揭穿关于大脑神奇力量的各种神话("两千年来,心理学不过是对人类最高级能力的简单讨论——而大多数能力他根本不具备"),并设计行为的机械模型,其中最著名的是同态调节器。该装置故意用不可靠的部件构成,以强调智能不在于精巧、高质量的部件,而在于整体结构。尽管他不断寻找行为的简单解释,却全心全意地拥抱复杂性,主要兴趣在于非线性、高度互联的系统,其中复杂关系构成主要研究对象。
作为他对关系兴趣的象征,他随身携带一条由三条较简单链条平行互锁构成的链子;他喜欢观察微观生态系统(用鱼竿和瓶子从厄巴纳的博尼雅德溪捕获),欣赏它们展示的丰富相互作用;他还建造了一个半随机电子装置,装有100个双三极管,观察了两年,最终因其难以理解的复杂行为而认输。或许是这个三极管网络激发了他对信息论的兴趣,将其作为处理复杂性和测量变量间相互作用强度的工具;他随后提出的"必要多样性定律"和多变量信息论的发展,是对理解复杂系统的重要贡献。
阿什比教授有一种非凡的天赋,能使看似复杂的思想变得简单,并用朴实的例子说明抽象概念("某只蜈蚣……")。他善于在别人只看到琐碎之处发现意义,在别人只看到事实之处发现原理。他始终充满热情和创造力;即使退休后,他先掌握了单簧管,继而着手重新设计其人机界面,以改善信息传递。他严肃而略显令人生畏的举止,在参与对话或讲座时,会转变为生动的风格——他独特的敏锐机智和从不寻常视角看待寻常事物的能力,很快会使谈话变成一连串令人惊讶的思想洪流。他的热情会完全克服他平常的矜持,比如他曾有一次假装发射一把六响手枪,"后坐力"——令所有人惊讶,包括他自己——使他踉跄着穿过房间,摔倒在地。
除了是一位诚实、一丝不苟的学者,他还是一位热心、体贴、慷慨的人,热切地将自己萌发的想法的功劳归于学生;此外,他为人谦逊,当被问及希望如何处理他大量未发表的研究笔记时,他典型的回答是"全部销毁"(为了给下一代重新发现的机会)。
那些亲自认识罗斯·阿什比的人,会记住他是一个善良而难忘的人;那些通过著作认识他的人,会记住他是系统科学的天才和巨人。
——罗杰·科南特(Roger Conant)(阿什比的博士生,也是本书的编辑之一)
本书编辑说明
(罗杰.科南特)
美国控制论学会于1980年春季的一次会议上决定,推动出版一套丛书,收录控制论和系统理论领域关键人物的开创性著作。本书,以及另一本以海因茨·冯·福斯特为中心的著作,是首批问世的两部作品。
我有幸于20世纪60年代那个非凡的黄金时代,在冯·福斯特位于伊利诺伊大学的生物计算机实验室工作,当时W·罗斯·阿什比也在那里。作为阿什比门下的博士生,我对他的创造力和精力惊叹不已,并深受其广阔视野以及他摆脱常人思维定式之自由的启发。这种自由常表现为以令人震惊的新颖方式看待事物的能力——仅举一例,他曾随口说道,在股市中亏损与获利同样困难。我感谢美国控制论学会和出版商给予的动力和机会,使我能通过编纂本书,部分地回报我对罗斯·阿什比的感激之情。
阿什比的两部著作《大脑设计》和《控制论导论》是控制论和系统理论文献中的经典,已被多种语言再版,想必为读者所熟知。然而,阿什比的许多工作散见于各处期刊、会议文集和不易获取的书籍中,有些文章仅以他在厄巴纳给学生发放的手稿形式出现。本书的目的即是将其中许多文章汇集于一册,从而使这位杰出人物的著作更易于获取。
指导本文选编的原则如下:
1. 若某部作品已实质性纳入阿什比早期的两部著作,则本书不予收录。
唯一例外是"必要多样性及其意涵……"一文,因其对"必要多样性定律"——阿什比最著名的成果之一——的清晰阐述而收录于此。
2. 以最少的篇数最大限度地涵盖所有著作中的思想。
阿什比的论文之间存在相当程度的重叠,他的一些钟爱主题在多篇独立作品中均有提及。我试图同时最小化这种重叠、本书的篇幅以及"损失"——即未收录于此的论文中的思想。这一任务不可能令任何人完全满意,包括我自己,一些优秀论文因此因这一精简原则而被舍弃。然而,我相信本集反映了阿什比除两部著作之外对控制论的几乎全部智识贡献。
我未能发现阿什比出版物的任何权威目录。因此,书末所列其著作目录是根据生物计算机实验室的文件、阿什比出版物中的参考文献以及与其学生和朋友的通信整理而成。尽管如此,某些方面可能仍不完整,不能视为最终版本。
我要感谢美国控制论学会主席斯图尔特·昂普利比,他为本项目提供了动力并奠定了良好开端;海因茨·冯·福斯特为此项工作提供了实质性帮助;伊利诺伊大学芝加哥校区图书馆的工作人员为我查找了许多阿什比的晦涩文章;亨利埃塔·科克斯承担了打字工作;乔治·克里尔对阿什比的工作进行了概述并就收录论文提出建议;我的贤妻雪莉,她欣然容忍甚至支持我对本项目的专注;最后是罗斯的遗孀罗斯巴德·阿什比,她寄来了照片以及下面这段她在其遗稿中发现的引语。
"我算得上是一位艺术家,不是在铅笔或颜料方面——我在那里毫无技艺——而是对完美有着深刻的鉴赏力。我的品味很广泛,因为我能欣赏任何精湛之作,无论是丘吉尔的一章文字、爱泼斯坦的一尊雕像,甚至马克斯·米勒的一个建议。我有一个抱负,希望有一天能创造出毫无瑕疵的作品。"
"笔记中记录的那种关于大脑的工作,对我来说仅仅是一种令人愉悦的消遣,一个我可以退隐其中的爱好,一个我可以编织纯粹思想的复杂而美妙图案的世界,不受社交、财务及其他纷扰的干扰……"
——W·罗斯·阿什比
前言:阿什比的思想财富
乔治.科里尔(本书另一个主编)
我想借此机会表达我对W·罗斯·阿什比晚期著作的个人感受。首先,我希望他描述其思想发展的书籍和论文能够得到恰当的理解、欣赏和发展。他的一些最重要的思想仍未受到应有的关注,目前正在被分析和进一步发展。他留下的大量未开发的思想,代表着未来研究的丰富智力资源。
对大多数人来说,阿什比是通过他的第二本书《控制论导论》(1956年)[b2]为人所知的,该书在多次再版和十四种不同语言的翻译之后,至今仍在印刷。他的第一本书《大脑设计》(1952年)[b1]知名度较低,而他1930年至1972年间撰写的众多论文则最不为人所知。这些论文散见于各种出版物中,许多被隐藏在会议论文集或论文集的编辑版本中。
我一直对阿什比那部杰作《控制论导论》深感惊叹。这本书写得如此精湛,作为入门教材与任何著作相比都毫不逊色。它至今仍是我灵感的巨大源泉。1970年,我在罗马与阿什比相处时,曾称赞他写了这样一部优秀的导论。令我惊讶的是,他回答说写这本书对他来说很容易。"不,"他回复道,"我毫不费力。"我后来才得知,在撰写该书期间的某个时候,他对自己的英语知识失去了信心,于是放下几乎完成的手稿,开始从头学习英语。一年多后,当他重新自信地掌握这门语言时,他才回到这本书的工作上。他没有使用旧稿,而是在几个月内从头完成了整本书。因此,这部杰作的诞生——难怪它如此精湛!
阿什比对系统研究各个方面的兴趣可以追溯到1940年代。这一十年的特点是系统研究、控制理论、信息与通信理论、自动机理论以及系统工程等新兴和初步领域的出现。这些新颖而有前景的思想与阿什比关于适应性和自组织概念的发展相吻合。他在这一十年的贡献极为重要。自1960年代以来,他一直日益成为系统研究领域公认的领导者,直至1972年去世。
自20世纪50年代初我开始熟悉阿什比的一些著作以来,我一直感受到他对我在系统研究方面工作的巨大影响。我清楚地知道,许多从事系统研究的人也有同样的感受。例如,罗杰·卡瓦洛[109]最近为阿什比进行的一项调查显示,作为20世纪下半叶第二位最有影响力的人物,他对系统研究者的影响几乎是卢德维希·冯·贝塔朗菲的两倍——而冯·贝塔朗菲通常被认为是该领域最有影响力的人物。
阿什比最伟大的思想之一是他对"对象"与"基于该对象定义的'系统'"之间区别的清晰认识。他写道[b2,p.39]:
"在这一点上,我们必须明确'系统'是如何定义的。我们的第一反应是指着钟摆说'这就是系统',但这种说法隐藏了它可能产生的巨大困难。每一个物质对象都包含无限多的变量,因此可以产生无限多个可能的系统。真实的钟摆,例如,不仅有长度和位置;对于电导率,它有晶体结构、化学杂质、内应力;对于温度,它有熔点、比热、导热性;对于光学吸收,它有表面水分、细菌污染、光学吸收、弹性、形状、比重的薄膜,等等。任何暗示这些变量中某一个可以忽略的说法,都是从未被提出的。所必要的是,我们应该挑选出我们感兴趣的变量,并研究这些变量之间的关系。系统现在意味着,不是一个事物,而是一个变量集。"
在我看来相当令人惊讶且不幸的是,这两个概念之间的根本区别对当前场景上的许多系统研究者来说仍然是陌生的。然而,它至关重要,因为许多系统研究中的混淆正是由于未能认识到它而产生的,正如一些批评者所暗示的,系统研究不过是研究一切(每个对象),因此逻辑上是空洞的。
阿什比明确区分对象和基于对象定义的系统,使他能够认识到同一对象可以以不同方式被看待(建模),每种方式都基于不同的属性和相关的响应函数。这使他能够将系统识别与正在研究的对象分离开来,也使他能够将自己限制在晚期论文[99,p.1]所描述的对象的"简化、可管理的子集"中,并拒绝所有其他部分。让我们引用他晚期论文[99,p.1]中的一段话:
"……虽然所有人都会同意大脑是复杂的,自行车是简单的,但人们也会记得,屠夫对羊脑的看法是简单的,而自行车,如果被详尽研究,作为理解人类大脑的唯一线索,就会变得非常复杂。因此,在我看来,用'复杂'来测量复杂性是一种完全错误的方式。"
阿什比工作的独特特征之一在于,他所发展的各种系统概念和原理具有高度的一般性,即它们并不局限于基于具有某种特定数学结构的变量所构成的系统。他就此问题表达了如下观点[95,p.103]:
"受过一定数学训练的工作者很容易养成(或陷入)一种思维习惯,认为'变量'必须是指具有可加性度量的数值尺度。这种限制是完全不必要的,有时甚至会导致致命后果。气象学家长期以来使用五种'云型',兽医研究猪的各种寄生虫,血液学家使用四种基本的'血型'。现代数学运用集合论的方法,完全能够处理这类变量,而这类变量在行为科学中往往是不可避免的。"
阿什比的许多思想不依赖于所涉及变量的尺度,这使得这些思想非常适用于所谓的软科学。具有讽刺意味的是,变量必须是"定量的"这一神话——至今仍严重主导着软科学——似乎正是这方面的主要障碍。
可以公平地说,系统的认识论层级[107,109,115,116]日益被认可为任何有意义的系统问题解决框架所必需的"骨架",而这一层级在阿什比的著作中是隐含的。尽管他没有明确表述这样的层级,但他的著作至少涵盖了我所提出的层级[109]中的四个认识论层次。
最低的认识论层次(源系统或0层),在我的层级表述中定义为一套变量(划分为基本变量和辅助变量)以及为每个变量定义的分辨率水平[109],显然只是对阿什比将系统定义为一套变量这一概念的更精确、更完整的阐述。他关于所选变量的方案(或活动)概念,则直接对应于我认识论层级中的数据系统(1层)。
就我认识论层级中的2层(生成系统或行为系统)而言,它在阿什比的早期著作中由状态决定系统(机器)[81]的概念所代表,但也由他更为一般的变换概念[b2]所代表。在20世纪50年代初,这些是相当新颖的思想,由此发展出一些系统理论,如有限状态机(自动机)理论,以及后来的动力系统理论。
结构系统(定义为耦合子系统的集合),代表我层级中的3层,在阿什比的著作中有相当广泛的论述。他的主要兴趣似乎在于研究部分(子系统)的各种性质与整体(结构系统)相应性质之间的关系。例如,对于这样一种性质——平衡状态——他推导出了整体与部分之间一个简单但重要的关系:"整体处于平衡状态,当且仅当每个部分在其他部分所提供的条件下处于平衡状态。"[b2,p.83] 他自己设计并著名的同态调节器,也是源于他对整体-部分关系研究的浓厚兴趣。
虽然大多数系统研究者只关注涉及一个或最多两个认识论层次的问题,但阿什比可能是新兴系统研究领域中第一位成功将更广泛范围的认识论层次整合到一个概念框架中的贡献者。从他的著作中可以清楚地看出,与许多当前的系统研究者不同,他认为认识论谱系的实验端与认知端同等重要。此外,他的工作出色地展示了对系统研究的发现(归纳)方法和公设(演绎)方法的平衡运用。
阿什比最伟大的贡献之一——必要多样性定律,也是他最早期思想之一[82,43]。其最简单但最一般的表述"只有多样性才能摧毁多样性"——开辟了多个可能的发展方向,具有潜在的深远意义。尽管对必要多样性定律的兴趣近来日益增加,但令人惊讶的是,某些相关领域,最值得注意的是控制理论,仍然完全不了解这一思想。这种令人遗憾的状况,被布莱恩·波特——少数具有更广阔视野的控制理论家之一——在几年前发表的一篇论文[113,p.227]中很好地刻画出来:
"……颇具讽刺意味的是,例如,最优控制理论虽然已被详尽发展到了几乎令人厌倦的地步,但控制科学家们似乎对阿什比著作的存在及其重要性 largely 一无所知。这种情况在阿什比的必要多样性定律方面尤为突出——该定律对于调节和控制的重要性,犹如热力学第二定律对于物理学的重要性。因此,必要多样性定律——顺便一提,它可以通过基本推理非常简单地得到证明——对调节器可实现的行为施加了严格的界限,无论其结构或设计如何:因为阿什比的定律相当可靠地指出,任何物理装置作为调节器的能力不能超过其作为通信通道的能力。该定律所表达的控制与通信之间的密切联系,无疑表明这一领域可能是系统科学家和控制科学家未来研究中最令人兴奋、最有价值且最重要的领域之一。当然,阿什比自己感到,在他漫长而多产的科学生涯结束时,他在这个领域的工作才刚刚开始。……阿什比的必要多样性定律表明,系统科学和控制科学中有许多非平凡的问题等待解决,而且——拟人化地应用该定律——解决这些问题的最佳方法,很可能是通过最大化系统科学家和控制科学家作为多样性通道的能力来实现的。"
调节是阿什比在其著作中高度关注的一个概念。他研究了反馈和前馈调节,并发展了分析和设计调节器的一般原理。他的大多数结果都用集合论术语描述,适用于任何尺度的变量。这可能是他的调节工作尚未在控制理论中得到利用的原因之一。控制理论主要是为连续变量或连续变量的离散表示而发展的。将微分方程或差分方程——它们一直是控制理论中的基本数学工具——与阿什比提供的一般集合论表述相整合,可能是困难的。然而,这样的整合将极大地增强控制理论的能力,特别是其对"软科学"的相关性。
"整体大于部分之和"这一表述——它刻画了系统研究的核心问题——常被一些人认为神秘,被另一些人认为平凡;很少有人理解其全部意涵。对于罗斯·阿什比来说,这一表述既不神秘也不平凡;他很好地理解了它,并试图发展方法论工具,以严格分析整体-部分关系。
在20世纪60年代初,阿什比发表了一种算法,用以确定一个n维关系是否可以从其所有(n-k)维投影中重建(k=1,2,…,n-1)[67]。他表明,一个关系可以从适当的投影中重建,当且仅当各投影的柱面扩展的集合交集与给定关系相同。尽管该算法只涉及整体-部分关系问题的一小部分,但作为澄清这一问题的首次尝试,它具有重要意义。然而,它几乎未被专业界注意到。即使在其发表十五年多后的现在,情况也没有多大改善。事实上,最近在诸多不同领域发展的系统模型几乎无一例外地由子系统构建而成。虽然每个子系统与总体系统变量集的一个子集相关联,且通常是对所涉及现象的经过良好验证的模型,但从给定子系统重建总体系统的能力问题几乎从未被提出。似乎许多系统建模者有一种将重建能力视为理所当然的倾向。显然,如果没有通过分析来确定系统模型的重建能力,该模型很可能是根本错误的,并可能具有极大的误导性。
1964年当我读到阿什比的论文[67]时,我对他关于重建问题的洞见印象深刻,但我花了十多年时间才充分理解其意义,并有足够的动力去继续阿什比开创的方向进行研究。我第一篇涉及重建问题的论文发表于1975年[106]。在该论文发表后,许多研究人员加入到进一步研究该问题各个方面的努力中,并发展了一个被称为重建分析[103,117]的新方法论领域。
重建分析的一些贡献者,最值得注意的是格里特·布鲁克斯特拉、罗杰·科南特和克劳斯·克里彭多夫,已经用信息论概念研究了重建问题的各个方面[117]。这也是阿什比在20世纪60年代中期开创的一个方向[71],这显然是他1972年去世前不久的主要兴趣之一[92,96]。可以公平地说,他证明了信息论与系统研究的相关性,这是阿什比的主要贡献之一。
阿什比对系统重建性质的强烈兴趣,只是他更大兴趣的一个方面——对简化方法的永恒追求。以下引自他1964年一次专题讨论会上的发言[69,pp.166,168,169],很好地描述了他在这一方面的观点:
"……系统理论(是)试图发展科学原理,以帮助我们应对具有高度相互作用部分的动态系统,其规模可能超过10¹⁰。面对远超此规模的问题和过程,他该怎么办?在我看来,此时他必须下定决心,是否接受这一限制。如果不接受,就让他去攻击它,试图找到战胜它的方法。如果接受,就让他全心全意地、一贯地接受。我个人的观点是,这一限制比能量守恒定律更不可能被突破。能量定律本质上是经验性的,可能在一夜之间消失,正如质量守恒定律那样,但阻止一个拥有10¹⁰资源的人执行一个真正需要超过此数量级过程的限制,基于我们关于因果的基本思维方式,且完全独立于其所依附的特定物质。如果这一观点正确,系统理论必须建立在简化方法的基础上,并将本质上以简化科学为基础。……我建议,未来的系统理论家必须是简化的专家。"
尽管阿什比并非计算机科学家,但他具有运用计算机的非凡才能。他证明了将计算机视为系统科学家的实验室、将计算机仿真视为其最重要的实验室工具之一,是完全有意义的。他开展了系统科学中最具典范性的基于计算机的实验研究之一;其目标是确定系统规模(所涉及变量的数量)及其连接度(变量间依赖关系的百分比)对特定类别系统稳定性的影响[90]。该研究仅限于线性动态系统。除其他结果外,它导致了连接度临界值(13%)的发现;该值具有临界性,因为对于足够大量的变量(10个或更多),几乎所有连接度小于临界值的系统都是稳定的,而几乎所有连接度大于临界值的系统都是不稳定的。在另一项研究中,通过计算机实验研究了由功能相同的有限状态机构成的系统类别。该研究的目标是确定循环长度及其他行为特征对各种类型有限状态机的系统规模的依赖性[75]。这些以及阿什比参与的一些其他基于计算机的系统实验研究,清楚地展示了计算机作为系统科学实验室的作用。
阿什比的独特贡献之一,是他将能量系统中已被充分理解的功率放大原理扩展到信息系统领域的思想。这一信息放大的思想在他的两部著作和许多论文中,在多种不同语境下被讨论,如调节放大、适应放大或设计放大。其最一般的形式嵌入在智能放大器的概念中[41]。在这一语境下,阿什比认为智能意味着解决问题的能力,而解决问题又意味着从全部可能性中做出恰当选择的能力。因此,他将智能放大器基本上视为选择放大器。当问题是调节时,选择放大器将采取调节放大器的特殊形式;当问题是设计具有给定性质的系统时,它将采取设计放大器的形式,等等。
各种形式的信息放大器思想具有深刻的哲学意义和实践意义。如果这样的放大器是可能的,那么至少在原则上,也有可能构建能够解决超出其设计者智力范围问题的人造系统。尽管具有如此巨大的理论和实践潜力,信息放大器的思想尚未在阿什比本人所发展的概念水平之外得到进一步阐述。这显然是他的伟大思想之一,但仍被低估,因而未得到充分发展。
系统设计的各个方面,特别是元设计问题,经常在阿什比的著作中被讨论,尤其是在他的晚期论文[96,98]中。他将系统设计视为一个调节过程,并运用信息论的一些概念来发展若干元设计原理,这些原理对于极其复杂系统的设计尤为重要。将这些原理纳入每一本系统设计教科书中,已是久拖未决之事。
我只能讨论阿什比的一些思想,特别是那些对我自己研究工作有所影响的思想。他的著作中还有许多关于适应性系统、自组织系统、自复制系统、系统建模、归纳、预测、超稳定性、生物计算机等主题的更多思想。他的一些思想影响了当前的科学观点并得到了进一步发展(例如,状态决定机器的概念或信息论在系统研究中的作用),一些只是最近才成为相当关注的研究对象(例如,重建分析),但他的著作中仍有许多丰富的思想在很大程度上被忽视,或至少没有在阿什比本人的阐述之外得到发展(例如,基于信息的放大或他的元设计思想)。可以合理预期,本书收录阿什比主要论文的出版,将重新激发人们对这一智力宝库的兴趣,并将导致其中所包含的许多思想的进一步发展。


来源:宋胖说事儿(公众号)

编辑:张家乐

分享到:  QQ好友和群QQ好友和群 QQ空间QQ空间 腾讯微博腾讯微博 腾讯朋友腾讯朋友
收藏收藏 支持支持 反对反对
沙发
 楼主| 发表于 2026-2-4 20:09:22 | 只看该作者
【案例】

智能的机制——阿什比论文集(2

大家好,接着由我来为大家翻译控制论先驱阿什比的论文集《智能的机制》。全书共有8个专题40多篇论文,基本把阿什比(除了名著《大脑设计》《控制论导论》之外)主要代表作都囊括了。除了个别零散论文(比如《智力放大器设计》)外,大多没有被翻译为中文。我想尝试翻译出来,与群友共享。也许在今天AI浪潮几乎让人疯狂的背景下,聆听一下这位控制论先驱对智能的思考对我们有帮助,能让我们冷静下来,对AI如实观照。我们接着翻译机制定律的专题。接下来我们翻译的是本专题第一篇论文《控制措施对稳定性的影响》控制措施对稳定性的影响
战争期间,政府管制措施的引入导致许多事务通过行政命令确定某些数量、价格或其他变量,而在自由放任体制下,这些本应由市场自行调节至均衡水平。汇率、工资和价格都是这方面的例子。这种管制不仅在战争期间多次出现,而且和平时期管制或计划经济的进一步扩展,可能会导致更多变量以这种方式被固定下来。
本文旨在指出:在任何一个动态系统中,固定某一变量可能会导致其余变量变得不稳定;同时,本文将论证有一类变量尤其容易引发这种结果。(在社会或经济系统中,向不稳定状态的转变将表现为各种奇特且不良的"恶性循环"随后不断滋生。
该理论可表述如下:一个包含n个变量的动态系统,其方程一般具有以下形式:


在平衡点(该点处各变量的变化率为零)附近,方程可在不失一般性的前提下视为线性的:


系统要在平衡点处保持稳定,其必要且充分条件是:该方程所有根的实部均为负数。


(由于我们讨论的是实际系统,所有系数 aij 均为实数。)进一步地,由于我们讨论的是在自由条件下已存在一段时间且保持稳定的平衡点,故可假设该系统原本处于稳定状态。
现假设我们将 xn 固定。其余部分的稳定性将取决于以下方程根的实部:


第一个系统的稳定性绝不意味着第二个系统也稳定。因此,固定某一变量确实可能导致系统其余部分变得不稳定。
数值示例如下:系统导出方程
λ3+3λ2 +26λ+60=0;
该方程的根为 -2.44,-0.28±4.95i(其中 i = -11/2)。由于所有根的实部均为负数,系统保持稳定。但若固定 x3,则得到行列式为


该方程的根现为 +1 +2 ,故系统变得不稳定。
然而,我们还可以进一步分析。由于所有根之和等于主对角线元素之和 aii 任何使该和变得不那么负的变化都将趋向于降低系统的稳定性——在其他条件不变的情况下(此处论证诚然不够严谨)。因此,若 ann 为绝对值较大的负数,则固定 xn 尤其可能导致失稳。这类变量不难识别,因其行为遵循方程:


其中 ϵ 独立于 x 但随时间变化,而a 为绝对值较大的负数。此类变量x 具有以下特性:(1)始终趋向于 −ϵ/a ;(2)快速趋向于 −ϵ/a (3)由于 −ϵ/a a 为分母,其值较小,故 x 的波动幅度亦较小。
因此,本文结论如下:(1)通过行政命令固定某一社会或经济变量,存在导致系统或其部分失稳的风险(后者表现为各种"恶性循环"的相继出现);(2)从这一角度看,尤其危险的变量类型是:在自由条件下变化迅速,且通过其快速变化影响其他变量,自身却仅在狭窄范围内波动的变量。
本人并非经济学家,无法提供具体实例,但相信此类实例不难找到。


来源:宋胖说事儿(公众号)

编辑:张家乐

板凳
 楼主| 发表于 2026-2-4 20:17:37 | 只看该作者
【案例】

智能的机制——阿什比论文集(3

大家好,接着由我来为大家翻译控制论先驱阿什比的论文集《智能的机制》。全书共有8个专题40多篇论文,基本把阿什比(除了名著《大脑设计》《控制论导论》之外)主要代表作都囊括了。除了个别零散论文(比如《智力放大器设计》)外,大多没有被翻译为中文。我想尝试翻译出来,与群友共享。也许在今天AI浪潮几乎让人疯狂的背景下,聆听一下这位控制论先驱对智能的思考对我们有帮助,能让我们冷静下来,对AI如实观照。
我们接着翻译机制定律的专题。接下来我们翻译的是本专题第二篇论文《大脑在自然世界中的地位》。
大脑在自然世界中的地位
(此论文为《大脑设计》一书的最初构思,发表于1967年1月15日)
关于大脑,人们已经了解甚多,但我们的大部分知识仍以实验和观察事实的形式存在。然而,随着人们对大脑更一般特性的兴趣日益增长——例如各种形式的"人工智能"——现在亟需对"大脑"的本质进行抽象表述,一种可直接转化为计算机或硬件的表述形式。本文基于集合论和状态决定系统的概念,给出了这样一种表述。
1.一种新机制理论。
我们当然可以这样描述大脑:它是一个物理化学部件的集合体,每个部件作用于许多其他部件,且每个部件都受物理化学定律的支配(在神经生理学家已证实的范围内)。但大脑的部件如此之多,以至于我们处理多部件协同作用的常规方法实际上已无法适用,我们必须停下来重新审视这一状况。
在神经细胞的特性被确定之后,还剩下将这些特性与大量神经细胞组织所呈现的特性联系起来的任务。所涌现的特性是有机体的行为特性,重要的是必须立即认识到:有机器的行为特性绝不能直接从单个神经细胞的特性推导出来,因为有机体的大多数行为特性源于神经细胞之间的相互作用——它们是物理学家所谓的"协同"现象。因此,任何关于神经细胞与行为之间关系的研究,都必须高度重视相互作用的问题。这一主题往往十分复杂,过去曾被认为是令人望而生畏的;但在过去二十年间,我们对复杂机制的理解取得了巨大进展,现在这一主题已可以较为清晰地加以论述。
1940年前后,试图处理神经细胞与行为之间关系的努力受到很大阻碍,原因在于:有志于科学的机械论者手头只有钟表、车床和打字机这类简单机器作为例子。因此他显然认为,任何"机器"都不可能纠正自身错误、不可能进行预测、不可能具有主动性,等等。这些概括对于1940年前的机器类型而言大体正确,但随着机器此后发展出全新的能力,许多旧有的概括如今已完全错误。
新机器(以及我们可以称之为"新机械论者"的思想)的本质,可以通过简要提及历史事件来最简单地阐明。1940年以前,机械装置(以及思考它们的"经典"物理学)属于"因果"类型,其典型特征是一个原因导致一个结果,然后过程就结束了;上紧发条的钟表走24小时,然后停下;车床接通电源后,循环运转不止;打字机按下按键,打出字母,然后停止。面对这些机器,心理学家也类似地进行理论建构:刺激引发反应,停止;狗经受一系列闪光和强化,形成条件反射,停止。更复杂的行为理论无法形成,因为没人知道如何思考复杂行为。
随后,霍华德·H·艾肯建造了马克一号。查尔斯·巴贝奇在一个世纪前就已理解顺序机械的原理,但未能解决纯机械问题。但马克一号运转了。这是一个通过构造给出的证明:"机械装置"可以包括那种将因果串联成无限长链条的类型,每个原因引发其结果,每个结果本身又成为下一步的原因。走走停停变成了走走走走走……,一种全新的计算行为财富被证明是可能的。
第二个重要贡献出现了(事实上稍早一些),当时无线电工程师驯服了"反馈"。人们很早就发现,给无线电接收机增加"再生"是提升其性能的有力方法,但代价是使接收机几乎疯狂般地难以控制。这场战斗持续了30年,但到1940年工程师们获胜了——他们理解了反馈,并能将其作为有用工具加以运用。这一理解是对行为新科学的第二个重要贡献,因为大多数生物系统富含循环作用。1940年以前,缺乏理解使任何现实性的处理成为不可能;甚至只是提及循环作用的存在,也往往使讨论陷入震惊的沉默,因为每个人都在反思自己无法清晰思考此类问题。然而,今天我们不再畏惧这一主题,因为我们知道它可以被理解,且有其自身的逻辑、定理和方法。我们也可以看到,这一进展在于理解长因果链条的特性,在这种情况下是围绕同一物理回路循环往复(而非像马克一号的过程那样线性向前)。
有了无线电接收机和马克一号作为先例,数学家和工程师得以将他们的方法扩展到同一领域。在这里,他们得到一股数学思潮的大力帮助,这一思潮源于怀特海和罗素的著作(1925),试图使数学思维摆脱其对连续性、线性和解析性的过度沉迷。他们的工作由以布尔巴基为集体笔名的法国学派充分发展,该学派详细展示了所有数学过程如何可视为对"元素集合"的某些基本运算的特例。对"元素"的全部要求只是它们可被明确识别。它们可以是数字1,2,3,……或直线上的点,但同样可以是气象学家区分的五种云型,或某种鸟类发出的三种叫声,或马的四种行进模式。因此,如果生物学家或心理学家的观念足够明确,可以作为基础,他就拥有了现代数理逻辑可以应用的必要材料。于是,一门完全严谨的行为科学的可能性由此产生。它从观察者的数据出发,将这些数据作为现代集合论中的元素,从而进入数学和逻辑的严谨世界(如Ashby, 1952, 1966)。
行为的新数学或逻辑,不应与本世纪初的"数学生物学"相混淆。当时唯一可用的数学方法是解析的、连续的和线性的形式,最初为解决牛顿问题而发展;在生物数据或概念被修改以适应僵化的数学框架后,它们往往只是生物现实的漫画。然而,新数学完全无需扭曲。它的最初步骤更多地是由机械计算的需求和外在形式引导的,但生物学家不应被这种呈现方式所误导。"有限状态机"Gill, 1962)、"无噪声转换器"Shannon and Weaver, 1949)、"状态决定系统"Ashby, 1952)以及"时序电路"的理论现已充分发展,本质上是同源的。它们基本上都处理这样一种情况:系统的下一状态由紧邻的前一状态决定,这种情况在自然系统中如此普遍,以至于被许多人视为绝对普遍。所有理论都表明,这一(表面上)简单的限制实际上蕴含着深刻而广泛的推论。
状态决定系统这一基本性质的表述可以采取多种形式,行为理论的学习者必须准备在它们出现的任何形式中识别它们。最简单的形式明确陈述下一状态(x')作为较早状态(x)的函数是什么:


因此,如果 x′=x+0.7 ,那么状态 x=0.2 之后,x 将变为 0.9 ,然后是 1.6 2.3 ,依此类推。如果将 x 视为在步骤 1,2,3,... 时取一系列值 (x1,x2,x3,...,xn) ,那么同样的方程将表现为:


有时 x 被视为时间 t 的函数,并记作 x(t) ;如果时间以步长 Δt 推进,那么方程将表现为:


一种等价的方法是,不指定 x 的新值,而是指定它相对于先前值的变化量 Δx 。于是 Δx=x′−x=x(t+Δt)−x(t) ,方程将具有如下形式:


其中 g 是函数:f(x)−v 。如果步长变为无穷小,在时间间隔 dt 内,Δx 变为 dx ,方程则变为常一阶微分方程的形式:


上面假设代表一组值中某一个值的符号 x ,可能是一个向量,例如具有 n 个分量。如果这些分量变量为 x1,x2,...,xn (其中下标用于区分不同变量,而非如方程 (2) 中表示不同步骤),则方程可具有以下扩展形式:


如果步长为无穷小,方程则变为一组联立常一阶微分方程:


有时下标本身是连续的,且 g 函数可能表现出某种特殊关系。热传导(热量或溶质的扩散)就属于这种情况,此时温度或浓度 x 随时间的变化方式取决于沿线性距离 y 的相邻温度;于是方程变为(例如):


这里重要的是,所有具有上述任何类型可规定行为方式的系统,都受制于一种新的机制逻辑。通过这种方式,许多独立发展起来的知识分支可以被整合在一起,获得统一的行为理论。读者必须认识到,尽管这一理论包含了数学物理学的许多结果(如上面的方程 (8)),但它并不受其限制。其基本概念是"映射"mapping)。它总是从一个集合(其"定义域")到一个集合(其"值域"),是一种规则(或过程、转换、变化或任何其他对应关系),对于定义域中的每个元素,给出值域中一个且仅有一个元素。正是"一个且仅有一个"这一特性刻画了"映射",而非某种物理作用;因此,如果两个集合是母亲和女儿,映射是从女儿到母亲:因为每个女儿有且仅有一个母亲,而每个母亲可能有多个女儿。下面,如果映射 μ 将元素 x (在定义域中)转换为 y (在值域中),我们将写作:


定义域和值域有时可能是同一个集合;例如,"平方"运算将整数集映射到整数集。当这种情况成立时,映射可以重复进行,从元素生成:


将此方程与前面的方程 (2) 相比较,我们可以看到,映射的数学概念为我们提供了表示状态决定系统(state-determined system)所需的形式。如果不涉及此处不适宜的技术细节,这个主题就很难进一步深入。但我希望已经说得足够清楚,以表明以下命题是可以辩护的:1)现代机制理论建立在映射概念之上,包含了过去获得的科学知识;2)现代机制理论通过大量考虑因果关系(既包括长序列中的,也包括带有反馈的),为生物学和心理学的复杂事实提供了充分的技术和逻辑;3)机制的现代逻辑根本上是一种行为的逻辑(而非物质或能量的逻辑)。因此,新机制论者(New Mechanist)感到自己有能力尝试弥合神经元与行为之间的鸿沟,但他也或许格外意识到,要弥合的鸿沟有多么巨大!五十年前,这似乎很简单:刺激进入,反应出来——还需要什么?当时人们假设,所需要的只是大量的反射,加上一点整合把它们焊接在一起即可。不幸的是,随着对机制的理解不断深入,人们也越来越认识到神经元活动与整个有机体行为之间的概念距离有多么遥远。今天的处境与物理学中的情况不无相似:当一位钢桥设计者反思其技艺建立在量子物理之上时。今天没有桥梁设计者会直接诉诸量子物理定律:这种联系必须经过几个阶段,通过原子运动、晶体结构、金属强度、实用冶金学、梁的强度,最终到达整体结构。从神经元到行为的鸿沟似乎同样将必须分阶段来弥合。接下来的章节将概述这样一种尝试


来源:宋胖说事儿(公众号)

编辑:张家乐

地板
 楼主| 发表于 2026-2-5 21:35:30 | 只看该作者
【案例】

智能的机制——阿什比论文集(4

大家好,接着由我来为大家翻译控制论先驱阿什比的论文集《智能的机制》。全书共有8个专题40多篇论文,基本把阿什比(除了名著《大脑设计》《控制论导论》之外)主要代表作都囊括了。除了个别零散论文(比如《智力放大器设计》)外,大多没有被翻译为中文。我想尝试翻译出来,与群友共享。也许在今天AI浪潮几乎让人疯狂的背景下,聆听一下这位控制论先驱对智能的思考对我们有帮助,能让我们冷静下来,对AI如实观照。
我们现在翻译的翻译机制定律这一专题。今天接着翻译的是本专题第二篇论文《大脑在自然世界中的地位》后续部门。
2演化与平衡
" behaving organism "(具有行为的有机体)可以从三种截然不同的观点来讨论。
第一种观点讨论其内在意识、其觉知。我将从这个角度无话可说,因为我无话可说;这个问题涉及极为困难的哲学和科学方法问题。
第二种观点考虑其创造性方面,如一个人发明新的音乐和谐系统或创作出乔伊斯式的散文。对此我也无话可说,因为我没有客观标准来区分这类产物与鹅卵石的吱吱声,或由词典和随机数表生成的一系列词语。当"什么都可以"时,科学就没什么可说的了。
第三种观点将具有行为的有机体视为为生存而塑造的:作为一个高度适应其环境的系统,由演化和自然选择塑造而成,并且能够(特别是在人属物种中)产生极其复杂的行为模式,这些模式显示出(对机制论者而言)对环境惊人复杂的适应。在这里,大脑被视为仅仅是一种促进生存的器官。这第三种观点如今已取得了一定的完整性,因为已不再存在完全神秘的大型鸿沟。我们今天所见的将在下面概述。
我们的出发点是这样一个确立已久的事实:地球约在五十亿年前凝固,自那时以来,影响其表面的条件要么相当恒定——如能量定律、引力定律、碳和水的性质等——要么变化缓慢——如其温度、到达地面的阳光质量、海洋的组成。
机制的逻辑现在变得适用。地球表面在每一时刻都将具有一个明确定义的状态——每粒沙的位置、每点的温度、每个物种的分布等等。自然定律在每一点上作用,决定该状态将如何变化。由于每个状态都转向某个状态,且从不转向两个状态,自然定律规定了可能状态集合到同一集合的映射。(这种表述是否完全真实尚不清楚;它在很大程度上肯定是真实的,而且它也是指导科学家日常工作的普遍假设。在本文中,我们将假设它是完全真实的;原子不确定性造成的复杂性会使我们反复说"统计上确定的"或"平均而言",但这种修正不会使以下概述产生重大改变,因此我们将忽略这种复杂性。)
让我们将由自然定律及其基本力引起的映射称为L,因此,如果它作用于状态 s,它将 s 改变为 L(s)。现在,说地球表面的定律和条件基本未变,意味着映射(或算子)L 随时间未变,因此作用的操作符序列一直是重复序列:L, L, L, ...而非,比如说,L,M,N,... 这样的序列。
如果定律或条件发生了显著变化,就会出现这种情况。这一(看似微不足道的)观察实际上将为我们严格处理生命和智能的起源提供一个可靠的出发点。
我们从这样一个事实出发:第一个序列显示出高度的冗余性(按香农和韦弗1949年定义的意义),从而显示出约束;因为较大的集合(由 J,K,L,M,N,... 按某种顺序组成的所有序列)被限制为一个子集(仅由元素 L 组成的那些序列)。布尔巴基学派已经证明,特别是在"集合的层次与结构"一节中,对子集的限制始终是产生性质、关系、模式、结构(这些词在普通语言中使用,或在数学中具有特殊精确性)的根本操作。因此,从映射理论来看,我们可以预期由单一算子重复生成的状态序列会显示出特殊特征。这种特殊特征出现的一种方式是处于平衡态——即满足以下关系的状态:
L(s)=s                                   11
这类状态在将大脑作为生存器官的研究中具有最高的重要性。
应该注意到,大多数"经典"的平衡例子——静止悬挂的摆、停走的手表、所有反应耗尽的化学混合物——都极其简单,并且完全依赖于有限量的能量。另一方面,"开放"系统仍然可以是一台"机器"(正如计算机通过状态决定而成为机器),但可能显示出这富有层次和魅力的 的平衡态(有时区分为"稳态")。这种丰富性来自于这样一个事实:从某一研究层次上被视为"状态"的东西(因此未被分析),在更仔细检查下,可能被发现具有丰富的内部结构。因此,罗马帝国在数百年间保持为可识别的同一实体,尽管遭受许多扰动,而更仔细的考察表明,实际上大量的个人活动和变化促成了帝国整体的稳定性。在这种情况下,严格的处理仍然是可能的:如果(按定义)满足
L(S)=S                       (12)
即,如果 L 作用于S 不产生新的状态(即 L(S)=S )。
因此,尽管 L 可能将状态 s1 改变为 s2 ,它的作用只是引起集合 S 内部的变化;而且如果 S 具有某种特征性质,当 L 作用时这一性质不会丧失。("位移后的稳定性"是一个特例,其中 L 是复合映射 λn∘Δ ,这里Δ 是实现某种位移的算子,使得 Δ(s)=s ,而 A 是其重复操作最终使状态从 Δ(s) 回到 s 的映射。)
"所有系统都趋向平衡"这一陈述包含了许多经验,但对于严格的行为理论来说过于模糊。然而,它不成立的情况似乎都是高度特殊的,并且需要精确的构造。即使一个系统没有平衡态(或循环),它也会趋向某些"优选的"区域或状态集合;只有当——如果该系统由以下条件规定时——才没有偏好(在相空间中轨迹没有收敛或发散):


g ‘s数具有这样的特殊性质:处处(都满足某种条件)


同样,如果系统是随机的且马尔可夫的,它也会趋向某些"优选的"状态,除非转移概率矩阵不仅其行相加为1,其列也相加为1。因此,"系统趋向平衡"这一陈述确实有一定的合理性。在任何特定情况下,数学上可接受的形式都必须根据具体情况来发展以适应其细节。
因此我们可以说,具有不变定律的大多数系统(即处于不变条件下的系统)会趋向它们滞留的状态(或状态集合);通过显示出向这类状态的收敛性,它们在定律与系统状态之间(以及在其组成部分之间)产生了关系。所产生的这种关系就是"适应于生存"。在初级层次上,这种关系是重言式的;在复杂系统的后果中,它发展出无限的复杂性。
在平衡态,各部分之间的关系必然是整体性的,且是一种协调关系。下面将给出一个例子来说明其含义。设矩阵为:

作为算子,或定律,或驱动力,它通过模12乘法改变状态(如向量


变为状态或向量


在这种情况下,状态已被改变。然而,向量


却被算子保持不变:


这些结果分别超过12的倍数2、5和3,因此状态被再生,且是平衡的。这里重要的是,三个分量值——2、5和3——协同作用以相互保存。例如,5依赖于2,因为5是由
3×2+1×5+2×3
得到的。如果2是1,结果就会
3×1+2×5+2×3
即14或2(如第一个例子中)。
这种协同作用是相当普遍的。在任何平衡态(无论简单还是具有复杂内部结构),各部分总是相互作用,使得所有部分的作用是再生每一个部分的状态。因此,如果我们仅仅观察一次再生行为,我们完全可以这样说:这组部分正在(在这些自然定律范围内)行动,以保持其条件不变。
那么,给定一个动态系统是孤立的,今天已存在一个完全严格的理论,说明它为什么应该趋向于以行为上"自我保护"为特征的状态或形式。但"状态或形式"必须等同于"有机体加环境"这一系统。例如,在绿洲,水井使村民存活,而村民维修水井。两者之所以能够持续存在,是由于它们之间恰当的相互作用。生物体所显示的"适应"总是针对其环境的某种性质:让环境改变,曾经适应的行为方式可能变得完全不合适。
(确保生存的)关系在那些稳定状态集合呈"柱形"的情况下,在概念上变得更简单,也就是说,其中某些变量保持在明确标记的界限之内。这些变量随后被识别为适应系统的"本质变量"——如果整体要生存,这些变量必须保持在"生理"限度之内:如食物的供应、循环血液的体积、威胁骨骼和皮肤连续性的压力、温血动物的体温等。
因此,严格的行为理论与生理学家不谋而合,都将内稳态视为所有适应性行为的核心。在研究行为时,“本质变量很容易被忽视。它们几乎保持恒定,而非本质变量则在很大范围内波动,变化迅速,通常会吸引观察者的注意。然而,非本质变量的戏剧性活动是次要的:它们之所以有意义和关联,仅仅是因为它们剧烈的变化起到了将本质变量保持在限度内的作用。如果它们产生了其他效果,这些效果对研究基本原理的学者而言,仅仅是副产品。
“内稳态”这个词最初由沃尔特·B·坎农(1932年)创造,用来描述这些过程,只要它们发生在生物体的自主、植物性和内部过程中。然而,严格的行为理论强调,这里内部与外部的任何界限最终都是武断的,许多过程同时利用内部和外部因素,并且共同的原则支配着两者。出于这些原因,如果不想失去行为理论的基本统一性,观察者能够将非本质变量(有机体行为)的自由活动与其最终实现的内稳态联系起来,并且是这种内稳态赋予了它们最终的意义,这一点至关重要。只有这样,有目的的自由活动才能与那些仅仅是力量在行动中表现的活动区分开来。当然,本质上两者并无区别:它们仅在对于某种已被理解的内稳态的关联性上有所不同。
从这个观点来看,人只不过是一个物种,它专门发展出了极其复杂的自由活动,并且设法获得了其中一些优势,同时避免了大部分危险。他可以熔化钢铁而不烧伤自己,可以制造和运行发动机而不被撕成碎片,可以跨大陆输送电力而不被电死。通过这种方式来看待人类的活动,我们可以从地球长期隔离这一基本事实,推演出一个连续的线索,直至那些总是倾向于内稳态行为的极其复杂系统的出现。
现在让我们更详细地考察这些自由活动,这些行为,以便了解人类那些众所周知的行为如何与其背后的机制联系起来。我们将首先考察称为“反射”的非常简单的行为片段,然后是更复杂类型的称为“本能”的行为,最后是那些很大程度上依赖于“学习”的行为。所有这一切都将被视为是支配(并驱动)所有物理化学事件的基本映射的表现形式,这些形式通过自然选择塑造为内稳态形式。


来源:宋胖说事儿(公众号)

编辑:张家乐

5#
 楼主| 发表于 2026-2-6 19:47:41 | 只看该作者
【案例】

智能的机制——阿什比论文集(5

大家好,接着由我来为大家翻译控制论先驱阿什比的论文集《智能的机制》。全书共有8个专题40多篇论文,基本把阿什比(除了名著《大脑设计》《控制论导论》之外)主要代表作都囊括了。除了个别零散论文(比如《智力放大器设计》)外,大多没有被翻译为中文。我想尝试翻译出来,与群友共享。也许在今天AI浪潮几乎让人疯狂的背景下,聆听一下这位控制论先驱对智能的思考对我们有帮助,能让我们冷静下来,对AI如实观照。
我们现在翻译的翻译机制定律这一专题。今天接着翻译的是本专题第二篇论文《大脑在自然世界中的地位》后续部分。
3反射有机体
反射,以其多种形式,在一般理论中呈现不出什么困难,因为现在已知,并且已在多种方式中得到证明,如果各部件具有某些最小性质,那么由它们组成的足够大和复杂的网络可以产生任何明确定义的行为。因此,那个老问题:机器能做吗?答案总是肯定的;只要所要求的活动能够以操作上有意义的术语进行明确的描述。生理学的所有反射都很有能力,而"反射问题"本质上就是发现每个特定反射的特定细节。
其中许多是调节性的,即稳态的,这在今天并不提供什么异常困难,因为现在众所周知,这种调节只需要(由基因模式)提供一个反馈(从主要效果返回原始原因的任何因果链),安排成"负"的,即返回的效果从原始扰动中减去,从而倾向于抵消它。在复杂情况下,"减法"操作可能必须以技术上复杂的方式理解,但基本思想保持不变。这种反馈的理论现在已广泛发展,部分在伺服机制理论中。希望使用这种反馈的本质上稳态方面的生理学家,不应剥夺自己从反馈机制理论中可以获得的大幅增加的知识和技术辅助。
然而,生物学主题的研究者会注意到,这种理论往往过于专门化于反馈是线性和连续的那些情况。生物调节器往往严重地是非线性的(反应与刺激不成比例)和非连续的。在反射水平研究这种调节不需要新原理,只需要新技术。这种非线性和非连续的调节在其最复杂的形式中出现在学习反应中(后面提到)。
4本能有机体
虽然反射有机体在机械论表述中几乎没有什么困难,但这种困难只有在反射保持简单时才很小。然而,现代机制理论设想的是复杂性无限的机制,既在其工作部件的数量方面,也在支配其内部活动的复杂条件性方面。
今天被识别和列出的"本能",每一个都有一个目标,但这一事实并不使它们脱离机制的类别,因为任何具有某种持久性和某种结局的可描述行为片段都必须有一个界限,因此在某种意义上具有稳定性——纯粹短暂的和容易转移的既不被注意也不被命名。因此,任何具有许多平衡状态的系统都可以被描述为具有同样多的目标和"本能"。日常生活中的机器似乎缺乏它们,仅仅是因为这些机器在行为方式和复杂稳态方面太过贫乏。让一台机器具有现代的活动和丰富的可能性,观察者很快就能命名其行为中的许多趋势,如果在生物有机体中,这些趋势会要求被识别为"本能"。
曾经有一段时间,本能被认为与反射根本不同,因为本能往往是由某种无法与任何特定物理或化学事件相识别的情况或事件引发的。因此,狗往往在"某种奇怪的东西"出现时会吠叫,而"某种奇怪的东西"无法与任何特定的声音或视网膜的任何特定刺激相识别。然而,现在已知,这种对刺激之间组合和关系的反应特性,如果机制以阶段或层次工作,使得第一层次"计算"初级刺激的各种函数,然后后续层次计算这些函数的函数,最后阶段只有在这些"计算"过程在倒数第二阶段产生了某种实际物理事件时才起作用,那么这种特性就很容易从机制中获得。这样,对初级刺激的任何定义函数,无论它可能多么复杂或微妙,都可以以纯粹的机械方式转化为适合作为本能行动物理原因的物理事件。反射和本能之间的明显区别之所以产生,部分是因为较早的理论大多无意识地基于一个单层次模型:刺激到反应,没有中间处理。
通过进化发展的有机体,因此发展出越来越复杂的机制,提高其以越来越复杂的方式对环境的扰动和威胁进行稳态反应的能力。这种进展有多么有序?在这里,机制的逻辑是坚定不移的:一般来说,每一个新的添加,每一个扩展,都会导致一个本质上全新的总体系统,其性质也是新的。只有当存在特殊的简单性时,新的扩展才能给出仅仅添加到已有行为集合中的新行为。一般来说,无论机器有多大,对其做出的改变有多小,如果机器不受限制,我们就无法对其行为中可能发生的变化的大小设定任何限制。数学家知道相应的事实,即如果


那么当参数 a 具有特定值 a1 时,这个系统的行为并不以任何方式限制 a 被改变为 a1+Δa 的系统的行为。
这一事实,尽管对那些寻找简单性的人来说是不愉快的,但在机制理论和行为分析中是基本的。正如少数化学元素(C、H、N、O)可以以许多组合放在一起形成有机化学的许多化合物一样,许多其他单元(晶体管、神经元、分子)也可以放入组合中,其行为多样性不受单元统一性的限制,而可以像其组合数量一样多样。这种丰富性正是来自单元之间积极相互作用存在的丰富性,简单性只在相互作用很小时发生(单元很多时)。
应该注意的是,整个系统的行为不能通过我们将整个系统视为由各种反馈环组成,找到每个单独环固有的行为,然后以任何方式添加或组合单独行为来预测。例如,已经构建了这样的系统,其中每一个可能的环都具有负反馈(因此每个环本身将是稳定的),但整体上却显示出不断增加的不稳定性发散(例如,Ashby,1952)。同样,机制的逻辑表明,我们没有权利期望本能(作为行为中观察到的复杂趋势)将是简单的、整洁的或整齐可分类的。在这里,实地工作者或临床医生有最后的发言权,因为只有他能说什么本能值得区分、定义和命名。
5学习有机体
学习和记忆的本质,曾经如此神秘,在过去二十年中已完全阐明,现在可以将它们视为与物质中发生的其他过程完全同源的整个过程。基于所有物质中的过程(原子水平以上)都是状态决定的这一基本假设(得到两个世纪科学工作的强烈支持),当观察者无法观察系统的每一个变量,因而发现它不可预测时,通过考虑他在可观察事物中的较早事件来恢复可预测性,"记忆"的概念就变得适用了。因此,如果三个变量——x y z 的系统——只能在 x 处被观察,观察者很可能会发现,t+1 时刻的 x 值是可以预测的,只要他知道 t t−1 t−2 时刻的 x 值。从信息论的角度来看,这种变化非常简单:变量 y(t) z(t) 被变量 x(t−1) x(t−2) 所取代,正如它们可能被 x y z 的任何两个函数所取代一样。
这种类比是精确的。如果检验(用香农的记号)
H(x)+H(y)−H(x,y)≠0
表明在他的意义上"传输"正在 x y 之间发生,我们就有了两个空间分离变量之间的普通传输,比如说,神经系统中的两个点之间。如果检验
H[x(t)]+H[x(t−k)]−H[x(t),x(t−k)]≠0
成立,那么"传输"(以完全相同的方式定义)正在 t 时刻 x 的事件与 k 个时间单位之前在 x 发生的事件之间发生。当如此时,我们就有了允许我们将"记忆"视为时间上传输的基本性质,这与我们充分理解的空间上的传输完全同源。
两个时间之间的传输在物理上应该是可能的,这需要某种特殊的物理机制,正如两个地点之间的传输一样。所使用的机制,虽然在某些方面差异很大,但总会使用某种形式的平衡,因为试图将某种状态从一个时间携带到另一个时间,而不被破坏和不丢失信息,要求某种东西在该间隔内是不变的,而"不变性""平衡"的核心。
用什么物理或化学"状态"来保持不变,来携带"记忆",在行为的更大问题中并不重要:所必要的是该状态应该具有某些性质:如何实现这些性质可以由纯粹局部意义的事项决定。显然,正如没有人期望一种方法被用于大脑和身体中所有从一处到另一处的许多传输一样,同样没有理由期望只有一种方法被用作从较早到较晚传输的"记忆基础"。更有可能的是,有机体将使用多种方法,每一种都适应于其特定目的的需要。
因此,记忆痕迹的细节在行为的更大问题中几乎没有什么意义。更有意义的是首先用于制作记录的方法,以及后来有利地使用它的方法。目前,我们的科学思维往往被大型数字计算机的例子严重误导。它有一个大的记忆存储,远离工作部件,工作部件将可记录的事实发送到特殊地方,然后后来回到完全相同的地方重新获得信息。这种方法,需要大量精确连接的线路,在生物机械中几乎无法实现,尤其是因为这种机械必须使用易受损伤、饥饿、感染和类似扰动的部件。更有可能的是,大脑的大多数记忆痕迹发生在其作用部位,并在那里保留。因此,似乎有助于特定反应(例如,回答"你叫什么名字?")的痕迹将是广泛分散的,每一种只有很小的效果,但在它们的总效果中 累积成对行为的决定性决定。"记忆"的概念将不得不变成"诸记忆",就像中世纪的"动物热"作为一个统一体,变成了今天所知的关于代谢和氧化的一切。在记忆类型的一端是那些对行为留下永久印记的简单事件,那些常被称为"痛苦的""可怕的"。这些学习往往使用自然选择发展的先天机制,准备学习和记录什么是痛苦的,但需要由儿童的特定环境提供细节。训练机制(产生"被烧伤的孩子"的行为)显然是稳态的,[它是一种稳态机制,其设计的最终细节被推迟,直到必要的信息由环境提供。这种发展稳态机制的方法在本质上显示了学习过程的所有必要特征;"更高"的形式本质上是相似的,被发展到复杂得多的程度。
3.6复杂性
机制的逻辑,定量地使用,表明任何像人脑一样复杂的机制,如果它及其环境是丰富连接的(内部和两者之间)——可能性将如此巨大,以至于所有地质时间都不足以将未组织的网络发展到适应的形式(Ashby, 1952),那么它永远不可能通过进化或个人学习被带到充分自我保存的形式。大多数儿童达到相当适应的成人状态之所以可能,只是因为适应可以分阶段发展。因此,我们的地球环境允许儿童学习如何将水倒入杯子,而与他刚刚学习的英语无关,这些又与他学习捏狗时狗会做什么无关。有时必须学习的东西不是完全可分离的,但允许学习分阶段发生,每个阶段只能参照先前建立的东西来建立。因此,算术可以按加法、减法、乘法、除法的顺序学习,但不能按相反顺序。而要想学撑杆跳,必须先学会站立、行走、奔跑和操纵长物体。因为我们的地球环境允许成人的充分适应主要分小阶段发展,这个过程比完全泛化的情况要简单得多。
然而,一旦对观察者如果要充分理解人类有机体中在他面前的东西必须获得多少信息做出定量估计,我们就会发现信息量可能超出一切可能的界限(例如,Bremermann, 1965),即使是最慷慨的允许。似乎很清楚,当我们离开关于大脑的旧思维方法,及其严重的过度简化,转向现代方法时,我们将不得不认真对待信息量的问题,以免浪费时间尝试不可能的事情。
"复杂性"的问题必须在我们试图理解大脑(无论是自然的还是人工的)的尝试中发挥主导作用,因为一旦我们离开1940年之前我们知道的机制,我们就到达复杂性以压倒性速度增加的形式。它们中的大多数性质增加,不是作为体积或质量,而是以组合速度,因此它们增加的阶数要么是 e^n n!,或者更快(例如 Ashby, 1966)。因此,在任何合理时间内发生适应的可能性根本上依赖于简单性的存在。相互作用不完全或微弱的情况,事实上,在我们的地球环境中非常常见,而所知的情况表明,大脑已被进化深刻地塑造以利用这一事实。因此,通过实现一系列子目标来致力于主要目标的极其常见的方法是这种适应的一种表达。目前几乎不能说更多,因为与复杂环境反应的复杂动态系统的一般研究才刚刚开始。
然而,今天,关于机制的逻辑已足够了解,表明神经元单位的性质可以与整个有机体的较大行为相关联的一般原则,可以被追溯,其严格性仅受我们时间和耐心的资源限制。
3.7致谢
本文所基于的工作得到美国空军科学研究办公室 Grant AF-OSR 7-63 和美国公共卫生部 Grant GM 10718-01 的支持。参考文献 略


来源:宋胖说事儿(公众号)

编辑:张家乐

6#
 楼主| 发表于 2026-2-7 21:04:17 | 只看该作者
【案例】

智能的机制——阿什比论文集(6

大家好,接着由我来为大家翻译控制论先驱阿什比的论文集《智能的机制》。全书共有8个专题40多篇论文,基本把阿什比(除了名著《大脑设计》《控制论导论》之外)主要代表作都囊括了。除了个别零散论文(比如《智力放大器设计》)外,大多没有被翻译为中文。我想尝试翻译出来,与群友共享。也许在今天AI浪潮几乎让人疯狂的背景下,聆听一下这位控制论先驱对智能的思考对我们有帮助,能让我们冷静下来,对AI如实观照。我们现在翻译的翻译机制定律这一专题。今天我这给大家刊登第三篇文章的摘要,因为这篇集合论的内容非常多,且枯燥。
机制与稳态的集合论
(这是 W. Ross Ashby(控制论与系统论的先驱学者)发表于 1964 年的经典论文,载于《General Systems》第 IX 卷第 83-97 页。这篇论文将集合论方法引入生物学和复杂系统研究,强调了同胚映射在简化复杂系统分析中的作用。
该文的展开就是《控制论导论》
摘要
过去二十年见证了科学向此前避而不谈的疆域进军——那就是本质上复杂的动态系统世界。一百年来,像大脑、社会、经济、原生质、胶体这样的动态系统,主要都是用古典科学方法来处理的;试图将整个系统还原为许多简单单元的组合,单元间仅存在无穷小的相互作用。然而,统计方法和矩阵方法的出现,开始使科学家能够更成功地处理中等复杂的系统。随后是大型通用计算机的出现;尽管它向科学家提出了又一个极其复杂的系统,但其清晰的行为逻辑极大地启发了他,以至于今天处理高度复杂系统的整体逻辑和策略已变得无比清晰;再加上信息论的规范,他得以获得一种全新的清晰度和严谨性。
对生物学家而言,这种新的严谨性的需求可能并非一目了然。然而,如果生物学要研究并真正理解复杂的系统,它所使用的方法必须是恰当的。其中首要的是"简化"方法:不是依靠迄今为止常用的直觉性经验法则,而是使用同胚映射的更为发达的方法。这种方法前景广阔,但其运用需要严谨性和技术;这些从何而来?
本文所述的方法之所以被提出,是因为作者在过去二十年中发现它是无价的指南。由于其概念最初完全不涉及连续性、顺序、度量或线性(尽管并不排斥这些因素),这种方法可以应用于生物学事实,而无需仅仅为了数学上的缘故而扭曲事实。
本文描述的方法基于以 N. 布尔巴基(N. Bourbaki)为笔名写作的法国学派的工作。正如他们的巨著所表明的,所有数学,以及因此所有精确思维的产物,都可以建立在集合论的基础上,因此将本文的方法与他们的方法完全保持一致具有相当大的优势;这样我们就可以确保这种方法与所有数学之间能够随时安全地互换。因此,他们的《结果集》("Fascicule de résultats")被作为本文方法的基础。(在我看来,他们完整的三卷本《集合论》("Théorie des ensembles")对面向生物学的工作者几乎没有增添什么价值。)我还大量借鉴了 J. 里格(J. Riguet)的工作,他将布尔巴基的工作扩展到了代数化并为其提供了一套演算体系的方向。特别归功于他的定理在正文中均有注明。
这种方法的最后一个优势在于,它在每个阶段都随时容纳对"信息量"的各种度量,例如香农(Shannon)以及麦克吉尔和加纳(McGill and Garner)的度量。对真正庞大而复杂系统的研究,处处都受到信息量大小的支配,以及它是否超过研究者信息处理资源的限制。该方法几乎直观地表明了信息量将如何被测量,这并非其最微不足道的优点。


来源:宋胖说事儿(公众号)

编辑:张家乐

7#
 楼主| 发表于 2026-2-8 21:25:11 | 只看该作者
【案例】

智能的机制——阿什比论文集(7

大家好,接着由我来为大家翻译控制论先驱阿什比的论文集《智能的机制》。全书共有8个专题40多篇论文,基本把阿什比(除了名著《大脑设计》《控制论导论》之外)主要代表作都囊括了。除了个别零散论文(比如《智力放大器设计》)外,大多没有被翻译为中文。我想尝试翻译出来,与群友共享。也许在今天AI浪潮几乎让人疯狂的背景下,聆听一下这位控制论先驱对智能的思考对我们有帮助,能让我们冷静下来,对AI如实观照。
我们现在翻译的翻译机制定律这一专题。今天我这给大家本主题的第四篇文章《自组织系统的原理》。
自组织系统的原理
(本文讨论了组织理论的核心概念,特别是"条件性"(conditionality)与"通信"(communication)之间的关系,以及如何使用不确定性分析(Uncertainty Analysis)来量化组织程度。)
原则性问题有时被认为过于不切实际而不重要,但我认为在我们的学科中绝非如此。我们必须处理的现象范围如此广泛,如果完全在技术或实践层面上处理,我们将被其巨大的数量和复杂性所击败。整个范围只能分块处理;在这些分块中,有些是复杂整体的同态映射,我们称之为"抽象理论""一般原理"。只有它们才能提供鸟瞰视角,使我们能够在这个广阔领域中活动而不会迷失方向。因此,我提议尝试这样一种鸟瞰式概览。
1.什么是"组织"
我们工作的核心在于"组织"这一基本概念。我们指的是什么?正如它在生物学中的用法,这是一个有些复杂的概念,由几个更原始的概念构建而成。由于这种丰富性,它不容易被定义,有趣的是注意到,虽然 March Simon1958)使用"组织"一词作为他们书的标题,但他们并没有给出正式定义。在这里我认为他们是对的,因为这个词涵盖了多种含义。我认为将来我们会较少听到这个词,尽管它所对应的操作,在计算机和类脑机制的世界中,将变得越来越重要。
在我看来,这个概念的核心是"条件性"。一旦两个实体 A B 之间的关系以 C 的值或状态为条件,那么"组织"的一个必要组成部分就存在了。因此,组织理论部分地与多变量函数理论是共同延伸的。
我们可以通过问"它的反面是什么?"来从另一个角度看待这个问题。"……为条件"的反面是"不以……为条件",因此"组织"的反面因此必须是,正如数学理论清楚地表明的,"可还原性"概念。(它也被称为"可分离性"。)这在数学形式中发生,当看起来像是多个变量(可能非常多)的函数在仔细检查时被证明具有那些行动不以其他部分的值为条件的部分。它在机械形式中、在硬件中发生,当看起来像一个机器被证明由两个(或更多)子机器组成,每个子机器都独立于其他机器而行动。
"条件性"及其反面"可还原性"的问题当然可以用多种数学和逻辑方法来处理。我稍后会说一些关于这种方法的内容。然而,在这里我想表达这样的观点:Garner McGill1956)引入的不确定性分析方法为我们提供了一种处理条件性的方法,它不仅完全严格,而且具有极高的普遍性。它的巨大普遍性和适用于复杂行为的特点在于,它适用于任何任意定义的状态集合。它的应用既不需要线性,也不需要连续性,不需要度量,甚至不需要排序关系。通过这种计算,条件性的程度可以被测量、分析,并以完全类似于 Fisher 的方差分析方法的方式分配给因素和相互作用;然而它不需要变量中的度量,只需要各种状态组合发生的频率。在我看来,正如 Fisher 的方差分析概念为理解度量上变异之间可能存在的复杂关系带来了大量光明,McGill Garner 的不确定性分析概念可能为我们提供一种更好的理解,即如何处理变量为非度量时的关系复杂性。在心理学和生物学中,这种变量非常普遍;毫无疑问,它们也将在计算机中发展的类脑过程中普遍出现。我期待 McGill Garner 的方法成为处理此类问题的通用语言,以便用定量方式思考和处理这些问题的时候到来。
"条件性"的处理,无论是通过多变量函数、相关分析、不确定性分析还是其他方式,都使我们意识到基本思想是:首先存在一个乘积空间——即可能性空间——在其中相关或约束诱导了现实。这种看待"条件性"的方式使我们意识到它与"通信"有关,当然,当部分之间存在"通信"(在某种广义上)时,我们应该将部分定义为"组织"的,这是相当合理的。(同样,自然的反面是独立性,它代表非通信。)
现在,从 A B "通信"必然意味着某种约束,A 发生的事件与 B 发生的事件之间存在某种相关:如果在 A 给定事件的情况下,B 可能发生所有可能的事件,那么从 A B 就没有通信,对可能发生的(AB)对也没有约束。因此,变量之间"组织"的存在等同于变量之间"通信"的存在。
我强调这一点,因为在过去,生物学家倾向于将组织视为某种额外的东西,某种添加到基本变量上的东西,而基于通信逻辑的现代理论则将组织视为一种限制或约束。这两种观点因此是截然相反的;不存在哪一种绝对正确的问题,因为每种在其上下文中都可能是适当的。但由于存在这种对立,我们必须格外小心行事,特别是在与他人讨论时,以免陷入完全的混乱。这个类比可能看起来有些复杂,但我确信它是可接受的,因为我们必须认识到,组织理论的讨论具有在物理学和化学等更客观的科学中未发现的特点。这种特点就在于我刚才提到的这个乘积空间。这个乘积空间从何而来?它的主要特点是它包含的比真实物理世界中实际存在的更多,因为正是后者给了我们实际的、受约束的子集。
现实世界呈现的是"现有之物"的子集;而乘积空间则代表观察者的认知不确定性。因此,当观察者改变时,乘积空间也可能随之改变;面对同一实际事物中的同一组实际事件,两个观察者完全可以合理地采用不同的乘积空间进行记录。由此可见,"约束"乃是观察者与事物之间的一种关系;任何特定约束的性质都同时取决于真实事物与观察者双方。由此推论,该理论的相当一部分将涉及那些并非事物内在固有、而是存在于观察者与事物之间的关系的属性。我们稍后将会看到一些有关这一事实的引人注目的例子。
2.整体与部分
如果说"条件性"是组织概念中的一个基本组成部分,那么同样基本的假设是:我们所谈论的是一个由部分构成的整体。这一假设值得我们稍加审视,因为当前的研究正在发展一种组织理论,这种理论并不观察部分及其相互作用,而是将系统视为一个未经分析的整体(Ashby, 1958, a)。当然,在物理学中,我们通常这样开始描述一个系统:"设变量为 x₁, x₂,..., xₙ",从而一开始就将整体视为由 n 个功能部分构成。然而,另一种方法处理的是整体未经分析的状态 S₁, S₂,...,而不明确提及可能产生这些状态的任何部分。这样一种系统的动力学随后可以被定义并用数学方法处理,正如我在其他著作中所示(Ashby, 1960, a)这种方法如何被运用。我在这里想要指出的是,我们可以拥有一种复杂的动力学,它无论多么复杂、交叉连接程度多高都可以,却不提及部分,因此也不使用组织的概念。由此可见,动力学概念与组织概念本质上是相互独立的,因为它们的存在与缺席可以有全部四种组合方式。
这一事实例证了我所说的,即"组织"部分地存在于观察者的眼中。两个观察者研究同一个系统,比如说一个蜂群,可能会发现其中一个观察者将蜂群视为五万个蜜蜂组成部分的相互作用,因而发现蜜蜂是"有组织"的;而另一个观察者,在观察整体状态——诸如活动、休眠、分群等状态时——可能看不到任何组织,只看到这些(未经分析的)状态的轨迹。
"组织"与"动力学"相互独立的另一个例证是:一个真实系统是否是有组织的或可还原的,部分地取决于观察者所采取的视角。例如,众所周知,一个有组织的(即相互作用的)由 n 个部分组成的线性系统,比如一个摆和弹簧的网络,可以从另一个视角(即所谓"正则"坐标的视角)来看,在其中所有(新识别出的)部分是完全分离的,因而整体是可还原的。因此,我坚持组织的相对性这一观点并无任何乖谬之处,因为人们常规性地利用这一事实的优势来研究相当普通的动态系统。
最后,为了强调系统中所见的组织在多大程度上依赖于观察它的观察者,我将陈述如下命题:给定一个行为被任意给定的整体,可以在其中看到各种各样任意的"部分";因为当提出任意部分时,所需要的全部条件就是,我们假设给定的部分与另一个适当相关的部分相耦合,使得两者一起形成一个与原先给定的整体同构的整体。例如,假设给定的整体 W 10 个状态,其行为遵循变换……


它的运动学图是:



并且假设我们希望将其"看作"包含部分 P,该部分具有内部状态 E 和输入状态 A:


稍加巧思,我们便能发现,若将部分 P 与部分 Q(其状态为 (F, G),输入为 B)通过变换 Q 相耦合:


令 A = F B = E,则新的整体 W' 具有变换:


在一一对应关系下,它与 W 同构。


因此,只要满足某些特定要求(例如平衡态映射到平衡态),任何动态系统都可以通过简单地改变观察者的视角,而展现出各种各样任意指定的"部分"。


来源:宋胖说事儿(公众号)

编辑:张家乐

发表回复

您需要登录后才可以回帖 登录 | 实名注册

本版积分规则

掌上论坛|小黑屋|传媒教育网 ( 蜀ICP备16019560号-1

Copyright 2013 小马版权所有 All Rights Reserved.

Powered by Discuz! X3.2

© 2016-2022 Comsenz Inc.

快速回复 返回顶部 返回列表