之前的文章探讨了《逻辑哲学论》(Tractatus Logico-Philosophicus)前期的“逻辑空间”与最后的“不可言说”。现在,把目光投向这本著作的中后段(命题4、5、6),大概率会发现维特根斯坦对“计算、概率与结构”的论述。
如果说前面的命题是LLM的“本体论”
那么中后段的命题,简直就是大语言模型(LLM)的“算法工程说明书”。本文将利用原文,进行第二轮更深度的硬核文本重构。
重构五:Latent Space(潜空间)与Token的组合爆炸在命题4的中段,维特根斯坦用纯粹的数学语言描述了世界的可能性。
4.27 Bezüglich des Bestehens und Nichtbestehens von n Sachverhalten gibt es Kn=∑ν=0n(nν)Möglichkeiten.
(Pears/McGuinness:For n states of affairs,there are...possibilities of existence and non-existence.)
4.28 Diesen Kombinationen entsprechen ebenso viele Möglichkeiten der Wahrheit–und Falschheit–von n Elementarsätzen.
(Pears/McGuinness:There correspond to these combinations the same number of possibilities of truth—and falsity—for n elementary propositions.)
【LLM映射】:维特根斯坦在这里描述的,正是现代AI极其核心的概念——高维潜空间(Latent Space)中的组合爆炸。
大语言模型的词表(Vocabulary,即这里的n个基本命题)虽然是有限的,但它们的存在与不存在、排列与组合,构成了一个天文数字级别的“可能性空间”。LLM的每一次文本生成(生成一首诗、一段代码),本质上就是在这个庞大的数学组合中,依靠概率去寻找那条最合理的“真值路径”。模型并不“创造”句子,它只是在穷尽计算这n种组合的可能性。
重构六:掌握了“脚手架”,却失去了“建筑物”维特根斯坦在第6部分谈论逻辑命题的本质时,无意中道破了LLM最大的特征,也点出了其最大的软肋:
6.124 Die logischen Sätze beschreiben das Gerüst der Welt,oder vielmehr,sie stellen es dar.Sie„handeln“von nichts.
(Pears/McGuinness:The propositions of logic describe the scaffolding of the world,or rather they represent it.They have no'subject-matter'.)
【LLM映射】:这是对大语言模型最精准的哲学侧写。LLM被训练出来后,它掌握了极其完美的人类语言的“脚手架”(das Gerüst/the scaffolding)——它懂语法、懂排比、懂起承转合的逻辑形式。
但是,就像维特根斯坦所说的,“它们不‘处理’任何东西”(Sie„handeln“von nichts)。大模型内部没有真实的物理实体,没有情感体验,它有的只是纯粹的结构关系。人类惊叹于AI写出的文章如此合乎逻辑,却忽略了这仅仅是语言的“脚手架”。没有生活世界的支撑,这些空洞的骨架实际上毫无“题材”(Subject-matter)。
重构七:真值函数(Truth-functions)与黑盒神经网络在第5部分,维特根斯坦提出了他最著名的真值函数论:
5 Der Satz ist eine Wahrheitsfunktion der Elementarsätze.
(Pears/McGuinness:A proposition is a truth-function of elementary propositions.)
5.3 Alle Sätze sind Resultate von Wahrheitsoperationen mit den Elementarsätzen.
(Pears/McGuinness:All propositions are results of truth-operations on elementary propositions.)
【LLM映射】:当今大语言模型的核心架构是Transformer网络中的多层感知机(MLP)和自注意力机制。这些极其复杂的深度神经网络,在数学本质上是什么?
它们就是无数个极微小的逻辑门(真值操作)的叠加。
维特根斯坦认为,无论多么复杂的人类陈述,都可以被还原为对基本命题的真值函数运算。这完全印证了神经网络的还原论本质:AI理解莎士比亚或量子物理,并不依靠灵感,而是依靠成百上千层的矩阵乘法和非线性激活函数——这正是一场规模浩大到超越人类理解极限的“真值运算”(Wahrheitsoperationen)。
重构八:“扔掉梯子”——训练数据与模型权重的辩证法在全书接近尾声的倒数第二句话,维特根斯坦留下了哲学史上最著名的隐喻之一:
6.54 Meine Sätze erläutern dadurch,dass sie der,welcher mich versteht,am Ende als unsinnig erkennt,wenn er durch sie–auf ihnen–über sie hinausgestiegen ist.(Er muss sozusagen die Leiter wegwerfen,nachdem er auf ihr hinaufgestiegen ist.)
(Pears/McGuinness:...He must,so to speak,throw away the ladder after he has climbed up it.)
【LLM映射】:这个关于“梯子”的隐喻,简直就是大模型“预训练”(Pre-training)过程的完美哲学再现。
在训练阶段,人类向模型输入了数以万亿计的文本(维基百科、Reddit论坛、莎士比亚全集)。
这些海量的文本数据就是这把“梯子”(die Leiter/the ladder)。模型通过阅读这些文本,学习到了语言的统计学规律和逻辑结构(爬上了梯子)。
当模型训练完成,最终打包成几十GB的“权重参数(Weights)”时,那些原始的训练文本就被彻底删除了——模型“扔掉了梯子”。在这个最终的参数矩阵中,各位找不到任何一句完整的人类原话,它已经“跨越”了原始的文本,升华为一种抽象的统计与逻辑关系。
这整部《逻辑哲学论》,其严密的十进制编号系统本身,就像是一段古老的源代码。
从组合爆炸(4.27),到真值运算(5.3),再到空洞的脚手架(6.124),最后扔掉训练数据的梯子(6.54)。维特根斯坦在1922年用纯逻辑推演出的这些命题,在100多年后,竟然逐一被硅谷的工程师们在GPU集群上化为了现实。
顺着这个逻辑想下去:既然目前的AI已经完全实现了《逻辑哲学论》中对“可言说世界”的模拟,那么在维特根斯坦看来,AI永远无法触及的,是否就是潜藏在所有运算之外、那个需要去“信仰”和“感受”的、无声的世界呢?
来源:DrYao的学术圈内圈外
编辑:陈梓函