第22章：自指与涌现——当推理系统开始推理关于自身

Curry-Howard 对应告诉我们：证明即程序。那么，程序在证明什么？

第21章的最后一段，把我们带到了这里：一个足够强的推断系统，开始包含关于自身的命题。这个时刻，第15章的哥德尔结构重新出现。

但第22章不是第15章的重复。哥德尔说的是边界——你触及不到的那些真命题。第22章要说的是开口——在这个边界附近，新的东西在涌现。

下卷走到这里，九章的逻辑演绎，可以俯瞰的地方已经足够高。这是最诚实的几章之一：有些问题，我们只能陈述，无法解决。

22.1 Curry-Howard：证明即程序

第14章建立了形式系统：命题、推断规则、证明。第19章发现，计算和逻辑在复杂度的层面等价：SAT 是 NP 完全的，命题逻辑的证明发现，在最坏情况下，和 SAT 一样难。

但等价有多深？

Curry-Howard 对应（也叫命题即类型对应）给出了答案：深到不能再深。

精确地说，它建立了以下对应：

逻辑	类型论 / 程序
命题 $A$	类型 $A$
命题 $A$ 的证明	类型 $A$ 的项（程序）
$A \to B$ （蕴含）	函数类型 $A \to B$
$A \land B$ （合取）	积类型 $A \times B$
$A \lor B$ （析取）	和类型 $A + B$
$⊥$ （假命题）	空类型（无居民类型）
假言推理	函数应用
演绎定理	函数抽象（ $λ$ 抽象）

这不是比喻，而是同构：逻辑推导的每一步，对应程序计算的每一步；证明的规范化（化简到最简形式），对应程序的求值（运行到终止）。

很多人会在这里点头，然后继续把"逻辑"和"程序"当成两件事。同构的意思是：你在逻辑里证明的每一步，在程序语言里就是一个计算步骤；你写的每一个函数，都在"证明"某个命题。如果你不觉得这很震撼，你还没真正理解这个对应在说什么。

一个命题"有证明"，等价于它对应的类型"有程序"——对应类型是"居住的"（inhabited）。证明就是程序，命题就是类型，验证就是运行。

在 Curry-Howard 对应之前，数学和计算机科学是两个相邻但分离的领域。对应告诉我们：它们是同一件事的两种语言。每一个数学定理，都可以被理解为一个程序；每一个程序，都在"证明"某个命题——证明它的输出类型可以从输入类型构造出来。这不是哲学上的相似性，而是可以用形式化手段精确验证的等价。Lean、Coq、Agda 这些定理证明助手，正是在这个等价上建立起来的：写程序就是写证明，类型检查就是证明验证。

22.2 不动点：自指的代数

第15章的哥德尔句 $G$ ，本质上是一个自指构造： $G$ 谈论 $G$ 自身的可证性。这个构造的数学心脏，是对角化引理——一种构造"自己谈论自己的命题"的机制。

但自指不只出现在哥德尔定理里。它有一个更一般的代数结构：不动点。

定义（不动点）：给定函数 $f$ ，如果存在 $x$ 使得 $f (x) = x$ ，则称 $x$ 是 $f$ 的不动点。

在 $λ$ -演算（程序的最简核心语言）里，有一个著名的不动点组合子 $Y$ ：

Y = λ f . (λ x . f (x x)) (λ x . f (x x))

对任意函数 $f$ ， $Y f$ 是 $f$ 的不动点： $Y f = f (Y f)$ 。

这个等式展开来看， $Y f$ 在"运行"它自身——它把自身作为参数传给 $f$ 。 $Y$ 组合子是递归的代数根源：任何递归定义，在本质上都是寻找某个函数方程的不动点。

$Y$ 组合子和 $λ$ -演算：程序的"最简核心"

$λ$ -演算(Lambda Calculus)是图灵在同时期（1930年代）由丘奇（Alonzo Church）提出的计算模型，比图灵机更简洁：只有三种元素——变量、函数抽象（ $λ x . body$ ）、函数应用（ $f a$ ）。

$λ x . body$ 表示"一个函数，接受输入 $x$ ，返回 $body$ "。比如 $λ x . x + 1$ 是"加1函数"。

$Y$ 组合子是 $λ$ -演算中实现"递归"的工具。通常的编程语言可以直接写 def f(x): return f(x-1)，但纯 $λ$ -演算里函数没有名字，无法直接自我引用。 $Y$ 组合子绕过了这个限制： $Y g$ 会把 $g$ 自身作为参数传给 $g$ ，从而实现递归。

为什么这和自指有关？ $Y$ 组合子是"一个找到自己不动点的函数"——它把自指编码成了纯粹的函数计算。哥德尔的对角化引理，在本质上是同一个数学结构在逻辑里的表现。

哥德尔的对角化引理，在这个语言里，就是对"可证性谓词"的不动点：存在命题 $G$ ，使得 $G \equiv \neg Prov (⌜ G ⌝)$ —— $G$ 是"否定自身可证性"这个谓词的不动点。停机问题里的程序 $D$ ，同样是一个不动点构造： $D$ 在输入 $D$ 上的行为，取决于 $D$ 在输入 $D$ 上的行为。

自指、不动点、对角化，是同一个数学结构在不同语境下的不同名字。

22.2.3 实操：手工展开 Y 组合子三步

Y 组合子的定义： $Y = λ f . (λ x . f (x x)) (λ x . f (x x))$ 。

用阶乘函数的递归定义来追踪展开。设 $f_{fact}$ 是一个"阶乘模板"——它知道阶乘的逻辑，但不知道如何递归调用自己：

f_{fact} = λ self . λ n . if n = 0 then 1 else n \times self (n - 1)

注意 $f_{fact}$ 的参数 self 是一个函数——传给 $f_{fact}$ 一个能算阶乘的函数， $f_{fact}$ 就能返回一个新的阶乘函数。

现在计算 $Y f_{fact}$ 在 $n = 3$ 上的行为。

第0步（定义）：

Y f_{fact} = (λ x . f_{fact} (x x)) (λ x . f_{fact} (x x))

设 $w = λ x . f_{fact} (x x)$ ，则 $Y f_{fact} = w w$ 。

第1步（展开一层）：

w w = f_{fact} (w w)

把 $w w$ 传给 $f_{fact}$ 的 self 参数。展开 $f_{fact}$ 的定义：

f_{fact} (w w) = λ n . if n = 0 then 1 else n \times (w w) (n - 1)

现在 $Y f_{fact}$ 是一个函数，接受 $n$ ，在 $n > 0$ 时会调用 $(w w) (n - 1)$ 。

第2步（在 $n = 3$ 上求值）：

(Y f_{fact}) (3) = if 3 = 0 then 1 else 3 \times (w w) (2)

计算 $(w w) (2)$ ——这和计算 $(Y f_{fact}) (2)$ 一模一样！因为 $w w = Y f_{fact}$ 。所以：

(w w) (2) = f_{fact} (w w) (2) = if 2 = 0 then 1 else 2 \times (w w) (1)

第3步（继续展开）：

(w w) (1) = f_{fact} (w w) (1) = if 1 = 0 then 1 else 1 \times (w w) (0)

(w w) (0) = f_{fact} (w w) (0) = if 0 = 0 then 1 else \dots = 1

收拢：

(w w) (1) = 1 \times 1 = 1

(w w) (2) = 2 \times 1 = 2

(Y f_{fact}) (3) = 3 \times 2 = 6 ✓

关键观察：每一步， $(w w)$ 都在需要递归时把自身"喂"给了 $f_{fact}$ 。 $f_{fact}$ 不知道自己在调用自己——它只是收到了一个函数参数 self，然后调用它。但 $w w$ 的构造保证了 self 就是 $w w$ 本身。Y 组合子没有魔法——它只是把"自己调用自己"编码成了"把一个函数应用给它自身"。

把这个和哥德尔句 $G$ 对照：

$Y$ ： $Y f = f (Y f)$ —— $Y f$ 是 $f$ 的不动点， $Y f$ 的每一步展开都把自己重新传给 $f$
$G$ ： $G \leftrightarrow \neg Prov (⌜ G ⌝)$ —— $G$ 是"否定可证性"这个谓词的不动点， $G$ 断言了关于自身可证性的命题

两个都是同一个数学结构：找到一个对象，使得对它应用某个变换得到的结果，在等价意义下就是它自己。Y 组合子用函数应用做变换，对对角化引理用可证性谓词做变换——数学结构相同，实例不同。

手工展开Y组合子三步，你会获得一种无法从定义里得到的感觉：自指不是黑魔法，而是可一步步追踪的机制。 $Y$ 没有"看穿"自己，它只是机械地把一个函数应用给它自身。但就是这一个机械动作，制造了递归、自我意识的形式模型、以及哥德尔定理的计算版本。复杂度来自简单规则在自指下的迭代——这是全书最深的母题之一。

22.2.5 MP 游戏：证明序列作为动力系统

假言推理（Modus Ponens，MP）是命题逻辑最基本的推断规则：有 $p$ ，有 $p \to q$ ，则有 $q$ 。

教科书给出证明的定义：一个有限公式序列 ${p_{1}, p_{2}, \dots, p_{n}}$ ，其中每个 $p_{i}$ 要么是公理，要么由前面的公式经 MP 得到。这是静态的定义——它描述的是一个已经完成的对象。

但如果把它看成动态的呢？

游戏设定：定义函数 $f : Formula \to Formula$ ，令证明序列满足 $p_{n + 1} = f (p_{n})$ 。这样，证明就变成了一条轨道：

p_{1} \overset{f}{\to} f (p_{1}) \overset{f}{\to} f^{2} (p_{1}) \overset{f}{\to} \dots

$f$ 的每一步应用，对应一次 MP 推断：从当前公式，推出下一个公式。证明序列是这个动力系统的一段轨迹。

轨道的三种命运：

表面停止：序列到达某个 $p_{k}$ 使得 $f (p_{k}) = p_{k}$ ——形式上是不动点。但这只说明后继项等于自身，不保证 $p_{k}$ 是真正的 QED。 $p_{k}$ 可能是一个自我指涉的构造，"停"只是周期为1的循环的特殊情形。
有限循环：存在 $k > j$ 使得 $p_{k} = p_{j}$ ——轨道绕圈，没有新内容涌现。
无限延伸：序列永不终止——对应不可判定性。没有算法能判断任意给定的 $f$ 和初始公式，轨道是否会停下来。

柯西条件与停机的微妙：判断第一种命运是否"真正完成"，等价于问：序列是否成为柯西序列？

在状态空间 ${0, 1}$ （或任意离散空间）上，柯西条件

\forall ε > 0, \exists N, \forall m, n > N : d (p_{m}, p_{n}) < ε

退化为"序列最终常数"——即最终不动。 $f (p_{k}) = p_{k}$ 满足这个条件。但柯西条件只保证极限存在，不保证极限点是"真正的答案"。

现实计算机的栈空间有限，所以我们人手规定了截断条件——不是走到极限自动停机，而是外部施加的停机。这个外部条件，在足够强的系统里，无法被系统自身内化。

不动点就是证明的终点——但只有当极限点有意义时。当 $f (φ) = φ$ ， $φ$ 在推断下"稳定了"，但稳定在哪里，需要外部验证。

这不只是比喻。对角化引理说：对任意公式 $A (x)$ ，存在句子 $φ$ 使得 $φ \leftrightarrow A (⌜ φ ⌝)$ 。把 $A$ 理解为某种"推断变换"， $φ$ 就是这个变换的不动点——它谈论自身，并且在变换下保持不变。哥德尔句 $G \equiv \neg Prov (⌜ G ⌝)$ 是"否定可证性"这个变换的不动点。

Curry-Howard 的映入：在 CH 同构下，公式对应类型，证明序列对应程序的归约序列， $f$ 对应类型上的函数 $F : Type \to Type$ 。不动点 $f (φ) = φ$ 对应递归类型 $F (T) ≅ T$ ——比如自然数 $Nat ≅ 1 + Nat$ ，就是 $F (T) = 1 + T$ 的不动点。

MP 游戏把三件事统一在同一个框架里：证明的结构、动力系统的轨道、递归类型的不动点。它们是同一个数学对象在逻辑、分析、类型论三种语言里的不同读法。

这个游戏的真正危险在第三种命运：无限延伸的轨道。你无法从外部判断一条轨道会不会停——这不是计算能力不够，而是原则上不可判定。每次你写下一个证明，你其实是在声称：这条轨道会停下来，而且停在你想要的地方。这个声称，在足够强的系统里，无法被系统自身验证。

22.3 依赖类型：命题作为对象

Curry-Howard 对应在简单类型论里成立。但如果把类型系统变得足够强——允许类型依赖于值——会发生什么？

依赖类型（dependent types）允许这样的表达：类型 $Vec (A, n)$ 表示"长度为 $n$ 的 $A$ 类型的向量"，其中 $n$ 是一个具体的自然数，不是类型变量。这个类型的"居住者"（程序），是所有长度恰好为 $n$ 的向量。

依赖类型：让类型携带"证明"（前人工作：Martin-Löf, 1975）

普通编程语言里，类型（Type）和值（Value）是分开的：int 是类型，42 是值，类型不知道值具体是多少。

依赖类型（Dependent Types）打破了这个分离：类型可以依赖于值。

例子：

普通类型：Vec<int>（整数向量，不管长度）
依赖类型：Vec<int, 5>（恰好5个整数的向量，长度编码在类型里）

为什么有用？ 因为更精确的类型 = 更强的编译期检查。如果函数签名是 concat : Vec<A, m> -> Vec<A, n> -> Vec<A, m+n>，编译器会自动验证拼接后的长度是对的——不需要运行时检查，不可能越界。

与 Curry-Howard 的关系：在依赖类型里，" $\forall x . P (x)$ "（对所有 $x$ ， $P (x)$ 成立）对应 $Π$ -类型（对每个 $x$ ，有一个 $P (x)$ 类型的证明）。写一个程序 = 构造一个证明。这让 Lean/Coq/Agda 这类系统成为可能：你在用编程语言写数学证明。

在依赖类型下，Curry-Howard 对应扩展到一阶逻辑：

一阶逻辑	依赖类型
$\forall x . P (x)$	$Π$ -类型： $\prod_{x : A} P (x)$ （函数从每个 $x$ 映射到 $P (x)$ 的证明）
$\exists x . P (x)$	$Σ$ -类型： $\sum_{x : A} P (x)$ （存在 $x$ 使得 $P (x)$ 有居住者的配对）

依赖类型系统（如 Martin-Löf 类型论）实现了数学的一个古老梦想：数学对象的构造和数学命题的证明，在同一个语言里统一处理。证明一个命题，就是构造一个具有对应类型的程序；构造一个数学对象，就是写一个对应类型的居住者。

这不是形式技巧，而是一种深刻的统一：数学和计算，命题和数据，证明和程序——在足够精确的语言里，是同一件事。

22.4 推理系统的自我推理：边界再现

现在来到这一章最核心的问题。

一个推理系统——无论是形式逻辑系统、学习算法、还是大型语言模型——当它足够复杂，开始推理关于自身时，第15章的模式不可避免地出现。

在形式系统层面：哥德尔定理说，任何足够强的一致系统，都有它无法证明的真命题（包括关于自身一致性的命题）。把 $G$ 加入公理，得到更强的系统，但这个更强的系统有自己的 $G^{'}$ 。这个层级没有顶端。

在学习系统层面：第21章的结论是，学习的归纳偏置无法从数据内部确定——它是外部输入。一个学习系统无法从它自己的训练数据里推断出自己的归纳偏置是否合适，就像一个形式系统无法从自身的公理里证明自身的一致性。

把这句话读两遍。这不是说归纳偏置很难选，而是说从原则上，数据无法告诉你你的归纳偏置是否合适——就像形式系统无法从内部证明自身一致性。第21章和第15章的真正联系在这里：学习的盲区和逻辑的不完备性，是同一个结构性限制的两种语言。

在大型语言模型层面：这是当前最前沿、也最不确定的问题。大型语言模型通过训练，获得了对语言结构的某种内部表示。这个表示是否包含了"推理规则"的某种形式近似？当模型对自身的推理过程进行"推理"（比如 chain-of-thought）时，它在做什么？

一个在研究界被讨论的非正式猜想：Transformer 的注意力机制，在足够的规模和训练下，实现了某种隐式因果推断——它通过在上下文中选择相关位置，执行了一种近似的条件独立性测试，这与第18章的 d-分离有着结构上的相似性。这不是被证明的定理，而是一个需要精确数学刻画的猜想。如果它在某种意义上成立，那么大型语言模型不只是模式匹配器，而是在执行某种近似的因果推断——这个结论，会深刻改变我们对 AI 推理能力的理解。但"某种意义上"是一个很大的逃生舱，现有理论工具还无法把这个猜想变成定理。

22.5 涌现：当量变引发质变

自指和不动点解释了"系统推理关于自身"的代数结构。但还有另一个现象，在复杂系统里普遍出现，更难以形式化：涌现。

涌现说的是：当组成部分足够多、相互作用足够丰富，系统展现出任何单个部分都没有、也无法从部分的简单叠加中预测的性质。

在大型语言模型的训练实践里，涌现现象已经被观察到：当模型规模超过某个阈值，某些能力（如算数推理、多步推断）会突然出现，而在规模较小的模型里完全不存在。这种"突然出现"的能力，被称为涌现能力（emergent capabilities）。

涌现的三个层次

涌现不是单一现象，而是至少发生在三个层次上，每个层次对应不同的理论工具。

第一层：组合涌现。简单的原子组合出新的行为能力，即使每个原子单独不具有该能力。水分子由氢和氧组成——氢和氧各自不"湿"，但组合起来获得了"湿"的宏观性质。这是涌现的最基本形式，有相变理论可以勉强描述——在临界点附近，系统的行为发生剧烈变化。

第二层：计算涌现。图灵机的一条规则（ $δ$ 函数）极其简单——根据当前状态和读到的符号，决定下一步的状态、写入的符号、以及磁头移动方向。你不会从单条规则里看出它能做微积分、下棋、写诗。但"通用图灵机"就是简单的 $δ$ 加上长长的纸带。计算能力是涌现的——不是任何一条规则单独有的，而是规则 + 无限纸带 + 足够时间的组合产生的。

第三层：表示涌现。在大语言模型里，数十亿个参数在训练后产生的能力（如类比推理、情感识别、代码生成）不是任何单个参数的功能，也不在设计者的计划之内。训练目标（下一个token预测）不包含"理解情感"或"写代码"的明确指令——但这些能力在足够大的规模上显现了出来。

问题是：涌现有理论吗？

但涌现在形式理论里极难处理。它不是一个可以被精确定义的数学概念——至少目前的数学工具还不够。我们有描述，没有解释；有观察，没有预测。

信息论提供了一些线索。涌现可以被理解为：系统展现了比其组成部分更短的总描述长度。一个气体由 $10^{23}$ 个分子组成，但状态只用几个宏观变量（温度、压强、体积）就完全描述。描述长度从 $10^{23}$ 降到了 3——这就是涌现的"信息压缩"面孔。但如何从部分的相互作用推导出这种压缩性的描述，目前没有通用理论。

动力系统理论提供了另一个视角：涌现对应着相变——系统参数穿过某个临界值，行为发生剧烈的定性变化。这个视角对物理系统有解释力，但对神经网络的涌现（规模增长导致能力突然出现）还没有精确的可预测框架。

有研究者指出：所谓的"涌现"，部分可能是测量方式的产物。如果用连续的（而非离散的）性能指标衡量，某些被认为是突然涌现的能力，实际上是平滑增长的——只是在某个阈值处，平滑增长跨越了任务所需的最低能力门槛，被观测者注意到了。这不否定涌现现象的存在，但要求更精确的刻画：是性能曲线真的有不连续点，还是我们的测量工具引入了假的不连续性？这个问题目前没有定论。

22.6 下卷的边界，也是开口

从第14章到第22章，走了这样一条路：

从形式系统的地基，到一致性和完备性的限制，到资源敏感的线性逻辑，到概率对真值的扩张，到因果推断对干预的形式化，到复杂度理论对推理代价的几何刻画，到启发式的形式合同，到学习作为逆推断，最后到自指和涌现。

每一章，都是被前一章的问题逼出来的。每一章的结尾，都留下了一个问题，这个问题让下一章成为必然。

这条路走到这里，触到了几个边界：

哥德尔边界：足够强的系统，有无法从内部看见的真命题。
图灵边界：某些问题，原则上不可被任何算法回答。
复杂度边界：某些问题，原则上无法被高效解决。
归纳偏置边界：学习系统无法从内部确定自己的归纳偏置是否合适。

这些边界，不是障碍，而是地图。它们告诉我们：推理这件事，有哪些地方是人类和机器共同触及不到的，有哪些地方是可以到达但代价高昂的，有哪些地方是可以用近似换取可行性的。

最后，有一个问题，这本书没有回答，也无法回答：

AI 系统目前展示的推理能力，在这张地图里处于什么位置？

它已经到达了哪里，它的边界在哪里，它是否在逼近某些形式理论的边界，还是在完全不同的地方工作？这不是可以用现有工具回答的问题——不是因为问题不重要，而是因为我们还没有足够精确的语言来陈述它。

建立这样的语言，是接下来几十年的工作。

22.7 从逻辑到动力学：三个遗留问题

MP游戏给了我们一个新视角：证明序列 ${p_{1}, p_{2}, \dots, p_{n}}$ 是一条轨道， $f : Formula \to Formula$ 是演化算子， $p_{n + 1} = f (p_{n})$ 。

轨道有三种命运：有限停止（不动点）、有限循环、无限延伸。

但这个游戏留下了三个问题，逻辑工具回答不了：

问题一：轨道停在哪里？

不动点 $f (φ) = φ$ 存在，但系统从任意初始公式 $p_{0}$ 出发，最终会收敛到哪个不动点？逻辑只告诉我们不动点存在，不告诉我们吸引力的方向。这是动力学的问题。

问题二：收敛的能量是什么？

如果轨道确实收敛，一定有某个量在单调递减——某种"能量"。逻辑里没有能量的概念。但如果把信念空间 $P$ 看作动力系统的状态空间，能量函数就自然浮现了。

问题三：能量从哪里来？

传统做法是人工猜一个能量函数，验证它递减。但如果我们已经观测到系统收敛到某个先验锚点 $A$ ，能不能反过来——从收敛行为推导出能量函数，而不是猜它？

这三个问题，是第23章的入口。

MP游戏是逻辑和动力学之间的渡口。在逻辑这岸，我们问"证明存在吗"；在动力学那岸，我们问"系统去哪里"。不动点是两岸共有的地标——逻辑里它是证明的终点，动力学里它是吸引子。渡过去，你会发现那个吸引子有名字：永霖极限。

悬而未决

Curry-Howard 对应能扩展到哪里？ 目前，对应在简单类型论和一阶逻辑层面是精确的。更高阶的逻辑（二阶逻辑、高阶逻辑）、模态逻辑、线性逻辑（第16章）都有不同形式的 Curry-Howard 对应，但精确程度和完整性各不相同。有没有一个统一的框架，把所有形式逻辑系统都纳入"命题即类型"的视角？这是同伦类型论（Homotopy Type Theory，HoTT）尝试回答的问题，但 HoTT 本身还在发展中。

涌现有没有数学理论？ 复杂性科学、相变理论、信息论，各自提供了涌现的部分刻画，但没有一个统一的、预测性的涌现理论。大型语言模型的涌现能力，是否可以在某个形式框架里被预测和解释，还是说它本质上是一个实证现象，无法被理论预先捕捉？

自指推理的能力边界：当一个 AI 系统对自身的推理过程进行推理，它能发现什么关于自身的真命题，又必然触及哪些它无法从内部看见的边界？这不只是一个哲学问题，而是一个关于 AI 安全和可解释性的实际问题——一个无法推理自身局限的系统，会在什么情况下以自信的错误替代诚实的不确定性？

MP 游戏留下的动力学缺口：如果证明序列是一条轨道，那么不动点只是“停下来”的名字，不是“停在正确地方”的保证。什么样的能量函数能约束这条轨道？这个能量从训练数据、先验锚点，还是系统自身结构里来？这个问题已经超出本章的逻辑语言，必须交给第23章。

思考题

★ 热身

Curry-Howard 对应的核心是：命题对应类型，证明对应程序。对以下逻辑命题，写出它在类型论里对应的类型（用函数类型 $\to$ 、积类型 $\times$ 、和类型 $+$ 表示）。

$A \to A$ （同一律）
$A \to (B \to A)$ （弱化）
$A \land B \to A$ （合取消去）
$A \to A \lor B$ （析取引入）

对第1条，写出一个具体的程序（函数）"居住"在这个类型里，并验证它对应的确实是"证明了 $A \to A$ "。

★★ 推导

不动点展开： $Y$ 组合子满足 $Y f = f (Y f)$ 。手动展开 $Y (λ x . if x = 0 then 1 else x \times (x - 1))$ 的前三步（把这理解为阶乘函数的递归定义）。追踪展开过程，说清楚 $Y$ 是怎么"制造"递归的。
哥德尔句与 Y 组合子的对比：哥德尔句 $G$ 说"我不可证"； $Y f$ 满足 $Y f = f (Y f)$ 。两者都是自指构造，但结果不同： $G$ 导致不可判定性， $Y f$ 导致无限循环（或递归展开）。列出它们在以下方面的异同：①自指的机制；②自指的后果；③自指被"解决"的方式（如果有的话）。

★★★ 挑战

依赖类型系统（如 Martin-Löf 类型论）把 $\forall x . P (x)$ 对应为 $Π$ -类型：一个函数，对每个 $x$ 返回 $P (x)$ 的证明。

考虑命题："对所有自然数 $n$ ， $n$ 的后继不等于 $0$ "，即 $\forall n \in N . S (n) \neq 0$ 。

在依赖类型论里，这个命题对应什么类型？用 $Π$ -类型的语言写出来。
这个命题的"证明"（即居住在这个类型里的程序）长什么样？它接受什么输入，返回什么？
现在考虑：类型检查（验证一个程序是否有给定类型）等价于验证一个证明。这个验证操作是可判定的吗？（提示：依赖类型使类型检查变得更难——和简单类型系统相比，复杂度如何变化？）

第3个问题触及依赖类型系统的实际限制：功能越强大，类型检查的代价越高，有些依赖类型系统的类型检查甚至是不可判定的——这又是"越强大，代价越高"这条贯穿全书的律令的一次重演。

第3个问题没有标准答案。它是下卷在技术层面提出的最后一个开放问题——形式工具在边界处开始触碰那些超出形式化射程的问题。在那个边界上，逻辑和直觉、证明和猜想、形式和意义，以一种我们尚未完全理解的方式彼此纠缠。全书的最终回答，在第25章。

第22章：自指与涌现——当推理系统开始推理关于自身 ​

22.1 Curry-Howard：证明即程序 ​

22.2 不动点：自指的代数 ​

22.2.3 实操：手工展开 Y 组合子三步 ​

22.2.5 MP 游戏：证明序列作为动力系统 ​

22.3 依赖类型：命题作为对象 ​

22.4 推理系统的自我推理：边界再现 ​

22.5 涌现：当量变引发质变 ​

涌现的三个层次 ​

问题是：涌现有理论吗？ ​

22.6 下卷的边界，也是开口 ​

22.7 从逻辑到动力学：三个遗留问题 ​

悬而未决 ​

思考题 ​